BR112019015244A2 - ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos - Google Patents
ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos Download PDFInfo
- Publication number
- BR112019015244A2 BR112019015244A2 BR112019015244A BR112019015244A BR112019015244A2 BR 112019015244 A2 BR112019015244 A2 BR 112019015244A2 BR 112019015244 A BR112019015244 A BR 112019015244A BR 112019015244 A BR112019015244 A BR 112019015244A BR 112019015244 A2 BR112019015244 A2 BR 112019015244A2
- Authority
- BR
- Brazil
- Prior art keywords
- nucleic acid
- sequence
- fragment
- variant
- gene
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
Abstract
a presente invenção refere-se ao campo de biomedicina e, em particular, ao campo de ácidos nucleicos terapêuticos. a presente invenção provê ácidos nucleicos artificiais, em particular rnas, codificando proteínas associadas a crispr. uma composição (farmacêutica) e kit de partes compreendendo a mesma são também providos. ainda, a presente invenção refere-se ao ácido nucleico artificial, composição (farmacêutica) ou kit de partes para uso em medicina, e em particular no tratamento e/ou profilaxia de doenças condescendentes a tratamento com proteínas associadas de crispr.
Description
Relatório Descritivo da Patente de Invenção para ’’ÁCIDOS NUCLEICOS CODIFICANDO PROTEÍNAS ASSOCIADAS Â CRISPR E USOS DOS MESMOS.
[0001] A presente invenção refere-se a ácidos nucleicos artificiais, em particular RNAs, codificando proteínas associadas a CRISPR, e composições (farmacêuticas) e kit de partes compreendendo os mesmos. Os ditos ácidos nucleicos artificiais, em particular RNAs, composições (farmacêuticas) e kits são inter alia compreendidos para uso em medicina, por exemplo, em terapia de gene, e em particular no tratamento e/ou profilaxia de doenças condescendentes a tratamento com proteínas associadas a CRISPR, por exemplo, através de edição, ativação, inativação de gene ou modulação da expressão de genes-alvo de interesse.
[0002] Sistemas CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente lnterespaçadas)-Cas conferem proteção imune adaptativa a bactérias e arqueas contra elementos de DNA invasores (por exemplo, vírus, plasmídeos) usando RNAs de antissenso para reconhecer e clivar DNA estranho de uma maneira específica de sequência. Na classificação mais recente, os sistemas CRISPR-Cas diversos são divididos em duas classes de acordo com a configuração de seus efetores: sistemas CRISPR Classe 1 utilizam várias proteínas associadas a Cas (associadas a CRISPR) e CRISPR-RNA (crRNA) como um RNA-guia (gRNA) para formar um complexo efetor, enquanto sistemas CRISPR Classe 2 empregam uma proteína Cas de componente único grande em conjunto com crRNAs para mediar interferência com elementos de DNA estranhos. Sistemas CRISPR-Cas Classe 1 múltiplos, que incluem os sistemas tipo I e tipo III, foram identificados e funcionalmente caracterizados em detalhes. A maioria dos sistemas CRISPR-Cas Classe 2 que foram identificados e experimentalmente caracterizados até agora empregam endonucleases guiadas por RNA homólogas da
Petição 870190070557, de 24/07/2019, pág. 66/401
2/306 família Cas9 como efetores, que funcionam com endonucleases de multidomínio, junto com crRNA e crRNA de transativação (tracrRNA) ou, alternativamente, com um RNA-guia único sintético (sgRNA), para clivar ambos os filamentos do DNA-alvo invasor (Sander e Joung, Nat. Biotechnol. 2014 Abr; 32(4): 347-355, Boettcher e McManus, Mol. Cell. 2015 Maio 21; 58(4): 575-585).
[0003] O sistema CRISPR/Cas9 tipo II nativo funciona essencial· mente em três etapas. Quando da exposição a DNA estranho, uma sequência de DNA estranho curta (protoespaçador) é incorporada ao genoma bacteriano entre repetições palindrômicas curtas no loci de CRISPR. Uma extensão curta de nucleotídeos conservados proximais ao protoespaçador (motivo adjacente de protoespaçador (PAM)) é usada para adquirir o protoespaçador (fase de aquisição ou adaptação). Subsequentemente, o organismo procariótico hospedeiro transcreve e processa loci de CRISPR para gerar RNA de CRISP maduro (crRNA) contendo ambos elementos de repetição de CRISP e o segmento genético espaçador integrado do DNA estranho correspondendo ao elemento de DNA não próprio prévio, junto com RNA de CRISP de transativação (tracrRNA) (etapa de expressão ou maturação). Finalmente, crRNA e Cas9 se associam com o tracrRNA provendo um complexo crRNA:tracrRNA:Cas9 que se associa com a sequência complementar no DNA invasor. As endonucleases Cas9 então introduzem uma quebra de filamento duplo de DNA (DSB) no DNA-alvo (fase de interferência) (Sander e Joung, Nat. BiotechnoL 2014 Abr; 32(4): 347-355).
[0004] Células de mamífero respondem a DSBs ou através do método de união de extremidade não homóloga (NHEJ) ou reparo direcionado à homologia (HDR). NHEJ pode introduzir inserção ou deleção aleatória de extensões curtas de bases de nucleotídeo, levando a mutações de gene, e efeitos de perda de função. Em HDR, introdução de um segmento de DNA com regiões tendo homologia com as sequências
Petição 870190070557, de 24/07/2019, pág. 67/401
3/306 flanqueando ambos os lados da quebra de filamento duplo de DNA levará a reparo pelo maquinário da célula hospedeira (Sander e Joung, Nat. Biotechnol. 2014 Abr; 32(4): 347-355).
[0005] Um segundo sistema CRISPR Classe 2, putativo, tentativamente atribuído tipo V, foi recentemente identificado em vários genomas bacterianos. Os sistemas CRISPR-Cas do tipo V putativos contêm uma proteína de -1.300 aminoácidos, grande, chamada Cpf1 ou Cas12 (CRISPR de Prevotella, Francisella 1, Acidaminococcus sp BV3L6 (AsCpf1) e Lachnospiraceae bacterium ND2006 (LbCpfl)). Cpf1 requer apenas um crRNA curto para reconhecer e ligar à sua sequência de DNA-alvo, ao invés do RNA-guia de '-100-nt (crRNA e tracrRNA) para Cas9. Isto é, Cpf1 geralmente mostra um 42nt único que tem um 23 nt em sua extremidade 3’ que é complementar ao protoespaçador da sequência de DNA-alvo, PAMs TTTN 5’ do protoespaçador e gera como DSB projeções 5’ comparado com extremidades cegas para scCas9. Cpf1 ciiva eficientemente DNA-alvo seguido por um motivo adjacente de protoespaçador (PAM) rico em T curto, em contraste com o PAM rico em G seguindo o DNA-alvo para sistemas Cas9. Terceiro, Cpf1 introduz uma quebra de filamento duplo de DNA escalonado com uma projeção 5’ de 4 ou 5-nt (Zetsche e outros. Cell. 2015 Out 22; 163(3): 759-771). Eficiências no alvo de Cpf1 em células humanas são comparáveis a spCas9 e Cpf1 não mostra nenhuma divagem fora do alvo ou reduzida. [0006] Desde a aplicação de sistemas CRISPR/Cas em genomas de mamífero, a tecnologia se desenvolveu rapidamente: Cas9 cataliticamente inativa ou morta (dCas9), que não exibe nenhuma atividade de endonuclease, pode ser especificamente recrutada por gRNAs adequados para sequências de DNA-alvo de interesse. Tais proteínas Cas e suas variantes e derivados são de interesse particular como ferramentas de regulagem de gene versáteis, específicas de sequência e não mutagênicas. Por exemplo, gRNAs apropriados podem ser usados para
Petição 870190070557, de 24/07/2019, pág. 68/401
4/306 direcionar derivados de dCas9 com domínios de repressão ou ativação de transcrição a genes-alvo, resultando em repressão de transcrição (chamada interferência de CRISPR, CRISPRi) ou ativação (chamada ativação de CRISPR, CRISPRa).
[0007] Com essas inovações sucessivas, sistemas CRISPR-Cas foram amplamente adaptados para engenharia de genoma. Sistemas CRISPR-Cas são versáteis e prontamente customizáveis, uma vez que gRNAs específicos para um gene-alvo de interesse podem ser facilmente preparados, enquanto a proteína Cas não requer nenhuma modificação. Loci múltiplos podem ser facilmente direcionados através da introdução de vários gRNAs (multiplexação).
[0008] O sistema CRISPR/Cas foi adotado com sucesso como uma ferramenta robusta, versátil e precisa para ativação/repressão de edição e transcrição de genoma em organismos bacterianos e eucarióticos, e desencadeou o desenvolvimento de novas abordagens promissoras para propósitos de pesquisa e terapêuticos. No entanto, apesar de suas várias vantagens, aplicação do sistema CRISP/Cas é frequentemente dificultada por expressão pobre da proteína Cas.
[0009] É um objetivo da presente invenção satisfazer essas necessidades e prover novas abordagens terapêuticas melhoradas para tratamento de cânceres, doenças infecciosas e outras doenças e condições definidas aqui. O objetivo de base da presente invenção é atingido pela matéria-objeto reivindicada.
[0010] Embora a presente invenção seja descrita em detalhes abaixo, deve ser compreendido que a presente invenção não é limitada às metodologias, protocolos e reagentes particulares descritos aqui uma vez que esses podem variar. Deve ser também compreendido que a terminologia usada aqui não pretende limitar o escopo da presente invenção que será limitado apenas pelas reivindicações apensas. A menos que de outro modo definido, todos os termos técnicos e científicos
Petição 870190070557, de 24/07/2019, pág. 69/401
5/306 usados aqui têm os mesmos significados como comumente compreendido por um versado comum na técnica.
[0011] A seguir, os elementos da presente invenção serão descritos. Esses elementos são listados com modalidades específicas, no entanto, deve ser compreendido que eles podem ser combinados de qualquer maneira e em qualquer número para criar modalidades adicionais. Os exemplos e modalidades preferidos descritos de várias maneiras não devem ser considerados limitar a presente invenção apenas às modalidades explicitamente descritas. A presente descrição deve ser compreendida apoiar e compreender modalidades que combinam as modalidades explicitamente descritas com qualquer número dos elementos revelados e/ou preferidos. Ainda, quaisquer permutas e combinações de todos os elementos descritos no presente pedido devem ser consideradas reveladas pela descrição do presente pedido a menos que o contexto indique de outro modo.
[0012] Em todo o presente relatório e reivindicações que seguem, a menos que o contexto dite de outro modo, o termo compreendem e variações tais como compreende e compreendendo serão compreendidos implicar a inclusão de um membro, inteiro ou etapa declarado, mas não a exclusão de qualquer outro membro, inteiro ou etapa não declarado. O termo consiste em é uma modalidade particular do termo compreendem, em que qualquer um do membro, inteiro ou etapa não declarado é excluído. No contexto da presente invenção, o termo compreendem engloba o termo consistem em. O termo compreendendo então engloba incluindo bem como consistindo, por exemplo, uma composição compreendendo X pode consistir exclusivamente em X ou pode incluir algo adicional, por exemplo, X + Y.
[0013] Os termos um e uma e o, a e referência similar usados no contexto de descrição da invenção (especialmente no contexto das reivindicações) devem ser considerados compreender ambos o singular
Petição 870190070557, de 24/07/2019, pág. 70/401
6/306 e o plural, a menos que de outro modo indicado aqui ou claramente contradito pelo contexto. Menção de faixas de valores aqui pretende apenas servir como um método de abreviação de referência individualmente a cada valor separado que se encaixe dentro da faixa. A menos que de outro modo indicado aqui, cada valor individual é incorporado ao relatório como se fosse individualmente mencionado aqui. Nenhuma linguagem no relatório deve ser interpretada como indicando qualquer elemento não reivindicado essencial para a prática da invenção.
[0014] A palavra substancialmente não exclui completamente, por exemplo, uma composição que é substancialmente livre de Y pode ser completamente livre de Y. Onde necessário, a palavra substancialmente pode ser omitida da definição da invenção.
[0015] O termo cerca de em relação a um valor numérico x significa x ± 10%.
[0016] Na presente invenção, se não indicado de outro modo, características diferentes de alternativas e modalidades podem ser combinadas umas com as outras.
[0017] Para questão de clareza e legibilidade as definições que seguem são providas. Qualquer característica técnica mencionada para essas definições pode ser lida em cada e toda modalidade da invenção. Definições e explicações adicionais podem ser especificamente providas no contexto dessas modalidades.
Definições [0018] Molécula de ácido nucleico artificial: uma molécula de ácido nucleico artificial pode ser tipicamente compreendida ser uma molécula de ácido nucleico, por exemplo, um DNA ou RNA, que não ocorre naturalmente. Em outras palavras, uma molécula de ácido nucleico artificial pode ser compreendida como uma molécula de ácido nucleico não natural. Tal molécula de ácido nucleico pode ser não natural devido à sua sequência individual (que não ocorre naturalmente) e/ou devido a outras
Petição 870190070557, de 24/07/2019, pág. 71/401
7/306 modificações, por exemplo, modificações estruturais de nucleotídeos, que não ocorrem naturalmente. Uma molécula de ácido nucleico artificial pode ser uma molécula de DNA, uma molécula de RNA ou uma molécula híbrida compreendendo porções de DNA e RNA. Tipicamente, moléculas de ácido nucleico artificiais podem ser projetadas e/ou geradas através de métodos de engenharia genética para corresponder a uma sequência artificial desejada de nucleotídeos (sequência heteróloga). Neste contexto uma sequência artificial é geralmente uma sequência que pode não ocorrer naturalmente, isto é, ela difere da sequência do tipo selvagem em pelo menos um nucleotídeo. O termo tipo selvagem pode ser compreendido como uma sequência ocorrendo na natureza. Ainda, o termo molécula de ácido nucleico artificial” não é restrito significar uma molécula única mas é, tipicamente, entendido compreender um conjunto de moléculas idênticas. Desta maneira, ele pode se relacionara uma pluralidade de moléculas idênticas contidas em uma alíquota.
[0019] DNA: DNA é a abreviação comum para ácido desóxi-ribonucleico. Ela é uma molécula de ácido nucleico, isto é, um polímero consistindo em nucleotídeos. Esses nucleotídeos são geralmente monômeros de desóxi-adenosina-monofosfato, desóxi-timidina-monofosfato, desóxi-guanosina-monofosfato e desóxi-citidina-monofosfato que são em si compostos de uma porção açúcar (desoxirribose), uma porção base e uma porção fosfato, e polimerizam por uma estrutura de estrutura principal característica. A estrutura da estrutura principal é, tipicamente, formada por ligações fosfodiéster entre a porção açúcar do nucleotídeo, isto é, desoxirribose, de um primeiro monômero e uma porção fosfato de um segundo monômero, adjacente. A ordem especifica dos monômeros, isto é, a ordem das bases ligadas à estrutura principal do açúcar/fosfato, é chamada a sequência de DNA. DNA pode ser de filamento
Petição 870190070557, de 24/07/2019, pág. 72/401
8/306 simples ou filamento duplo. Na forma de filamento duplo, os nucleotideos do primeiro filamento tipicamente hibridizam com os nucleotideos do segundo filamento, por exemplo, através de emparelhamento de base A/T e emparelhamento de base G/C.
[0020] Sequência heteróloqa: duas sequências são tipicamente compreendidas ser ‘heterólogas’ se elas não forem deriváveis do mesmo gene. Isto é, embora sequências heterólogas possam ser deriváveis do mesmo organismo, elas naturalmente (na natureza) não ocorrem na mesma molécula de ácido nucleico, tal como no mesmo mRNA. [0021] Sítio de clonagem: um sítio de clonagem é tipicamente compreendido ser um segmento de uma molécula de ácido nucleico que é adequada para inserção de uma sequência de ácido nucleico, por exemplo, uma sequência de ácido nucleico compreendendo uma estrutura de leitura aberta. Inserção pode ser realizada através de qualquer método biológico molecular conhecido do versado na técnica, por exemplo, através de restrição e ligação. Um sítio de clonagem compreende tipicamente um ou mais sítios de reconhecimento de enzima de restrição (sítios de restrição). Esses um ou mais sítios de restrição podem ser reconhecidos por enzimas de restrição que clivam o DNA nesses sítios. Um sítio de clonagem que compreende mais de um sítio de restrição pode ser também chamado um sítio de clonagem múltiplo (MCS) ou um poliligante.
[0022] Molécula de ácido nucleico: uma molécula de ácido nucleico é uma molécula compreendendo, preferivelmente consistindo em componentes de ácido nucleico. O termo molécula de ácido nucleico referese preferivelmente a moléculas de DNA ou RNA. Ele é preferivelmente usado sinonimamente com o termo polinucleotídeo. Preferivelmente, uma molécula de ácido nucleico é um polímero compreendendo ou consistindo em monômeros de nucleotídeo, que são ligados covalente
Petição 870190070557, de 24/07/2019, pág. 73/401
9/306 mente uns aos outros por ligações fosfodiéster de uma estrutura principal de açúcar/fosfato. O termo molécula de ácido nucleico também compreende moléculas de ácido nucleico modificadas, tais como moléculas de DNA ou RNA modificadas na base, modificadas no açúcar ou modificadas na estrutura principal.
[0023] Estrutura de leitura aberta: uma estrutura de leitura aberta (ORF) no contexto da invenção pode ser tipicamente uma sequência de vários tripletos de nucleotídeo, que podem ser traduzidos em um peptídeo ou proteína. Uma estrutura de leitura aberta contém preferivelmente um códon de partida, isto é, uma combinação de três nucleotídeos subsequentes codificando geralmente o aminoácido metionina (ATG), em sua extremidade 5’ e uma região subsequente, que geralmente exibe um comprimento que é um múltiplo de 3 nucleotídeos. Uma ORF é preferivelmente terminada por um códon de parada (por exemplo, TAA, TAG, TGA). Tipicamente, este é o único códon de parada da estrutura de leitura aberta. Desta maneira, uma estrutura de leitura aberta no contexto da presente invenção é preferivelmente uma sequência de nucleotídeo, consistido em vários nucleotídeos que podem ser divididos por três, que começa com um códon de início (por exemplo, ATG) e que preferivelmente termina com um códon de parada (por exemplo, TAA, TGA ou TAG). A estrutura de leitura aberta pode ser isolada ou ela pode ser incorporada em uma sequência de ácido nucleico mais longa, por exemplo, em um vetor ou um mRNA. Uma estrutura de leitura aberta pode ser também chamada sequência de codificação de (proteína) ou, preferivelmente, sequência de codificação.
[0024] Peptídeo: um peptídeo ou polipeptídeo é tipicamente um polímero de monômeros de aminoácido, ligado por ligações peptídicas. Ele contém tipicamente menos de 50 unidades de monômero. Não obstante, o termo peptídeo não é uma renúncia a moléculas tendo mais de 50 unidades de monômero. Peptídeos longos são também chamados
Petição 870190070557, de 24/07/2019, pág. 74/401
10/306 polipeptídeos, tipicamente tendo entre 50 e 600 unidades monoméricas. [0025] Proteína: uma proteína compreende tipicamente um ou mais peptídeos ou polipeptídeos. Uma proteína é tipicamente dobrada em forma 3-dimensional, que pode ser necessária para a proteína exercer sua função biológica.
[0026] Sítio de restrição: um sítio de restrição, também chamado sítio de reconhecimento de enzima de restrição, é uma sequência de nucleotídeo reconhecida por uma enzima de restrição. Um sítio de restrição é tipicamente uma sequência de nucleotídeo preferivelmente palindrômica, curta, por exemplo, uma sequência compreendendo 4 a 8 nucleotídeos. Um sítio de restrição é preferivelmente especificamente reconhecido por uma enzima de restrição. A enzima de restrição tipicamente cliva uma sequência de nucleotídeo compreendendo um sítio de restrição neste sítio. Em uma sequência de nucleotídeo de filamento duplo, tal como uma sequência de DNA de filamento duplo, a enzima de restrição tipicamente corta ambos os filamentos da sequência de nucleotídeo.
[0027] RNA, mRNA: RNA é a abreviação comum para ácido ribonucleico. Ele é uma molécula de ácido nucleico, isto é, um polímero consistindo em nucleotídeos. Esses nucleotídeos são geralmente monômeros de adenosina-monofosfato, uridina-monofosfato, guanosina-monofosfato e citidina-monofosfato que são conectados uns aos outros ao longo de uma chapa estrutura principal. A estrutura principal é formada por ligações fosfodiéster entre o açúcar, isto é, ribose, de um primeiro monômero e uma porção fosfato de um segundo monômero, adjacente. A sucessão específica do monômero é chamada a sequência de RNA. Geralmente RNA pode ser obtenível através de transcrição de uma sequência de DNA, por exemplo, dentro de uma célula. Em células eucarióticas, transcrição é tipicamente realizada dentro do núcleo ou da mitocôndria. In vivo, transcrição de DNA geralmente resulta no chamado
Petição 870190070557, de 24/07/2019, pág. 75/401
11/306
RNA prematuro que tem que ser processado no chamado RNA mensageiro, geralmente abreviado como mRNA. Processamento do DNA prematuro, por exemplo, em organismos eucarióticos, compreende uma variedade de modificações pós-transcripcionais diferentes tais como união, capeamento de 5’, poliadenilação, exportação a partir do núcleo ou da mitocôndria e similar. A soma desses processos é também chamada maturação de RNA. O RNA mensageiro maduro geralmente provê a sequência de nucleotídeo que pode ser traduzida em uma sequência de aminoácido de um peptídeo ou proteína particular. Tipicamente, um mRNA maduro compreende um 5!-cap, um 5!-LJTR, uma estrutura de leitura aberta, uma 3!~UTR e uma sequência poli(A). Além do RNA mensageiro, vários tipos de não codificação de RNA existem, os quais podem estar envolvidos em regulagem de transcrição e/ou tradução.
[0028] Sequência de uma molécula de ácido nucleico: a sequência de uma molécula de ácido nucleico é tipicamente compreendida ser a ordem particular e individual, isto é, a sucessão de seus nucleotídeos. A sequência de uma proteína ou peptídeo é tipicamente compreendida ser a ordem, isto é, a sucessão de seus aminoácidos.
[0029] Identidade de sequência: duas ou mais sequências são idênticas se elas exibirem o mesmo comprimento e ordem de nucleotídeos ou aminoácidos. A porcentagem de identidade tipicamente descreve o grau ao qual duas sequências são idênticas, isto é, ela descreve tipicamente a porcentagem de nucleotídeos que corresponde em sua posição na sequência a nucleotídeos idênticos de uma sequência de referência. Para determinação do grau de identidade (identidade %), as sequências a serem comparadas são tipicamente consideradas exibir o mesmo comprimento, isto é, o comprimento da sequência mais longa das sequências a ser comparada. Isso significa que uma primeira sequência consistindo em 8 nucleotídeos é 80% idêntica a uma segunda sequência consistindo em 10 nucleotídeos compreendendo a primeira sequência.
Petição 870190070557, de 24/07/2019, pág. 76/401
12/306
Em outras palavras, no contexto da presente invenção, identidade de sequências refere-se preferivelmente à porcentagem de nucleotídeos ou aminoácidos de uma sequência que têm a mesma posição em duas ou mais sequências tendo o mesmo comprimento. Especificamente, a identidade % das duas sequências de aminoácido ou duas sequências de ácido nucleico pode ser determinada alinhando as sequências para propósitos de comparação ótima (por exemplo, lacunas podem ser introduzidas em quaisquer sequências para melhora alinhamento com as outras sequências) e comparando os aminoácidos ou nucleotídeos em posições correspondentes. Lacunas são geralmente consideradas posições não idênticas, sem importar sua posição atual em um alinhamento. O melhor alinhamento é tipicamente um alinhamento de duas sequências que resulta na identidade percentual mais alta. A identidade percentual é determinada pelo número de nucleotídeos idênticos nas sequências sendo comparadas (isto é, identidade % · no. de posições idênticas/no. total de posições x 100). A determinação de identidade percentual entre duas sequências pode ser obtida usando um algoritmo matemático conhecido daqueles de habilidade na técnica.
[0030] Molécula de ácido nucleico estabilizada: uma molécula de ácido nucleico estabilizada é uma molécula de ácido nucleico, preferivelmente uma molécula de DNA ou RNA, que é modificada de modo que ela é mais estável à desintegração ou degradação, por exemplo, por fatores ambientais ou digestão enzimática, tal como por uma degradação de exo- ou endonuclease, do que a molécula de ácido nucleico sem a modificação. Preferivelmente, uma molécula de ácido nucleico estabilizada no contexto da presente invenção é estabilizada em uma célula, tal como uma célula procariótica ou eucariótica, preferivelmente em uma célula de mamífero, tal como uma célula humana. O efeito de estabilização pode ser também exercido fora de células, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 77/401
13/306 em uma solução tampão, etc., por exemplo, em um processo de fabricação para uma composição farmacêutica compreendendo a molécula de ácido nucleico estabilizada.
[0031 ] Transfecção: o termo transfecção refere-se à introdução de moléculas de ácido nucleico, tais como moléculas de DNA ou RNA (por exemplo, mRNA), em células, preferivelmente em células eucarióticas. No contexto da presente invenção, o termo transfecção compreende qualquer método conhecido do versado na técnica para introdução de moléculas de ácido nucleico em células, preferivelmente em células eucarióticas, tais como em células de mamífero. Tais métodos compreendem, por exemplo, eletroporação, lipofecção, por exemplo, com base em lipídeos catiônicos e/ou Hpossomas, precipitação de fosfato de cálcio, transfecção baseada em nanopartículas, transfecção baseada em vírus ou transfecção baseada em polímeros catiônicos, tal como DEAEdextrano ou polietilenoimina, etc. Preferivelmente, a introdução é não viral.
[0032] Vetor: o termo vetor refere-se a uma molécula de ácido nucleico, preferivelmente a uma molécula de ácido nucleico artificial. Um vetor no contexto da presente invenção é adequado para incorporação ou carregamento de uma sequência de ácido nucleico desejada, tal como uma sequência de ácido nucleico compreendendo uma estrutura de leitura aberta. Tais vetores podem ser vetores de armazenamento, vetores de expressão, vetores de clonagem, vetores de transferência, etc. Um vetor de armazenamento é um vetor que permite o armazenamento conveniente de uma molécula de ácido nucleico, por exemplo, de uma molécula de mRNA. Desta maneira, o vetor pode compreender uma sequência correspondendo, por exemplo, a uma sequência de mRNA desejada ou uma parte da mesma, tal como uma sequência correspondendo à sequência de codificação e a 3’-UTR de um mRNA. Um
Petição 870190070557, de 24/07/2019, pág. 78/401
14/306 vetor de expressão pode ser usado para produção de produtos de expressão tal como RNA, por exemplo, mRNA, ou peptídeos, polipeptídeos ou proteínas. Por exemplo, um vetor de expressão pode compreender sequências necessárias para transcrição de uma extensão de sequência do vetor, tal como uma sequência de promotor, por exemplo, uma sequência de promotor de polimerase de RNA. Um vetor de clonagem é tipicamente um vetor que contém um sítio de clonagem, que pode ser usado para incorporar sequências de ácido nucleico ao vetor. Um vetor de clonagem pode ser, por exemplo, um vetor de plasmídeo ou um vetor de bacteriófago. Um vetor de transferência pode ser um vetor que é adequado para transferência de moléculas de ácido nucleico para células ou organismos, por exemplo, vetores virais. Um vetor no contexto da presente invenção pode ser, por exemplo, um vetor de RNA ou um vetor de DNA. Preferivelmente, um vetor é uma molécula de DNA. Preferivelmente, um vetor no senso do presente pedido compreende um sítio de clonagem, um marcador de seleção, tal como um fator de resistência a antibiótico e uma sequência adequados para multiplicação do vetor, tal como uma origem de replicação.
[0033] Veículo: um veículo é tipicamente compreendido ser um material que é adequado para armazenamento, transporte e/ou administração de um composto, tal como um composto farmaceuticamente ativo. Por exemplo, ele pode ser um líquido fisiologicamente aceitável, que é adequado para armazenamento, transporte e/ou administração de um composto farmaceuticamente ativo.
[0034] A presente invenção é baseada em parte na surpreendente constatação que elementos de 3’ e/ou 5’ UTR particulares podem mediar uma expressão aumentada de sequências de codificação, especificamente aquelas codificando proteínas associadas a CRISPR (Cas), tal como Cas9 ou Cpf1. Os presentes inventores constataram especifica
Petição 870190070557, de 24/07/2019, pág. 79/401
15/306 mente que certas combinações de elementos de 3’ e 5’ UTR são particularmente vantajosos para provisão de um perfil de expressão desejado e quantidades de proteína expressa. Em particular, expressão alta de proteína Cas por um período de tempo curto (mais ou menos 24 horas, expressão de pulso) pode ser desejada para muitas aplicações, por exemplo, a fim de minimizar exposição de DNA genômico para reduzir efeitos fora do alvo (isto é, quaisquer defeitos não intencionais sobre qualquer um ou mais alvo, gene ou transcrito celular). A ação sinergística de tais elementos 3’ e 5’ UTR em um ácido nucleico artificial codificando proteína associada a CRISP é particularmente benéfica quando expressão transiente de quantidades grandes de tais proteínas é desejada in vitro ou in vivo. Tais ácidos nucleicos artificiais então inter alia se prestam a várias aplicações terapêuticas que são condescendentes a tratamento através da introdução de mutações, inativações ou ativações de gene ou modulação da expressão de genes de interesse. [0035] Desta maneira, em um primeiro aspecto, a presente invenção refere-se então a uma molécula de ácido nucleico artificial compreendendo
a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISP; b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4; e c. pelo menos um elemento de região não traduzida 3’ derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9.
[0036] O termo UTR refere-se a uma região não traduzida flanqueando a sequência de codificação de um ácido nucleico artificial como aqui definido. Neste contexto, um elemento de UTR compreende ou consiste em uma sequência de ácido nucleico que é derivada da UTR
Petição 870190070557, de 24/07/2019, pág. 80/401
16/306 (de ocorrência natural, tipo selvagem) de um gene particular, preferivelmente como exemplificado aqui.
[0037] Quando se referindo a elementos de UTR derivados de uma UTR particular, referência é feita a sequências de ácido nucleico correspondendo à sequência da dita UTR (UTR parental) ou um homólogo, variante ou fragmento da dita UTR. O termo inclui sequências correspondendo à sequência do tipo selvagem inteira (comprimento integral) da dita UTR, ou um homólogo, variante ou fragmento da mesma, incluindo homólogos e variantes de comprimento integral, bem como fragmentos das ditas sequências do tipo selvagem de comprimento integral, homólogos e variantes, e variantes dos ditos fragmentos. O termo corresponde a significa que a sequência de ácido nucleico derivada da UTR parental pode ser uma sequência de RNA (por exemplo, igual à sequência de RNA usada para definição da dita sequência de UTR parental), ou uma sequência de DNA (de ambos filamentos de senso e antissenso e ambas madura e imatura), que corresponde a tal sequência de RNA.
[0038] Quando se referindo a um elemento de UTR derivado de uma UTR de um gene, ou um homólogo, fragmento ou variante da mesma, a expressão ou um homólogo, fragmento ou variante da mesma pode se referir ao gene, ou à UTR, ou ambos.
[0039] O termo homólogo no contexto de genes (ou sequências de ácido nucleico derivadas dos mesmos ou compreendidas pelo dito gene, tal como uma UTR) refere-se a um gene (ou uma sequência de ácido nucleico derivada do mesmo ou compreendida pelo dito gene) relacionado a um segundo gene (portal sequência de ácido nucleico) por descendente de uma sequência de DNA ancestral comum. O termo homólogo inclui genes separados pelo evento de especiação (ortólogo) e genes separados pelo evento de duplicação genética (parálogos).
Petição 870190070557, de 24/07/2019, pág. 81/401
17/306 [0040] O termo variante no contexto de sequências de ácido nucleico de genes refere-se a variantes de sequência de ácido nucleico, isto é, sequências de ácido nucleico ou genes compreendendo uma sequência de ácido nucleico que difere em pelo menos um ácido nucleico de uma sequência de ácido nucleico de referência (ou parental) de um ácido nucleico ou gene de referência (ou parental). Ácidos nucleicos ou genes variantes podem então compreender preferivelmente, em sua sequência de ácido nucleico, pelo menos uma mutação, substituição, inserção ou deleção comparado com sua respectiva sequência de referência. Preferivelmente, o termo variante como aqui usado inclui variantes de ocorrência natural e variantes engenheiradas de sequências de ácido nucleico ou genes. Desta maneira, uma variante como definido aqui pode ser derivada, de isolada de, relacionada à, baseada em ou homóloga à sequência de ácido nucleico de referência. Variantes podem ter preferivelmente uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente de pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97%, a uma sequência de ácido nucleico da respectiva sequência de ácido nucleico de ocorrência natural (tipo selvagem) ou gene, ou um homólogo, fragmento ou derivado do mesmo.
[0041 ] O termo fragmento no contexto de sequências de ácido nucleico ou genes refere-se a uma subsequência contínua da sequência de ácido nucleico de referência de comprimento integral (ou parental) ou gene. Em outras palavras, um fragmento pode ser tipicamente uma porção mais curta de uma sequência de ácido nucleico de comprimento integral ou gene. Desta maneira, um fragmento consiste, tipicamente, em uma sequência que é idêntica à extensão correspondente dentro da
Petição 870190070557, de 24/07/2019, pág. 82/401
18/306 sequência de ácido nucleico de comprimento integral ou gene. O termo inclui fragmentos de ocorrência natural bem como fragmentos engenheirados. Um fragmento preferido de uma sequência no contexto da presente invenção consiste em uma extensão contínua de ácidos nucleicos correspondendo a uma extensão contínua de entidades no ácido nucleico ou gene cujo fragmento é derivado que presenta pelo menos 20%, preferivelmente pelo menos 30%, mais preferivelmente pelo menos 40%, mais preferivelmente pelo menos 50%, ainda mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 70% e sobretudo preferivelmente pelo menos 80% da sequência de ácido nucleico total (isto é, comprimento integral) ou gene a partir do qual o fragmento é derivado. Uma identidade de sequência indicada com relação a tal fragmento refere-se preferivelmente à sequência de ácido nucleico inteira ou gene. Preferivelmente, um fragmento pode compreender uma sequência de ácido nucleico tendo uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente de pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97% com uma sequência de ácido nucleico ou gene de referência do qual ela é derivada.
[0042] Elementos de UTR usados no contexto da presente invenção são preferivelmente funcionais, isto é, capazes de elicitar o mesmo efeito biológico desejado que as UTRs de ocorrência natural (tipo selvagem) das quais eles são derivados, isto é, em particular de controle da expressão (isto é, regulagem, preferivelmente aumento) da expressão de uma sequência de codificação operavelmente ligada. O termo operavelmente ligado” como aqui usado significa que sendo posto em uma relação funcional com uma sequência de codificação. Elementos de
Petição 870190070557, de 24/07/2019, pág. 83/401
19/306
UTR definidos aqui são preferivelmente operavelmente ligados, isto é, postos em uma relação funcional, à sequência de codificação do ácido nucleico artificial da invenção, preferivelmente de uma maneira que permite que eles controlem (isto é, regulem, preferivelmente aumentem) a expressão da dita sequência de codificação. O termo expressão como aqui usado inclui em geral todas as etapas de biossíntese de proteína, transcrição inter alia, processamento e tradução de mRNA. Os elementos de UTR especificados aqui, em particular nas combinações descritas, são particularmente pretendidos aumentar a transcrição de sequência de codificação codificando a proteína associada à CRISPR descrita aqui.
[0043] O ácido nucleico artificial da invenção compreende então vantajosamente um elemento de 5’ UTR e um elemento de 3’ UTR, cada um derivado de um gene selecionado daqueles indicados aqui. Elementos de 5’ UTR adequados são selecionados de elementos de 5’-UTR derivados de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4, preferivelmente como definido aqui. Elementos de 3’ UTR adequados são selecionados de elementos de 3’ UTR derivados de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9, preferivelmente como definido aqui.
[0044] Tipicamente, elementos de 5’- ou 3’-UTR das moléculas de ácido nucleico artificiais da invenção são heterólogos para a pelo menos uma sequência de codificação.
[0045] Preferivelmente, as UTRs (servindo como UTRs parentals para os elementos de UTR do ácido nucleico artificial da invenção) indicadas aqui compreendem as UTRs de ocorrência natural (tipo selvagem), bem como homólogos, fragmentos, variantes e sequências de RNA correspondentes das mesmas.
Petição 870190070557, de 24/07/2019, pág. 84/401
20/306 [0046] Em outras palavras, o ácido nucleico artificial pode compreender preferivelmente a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISPR; b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4 ou um homólogo, fragmento, variante ou sequência de RNA correspondente de qualquer uma das ditas 5’ UTRs; e c. pelo menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9 ou um homólogo, fragmento, variante ou sequência de RNA correspondente de qualquer uma das ditas 3’ UTRs.
[0047] As 5’ UTRs e 3’ UTRs são preferivelmente operavelmente ligadas à sequência de codificação do ácido nucleico artificial da invenção.
UTRs
5’ UTR [0048] O ácido nucleico artificial descrito aqui compreende pelo menos um elemento de 5’-UTR derivado de uma 5’ UTR de um gene como aqui indicado ou um homólogo, variante ou fragmento do mesmo.
[0049] O termo 5’-UTR refere-se a uma parte de uma molécula de ácido nucleico que está localizada 5’ (isto é, a montante) de uma estrutura de leitura aberta e que não é traduzida em proteína. No contexto da presente invenção, uma 5’-UTR começa com o sítio de início de transcrição e termina um nucieotídeo antes do códon de parada da estrutura de leitura aberta. A 5’-UTR pode compreender elementos para controle de expressão de gene, também chamados elementos reguladores. Tais elementos reguladores podem ser, por exemplo, sítios de ligação ribossomal. A 5’-UTR pode ser pós-transcripcionalmente modificada, por exemplo, pela adição de um 5’-Cap. Desta maneira, 5’-UTRs
Petição 870190070557, de 24/07/2019, pág. 85/401
21/306 podem correspondem preferivelmente à sequência de um ácido nucleico, em particular um mRNA maduro, que está localizada entre o 5’Cap e o códon de início, e mais especificamente a uma sequência, que se estende a partir de um nucleotídeo localizado 3’ para o 5’-Cap, preferivelmente a partir do nucleotídeo localizado imediatamente 3’ para o 5’~Cap, a um nucleotídeo localizado 5’ para o códon de início da sequência de codificação de proteína (sítio de início de transcrição), preferivelmente ao nucleotídeo localizado imediatamente 5’ para o códon de início da sequência de codificação de proteína (sítio de início de transcrição). O nucleotídeo localizado imediatamente 3’ para a 5’-Cap de um mRNA maduro corresponde tipicamente ao sítio de início de transcrição. 5’ UTRs têm tipicamente um comprimento de menos do que 500, 400, 300, 250 ou menos de 200 nucleotídeos. Em algumas modalidades, seu comprimento pode estar na faixa de pelo menos 10, 20, 30 ou 40, preferivelmente até 100 ou 150, nucleotídeos.
[0050] Preferivelmente, o pelo menos um elemento de 5’ UTR compreende ou consiste em uma sequência de ácido nucleico derivada da 5’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano, ou de uma variante da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano. [0051] Os nomes das UTRs compreendendo a extensão .1 ou var são idênticas à UTR sem a dita extensão.
Elementos de 5’ UTR derivados de gene TOP [0052] Alguns dos elementos de 5’ UTR especificados aqui podem ser derivados da 5’ UTR de um gene TOP ou de um homólogo, variante ou fragmento do mesmo.
[0053] Genes TOP são então tipicamente caracterizados pela pre
Petição 870190070557, de 24/07/2019, pág. 86/401
22/306 sença de um trato de oligopirimidina 5’ terminal (TOP) e, ainda, tipicamente por uma regulagem traducíonal associada a crescimento. No entanto, genes TOP com uma regulagem traducional específica de tecido são também conhecidos. mRNA que contém um 5’ TOP é frequentemente referido como mRNA de TOP. Desta maneira, genes que proveem tais RNAs mensageiros são referidos como genes TOP. Sequências TOP foram exemplo, encontradas em genes e mRNA codificando fatores de alongamento de peptídeo e proteínas ribossomais.
[0054] O trato de oligopirimidina 5’ terminal (5’ TOP ou TOP) é tipicamente uma extensão de nucleotídeos de pirimidina localizados na região 5’ terminal de uma molécula de ácido nucleico, tal como a região 5’ terminal de certas moléculas de mRNA ou a região 5’ terminal de uma entidade funcional, por exemplo, a região transcrita, de certos genes.
[0055] A 5’ UTR de um gene de TOP corresponde à sequência de uma 5’ UTR de um mRNA maduro derivado de um gene de TOP, que se estende preferivelmente a partir do nucleotídeo localizado 3’ até o 5’CAP para o nucleotídeo localizado 5’ até o códon de início. A sequência de TOP começa tipicamente com uma citidina, que geralmente corresponde ao sítio de início de transcrição, e é seguida por uma extensão de geralmente cerca de 3 a 30 nucleotídeos de pirimidina. A extensão de pirimidina e então a 5’ TOP termina um nucleotídeo 5’ para o primeiro nucleotídeo de purina localizado a jusante da TOP.
[0056] Uma 5'UTR de um gene de TOP tipicamente não compreende quaisquer códons de início, preferivelmente quaisquer AUGs a montante (uAUGs) ou estruturas de leitura aberta a montante (uORFs). Nela, AUGs a montante e estruturas de leitura aberta a montante são tipicamente compreendidas ser AUGs e estruturas de leitura aberta que ocorrem 5’ do códon de início (AUG) da estrutura de leitura aberta que deve ser traduzida. As 5’ UTRs de genes de TOP são geralmente bem curtas. Os comprimentos das 5’ UTRs de genes de TOP podem variar
Petição 870190070557, de 24/07/2019, pág. 87/401
23/306 entre 20 nucleotídeos até 500 nucleotídeos, e são tipicamente menos do que cerca de 200 nucleotídeos, preferivelmente menos do que cerca de 150 nucleotídeos, mais preferivelmente menos do que cerca de 100 nucleotídeos. Por exemplo, uma TOP pode compreender 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30 ou ainda mais nucleotídeos.
[0057] No contexto da presente invenção, um motivo de TOP é uma sequência de ácido nucleico que corresponde a uma 5’ TOP como acima definido. Desta maneira, um motivo de TOP no contexto da presente invenção é preferivelmente uma extensão de nucleotídeos de pirimidina tendo um comprimento de 3-30 nucleotídeos. Preferivelmente, o motivo de TOP consiste em pelo menos 3, preferivelmente pelo menos 4, mais preferivelmente pelo menos 6, mais preferivelmente pelo menos 7 e sobretudo preferivelmente pelo menos 8 nucleotídeos de pirimidina, em que a extensão de nucleotídeos de pirimidina começa preferivelmente em sua extremidade 5’ com um nucleotídeo de citosina. Nos genes de TOP e mRNAs de TOP, o motivo de TOP começa preferivelmente em sua extremidade 5’ com o sítio de início de transcrição e termina um nucleotídeo 5’ para o primeiro resíduo purina no dito gene ou mRNA. Um motivo TOP no senso da presente invenção está preferivelmente localizado na extremidade 5’ de uma sequência, que representa uma 5’ UTR, ou na extremidade 5’ de uma sequência, que codifica uma 5’ UTR. Desta maneira, preferivelmente, uma extensão de 3 ou mais nucleotídeos de pirimidina é chamada motivo de TOP no senso da presente invenção se esta extensão estiver localizada na extremidade 5’ de uma respectiva sequência, tal como a molécula de ácido nucleico artificial, o elemento 5’ UTR da molécula de ácido nucleico artificial ou a sequência de ácido nucleico que é derivada da 5’ UTR de um gene de TOP como descrito aqui. Em outras palavras, uma extensão de
Petição 870190070557, de 24/07/2019, pág. 88/401
24/306 ou mais nucleotídeos de pirimidina, que não está localizada na extremidade 5’ de uma 5’ UTR ou um elemento de 5’ UTR, mas em qualquer lugar dentro de uma 5’ UTR ou um elemento de 5’ UTR, preferivelmente nâo é referida como motivo de TOP.
[0058] Em modalidades particularmente preferidas, os elementos de 5’ UTR derivados de 5’ UTRs de genes de TOP exemplificados aqui nâo compreendem um motivo de TOP ou uma 5’ TOP, como acima definido. Desta maneira, a sequência de ácido nucleico do elemento de 5’ UTR, que é derivada de uma 5’ UTR de um gene de TOP, pode terminar em sua extremidade 3’ com um nucleotídeo localizado na posição 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 a montante do códon de início (por exemplo, A(U/T)G) do gene ou mRNA do qual ele é derivado. Desta maneira, o elemento de 5’ UTR não compreende qualquer parte da sequência de codificação de proteína. Desta maneira, preferivelmente, a única parte de codificação de aminoácido do ácido nucleico artificial é provida pela sequência de codificação codificando a proteína associada a CRISPR (e opcionalmente sequências de aminoácido adicionais como descrito aqui).
[0059] Elementos de 5’ UTR específicos previstos de acordo com a presente invenção são descritos em detalhes abaixo.
Elementos de 5’ UTR derivados de HSD17B4 [0060] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma 17-beta-hídroxiesteroíde desidrogenase 4 ou um homólogo, variante ou fragmento da mesma, preferivelmente sem o motivo de 5’ TOP.
[0061] Tais elementos de 5’ UTR compreende ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da 17-beta-hidroxiesteroide desidrogenase 4 (HSD17B4,
Petição 870190070557, de 24/07/2019, pág. 89/401
25/306 também referida como enzima multifuncional peroxissomal tipo 2), preferivelmente de um gene da 17-beta-hidroxlesteroide desidrogenase 4 (HSD17B4) de vertebrado, mais preferivelmente de um gene da 17beta-hidroxiesteroide desidrogenase 4 (HSD17B4) de mamífero, sobretudo preferivelmente de um gene da 17-beta-hidroxlesteroide desidrogenase 4 (HSD17B4) humana ou um homólogo, variante ou fragmento de qualquer uma das ditas 5’ UTRs, em que preferivelmente o elemento de 5’ UTR não compreende a 5’ TOP do dito gene.
[0062] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de HSD17B4, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 1 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 2 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou ainda 97%,
Petição 870190070557, de 24/07/2019, pág. 90/401
26/306 de identidade de sequência com a sequência de ácido nucleico de acordo com a SEQ ID NO: 2.
Elementos de 5-UTR derivados de RPL32 [0063] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma proteína Grande ribossomal (RPL), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento de 5’ UTR preferivelmente não tem o motivo de 5’ TOP (trato de oligopirimidina terminal).
[0064] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da proteína ribossomal Large 32 (RPL32), preferivelmente de um gene da proteína ribossomal Large 32 (L32) de vertebrado, mais preferivelmente de um gene da proteína ribossomal de mamífero Large 32 (L32), sobretudo preferivelmente de um gene da proteína ribossomal Large 32 (L32) humana ou um homólogo, variante ou fragmento de qualquer uma das ditas 5’ UTRs, em que o elemento 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene. O termo SiRPL32!' inclui também variantes e fragmentos das mesmas, que são aqui também referidos como RPL32var ou 32L4.
[0065] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de RPL21, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 21 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%,
Petição 870190070557, de 24/07/2019, pág. 91/401
27/306 ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO:21, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 22 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO:22.
Elementos de 5’~UTR derivados de NDUFA4 [0066] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico que é derivada de uma 5’ UTR de um gene codificando uma subunidade de Citocroma c oxidase (NDUFA4) ou um homólogo, fragmento ou variante da mesma.
[0067] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da subunidade de Citocroma c oxidase (NDUFA4 ou Ndufa4.1), preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) de vertebrado, mais preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) de mamífero, sobre preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) humana ou um homólogo, variante ou fragmento da mesma. [0068] Desta maneira, ácidos nucleicos artificiais de acordo com a
Petição 870190070557, de 24/07/2019, pág. 92/401
28/306 invenção podem compreender um elemento de 5’ UTR derivado de um gene de NDUFA4, onde o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 9 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ iD NO:9 ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 10 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10.
Elementos de 5’-UTR derivados de SLC7A3 [0069] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando um membro 3 da família de veículo de soluto 7 (SLC7A3), ou um homólogo, fragmento ou variantes da mesma.
[0070] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’
Petição 870190070557, de 24/07/2019, pág. 93/401
29/306
UTR de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3 ou Slc7a3.1), preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) de vertebrado, mais preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) de mamífero, sobretudo preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) humano, ou um homologo, variante ou fragmento da mesma.
[0071 ] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de SLC7A3, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 15 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 16, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID
Petição 870190070557, de 24/07/2019, pág. 94/401
30/306
NO:16.
Elementos de 5’ UTR derivados de NOSIP [0072] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 5’ UTR de um gene codificando uma proteína de interação com Óxido nítrico sintase ou um homólogo, variante ou fragmento da mesma.
[0073] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da proteína de interação com Óxido nítrico sintase (NOSIP ou Nosip.T'), preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) de vertebrado, mais preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) de mamífero, sobretudo preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) humana ou um homólogo, variante ou fragmento da mesma.
[0074] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de NOSIP, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 11 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA
Petição 870190070557, de 24/07/2019, pág. 95/401
31/306 de acordo com a SEQ ID NO: 12, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12.
Elementos de 5-UTR derivados de ATP5A1 [0075] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma subunidade alfa de ATP sintase mitocondrial (ATP5A1), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0076] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa da ATP sintase mitocondrial (ATP5A1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) de mamífero, mais preferivelmente ainda de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0077] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de ATP5A1, em que o dito elemento de 5’ UTR compreende ou
Petição 870190070557, de 24/07/2019, pág. 96/401
32/306 consiste em uma sequência de DNA de acordo com a SEQ ID NO: 5 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 6, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6. Elementos de 5’~UTR derivados de ASAH1 [0078] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando a subunidade alfa de ATP sintase mitocondrial (ASAH1), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0079] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa da ATP
Petição 870190070557, de 24/07/2019, pág. 97/401
33/306 sintase mitocondrial (ASAHI), preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de vertebrado, mais preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0080] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de ASAH1, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 3 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 3, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 4, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4.
Petição 870190070557, de 24/07/2019, pág. 98/401
34/306
Elementos de 5’~UTR derivados de MP68 [0081] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (MP68), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0082] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (MP68 ou ,!Mp68), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de mamífero, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0083] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de Mp68, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 7 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de
Petição 870190070557, de 24/07/2019, pág. 99/401
35/306 acordo com SEQ ID NO: 7, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 8, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8.
Elementos de 5- UTR derivados de RPL31 [0084] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (RPL31), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0085] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (RPL31 ou Rpl31.T), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (RPL31) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial de (RPL31) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa de ATP sintase de mitocondrial (RPL31) humana, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0086] Desta maneira, ácidos nucleicos artificiais de acordo com a
Petição 870190070557, de 24/07/2019, pág. 100/401
36/306 invenção podem compreender um elemento de 5’ UTR derivado de um gene de RPL31, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 13 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 14, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14.
Elementos de 5’ UTR derivados de TUBB4B [0087] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma subunidade alfa de ATP sintase mitocondrial (TUBB4B), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
Petição 870190070557, de 24/07/2019, pág. 101/401
37/306 [0088] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B ou TUBB4B.1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0089] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de TUBB4B, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 17 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 18, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos
Petição 870190070557, de 24/07/2019, pág. 102/401
38/306
70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18.
Elementos de 5‘ UTR derivados de UBQLN2 [0090] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (UBQLN2), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0091] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2 ou Ubqln2.1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial de mamífero (UBQLN2) de mamífero, sobretudo preferivelmente um gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0092] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de UBQLN2, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 19ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tem, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%,
Petição 870190070557, de 24/07/2019, pág. 103/401
39/306
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 19, ou em que o dito elemento de 5’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 20, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20.
3’ UTR [0093] O ácido nucleico artificial descrito aqui compreende ainda pelo menos um elemento de 3’-UTR derivado de uma 3’-UTR de um gene como aqui indicado, ou um homólogo, variante, fragmento do dito gene. O termo 3’-UTR refere-se a uma parte de uma molécula de ácido nucleico, que está localizada 3’ (isto é, a jusante) de uma estrutura de leitura aberta e que não é traduzida em proteína. No contexto da presente invenção, uma 3’-UTR corresponde a uma sequência que está localizada entre o códon de parada da sequência de codificação de proteína, preferivelmente imediatamente 3’ para o códon de parada da sequência de codificação de proteína, e a sequência de poli(A) da molécula de ácido nucleico artificial, preferivelmente RNA.
Petição 870190070557, de 24/07/2019, pág. 104/401
40/306 [0094] Preferivelmente, o pelo menos um elemento de 3’ UTR compreende ou consiste em uma sequência de ácido nucleico derivada da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano, ou de uma variante da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano. Elementos de 3-UTR derivados de GNAS [0095] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma proteína de ligação ao nucleotídeo Guanina G(s) curto das isoformas de subunidade alfa (GNAS) ou um homólogo, variante ou fragmento do mesmo.
[0096] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS ou Gnas.1), preferivelmente de um gene curto das Isoformas de subunidade alfa da proteína de ligação ao nucleotídeo Guanina G(s) (GNAS) de vertebrado, mais preferivelmente de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS) de mamífero, sobretudo preferivelmente de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS) de humano ou um homólogo, variante ou fragmento do mesmo.
[0097] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de GNAS, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29 ou um
Petição 870190070557, de 24/07/2019, pág. 105/401
41/306 homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29, ou em que o dito elemento de 3’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 30, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 30.
Elementos de 3’ UTR derivados de CASP1 [0098] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma Caspase-1 (CASP1) ou um homólogo, variante ou fragmento da mesma.
[0099] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da Caspase-1 (CASPT' ou CASP1.1), preferivel
Petição 870190070557, de 24/07/2019, pág. 106/401
42/306 mente de um gene da Caspase-1 (CASP1) de vertebrado, mais preferivelmente de urn gene da Caspase-1 (CASP1) de mamífero, sobretudo preferivelmente de um gene da Caspase-1 (CASP1) de humano ou urn homólogo, variante ou fragmento da mesma.
[0100] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de CASP1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 25, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 26, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26.
Elementos de 3’ UTR derivados de PSMB3 [0101] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’-UTR que compreende ou consiste em
Petição 870190070557, de 24/07/2019, pág. 107/401
43/306 uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma subunidade beta tipo-3 de Proteassoma (PSMB3) ou um homólogo, variante ou fragmento da mesma.
[0102] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de vertebrado, mais preferivelmente de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de mamífero, sobretudo preferivelmente de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de humano ou um homólogo, variante ou fragmento da mesma.
[0103] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de PSMB3, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 23 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 24, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente
Petição 870190070557, de 24/07/2019, pág. 108/401
44/306 pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24.
Elementos de 3’ UTR derivados de ALB [0104] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene codificando Albumina de soro (ALB) ou um homólogo, variante ou fragmento da mesma.
[0105] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da Albumina do soro (ALB ou Albumina 7), preferivelmente de um gene da Albumina do Soro (ALB) de vertebrado, mais preferivelmente de um gene de Albumina do soro (ALB) de mamífero, sobretudo preferivelmente de um gene da Albumina do soro (ALB) de humano ou um homólogo, variante ou fragmento da mesma.
[0106] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de ALB, onde o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 35 ou um homólogo, variante ou fragmento da mesma, em particular de uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de
Petição 870190070557, de 24/07/2019, pág. 109/401
45/306 ácido nucleico de acordo com SEQ ID NO: 35, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 36, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36.
Elementos de 3’-UTR derivados de RPS9 [0107] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene codificando a proteína ribossomal 40S S9 (RPS9)) ou um homólogo, variante ou fragmento da mesma.
[0108] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da proteína ribossomal 40S S9 (RSPG ou RSP9.T), preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de vertebrado, mais preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de mamífero, sobretudo preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de humano ou um homólogo, variante ou fragmento da mesma.
[0109] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de RPS9, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 33 ou
Petição 870190070557, de 24/07/2019, pág. 110/401
46/306 um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 33, ou em que o dito elemento de 5’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 34, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34.
Elementos de 3!-UTR derivados de COX6B1 [0110] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico que é derivada de uma 3’ UTR de um gene de COX6B1 ou um homólogo, variante ou fragmento da mesma. [0111] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de gene de COX6B1 (ou COX6B1.1), preferivelmente de um gene de COX6B1 de vertebrado, mais preferivelmente de um gene de COX6B1 de mamífero, sobretudo preferivelmente de um gene de COX6B1
Petição 870190070557, de 24/07/2019, pág. 111/401
47/306 humano ou um homólogo, variante ou fragmento da mesma.
[0112] Desta maneira, ácidos nuclelcos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de COX6B1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 27 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 28, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28.
Elementos de 3’~UTR derivados de NDUFA1 [0113] Ácidos nuclelcos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene de NDUFA1 ou um homólogo, variante ou fragmento da mesma.
Petição 870190070557, de 24/07/2019, pág. 112/401
48/306 [0114] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene de NDUFAL1 (ou Ndufa1.1), preferivelmente de um gene de NDUFA1 de vertebrado, mais preferivelmente de um gene de NDUFA1 de mamífero, sobretudo preferivelmente de um gene de NDUFA1 de humano ou um homólogo, variante ou fragmento da mesma.
[0115] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de NDUFA1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 31 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 32, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ
Petição 870190070557, de 24/07/2019, pág. 113/401
49/306
ID NO: 32.
Combinações de UTR [0116] Preferivelmente, o pelo menos um elemento de 5’ UTR e o pelo menos um elemento de 3’ UTR agem sinergisticamente para aumentar a expressão da pelo menos uma sequência de codificação operavelmente ligada às ditas UTRs. É pretendido aqui utilizar as 5’-UTRs e 3’-UTRs mencionadas em qualquer combinação útil. 5’ e 3’-UTRs particularmente úteis são listadas na Tabela 1A abaixo. Combinações particularmente úteis de 5’ UTRs e 3’-UTRs são listadas na Tabela 1B abaixo. Modalidades particularmente preferidas da invenção compreendem a combinação das CDS de escolha, isto é, Cas9, Cpf1, CasX, CasY ou Cas13 com uma combinação de UTR selecionada do grupo de HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var/ albumina7; 32L4 / albumina7; HSD17B4/CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 /PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufa1.1; Nosip.1 / Ndufa1.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1; e Ubqln2.1 /RPS9.1.
Tabela 1A
Descrição | Tipo de Sequência | SEQ ID NO |
HSD17B45-UTR | DNA | SEQ ID NO: 1 |
HSD17B45-UTR | RNA | SEQ ID NO: 2 |
ASAH1 5-UTR | DNA | SEQ ID NO: 3 |
ASAH1 5-UTR | RNA | SEQ ID NO: 4 |
ATP5A15-UTR | DNA | SEQ ID NO: 5 |
TP5A15-UTR | RNA | SEQ ID NO: 6 |
Mp68 5'-UTR | DNA | SEQ ID NO: 7 |
Mp68 5'-UTR | RNA | SEQ ID NO: 8 |
Ndufa4 5-UTR | DNA | SEQ ID NO: 9 |
Ndufa4 5-UTR | RNA | SEQ ID NO: 10 |
Petição 870190070557, de 24/07/2019, pág. 114/401
50/306
Tabela 1A -continuação-
Descrição | Tipo de Sequência | SEQ ID NO |
Nosip 5’-UTR | DNA | SEQ ID NO: 11 |
Nosip 5’-UTR | RNA | SEQ ID NO: 12 |
Rpl31 5'-UTR | DNA | SEQ ID NO: 13 |
Rpl31 5'-UTR | RNA | SEQ ID NO: 14 |
Slc7a3 5-UTR | DNA | SEQ ID NO: 15 |
Slc7a3 5-UTR | RNA | SEQ ID NO: 16 |
TUBB4B 5-UTR | DNA | SEQ ID NO: 17 |
TUBB4B 5-UTR | RNA | SEQ ID NO: 18 |
Ubqln2 5S-UTR | DNA | SEQ ID NO: 19 |
Ubqln2 5S-UTR | RNA | SEQ ID NO: 20 |
RPL32 (32L4) 5'-UTR | DNA | SEQ ID NO: 21 |
RPL32 (32L4) 5'-UTR | RNA | SEQ ID NO: 22 |
PSMB3 3!-UTR | DNA | SEQ ID NO: 23 |
PSMB3 3-UTR | RNA | SEQ ID NO: 24 |
CASP13-UTR | DNA | SEQ ID NO: 25 |
CASP13-UTR | RNA | SEQ ID NO: 26 |
COX6B13-UTR | DNA | SEQ ID NO: 27 |
COX6B13-UTR | RNA | SEQ ID NO: 28 |
Gnas 3'-UTR | DNA | SEQ ID NO: 29 |
Gnas 3'-UTR | RNA | SEQ ID NO: 30 |
Ndufal 3-UTR | DNA | SEQ ID NO: 31 |
Ndufal 3-UTR | RNA | SEQ ID NO: 32 |
RPS9 3’-UTR | DNA | SEQ ID NO: 33 |
RPS9 3’-UTR | RNA | SEQ ID NO: 34 |
ALB7 3S-UTR | DNA | SEQ ID NO: 35 |
ALB7 3S-UTR | RNA | SEQ ID NO: 36 |
Petição 870190070557, de 24/07/2019, pág. 115/401
51/306
Tabela 1B: combinações de UTR úteis e construtos correspondentes
Combinação de UTR | SEQ ID NOs |
HSD17B4 / Gnas | 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 10402-10408; 10554; 10599-10612 |
Slc7a3/Gnas | 414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626 |
ATP5A1 / CASP | 415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640 |
Ndufa4 / PSMB3 | 416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654 |
HSD17B4 / PSMB3 | 417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436; 10558; 10655-10668 |
RPL32 / albumina 7 | 418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 |
32L4 / aibumina 7 (Gen5, HSL PoliC) | 419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696 |
HSD17B4 / CASP1 | 420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710 |
Slc7a3 / CASP1 | 421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724 |
Slc7a3 / PSMB3 | 422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738 |
Nosip / PSMB3 | 423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 10472-10478; 10564; 10739-10752 |
Ndufa4 / RPS9 | 424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766 |
HSD17B4/RPS9 | 425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780 |
ATP5A1 / Gnas | 9498- 9609; 10493-10499; 10567; 10781-10794 |
Ndufa4 / COX6B1 | 9610-9721; 10500-10506; 10568; 10795-10808 |
Ndufa4 / Gnas | 9722-9833; 10507-10513; 10569; 10809-10822 |
Ndufa4 / Ndufal | 9834-9945; 10514-10520; 10570; 10823-10836 |
Nosip / Ndufal | 9946-10057; 10521-10527; 10571; 10837-10850 |
Rpl31 / Gnas | 10058-10169; 10528-10534; 10572; 10851-10864 |
TUBB4B/RPS9 | 10170-10281; 10535-10541; 10573; 10865-10878 |
Ubqln2 / RPS9 | 10282-10393; 10542-10548; 10574; 10879-10892 |
Mp68 / Gnasl | 14526;14533; 14540 |
Mp68 / Ndufal | 14527;14534; 14541 |
Petição 870190070557, de 24/07/2019, pág. 116/401
52/306 [0117] Em algumas modalidades, o ácido nucleico artificial codificando uma proteína associada a CRISPR da invenção compreende pelo menos uma combinação de UTR selecionada do grupo consistindo em HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var / albumina7; 32L4 / albumina7; HSD17B4 / CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 /PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufal .1; Nosip.1 / Ndufal.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1 ;Ubqln2.1 / RPS9.1; MP68 / Gnasl .1 e IVIP68 / Ndufal .1.
[0118] Em algumas modalidades, os ácidos nucleicos artificiais de acordo com a invenção compreendem pelo menos uma combinação de UTR selecionada das combinações de UTR reveladas no PCT/EP/2017/ 076775 em conexão com ácidos nucleicos artificiais codificando proteínas associadas a CRISPR, que é incorporado aqui a título de referência em sua totalidade. Desta maneira, em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem compreender pelo menos uma combinação de UTR selecionada do grupo consistindo em SLC7A3 / GNAS; ATP5A1 / CASP1; HSD17B4 / GNAS; NDUFA4 / COX6B1; NOSIP / NDUFA1, NDUFA4 / NDUFA1; ATP5A1 / GNAS; MP68 / NDUFA1; NDUFA4 / RPS9; NDUFA4 / GNAS; NDUFA4 / PSMB3; TUBB4B / RPS9.1; UQBLN2 / RPS9; RPL31 / GNAS) ou HSD17B4 / PSMB3.
[0119] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem então compreender ou consistir em uma sequência de ácido nucieico como revelado no PCT/EP2017/076775 em conexão com ácidos nucleicos artificiais codificando proteínas associadas a CRISPR.
[0120] Cada um dos elementos de UTR definidos na Tabela 1 em
Petição 870190070557, de 24/07/2019, pág. 117/401
53/306 referência a uma SEQ ID NO específica pode incluir variantes ou fragmentos das mesmas, exibindo pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a respectiva sequência de ácido nucleico definida por referência à sua SEQ ID NO específica. A última coluna da Tabela 1 revela claramente todas as possíveis cds Cas9 e Cpf1 que podem ser combinadas com as combinações de UTR vantajosas específicas mostradas na coluna ”5’ UTR incl. SEQ ID NO: e coluna 3’ UTR incl. SEQ ID NO., isto é, as combinações como revelado são modalidades preferidas da invenção para um versado na técnica. Uma modalidade especificamente preferida assemelha uma sequência de Cas9 ou Cpf1 da invenção com 5’UTR SLC7A3 (SEQ ID NO: 15/16) ou uma sequência derivada da mesma e com 3’UTR GNAS (SEQ ID NO: 29/30) ou uma sequência derivada da mesma.
[0121] Para facilidade de referência, a Tabela A1 descreve combinações de CDS e UTR particularmente preferidas e vantajosas.
[0122] Cada uma das sequências identificadas na Tabela 1 com referência à sua SEQ ID NO específica pode ser também definida por sua sequência de DNA correspondente, como indicado aqui.
[0123] Cada uma das sequências identificadas na Tabela 1 com referência à sua SEQ ID NO específica pode ser modificada (opcionalmente independentemente uma da outra) como descrito abaixo.
[0124] Ácidos nucleicos artificiais preferidos de acordo com a invenção podem compreender
a. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou
Petição 870190070557, de 24/07/2019, pág. 118/401
54/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou
d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSSLC7A3MB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de um homólogo, um fragmento ou variante do mesmo; ou
g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou
Petição 870190070557, de 24/07/2019, pág. 119/401
55/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou
h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou
i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou
l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou
m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, fragmento ou uma
Petição 870190070557, de 24/07/2019, pág. 120/401
56/306 variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1 ou de um homólogo, um fragmento ou variante do mesmo; ou
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo; ou
p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo; ou
q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31 ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B ou de um homólogo, um fragmento ou
Petição 870190070557, de 24/07/2019, pág. 121/401
57/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou
s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo;
t. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo.
[0125] Ácidos nucleicos artificiais particularmente preferidos podem compreender uma combinação de UTRs de acordo com d, e, g ou I.
[0126] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de um homólogo, um fragmento ou uma variante do mesmo.
Sequência de codificação
Proteínas associadas a CRISPR [0127] O ácido nucleico artificial de acordo com a invenção compreende pelo menos uma sequência de codificação codificando uma proteína associada a CRISPR.
Petição 870190070557, de 24/07/2019, pág. 122/401
58/306 [0128] O termo proteína associada a CRISPR refere-se a endonucleases guiadas por RNA que são parte de um sistema CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas) (e seus homólogos, variantes, fragmentos ou derivados), que é usado por procarlontes para conferir imunidade adaptatlva contra elementos de DNA estranho. Proteínas associadas a CRISPR incluem, sem limitação, Cas9, Cpf1 (Cas12), C2c1, C2c3, C2c2, Cas13, CasX e CasY. Como aqui usado, o termo proteína associada a CRISPR inclui proteínas do tipo selvagem bem como homólogos, variantes, fragmentos e derivados dos mesmos. Desta maneira, quando se referindo a moléculas de ácido nucleico artificiais codificando Cas9, Cpf1 (Cas12), C2c1, C2c3, e C2c2, Cas13, CasX e CasY, as ditas moléculas de ácido nucleico artificiais podem codificar as respectivas proteínas do tipo selvagem ou homólogos, variantes, fragmentos e derivados das mesmas. [0129] Proteínas associadas a CRISPR podem ser codificadas por qualquer gene ou um homólogo, variante ou fragmento do mesmo. Quando se referindo a genes, o termo homólogo ou gene homólogo inclui genes ortólogos ou genes parálogos.
[0130] Proteínas associadas a CRISPR (e seus homólogos, variantes, fragmentos ou derivados) são preferivelmente funcionais, isto é, exibem propriedades biológicas desejadas, e/ou exercem funções biológicas desejadas. As ditas propriedades biológicas ou funções biológicas podem ser comparáveis ou até mesmo melhoradas comparado com a proteína de referência correspondente (ou parental). Proteínas associadas a CRISPR funcionais, e homólogos, variantes, fragmentos ou derivados das mesmas, preferivelmente retêm a habilidade em ser direcionadas por um RNA-gula para sequências de DNA de interesse de uma maneira específica de sequência. No entanto, a atividade de endonuclease (isto é, habilidade em introduzir DSBs na sequência de DNA de interesse) tipicamente exercida por proteínas associadas a CRISP do
Petição 870190070557, de 24/07/2019, pág. 123/401
59/306 tipo selvagem pode ser, mas não é necessariamente, retida em todos os homólogos, variantes, fragmentos e derivados funcionais de proteínas associadas a CRISPR como descrito aqui.
[0131] Especificamente, homólogos, variantes, fragmentos ou derivados funcionais são preferivelmente capazes de (1) interagir especificamente com uma sequência de DNA-alvo, (2) associação com um RNA-guia adequado e opcionalmente (3) reconhecimento de um motivo adjacente protoespaçador (PAM) que é justaposto à sequência de DNAalvo. Neste contexto, interagir com preferivelmente significa se ligar a, e opcionalmente (ainda) clivar (através de atividade de endonuclease ou nickase), ativar ou reprimir expressão e/ou recrutamento de efetores. Especificamente significa que a proteína associada a CRISPR interage com a sequência de DNA-alvo mais prontamente do que ela interage com outras sequências de DNA não alvo.
[0132] Quando se referindo a uma proteína associada a CRISP particular (tais como Casp9, Cpf1) aqui, a respectiva proteína deve ser entendida compreender todas as formas pós-traducionalmente modificadas da mesma. Modificações pós-traducionais (PTMs) podem resultar em modificações covalentes ou não covalentes de uma dada proteína. Modificações pós-traducionais comuns incluem glicosilação, fosforilação, ubiquitinação, S-nitrosiiação, metilação, N-acetilação, lipidação, formação de ligação dissulfeto, sulfação, acilação, desaminação, etc. PTMs diferentes pode resultar, por exemplo, em químicas, atividades, localizações, interações ou conformações diferentes. No entanto, todas proteínas associadas a CRISPR pós-traducionalmente modificadas previstas dentro do contexto da presente invenção preferivelmente permanecem funcionais, como definido acima.
Homólogos [0133] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente homólogos da
Petição 870190070557, de 24/07/2019, pág. 124/401
60/306 mesma. Quando se referindo a proteínas, o termo homólogo compreende ortólogos (ou proteínas hortólogas) e parálogos (ou proteínas parálogas). Neste contexto, ortólogos são proteínas codificadas por genes em espécies diferentes que se desenvolveram a partir de um gene ancestral comum através de especiação. Ortólogos frequentemente retêm a(s) mesma(s) função(ões) no curso de evolução. Desta maneira, funções podem ser perdidas ou ganhas quando comparando um par de ortólogos. No entanto, no contexto da presente invenção, proteínas associadas a CRISPR ortólogas preferivelmente retêm sua habilidade em se associar com um RNA-guia adequado para especificamente interagir com uma sequência de DNA de interesse (isto é, são funcionais). Parálogos são genes produzidos através de duplicação de gene dentro de um genoma. Parálogos tipicamente desenvolvem novas funções ou podem eventualmente se tornar pseudogenes. No contexto da presente invenção, proteínas associadas a CRISPR parálogas são preferivelmente funcionais, como acima definido.
Variantes [0134] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente variantes da mesma.
[0135] O termo variante como aqui usado com referência a proteínas preferivelmente refere-se a variantes de sequência, isto é, proteínas compreendendo uma sequência de aminoácido que difere em pelo menos um resíduo de aminoácido de uma sequência de aminoácido referência (ou de origem) de uma proteína de referência (ou de origem).
[0136] Proteínas variantes podem então preferivelmente compreender, em sua sequência de aminoácido, pelo menos uma mutação, substituição, inserção ou deleção de aminoácido comparado com sua respectiva sequência de referência. Substituições podem ser selecionadas
Petição 870190070557, de 24/07/2019, pág. 125/401
61/306 de substituições conservatives ou não conservatives. Em algumas modalidades, é preferido que uma variante de proteína codificada por pelo menos uma sequência de codificação do ácido nucleico artificial da invenção compreenda pelo menos uma substituição de aminoácido conservative, em que aminoácidos, tendo originado a partir da mesma classe, são trocados por outros. Em particular, esses são aminoácidos tendo cadeias laterais alifáticas, cadeias laterais positivamente ou negativamente carregadas, grupos aromáticos nas cadeias laterais ou aminoácidos, cujas cadeias laterais podem formar pontes de hidrogênio, por exemplo, cadeias laterais que têm uma função hidroxila. Através de constituição conservative, por exemplo, um aminoácido tendo uma cadeia lateral polar pode ser substituído por um outro aminoácido tendo uma cadeia lateral polar correspondente ou, por exemplo, um aminoácido caracterizado por uma cadeia lateral hidrofóbica pode ser substituído por um outro aminoácido tendo uma cadeia lateral hidrofóbica correspondente (por exemplo, serina (treonina) portreonina (serina) ou leucina (isoleucina) por isoleucina (leucina)).
[0137] Preferivelmente, o termo variante como usado aqui inclui variantes de ocorrência natural, por exemplo, preproteínas, proproteínas e proteínas associadas a CRISPR que foram submetidas a processamento proteolítico pós-traducional (isso pode envolver remoção da metionina N-terminal, peptídeo de sinal e/ou a conversão de uma proteína inativa ou não funcional em uma ativa ou funcional), e proteínas mutantes de ocorrência natural. O termo variante compreende ainda variantes engenheiradas de proteínas associadas a CRISPR, que podem ser modificadas (na sequência) para introduzir ou abolir uma certa propriedade e/ou funcionalidade biológica. Variantes de Cas9 engenheiradas são discutidas em detalhes abaixo. Os termos variantes de transcrito ou variantes unidas no contexto de proteína referem-se a variantes produzidas a partir de RNAs mensageiros que são inicialmente
Petição 870190070557, de 24/07/2019, pág. 126/401
62/306 transcritos a partir do mesmo gene, mas são subsequentemente submetidas à união alternativa (ou diferencial), em que exons particulares de um gene podem ser incluídos ou excluídos do mRNA mensageiro processado, final (mRNA). Variantes de transcrito de proteínas associadas a CRISPR, no entanto, preferivelmente retêm sua funcionalidade biológica desejada, como definido acima. Será notado que o termo variante pode ser essencialmente definido por meio de um grau mínimo de identidade de sequência (e preferivelmente também uma função/propriedades biológicas desejadas) comparado com uma proteína de referência. Desta maneira, homólogos, fragmentos ou certos derivados (que também diferem em termos de sua sequência de aminoácido da proteína de referência) podem ser classificados como variante também. Desta maneira, uma variante como definido aqui pode ser derivada de, isolada de, relacionada a, baseada em ou homóloga a uma proteína de referência, que pode ser uma proteína associada a CRISPR (tais como Cas9, Cpf1) como aqui definido ou um homólogo, fragmento, variante ou derivado da mesma.
[0138] Variantes de proteína associada a CRISPR (tais como Cas9, Cpf1) de acordo com a invenção têm preferivelmente uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, com uma sequência de aminoácido da respectiva proteína associada a CRISPR de ocorrência natural (tipo selvagem) (tais como Cas9, Cpf1) ou um homólogo, fragmento ou derivado da mesma.
Fragmentos [0139] Cada proteína associada a CRISPR exemplificada aqui (tais
Petição 870190070557, de 24/07/2019, pág. 127/401
63/306 como Cas9, Cpf1) compreende também preferivelmente fragmentos da mesma.
[0140] O termo fragmento refere-se a uma proteína ou poHpeptídeo que consiste em uma subsequência contínua da sequência de aminoácido de comprimento integral de uma proteína de referência (ou de origem) ou (poli) peptídeo, que é, com relação a esta sequência de aminoácido, N-terminalmente, C-terminalmente e/ou intrassequencialmente truncada comparado com a sequência de aminoácido da dita proteína de referência. Tal truncamento pode ocorrer ou no nível de aminoácido ou no nível de ácido nucleico, respectivamente. Em outras palavras, um fragmento pode tipicamente ser uma porção mais curta de uma sequência de comprimento integral de uma sequência de aminoácido. Desta maneira, um fragmento tipicamente consiste em uma sequência que é idêntica à extensão correspondente dentro da sequência de aminoácido de comprimento integral. O termo inclui fragmentos de ocorrência natural (tais fragmentos resultando de atividade de protease /n vivo de ocorrência natural) bem como fragmentos engenheirados.
[0141] O termo fragmento como aqui usado pode se referir a um peptídeo ou polipeptídeo compreendendo uma sequência de aminoácido de pelo menos 5 resíduos de aminoácido contíguos, pelo menos 10 resíduos de aminoácido contíguos, pelo menos 15 resíduos de aminoácido contíguos, pelo menos 20 resíduos de aminoácido contíguos, pelo menos 25 resíduos de aminoácido contíguos, pelo menos 40 resíduos de aminoácido contíguos, pelo menos 50 resíduos de aminoácido contíguos, pelo menos 60 resíduos de aminoácido contíguos, pelo menos 70 resíduos de aminoácido contíguos, pelo menos 80 resíduos de aminoácido contíguos, pelo menos 90 resíduos de aminoácido contíguos, pelo menos 100 resíduos de aminoácido contíguos, pelo menos 125 resíduos de aminoácido contíguos, pelo menos 150 resíduos de
Petição 870190070557, de 24/07/2019, pág. 128/401
64/306 aminoácido contíguos, pelo menos 175 resíduos de aminoácido contíguos, pelo menos 200 resíduos de aminoácido contíguo ou pelo menos 250 resíduos de aminoácido contíguos da sequência de aminoácido de uma proteína associada a CRISPR como aqui definido ou um homólogo, variante ou derivado da mesma.
[0142] Um fragmento preferido de uma sequência no contexto da presente invenção consiste em uma extensão contínua de aminoácidos correspondendo a uma extensão contínua de entidades na proteína cujo fragmento é derivado, que representa pelo menos 20%, preferivelmente pelo menos 30%, mais preferivelmente pelo menos 40%, mais preferivelmente pelo menos 50%, ainda mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 70% e sobretudo preferivelmente pelo menos 80% da proteína total (isto é, comprimento total) ou (poli-)peptídeo do qual o fragmento é derivado.
[0143] Uma identidade de sequência indicada com relação a tal fragmento refere-se preferivelmente à sequência de aminoácido inteira da proteína de referência ou à sequência de ácido nucleico inteira codificando a dita proteína de referência. Preferivelmente, um fragmento de uma proteína associada a CRISPR (tais como Cas9 ou Cpf1), ou um homólogo, variante ou derivado da mesma, pode compreender tipicamente uma sequência de aminoácido tendo uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, com a sequência de aminoácido da dita proteína associada a CRISPR (por exemplo, Cas9, Cpf1) ou dito homólogo, variante ou derivado.
Petição 870190070557, de 24/07/2019, pág. 129/401
65/306
Derivados [0144] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente derivados da mesma.
[0145] O termo derivado, quando se referindo a proteínas, deve ser compreendido como uma proteína que foi modificada com relação a uma proteína de referência (ou parental) para incluir uma propriedade ou funcionalidade nova ou adicional. Derivados podem ser modificados para compreender funcionalidades biológicas desejadas (por exemplo, através da introdução ou remoção de porções ou domínios que conferem, melhoram, reduzem ou abolem afinidade ou especificidade de ligação-alvo ou atividades enzimáticas), propriedades de fabricação (por exemplo, através da introdução de porções que conferem uma solubiiidade aumentada ou excreção melhorada ou permitem purificação) ou propriedades farmacocinéticas/farmacodinâmicas para uso médico (por exemplo, através da introdução de porções que conferem estabilidade, biodisponibilidade, absorção aumentadas; distribuição e/ou eliminação reduzida). Derivados podem ser preparados através da introdução ou remoção de uma porção ou domínio que confere uma propriedade ou funcionalidade biológica de interesse. Tais porções ou domínios podem ser introduzidos na sequência de aminoácido (por exemplo, nos resíduos amino e/ou carboxila terminais) pós-traducionalmente ou no nível de sequência de ácido nucleico usando técnicas de engenharia genética padrão (cf. Sambrook, J. e outros, 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York). Um derivado pode ser derivado de (e então opcionalmente inclui) a sequência de proteína associada a CRISPR de ocorrência natural (tipo selvagem) ou uma variante ou segmento da mesma.
[0146] Será compreendido que derivados de proteína associada a
Petição 870190070557, de 24/07/2019, pág. 130/401
66/306
CRISPR podem diferir (por exemplo, por meio de introdução ou remoção de porções de (poli)peptídeo e/ou domínios de proteína) em sua sequência de aminoácido da proteína de referência da qual eles são derivados, e então podem se qualificar como variantes também. No entanto, embora variantes de sequência sejam principalmente definidas em termos de sua identidade de sequência com uma sequência de aminoácido de referência, derivados são preferivelmente caracterizados pela presença ou ausência de uma propriedade ou funcionalidade biológica específica comparado com a proteína de referência.
[0147] Muitos derivados de proteína associada a CRISPR são baseados em variantes, fragmentos, variantes de fragmento ou fragmentos variantes das respectivas proteínas associadas a CRISPR de ocorrência natural (tipo selvagem). Por exemplo, derivados de proteína associada a CRISPR de acordo com a invenção podem incluir derivados baseados em variantes de proteína engenheirados compreendendo mutações que abolem atividade de endonuclease e/ou nickase, que foram engenheirados mais para incluir domínios efetores e adaptadores conferindo propriedades ou funcionalidades biológicas novas ou adicionais. [0148] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção então codifica um derivado de proteína associada a CRISPR (por exemplo, Cas9, Cpf1) como aqui definido, em que o dito derivado compreende pelo menos um domínio efetor adicional.
[0149] Um domínio efetor deve ser compreendido como uma porção de proteína que confere uma propriedade e/ou funcionalidade biológica adicional e/ou nova. No contexto da presente invenção, domínios efetores podem ser selecionados com base em sua capacidade de conferir uma função biológica (nova ou adicional) à proteína associada a CRISPR, preferivelmente sem interferir com sua habilidade em se associar com um RNA-guia adequado para especificamente interagir com uma sequência de DNA-alvo. A função biológica nova ou adicional pode
Petição 870190070557, de 24/07/2019, pág. 131/401
67/306 ser, por exemplo, repressão (indução de interferência de CRISPR, CRISPRi) ou ativação transcripcional (indução de ativação de CRISPR, CRISPRa). Domínios efetores de interesse no contexto da presente invenção podem então ser selecionados para domínios repressores transcripcionais, domínios box associados a Krüppel (KRAB), domínios de proteína de interação MAX 1 (MXI1), quatro domínios mSin3 concatenados (SID4X) ou domínios de ativação de transcrição, incluindo domínios de ativação VP16 do herpes simplex (VP64 ou VP160), domínio de ativação de subunidade de transativação de fator-κΒ (NF-κΒ) (p65AD). Tal(ais) domínio(s) efetor(es) pode(m) serfundido(s) a qualquer terminal amino (N-) ou carboxila (C-) da proteína associada a CRISP, ou ambos. Com domínios efetores adequados, transcrição pode ser também regulada no nível epigenético. Histona desmetilase LSD1 remove a marca de desmetilação de histona 3 em Lys4 (H3K4me2) dos potencializadores distais direcionados, levando à repressão de transcrição. O núcleo catalítico da histona acetiltransferase p300 (p300Núcleo) pode acetilar H3K27 (H3K27ac) em potencializadores proximais e distais direcionados, o que leva à ativação de transcrição. A funcionalidade biológica nova ou adicional pode, ainda ou alternativamente, ser o recrutamento de domínios efetores de interesse. Para esta finalidade, o domínio efetor pode ser um domínio de recrutamento”, preferivelmente um domínio ou motivo de interação proteína-proteína, tais como motivos WRPW (TrpArg-Pro-Trp) (Fisher e outros. Mol Cell Biol. 1996 Jun; 16(6):2670-7). A função biológica nova ou adicional pode, ainda ou alternativamente, ser o recrutamento de outras entidades de interesse, tais como RNAs. Para esta finalidade, o domínio efetor pode ser selecionado de domínios de interação de proteína-RNA, tal como domínio de choque térmico (CSD). [0150] Derivados de proteína associada a CRISPR compreendendo um domínio efetor então incluem (a) proteínas associadas a CRISPR
Petição 870190070557, de 24/07/2019, pág. 132/401
68/306 (ou homólogos, variantes, fragmentos das mesmas) que são diretamente fundidas (opcionalmente através de um ligante adequado) domínios efetores capazes de interagir com a sequência de DNA-alvo (ou elementos reguladores operavelmente ligados à mesma) e (b) proteínas associadas a CRISPR (ou homólogos, variantes, fragmentos das mesmas) que são fundidas a (opcionalmente através de um ligante adequado) domínios efetores que recrutam efetores adicionais (domínios, proteínas ou ácidos nucleicos) de interesse, que são, por sua vez, capazes de interagir com a sequência de DNA-alvo (ou elementos reguladores operavelmente ligados à mesma).
[0151] Domínios efetores podem ser fundidos a proteínas associadas a CRISPR (ou variantes ou fragmentos das mesmas), opcionalmente através de um ligante adequado (peptídeo), usando técnicas padrão de engenharia genética (cf. Sambrook, J. e outros., 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York).
[0152] Ligantes peptídicos de interesse são geralmente conhecidos na técnica e podem ser classificados em três tipos: ligantes flexíveis, ligantes rígidos e ligantes clivávels. Ligantes flexíveis são geralmente aplicados quando os domínios unidos requerem um certo grau de movimento ou interação, e são então de interesse particular no contexto de derivados de proteína associada a CRISPR da presente invenção. Eles são geralmente ricos em aminoácidos pequenos, não polares (por exemplo, Gly) ou polares (por exemplo, Ser ou Thr) para prover flexibilidade e solubilidade bodas, e permitir a mobilidade dos domínios de proteína conectados. A incorporação de Ser ou Thr pode manter a estabilidade do ligante em soluções aquosas através de formação de ligações hidrogênio com moléculas de água, e então reduzir interações desfavoráveis entre o ligante e as porções de proteína.
Petição 870190070557, de 24/07/2019, pág. 133/401
69/306 [0153] Os ligantes flexíveis mais comumente usados têm sequências consistindo principalmente em extensões de resíduos Gly e Ser (ligante !'GS). Um exemplo do ligante flexível mais amplamente usado tem a sequência de (Gly-Gly-Gly-Gly-Ser)n. Ao ajustar o número de cópia η, o comprimento deste ligante GS pode ser otimizado para obter separação apropriada dos domínios de proteína, ou manter as interações interdomínio necessárias. Além dos ligantes GS, muitos outros ligantes flexíveis foram projetados para proteínas de fusão recombinantes. Esses ligantes flexíveis são também ricos em aminoácidos pequenos ou polares tais como Gly e Ser, mas podem conter aminoácidos adicionais tais como Thr e Ala para manter flexibilidade, bem como aminoácidos polares tais como Lys e Glu para melhorar a solubilidade.
[0154] Vários outros tipos de ligantes flexíveis, incluindo KESGSVSSEQLAQFRSLD, EGKSSGSGSESKST e GSAGSAAGSGEF, foram aplicados para a construção de proteínas de fusão. Outros ligantes flexíveis incluem ligantes apenas de glicina (Gly)s ou (Gly)e.
[0155] Ligantes rígidos podem ser empregados quando separação dos domínios de proteína e redução de sua interferência tiverem que ser assegurados. Ligantes cliváveis, por outro lado, podem ser introduzidos para liberar domínios funcionais livres in vivo. Chen e outros, Adv Drug Deliv Rev. 2013 Out 15; 65(10): 1357-1369, revisam os ligantes peptídicos mais comumente usados e suas aplicações, e é aqui incorporado a título de referência em sua totalidade.
[0156] Além da fusão dos domínios efetores desejados à proteína associada a CRISP, há várias abordagens alternativas para mediação de um efeito biológico desejado sobre uma sequência-alvo de interesse. Essas abordagens utilizam essencialmente proteínas associadas a CRISPR (ou RNAs-guia) que são capazes de recrutar domínios efetores de interesse para a sequência de DNA-alvo. Essas abordagens podem prover opções adicionais e flexibilidade para recrutamento multiplex de
Petição 870190070557, de 24/07/2019, pág. 134/401
70/306 domínios efetores para uma sequência de DNA-aivo específica de interesse (tal como um promotor ou potencializador).
[0157] O método de ativação SunTag usa uma disposição de marcadores de epítopo de peptídeo pequenos fundidos a uma proteína associada a CRISP (por exemplo, dCas9) para recrutar cópias múltiplas de fragmento variável de cadeia simples (scFv) fundido à GFP super dobradora (sfGFP); para melhoria da dobra de proteína), fundido a (um) domínio(s) efetor(es), por exemplo, VP64. O método de ativação tripartido sinérgico (VPR) usa uma fusão em tandem de três domínios efetores (por exemplo, ativadores de transcrição, VP64, p65 e o transativador R do vírus Epstein-Barr (Rta)), para conferir a funcionalidade biológica desejada. O sistema de recrutamento à base de aptâmero (mediador de ativação sinérgico (SAM)) utiliza uma proteína associada a CRISPR (por exemplo, dCas9) com um RNA-guia com dois sítios de ligação (por exemplo, aptâmeros de RNA no tetraloop e o segundo tronco-aiça) para recrutar a proteína de revestimento MS2 de fago (MCP) que é fundida aos domínios efetores (por exemplo, ativadores transcripcionais, tais como p65 e fator de choque térmico 1 (HSF1)). Ainda, domínios efetores adicionais (por exemplo, VP64) podem ser fundidos à proteína associada a CRISPR, provendo um derivado de acordo com a presente invenção.
[0158] Os métodos de ativação descritos acima podem ser prontamente adaptados para conferir função de repressão transcripcional, ou outras funcionalidades biológicas desejadas, às proteínas associadas a CRISPR ou seus homólogos, variantes, fragmentos ou derivados como descrito aqui. Derivados de proteína associada a CRISPR e várias abordagens para mediação de CRISPRa e CRISPR! são revistos em Dominguez e outros, Nat Rev Mol Ceil Biol. 2016 Jan;17(1):5-15, que é aqui incorporado a título de referência em sua totalidade.
Petição 870190070557, de 24/07/2019, pág. 135/401
71/306
Peptídeos de Sinal [0159] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção compreende pelo menos uma sequência de ácido nucleico codificando peptídeo de sinal. A dita sequência de ácido nucleico está preferivelmente localizada dentro da região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos um peptídeo de sinal.
[0160] Um peptídeo de sinal (algumas vezes referido como sequência de sinal, sinal de direcionamento, sinal de localização, sequência de localização, peptídeo de trânsito, sequência líder ou peptídeo líder) é tipicamente um peptídeo curto (5-30 aminoácidos de comprimento) preferivelmente localizado no terminal N da proteína associada a CRISPR codificada (ou um homólogo, variante, fragmento ou um derivado da mesma).
[0161] Peptídeos de sinal preferivelmente fazem a mediação do transporte da proteína associada a CRISPR codificada (ou um homólogo, variante, fragmento ou derivado da mesma) para um compartimento celular definido, por exemplo, a superfície celular, o retículo en~ doplásmico (ER) ou o compartimento endossomal-lisossomal. Peptídeos de sinal são então inter alia úteis a fim de facilitar a excreção de proteínas expressas de uma linhagem de célula de produção.
[0162] Peptídeos de sinal exemplares compreendidos no contexto da presente invenção incluem, sem ser limitado aos mesmos, sequências de sinal de moléculas do MHC clássicas ou não classificas (por exemplo, sequências de sinal de moléculas do MHC I e II, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 136/401
72/306 da molécula do MHC classe I HLA-A*0201), sequências de sinal de citocinas ou imunoglobulinas, sequências de sinal da cadeia invariante de imunoglobulinas ou anticorpos, sequências de sinal de Lampl, Tapasina, Erp57, Calreticulina, Calnexina, PLAT, EPO ou albumina e ainda proteínas associadas à membrana ou de proteínas associadas com o retículo endoplásmico (ER) ou o compartimento endossomal-lisossomal. Sobretudo preferivelmente, sequências de sinal são derivadas de HLA-A2 (humana), PLAT (humana), sEPO (humana), ALB (humana), IgE-líder (humana), CD5 (humana), IL 2 (humana), CTRB2 (humana), IgG-HC (humana), Ig-HC (humana), Ig-LC (humana), GpLuc, Igkappa (humana) ou um fragmento ou variante de qualquer uma das proteínas mencionadas acima, em particular HLA-A2, HsPLAT, sHsEPO, HsALB, HsPLAT(aa1-21), HsPLAT(aa1-22), IgE-líder, HsCD5(aa1-24), HslL2 (aa1-20), HsCTRB2(aa1-18), lgG-HC(aa1-19), lg-HC(aa1-19), Ig-LC (aa1-19), GpLuc(1-17) ou Mmlgkappa. A presente invenção compreende o uso das sequências de sinal mencionadas acima, ou variantes ou fragmentos das mesmas, contanto que essas variantes ou fragmentos sejam funcionais, isto é, capazes de direcionamento da proteína associada a CRISPR a um local (intra- ou extra)celular de interesse.
[0163] A sequência de ácido nucleico codificando o dito peptídeo de sinal é preferivelmente fundida à sequência de ácido nucleico codificando a proteína associada à CRISPR (ou seu homólogo, variante, fragmento ou derivado) na região de codificação do ácido nucleico artificial da invenção através de técnicas de engenharia genética padrão (cf. Sambrook, J. e outros, 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York). Expressão da dita região de codificação fornece preferivelmente uma proteína associada a CRISPR compreendendo (preferivelmente em seu terminal N, terminal C ou ambos), o peptídeo de sinal codificado.
Petição 870190070557, de 24/07/2019, pág. 137/401
73/306
Sequência de localização nuclear (NLS) [0164] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender ainda preferivelmente uma sequência de ácido nucleico codificando pelo menos uma sequência de localização nuclear (NLS). A dita sequência de ácido nucleico está preferivelmente localizada na região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos uma sequência de localização nuclear (NLS).
[0165] Um sinal ou sequência de localização nuclear (NLS) é uma extensão curta de aminoácidos que faz a mediação do transporte de proteínas nucleares para o núcleo. Uma proteína associada a CRISPR codificada pelo ácido nucleico artificial da invenção é particularmente pretendida para terapia e pesquisa em células de mamífero, elas podem ser dotadas de pelo menos uma NLS a fim de permitir sua importação para o núcleo onde elas podem exercer seus efeitos sobre DNA genômico, a NLS preferivelmente interage com complexos de poro nuclear (NPCs) no envelope do núcleo, desta maneira facilitando o transporte da proteína associada a CRISPR para o núcleo.
[0166] Uma variedade de sequências de NLS é conhecida na técnica, e seu uso (ou adaptação para uso) de acordo com a presente invenção está dentro das habilidades e conhecimentos comuns do versado na técnica. O melhor sinal de transporte caracterizado é a NLS clássica (cNLS) para importação de proteína nuclear, que consiste em ou uma (monopartida) ou duas (bipartidas) extensões de aminoácidos básicos. Tipicamente, o motivo monopartido é caracterizado por um agrupamento de resíduos básicos precedidos por um resíduo de quebra
Petição 870190070557, de 24/07/2019, pág. 138/401
74/306 de hélice. Similarmente, o motivo bipartido consiste em dois agrupamentos de resíduos básicos separados por 9-12 resíduos. cNLSs monopartidas são exemplificadas pela NLS de antígeno T grande SV40 (126PKKKRRV132; SEQ ID NO: 381) e cNLSs bipartidas são exemplificadas pela NLS de nucleoplasmina (155KRPAATKKAGQAKKKK170; SEQ ID NO: 382). Resíduos consecutivos da lisina N~terminal da NLS monopartida são referidos como P1, P2, etc. cNLS monopartidas requerem tipicamente uma lisina na posição P1, seguido por resíduos básicos nas posições P2 e P4 para prover uma sequência de consenso livre K(K/R)X(K/R) (SEQ ID NO: 384; Lange e outros, J. Biol. Chem. 2007 Fev 23; 282(8): 5101-5105).
[0167] É desta maneira pretendido, de acordo com modalidades preferidas, que a molécula de ácido nucleico artificial compreenda ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS). A molécula de ácido nucleico artificial de acordo com a invenção pode então codificar 1, 2, 3, 4, 5 ou mais NLS, que são opcionalmente selecionadas da NLS exemplificada aqui. A dita sequência de ácido nucleico de codificação de NLS está preferivelmente localizada na região de codificação do ácido nucleico artificial da invenção e é preferivelmente fundido à sequência de ácido nucleico codificando a proteína associada a CRISPR, de modo que expressão da dita região de codificação provê uma proteína associada a CRISPR compreendendo a dita pelo menos uma NLS, preferivelmente em seu terminal N, terminal C ou ambos. Em outras palavras, a molécula de ácido nucleico artificial de acordo com a invenção pode preferivelmente codificar uma proteína associada a CRISPR compreendendo pelo menos uma NLS, preferivelmente em seu terminal N, terminal C ou ambos.
[0168] Uma NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de
Petição 870190070557, de 24/07/2019, pág. 139/401
75/306 acordo com a SEQ ID NO: 426 (MAPKKKRKVGIHGVPAA), também referida aqui como NLS2, que pode ser codificada por uma sequência de ácido nucleico de acordo com qualquer uma da SEQ ID NOs: 409; 2538, 1378; 3698; 4858; 6018; 7178; ou 8338, ou uma variante ou fragmento (funcional) de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende o uso de variantes ou fragmentos de NSL2, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com a SEQ ID NO: 426.
[0169] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 427 (KRPAATKKAGQAKKKK), também referida aqui como NLS4, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539; 1379; 3699; 4859;
Petição 870190070557, de 24/07/2019, pág. 140/401
76/306
6019; 7179; 8339, ou uma variante ou fragmento (funcional) de quaiquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende ainda o uso de variantes ou fragmentos de NSL4, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com SEQ ID NO: 427.
[0170] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 427 (KRPAATKKAGQAKKKK), também referida aqui como NLS4, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539; 1379; 3699; 4859; 6019; 7179; 8339, ou uma variante ou fragmento (funcional) de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%,
Petição 870190070557, de 24/07/2019, pág. 141/401
77/306
30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende ainda o uso de variantes ou fragmentos de NSL4, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com SEQ ID NO: 427.
[0171] É ainda compreendido aqui equipar a proteína associada a CRISPR com duas ou mais NLSs, e essas NLSs podem, por exemplo, ser selecionadas de NLS2 (caracterizada por SEQ ID NO: 426) e NLS4 (caracterizada por SEQ ID NO: 427) ou uma variante ou fragmento funcional de um ou ambos esses sinais de localização nuclear.
[0172] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 10575 (KRPAATKKAGQAKKKK), também referida aqui como NLS3, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539 1379; 3699; 4859; 6019; 7179; 8339, 10551; 10581, 10593; 10584; 10587; 10590;
Petição 870190070557, de 24/07/2019, pág. 142/401
78/306
10593; 10596, ou uma variante ou fragmento (funcional) da mesma de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende o uso de variantes ou fragmentos de NLS3, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com a SEQ ID NO: 427.
[0173] Desta maneira, sequências de NLS preferidas podem compreender ou consistir em uma sequência de aminoácido de acordo com as SEQ ID NO:426; 427; 10575; 381; 382; 384; 11957; 11958-11964 que podem ser codificadas por uma sequência de ácido nucleico de acordo com 409; 2538; 410; 2539: 10551; 10581; 11973; 11974-1198, 1378; 3698; 4858; 6018; 7178; 8338: 1379; 3699; 4859; 6019: 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005: 12013; 11966-11972; 11982-11988; 11990
Petição 870190070557, de 24/07/2019, pág. 143/401
79/306
11996; 11998-12004; 12006-12012; ou 12014-12020.
[0174] NLS preferidas adicionais podem compreender ou consistir em uma sequência de aminoácido de acordo com as SEQ ID NOs: 12021-14274.
[0175] As sequências de NLS como acima descrito são uma lista não iimitante de NLS geralmente usadas e aceitas. É compreendido que qualquer uma das enzimas de edição de gene mencionadas aqui, por exemplo, Cas9 ou Cpf1, pode ser combinada com qualquer outra NLS como conhecido na técnica e com qualquer número de sequências de NLS em uma sequência. Também combinações de sequências de NLS diferentes são convertidas pela descrição da invenção acima.
[0176] Também estão compreendidas no ensinamento da invenção sequências codificando uma proteína de edição de gene como revelado aqui ou na listagem de sequências compreendendo qualquer NLS como aqui revelado ou conhecido na técnica em qualquer número e/ou combinação de NLS (isto é, 573’ NLS).
Marcadores de proteína e peptídeo [0177] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção compreende ainda pelo menos uma sequência de ácido nucleico codificando marcador de proteína ou peptídeo. A dita sequência de ácido nucleico está preferivelmente localizada dentro da região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos um marcador de proteína ou peptídeo.
[0178] Marcadores de proteína e peptídeo são sequências de ami
Petição 870190070557, de 24/07/2019, pág. 144/401
80/306 noácido que podem ser introduzidas em proteínas de interesse para permitir purificação, detecção, localização ou para outros propósitos. Marcadores de proteína e peptídeo podem ser classificados com base em sua função e incluem, sem limitação, marcadores de afinidade (tal como proteína de ligação à quitina (CBP), proteína de ligação à maltose (MBP), glutationa-S-transferase (GST), marcadores de poli(His), marcadores de Fc, marcadores de Strep), marcadores de solubílização (tais como tiorredoxina (TRX) e poli(NANP)), marcadores de cromatografia (tais como marcadores de FLAG), marcadores de epítopo (marcador de V5, marcador de Myc, marcador de HA e marcador de NE), marcadores fluorescentes (tais como marcadores de GFP) ou outros (marcador de Av, permite biotinilação e subsequente isolamento).
[0179] A molécula de ácido nucleico artificial de acordo com a invenção pode então codificar 1,2, 3,4,5 ou mais marcadores de proteína ou peptídeo, que são opcionalmente selecionados dos marcadores de proteína exemplificados aqui. A dita sequência de ácido nucleico codificando marcador de proteína ou peptídeo está preferivelmente localizada na região de codificação da molécula de ácido nucleico artificial da invenção, e é preferivelmente fundida à sequência de ácido nucleico codificando a proteína associada a CRISPR, de modo que expressão da dita região de codificação provê uma proteína associada a CRISPR compreendendo o dito pelo menos um marcador de proteína ou peptídeo. Em outras palavras, a molécula de ácido nucleico artificial de acordo com a invenção pode preferivelmente codificar uma proteína associada a CRISPR compreendendo pelo menos um marcador de proteína ou peptídeo. Meios e métodos para introdução de ácidos nucleicos codificando tais marcadores de proteína ou peptídeo estão dentro das habilidades e conhecimento comum do versado na técnica.
[0180] A molécula de ácido nucleico artificial, preferivelmente RNA, da presente invenção pode codificar uma proteína associada a CRISPR
Petição 870190070557, de 24/07/2019, pág. 145/401
81/306 (tal como cas9, Cpf1) exibindo qualquer um dos traços ou características acima, se adequado ou necessário, em qualquer combinação umas com as outras, contanto que os traços ou características não interfiram uns com os outros. Desta maneira, a molécula de ácido nucleico artificial, em particular RNA, pode codificar qualquer proteína associada a CRISPR exemplificada aqui, ou um homólogo, variante, fragmento ou derivado da mesma, como aqui definido, que pode compreender uma ou mais NLSs, e opcionalmente uma ou mais sequências de sinal e/ou marcadores de proteína ou peptídeo, contanto que a proteína associada a CRISPR codificada (e a NLS, sequência de sinal, marcador de proteína/peptídeo) preferivelmente retenha sua função ou propriedade biológica desejada, como acima definido.
[0181] Também estão compreendidas nos ensinamentos da invenção todas as sequências tendo um marcador de proteína ou peptídeo sem a(s) dita(s) sequência(s) de marcador que foi(foram) introduzida(s) para purificação, detecção, localização ou para outros propósitos. Em outras palavras, uma sequência que é revelada na listagem de sequência com um marcador de proteína ou peptídeo é também claramente compreendida nos ensinamentos da invenção quando a sequência de marcador é removida. Um versado na técnica é prontamente capaz de remover qualquer sequência de marcador de uma sequência de proteína marcada, isto é, usar também as sequências da invenção em uma forma não marcada. O mesmo é verdadeiro para sequências de troncoalça de PolyC e histona que poderíam ser facilmente removidas da ou também adicionadas à proteína, se desejado.
Cas9 [0182] Cas9 refere-se a endonucleases de DNA CRISPR-Cas Tipo II guiadas por RNA, que podem ser codificadas pelo gene cas9 de Streptococcus pyogenes sorotipo M1 (Sequência de Referência NCBI: NCJ002737.2, SPy1046; S. pyogenes) i.e. spCas9, ou um homólogo,
Petição 870190070557, de 24/07/2019, pág. 146/401
82/306 variante ou fragmento da mesma. Cas9 pode ser preferivelmente recrutada por um RNA-guia (gRNA) para clivar, especificamente de sítio, uma sequência de DNA-alvo usando dois domínios de endonuclease distintos (domínios tipo H de HNH e RuVC/RNase), um para cada filamento da hélice dupla do DNA. RuvC e HNH juntos produzem quebras de filamento duplo (DSBs), e podem produzir separadamente quebras de filamento simples (Pedido de Patente Publicado U.S. No.2014-0068797 e Jinek M. e outros, Science. 2012 Ago 17;337(6096):816-21). Cas9 é preferivelmente capaz de reconhecer especificamente (e preferivelmente se ligar a) um motivo adjacente protoespaçador (RAM) justaposto à sequência de DNA-alvo. O RAM está tipicamente localizado na 3’ do DNAalvo e pode compreender ou consistir na sequência de três nucleotídeos NGG. Ele é tipicamente reconhecido pelo domínio de interação de PAM (domínio PI) localizado próximo do terminal C de Cas9.
[0183] Um grande número de proteínas Cas9 é conhecido na técnica e compreendido como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cas9 adequadas são listadas na Tabela 2 abaixo. Nela, cada fileira corresponde a uma proteína Cas9 como identificado pelo número de acesso do banco de dados da proteína correspondente (primeira coluna, A, No. Ac). A segunda coluna na Tabela 2 (B) indica a SEQ ID NO: correspondendo à respectiva sequência de aminoácido como provido aqui. Proteínas Cas9 preferidas são mostradas na listagem de sequência sob SEQ ID NO:428-441; SEQ ID NO: 10999-11001; e SEQ ID NO:442-1345. As sequências de mRNA otimizadas correspondentes que são modalidade preferida da invenção são mostradas na listagem de sequência sob SEQ ID NO:411; 25402553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 1147311475; 11591-11593; 11709-11711; 11827-11829: 11945-11947; 13942297; 3714-4617; 4874-5777; 6034-6937; 7194-8097; e 8354-9257.
Petição 870190070557, de 24/07/2019, pág. 147/401
83/306
Sequências de Aminoácido
Tabela 2. Proteínas Cas9 da invenção
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
1 | Q99ZW2 | Cas9_Q99ZW2_prot | 428 |
2 | A0Q5Y3 | Cas9_A0Q5Y3__prot | 429 |
3 | J7RUA5 | Cas9_J7RLJA5_prot | 430 |
4 | G3ECR1 | Cas9j33ECR1_prot | 431 |
5 | J3F2B0 | Cas9_J3F2B0__prot | 432 |
6 | Q03JI6 | Cas9__Q03JI6___prot | 433 |
7 | C9X1G5 | Cas9__C9X1 G5_prot | 434 |
8 | Q927P4 | Cas9__Q927P4__prot | 435 |
9 | Q8DTE3 | Cas9_Q8DTE3__prot | 436 |
10 | Q9CLT2 | Cas9___Q9CLT2___prot | 437 |
11 | A1IQ68 | Cas9_A1 IQ68__prot | 438 |
12 | Q6NKI3 | Cas9_Q6NKI3__prot | 439 |
13 | Q0P897 | Cas9__Q0P897_prot | 440 |
14 | Q03LF7 | Cas9__Q03LF7___prot | 441 |
15 | T0TDV9 | Cas9__T0TDV9_prot | 442 |
16 | A0A0D8BYB2 | Cas9__A0A0D8BYB2__prot | 443 |
17 | A0A0M4TTU2 | Cas9_A0A0M4TTU2„prot | 444 |
18 | A7H5P1 | Cas9_A7H5P1__prot | 445 |
19 | A0A0W8KZ82 | Cas9_A0A0W8KZ82_prot | 446 |
20 | A0A0E1ZMQ3 | Cas9_A0A0E1ZMQ3_prot | 447 |
21 | W8KE67 | Cas9_W8KE67_prot | 448 |
22 | A0A0B6V308 | Cas9__A0A0B6V308_prot | 449 |
23 | A0A1E7PM50 | Cas9_A0A1 E7PM50_prot | 450 |
24 | A0A1E7P6J5 | Cas9_A0A1 E7P6J5...prot | 451 |
25 | A0A1D9BML5 | Cas9_A0A1 D9BML5_prot | 452 |
26 | A5KEK9 | Cas9_A5KEK9__prot | 453 |
27 | D2MWB9 | Cas9__D2MWB9__prot | 454 |
28 | A0A0H4KTI1 | Cas9_A0A0H4KTI 1„.prot | 455 |
29 | A0A0D7V4T2 | Cas9..A0A0D7V4T2....prot | 456 |
30 | A0A059HXJ1 | Cas9_A0A059HXJ1_prot | 457 |
Petição 870190070557, de 24/07/2019, pág. 148/401
84/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
31 | A0A1E7NYV5 | Cas9__A0A1 E7NYV5„prot | 458 |
32 | A0A1E7P943 | Cas9„ A0A1 E7P943_prot | 459 |
33 | A0A0E2UY67 | Cas9__A0A0E2UY67_prot | 460 |
34 | A0A1B3X857 | Cas9__A0A1 B3X857__prot | 461 |
35 | A0A0E9LLC5 | Cas9.,A0A0E9LLC5....prot | 462 |
36 | A0A125S8M1 | Cas9_A0A125S8M1__prot | 463 |
37 | A0A0S8HUJ8 | Cas9_A0A0S8HUJ8__prot | 464 |
38 | A0A0A8GXC3 | Cas9_A0A0A8GXC3_prot | 465 |
39 | A0A0A8GU36 | Cas9_A0A0A8GU36_prot | 466 |
40 | A0A139BVD9 | Cas9_A0A 139B VD9_prot | 467 |
41 | A3VED0 | Cas9__A3VED0__prot | 468 |
42 | A0A0A8HTA3 | Cas9..,A0A0A8HTA3...prot | 469 |
43 | A0A125S8L7 | Cas9_A0A125S8L7mprot | 470 |
44 | T2LKS6 | Cas9_T2LKS6__prot | 471 |
45 | A0A0A8H849 | Cas9_A0A0A8H849_prot | 472 |
46 | F5S4M8 | Cas9...F5S4M8...prot | 473 |
47 | G1UFN3 | Cas9__G 1U F N 3__prot | 474 |
48 | B5ZLK9 | Cas9__B5ZLK9__prot | 475 |
49 | C5ZYI3 | Cas9_C5ZYI3__prot | 476 |
50 | A0A0G3EK96 | Cas9___.A0.A0G3EK9S___prot | 477 |
51 | A0A125S8M5 | Cas9_A0A125S8M5__prot | 478 |
52 | A0A0L6CQ85 | Cas9__A0A0L6CQ85__prot | 479 |
53 | A0A0L8B0U9 | Cas9..AOAOL8BOU9..jorot | 480 |
54 | A0A178N1Y8 | Cas9_A0A178N1 Y8__prot | 481 |
55 | A0A125S8I0 | Cas9__AOA125S8IO__prot | 482 |
56 | A0A0A1PPJ7 | Cas9__A0A0A1 PPJ7__prot | 483 |
57 | B8I085 | Cas9__B8l085__prot | 484 |
58 | A0A1B8J9V3 | Cas9_A0A1 B8J9V3_prot | 485 |
59 | I7GTK8 | Cas9J7GTK8_prot | 486 |
60 | D3UFL8 | Cas9__D3UFL8_prot | 487 |
61 | E1VQA3 | Cas9__E1VQA3_prot | 488 |
62 | M4V7E7 | Cas9__M4V7E7__prot | 489 |
63 | F4GDP9 | Cas9__F4GDP9__prot | 490 |
Petição 870190070557, de 24/07/2019, pág. 149/401
85/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
64 | A0A0Q6WIJ3 | Cas9__A0A0Q6WIJ3__prot | 491 |
65 | A0A0E9L8G0 | Cas9._A0A0E9L8G0.prot | 492 |
66 | A0A0A1VBC9 | Cas9_A0A0A 1 VBC9_prot | 493 |
67 | B1GZM3 | Cas9__B1GZM3__prot | 494 |
68 | A0A1C0W3U5 | Cas9_A0A1C0W3U5„prot | 495 |
69 | D5BR51 | Cas9_.D5BR51_.prot | 496 |
70 | A0A1A7NZJ6 | Cas9_A0A1A7NZJ6__prot | 497 |
71 | A0A125S8J2 | Cas9_A0A125S8J2_prot | 498 |
72 | A0A0A2YBT2 | Cas9_A0A0A2YBT2_.prot | 499 |
73 | A0A099UFG2 | Cas9_A0A099UFG2_prot | 500 |
74 | A0A0C5JLX1 | Cas9__A0A0C5JLX1_prot | 501 |
75 | A7HP89 | Cas9_.A7HP89_.prot | 502 |
76 | A0A0J6BUV9 | Cas9_A0A0J6BUV9_prot | 503 |
77 | A0A1C9ZTA2 | Cas9_A0A 1C9ZT A2__prot | 504 |
78 | A0A087N7M8 | Cas9_A0A087N7M8__prot | 505 |
79 | A0A0Q9CTQ5 | Cas9_A0A0Q9CTQ5_prot | 506 |
80 | A0A101I188 | Cas9_A0A 1011188_prot | 507 |
81 | V2Q0I9 | Cas9_V2QOI9_prot | 508 |
82 | F9ZKQ5 | Cas9_F9ZK.Q5_.prot | 509 |
83 | F0Q2T1 | Cas9...F0Q2T1...prot | 510 |
84 | M4R7E0 | Cas9__M4R7E0_prot | 511 |
85 | T1DV82 | Cas9_T 1 DV82_prot | 512 |
86 | W0Q6X6 | Cas9__W0Q6X6_prot | 513 |
87 | A0A0E9MLX9 | Cas9.A0A0E9MLX9.prot | 514 |
88 | A0A0D6MWC5 | Cas9_A0A0D6MWC5__prot | 515 |
89 | A0A087MCH0 | Cas9_A0A087MCH0_prot | 516 |
90 | I3TWJ0 | Cas9_.l3TWJ0_.prot | 517 |
91 | A0A011P7F8 | Cas9__A0A011 P7F8...prot | 518 |
92 | A0A163RXL7 | Cas9_A0A163RXL7_prot | 519 |
93 | A9HKP2 | Cas9_A9HKP2_prot | 520 |
94 | A0A0N1EBR4 | Cas9_A0A0N1 EBR4_prot | 521 |
95 | A0A0A8HLU7 | Cas9__A0A0A8HLU7__prot | 522 |
96 | E1W6G3 | Cas9_E1W6G3__prot | 523 |
Petição 870190070557, de 24/07/2019, pág. 150/401
86/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
97 | J4KDT3 | Cas9_J4KDT3_prot | 524 |
98 | E3CY56 | Cas9_E3CY56_prot | 525 |
99 | J7RUA5 | Cas9__J7RUA5_prot | 526 |
100 | A0A151A3A4 | Cas9_A0A 151 A3A4__prot | 527 |
101 | A0A1E5TL62 | Cas9_A0A1 E5TL62...prot | 528 |
102 | M4S2X5 | Cas9_M4S2X5__prot | 529 |
103 | E0F2V7 | Cas9__E0F2V7__prot | 530 |
104 | A0A0N7KBI5 | Cas9_A0A0N7KBI5_prot | 531 |
105 | A0A133QCR3 | Cas9__A0A133QCR3_prot | 532 |
106 | K0G350 | Cas9__K0G350_prot | 533 |
107 | U5ULJ7 | Cas9__U5ULJ7__prot | 534 |
108 | F0ET08 | Cas9_F0ET08_prot | 535 |
109 | A0A0S2F228 | Cas9_A0A0S2F228_prot | 536 |
110 | A0A060QC50 | Cas9_A0A060QC50__prot | 537 |
111 | C5S1N0 | Cas9__C5S1 NO_prot | 538 |
112 | A0A0K1NCD0 | Cas9_A0A0K1 NCD0...prot | 539 |
113 | A0A099TTS6 | Cas9__A0A099TTS6__prot | 540 |
114 | A0A0D2SXK1 | Cas9__A0A0D2SXK1__prot | 541 |
115 | A0A1E4MWW9 | Cas9__A0A1 E4MWW9_prot | 542 |
116 | A0A0M3VQX7 | Cas9_A0A0M3VQX7„prot | 543 |
117 | A0A0T0PVC7 | Cas9_A0A0T0PVC7_prot | 544 |
118 | Q7MRD3 | Cas9_Q7MRD3_prot | 545 |
119 | A0A160JE60 | Cas9„ A0A 160J E60...prot | 546 |
120 | J6LE60 | Cas9__J6LE60__prot | 547 |
121 | A0A0P1D4L3 | Cas9_A0A0P1 D4L3__prot | 548 |
122 | A0A176I8B4 | Cas9__A0A176l8B4__prot | 549 |
123 | A0A143DGZ8 | Cas9.,A0A143DGZ8...prot | 550 |
124 | G2ZYP2 | Cas9_G2ZYP2__prot | 551 |
125 | A6VLA7 | Cas9_A6VLA7__prot | 552 |
126 | A0A151APJ0 | Cas9..A0A151APJ0....prot | 553 |
127 | V9H606 | Cas9__V9H606_prot | 554 |
128 | A0A0D6XNZ8 | Cas9__A0A0D6XNZ8__prot | 555 |
129 | Q13CC2 | Cas9__Q13CC2__prot | 556 |
Petição 870190070557, de 24/07/2019, pág. 151/401
87/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
130 | A5EIM8 | Cas9__A5EIM8__prot | 557 |
131 | B1UZL4 | Cas9_B1UZL4_prot | 558 |
132 | B1BJM3 | Cas9__B1 BJM3_prot | 559 |
133 | Q20XX4 | Cas9__Q20XX4__prot | 560 |
134 | A0A125S8L3 | Cas9___A0A125S8L3___prot | 561 |
135 | A0A0B8Z713 | Cas9_A0A0B8Z713_prot | 562 |
136 | A0A150D6Y2 | Cas9__A0A150D6Y2__prot | 563 |
137 | A1WH93 | Cas9_A1WH93_prot | 564 |
138 | R8LDU5 | Cas9_R8LDU5_prot | 565 |
139 | A0A0F7K1T5 | Cas9_A0A0F7K1T5_prot | 566 |
140 | R8NC81 | Cas9__R8NC81__prot | 567 |
141 | A0A0P7L7M3 | Cas9_A0A0P7L7M3„prot | 568 |
142 | F0PZE9 | Cas9_F0PZE9__prot | 569 |
143 | C2UN05 | Cas9__C2UN05__prot | 570 |
144 | T0HC86 | Cas9__T0HC86__prot | 571 |
145 | R5QL13 | Cas9_R5QL.13_.prot | 572 |
146 | A0A0J0YQ19 | Cas9_A0A0J0YQ19_prot | 573 |
147 | A0A196P6K7 | Cas9_A0A196P6K7_prot | 574 |
148 | R6QL84 | Cas9_R6QL84__prot | 575 |
149 | A0A0J5QZM1 | Cas9...A0A0J5QZM1...prot | 576 |
150 | A0A0P1ETF1 | Cas9_A0A0P1 ETF1_prot | 577 |
151 | A0A125S8J5 | Cas9_A0A125S8J5__prot | 578 |
152 | A0A1C6WUG4 | Cas9_A0A1C6WUG4_prot | 579 |
153 | A0A1D3QUT4 | Cas9_A0A1 D3QUT4_prot | 580 |
154 | F2B8K0 | Cas9__F2B8K0__prot | 581 |
155 | A0A1D3PTA0 | Cas9_A0A1 D3PTA0__prot | 582 |
156 | A0A0P7LDT0 | Cas9.„A0A0P7LDT0...prot | 583 |
157 | A0A0R1LQW1 | Cas9_A0A0R1 LQW1_prot | 584 |
158 | A0A159Z911 | Cas9__A0A159Z911_prot | 585 |
159 | R5Y7W7 | Cas9„R5Y7W7_prot | 586 |
160 | A8LN05 | Cas9__A8LN05__prot | 587 |
161 | S0RVL7 | Cas9__S0RVL7_prot | 588 |
162 | W1K9F9 | Cas9__W1 K9F9__prot | 589 |
Petição 870190070557, de 24/07/2019, pág. 152/401
88/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
163 | A0A1E4DUI9 | Cas9_A0A1E4DUI9_prot | 590 |
164 | A0A1E4F4V8 | Cas9_A0A1 E4F4V8_prot | 591 |
165 | J8W240 | Cas9_J8W240__prot | 592 |
166 | C6SFU3 | Cas9_C6SFU3_prot | 593 |
167 | C5TLV5 | Cas9_.C5TLV5_.prot | 594 |
168 | A0A0Y5JFG8 | Cas9_A0A0Y5JFG8_prot | 595 |
169 | A0A125S8I7 | Cas9__A0A125S8l7_prot | 596 |
170 | E4ZF34 | Cas9_E4ZF34_prot | 597 |
171 | A0A0Y6L5Q1 | Cas9._A0A0Y6L5Q1_.prot | 598 |
172 | A0A0T7L299 | Cas9_A0A0T7L299_prot | 599 |
173 | X5EPV9 | Cas9_X5EPV9_prot | 600 |
174 | C6SH44 | Cas9._C6SH44_.prot | 601 |
175 | E0NB23 | Cas9__E0N B23_prot | 602 |
176 | A9M1K5 | Cas9__A9M 1 K5_prot | 603 |
177 | D0W2Z9 | Cas9_D0W2Z9_prot | 604 |
178 | R0TXT9 | Cas9_.R0TXT9_.prot | 605 |
179 | C6S593 | Cas9_C6S593_prot | 606 |
180 | A0A1A6FJT6 | Cas9__A0A1A6FJT6_prot | 607 |
181 | A0A0D8IYR9 | Cas9_A0A0D8IYR9_prot | 608 |
182 | A0A0W7TPK7 | Cas9_.A0A0W7TPK7_.prot | 609 |
183 | G9RUL1 | Cas9_.G9RUL1_.prot | 610 |
184 | A0A0N8K819 | Cas9_A0A0N8K819_prot | 611 |
185 | A0A0Q7HTH3 | Cas9._A0A0Q7HTH3_.prot | 612 |
186 | A0A0Q0YQ33 | Cas9._A0A0Q0YQ33_.prot | 613 |
187 | E8LGQ1 | Cas9_E8LGQ1_prot | 614 |
188 | A0A0K1KC97 | Cas9_A0A0K1 KC97_prot | 615 |
189 | A0A150MM34 | Cas9_.A0A150MM34_.prot | 616 |
190 | H7F839 | Cas9_.H7F839_.prot | 617 |
191 | A0A178TEJ9 | Cas9__A0A178TEJ9__prot | 618 |
192 | A0A150MP45 | Cas9_.A0A150MP45_.prot | 619 |
193 | A0A164FEH7 | Cas9...A0A164FEH7_..prot | 620 |
194 | V6VHM9 | Cas9_.V6VHM9_.prot | 621 |
195 | A0A096BCZ5 | Cas9_A0A096BCZ5_prot | 622 |
Petição 870190070557, de 24/07/2019, pág. 153/401
89/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
196 | A0A0J8GDE4 | Cas9_A0A0J8GDE4_prot | 623 |
197 | G9QLF2 | Cas9._G9QLF2_.prot | 624 |
198 | D7N2B0 | Cas9_.D7N2B0_.prot | 625 |
199 | S5ZZV3 | Cas9_S5ZZV3_prot | 626 |
200 | A0A0N1BZF2 | Cas9__A0A0N 1 BZF2_prot | 627 |
201 | A0A0C9MY24 | Cas9...A0A0C9MY24_prot | 628 |
202 | A0A1C7NZW8 | Cas9_A0A1C7NZW8_prot | 629 |
203 | H0UDA8 | Cas9_H0UDA8__prot | 630 |
204 | E3HCA8 | Cas9_.E3HCA8_.prot | 631 |
205 | A0A073IJU3 | Cas9_.A0A073IJU3_.prot | 632 |
206 | W3RQ02 | Cas9_W3RQ02_prot | 633 |
207 | A0A0U2W148 | Cas9__A0A0U2W148_prot | 634 |
208 | G4CMU0 | Cas9_.G4CMU0_.prot | 635 |
209 | A0A0H1A177 | Cas9_A0A0H 1A177_prot | 636 |
210 | A0A125S8L4 | Cas9_A0A125S8L4_prot | 637 |
211 | A0A0T2NHL9 | Cas9_A0A0T2N H L9__prot | 638 |
212 | A0A1A9FXI0 | Cas9_A0A1A9FXI0_prot | 639 |
213 | A0A139DPY2 | Cas9_A0A139DPY2_prot | 640 |
214 | A0A1A7V637 | Cas9_A0A 1 A7V637_prot | 641 |
215 | R5KSL2 | Cas9_.R5KSL2_.prot | 642 |
216 | R7B4M2 | Cas9_.R7B4M2_.prot | 643 |
217 | A0A143X3E0 | Cas9_A0A143X3E0__prot | 644 |
218 | R6DVD3 | Cas9...R6DVD3...prot | 645 |
219 | W0A9N2 | Cas9_W0A9N2_prot | 646 |
220 | R5UJK1 | Cas9_R5UJK1_prot | 647 |
221 | A5Z395 | Cas9_A5Z395__prot | 648 |
222 | A0A0X1TKX4 | Cas9_A0A0X1TKX4_prot | 649 |
223 | R7A6L3 | Cas9_.R7A6L3_.prot | 650 |
224 | J2WFY6 | Cas9_J2WFY6_prot | 651 |
225 | W1SA26 | Cas9 _W1 SA26_prot | 652 |
226 | A0A099UAI1 | Cas9_A0A099UAI 1_.prot | 653 |
227 | U2XW20 | Cas9_U2XW20_prot | 654 |
228 | R6ACK8 | Cas9_R6ACK8_prot | 655 |
Petição 870190070557, de 24/07/2019, pág. 154/401
90/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
229 | C4ZA16 | Cas9__C4ZA16__prot | 656 |
230 | A0A133XDM2 | Cas9_A0A133?<DM2...prot | 657 |
231 | V8C5L2 | Cas9_V8C5L2_prot | 658 |
232 | E4MSY6 | Cas9_E4MSY6_prot | 659 |
233 | A0A0A1H768 | Cas9_A0A0A1 H768 ..pro t | 660 |
234 | A0A0Q7WLY8 | Cas9_A0A0Q7WLY8_prot | 661 |
235 | A0A0R1JQF2 | Cas9_A0A0R1 JQF2__prot | 662 |
236 | A0A142LIG4 | Cas9_A0A 142LI G4_prot | 663 |
237 | R2S872 | Cas9..R2S872...prot | 664 |
238 | A0A0E2RF34 | Cas9_A0A0E2RF34_prot | 665 |
239 | A0A0R1IXU4 | Cas9_A0A0R1 IXU4_prot | 666 |
240 | A0A0E2Q4M6 | Cas9..,A0A0E2Q4M6....prot | 667 |
241 | A0A139MDP4 | Cas9...A0A 139M D P4...prot | 668 |
242 | X8HGN9 | Cas9_X8HGN9_prot | 669 |
243 | A0A1C3YEE6 | Cas9_A0A1C3YEE6_prot | 670 |
244 | A0A0P6UEB3 | Cas9_A0A0P6UEB3_prot | 671 |
245 | A0A0M3RT06 | Cas9_A0A0M3RT06_prot | 672 |
246 | K0ZVL9 | Cas9__K0ZVL9_prot | 673 |
247 | R0P7Y6 | Cas9_R0P7Y6_prot | 674 |
248 | S0KIG9 | Cas9...S0KIG9...prot | 675 |
249 | A0A081Q0Q9 | Cas9...A0A081 Q0Q9...prot | 676 |
250 | F8LWC5 | Cas9_F8LWC5_prot | 677 |
251 | I0SS54 | Cas9J0SS54_prot | 678 |
252 | A0A125S8J6 | Cas9_A0A 125S8J6_.prot | 679 |
253 | V8LWT4 | Cas9__.V8L.WT 4_prot | 680 |
254 | A0A111NJ61 | Cas9__A0A111NJ61_prot | 681 |
255 | A0A0A0DHL5 | Cas9..,A0A0A0DHL5...prot | 682 |
256 | Q5M542 | Cas9_.Q5M542_.prot | 683 |
257 | A0A0Z8LKF1 | Cas9_A0A0Z8LKF1_prot | 684 |
258 | A0A126UMM8 | Cas9_A0A126UMM8_prot | 685 |
259 | A0A0N8VNG6 | Cas9_A0A0N8VNG6_prot | 686 |
260 | A0A081PRN2 | Cas9_A0A081 PRN2_prot | 687 |
261 | T1ZF93 | Cas9_T1ZF93_prot | 688 |
Petição 870190070557, de 24/07/2019, pág. 155/401
91/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
262 | A0A125S8J9 | Cas9_A0A125S8J9_prot | 689 |
263 | A0A0H4LAU6 | Cas9..A0A0H4L.AU6...prot | 690 |
264 | A0A0P0N7J4 | Cas9_A0A0P0N7J4_prot | 691 |
265 | A0A1G0BAB7 | Cas9_A0A1 G0BAB7__prot | 692 |
266 | F8LNX0 | Cas9...F8LNX0...prot | 693 |
267 | U5P749 | Cas9...U5P749...prat | 694 |
268 | K6QJ37 | Cas9__K6QJ37_prot | 695 |
269 | D4KTZ0 | Cas9_D4KTZ0_prot | 696 |
270 | U1GXL8 | Cas9JJ1GXL8...prot | 697 |
271 | E8KVY4 | Cas9..E8KVY4...prot | 698 |
272 | A0A173V977 | Cas9_A0A173V977_prot | 699 |
273 | W3XZF8 | Cas9...VV3XZF8...prot | 700 |
274 | A0A0X8G6A4 | Cas9...A0A0X8G6A4...prot | 701 |
275 | A0A139RFX7 | Cas9__A0A139RFX7_prot | 702 |
276 | A0A0R1M5J7 | Cas9_A0A0R1 M5J7_prot | 703 |
277 | A0A0U3F8P4 | Cas9_A0A0U3F8P4_prot | 704 |
278 | B1SGF4 | Cas9_B 1SG F4_prot | 705 |
279 | A0A0U3EY47 | Cas9__A0A0U3EY47__prot | 706 |
280 | A0A176T602 | Cas9_A0A 176T602_prot | 707 |
281 | A0A1C3SQ53 | Cas9..,A0A1C3SQ53...prot | 708 |
282 | F5WVI4 | Cas9_F5WVI4_prot | 709 |
283 | H2A7K0 | Cas9_H2A7K0__prot | 710 |
284 | A0A091BWC6 | Cas9_A0A091 BWC6_prot | 711 |
285 | F5X275 | Cas9..F5X275...prot | 712 |
286 | A0A081JGI6 | Cas9_A0A081JGI6_prot | 713 |
287 | B9M9X8 | Cas9_B9M9X8_prot | 714 |
288 | A0A1D2U437 | Cas9_A0A1 D2U437...prot | 715 |
289 | E6WZS9 | Cas9...E6WZS9...prot | 716 |
290 | S0J9K5 | Cas9_S0J9K5_prot | 717 |
291 | A0A0R1J9U0 | Cas9...A0A0R1J9U0....prot | 718 |
292 | X8KGX3 | Cas9..X8KGX3...prot | 719 |
293 | A0A081R6F9 | Cas9_A0A081 R6F9__prot | 720 |
294 | A0A139QZ91 | Cas9__A0A 139QZ91 __prot | 721 |
Petição 870190070557, de 24/07/2019, pág. 156/401
92/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
295 | S1RM25 | Cas9__.S1RM25_.prot | 722 |
296 | E0PQK3 | Cas9_.E0PQK3_.prot | 723 |
297 | I0QHG7 | Cas9.J0QHG7...prot | 724 |
298 | A0A0R1XK13 | Cas9_A0A0R1XK13_prot | 725 |
299 | A0A1E9DYC7 | Cas9__A0A1 E9DYC7...prot | 726 |
300 | A0A139NS17 | Cas9_A0A139NS17_prot | 727 |
301 | A8AY02 | Cas9_A8AY02_prot | 728 |
302 | E9DN79 | Cas9_E9DN79_prot | 729 |
303 | A0A125S8J4 | Cas9._A0A125S8J4_.prot | 730 |
304 | K8Z8F3 | Cas9_.K8Z8F3_.prot | 731 |
305 | C7G697 | Cas9_C7G697_prot | 732 |
306 | A0A0F2E4R3 | Cas9_.A0A0F2E4R3_.prot | /33 |
307 | I2NMF2 | Cas9J2NMF2_prot | 734 |
308 | A0A173WZ1 | Cas9__A0A 173VVZ1 __prot | 735 |
309 | A0A1F0FMT7 | Cas9_A0A1 F0FMT7_prot | 736 |
310 | K1LQN8 | Cas9_K1LQN8_prot | 737 |
311 | A0A125S8K1 | Cas9_A0A 125S8K1__prot | 738 |
312 | A0A125S8K3 | Cas9_A0A125S8K3_prot | 739 |
313 | H8MA21 | Cas9_H8MA21_prot | 740 |
314 | W0SDH6 | Cas9_.W0SDH6_.prot | 741 |
315 | J9E534 | Cas9_.J9E534_.prot | 742 |
316 | A0A0V0PNI8 | Cas9_A0A0V0PNI8_prot | 743 |
317 | A0A171J711 | Cas9_A0A 171J 711 _prot | 744 |
318 | Q1WVK1 | Cas9_Q 1WVK1 _prot | 745 |
319 | C0FXH5 | Cas9_C0FXH5_prot | 746 |
320 | K0XCK7 | Cas9_K0XCK7_prot | 747 |
321 | A0A125S8J8 | Cas9_.A0A125S8J8_.prot | 748 |
322 | A0A060RE66 | Cas9_.A0A060RE66_.prot | 749 |
323 | Q1QGC9 | Cas9_Q1 QGC9_prot | 750 |
324 | D3NT09 | Cas9_.D3NT09_.prot | 751 |
325 | A0A0R1MEF5 | Cas9_.A0A0R1MEF5_.prot | 752 |
326 | A0A0R2CKA0 | Cas9_.A0A0R2CKA0_.prot | 753 |
327 | V4Q7N5 | Cas9_V4Q7N5_prot | 754 |
Petição 870190070557, de 24/07/2019, pág. 157/401
93/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
328 | Q2RX87 | Cas9__Q2RX87__prot | 755 |
329 | A0A0R2FKF9 | Cas9_A0A0R2FKF9_prot | 756 |
330 | R7BDB6 | Cas9__R7BDB6mprot | 757 |
331 | A0A1C9ZUE2 | Cas9_A0A 1C9ZU E2__prot | 758 |
332 | S2WQ18 | Cas9_S2WQ18„prot | 759 |
333 | A0A1C9ZTA0 | Cas9_A0A1 C9ZTA0__prot | 760 |
334 | F0RSV0 | Cas9_F0RSV0__prot | 761 |
335 | A0A0N0IXQ9 | Cas9_A0A0N0IXQ9_prot | 762 |
336 | A0A0R1X611 | Cas9_A0A0R1X611_ prof | 763 |
337 | B2KB46 | Cas9_B2KB46_prot | 764 |
338 | U2KF13 | Cas9__U2KF13__prot | 765 |
339 | D5ESN1 | Cas9..D5ESN1....prot | 766 |
340 | R7HI23 | Cas9_R7HI23__prot | 767 |
341 | I9J7D5 | Cas9J9J7D5__prot | 768 |
342 | A0A0B0BZE8 | Cas9__A0A0B0BZE8__prot | 769 |
343 | R5W806 | Cas9„R5W806_prot | 770 |
344 | G6B158 | Cas9__G6B158_prot | 771 |
345 | U2IU08 | Cas9__U2IU08__prot | 772 |
346 | A0A096AT21 | Cas9__A0A096AT21__prot | 773 |
347 | R6ZCR1 | Cas9_R6ZCR 1_ prof | 774 |
348 | D1W6R4 | Cas9_D1W6R4__prot | 775 |
349 | D1VXP4 | Cas9__D 1 VXP4__prot | 776 |
350 | U7USL1 | Cas9JJ7USL1...prot | 777 |
351 | E2N8V1 | Cas9__E2N8V1_prot | 778 |
352 | R6D2P4 | Cas9__R6D2P4__prot | 779 |
353 | A0A134BD56 | Cas9__A0A134BD56__prot | 780 |
354 | A0A099BT78 | Cas9..,A0A099BT78...prot | 781 |
355 | R7CVK2 | Cas9mR7CVK2_prot | 782 |
356 | D2EJF1 | Cas9_D2 E J F1 __prot | 783 |
357 | A0A069QG82 | Cas9..A0A06SQG82....prot | 784 |
358 | R5LWG1 | Cas9_R5LWG1_prot | 785 |
359 | C9LGP5 | Cas9__C9LGP5__prot | 786 |
360 | Q6KIQ7 | Cas9__Q6KIQ7__prot | 787 |
Petição 870190070557, de 24/07/2019, pág. 158/401
94/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
361 | A0A180F6C8 | Cas9._A0A180F6C8_.prot | 788 |
362 | C0WRP7 | Cas9_C0WRP7_prot | 789 |
363 | A0A174NKB5 | Cas9_A0A 174N KB5_.prot | 790 |
364 | U2Y346 | Cas9_U2Y346_prot | 791 |
365 | A0A125S8I5 | Cas9__A0A125S8i5_prot | 792 |
366 | R7CG17 | Cas9_.R7CG17_.prot | 793 |
367 | F3A050 | Cas9_F3A050_prot | 794 |
368 | D1AUW6 | Cas9_D1AUW6_prot | 795 |
369 | A0A0X8KN88 | Cas9._A0A0X8KN88_.prot | 796 |
370 | A0A0D5BKQ5 | Cas9._A0A0D5BKQ5_.prot | 797 |
371 | A0A0N1DVV7 | Cas9_A0A0N 1 DW7_prot | 798 |
372 | A0A085Z0I3 | Cas9_.AOAO85ZOI3_.prot | 799 |
373 | J3TRJ9 | Cas9_.J3TRJ9_.prot | 800 |
374 | A0A0F6CLF2 | Cas9_A0A0F6CLF2_prot | 801 |
375 | A0A199XSD8 | Cas9_A0A199XSD8_prot | 802 |
376 | A0A0B8YC59 | Cas9_.A0A0B8YC59_.prot | 803 |
377 | K2M2X7 | Cas9_K2M2X7_prot | 804 |
378 | A0A1B9Y472 | Cas9_A0A1 B9Y472_prot | 805 |
379 | A0A0Q4DTQ9 | Cas9_A0A0Q4DTQ9_prot | 806 |
380 | S4EM46 | Cas9_.S4EM46_.prot | 807 |
381 | A0A1D2JYF3 | Cas9_A0A1 D2JYF3_.prot | 808 |
382 | A0A0R2FVI8 | Cas9_A0A0R2FVI8_prot | 809 |
383 | A0A174LFF7 | Cas9..A0A174LFF7_prot | 810 |
384 | A0A173SPI3 | Cas9_A0A173SPI3_prot | 811 |
385 | D0DRL9 | Cas9__D0DRL9__prot | 812 |
386 | A0A175A1Y1 | Cas9_A0A 175A1Y1 __prot | 813 |
387 | A0A062XBE5 | Cas9_.A0A062XBE5_.prot | 814 |
388 | A0A0K8MIK7 | Cas9_.A0A0K8MIK7_.prot | 815 |
389 | A0A0R1TV35 | Cas9_A0A0R1TV35_prot | 816 |
390 | A0A125S8J7 | Cas9..A0A125S8J7...prot | 817 |
391 | A0A0R1ZP43 | Cas9_A0A0R1ZP43_prot | 818 |
392 | W4T7U3 | Cas9_W4T7U3_prot | 819 |
393 | A0A0J5P9G6 | Cas9_A0A0J5P9G6_prot | 820 |
Petição 870190070557, de 24/07/2019, pág. 159/401
95/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
394 | A0A0R2CL57 | Cas9__A0A0R2CL57__prot | 821 |
395 | R6U7U5 | Cas9__R6U7U5__prot | 822 |
396 | A0A0R2AFH9 | Cas9_A0A0R2AFH9_prot | 823 |
397 | E7MR72 | Cas9__E7M R72__prot | 824 |
398 | A0A1C0YPC7 | Cas9.,A0A1C0YPC7...prot | 825 |
399 | A0A179EQS1 | Cas9_A0A179EQS1_prot | 826 |
400 | W9EE99 | Cas9_W9EE99_prot | 827 |
401 | A0A0R2BKJ5 | Cas9_A0A0R2BKJ5_prot | 828 |
402 | E6LI02 | Cas9...E6Li02....prot | 829 |
403 | V5XLV7 | Cas9..V5XLV7..prot | 830 |
404 | G2KVM6 | Cas9__G2KVM6__prot | 831 |
405 | A0A1C5TF27 | Cas9.,A0A1C5TF27..prot | 832 |
406 | H3NFH0 | Cas9_H3NFH0_prot | 833 |
407 | A0A081BKX9 | Cas9_A0A081 BKX9__prot | 834 |
408 | A0A1C7DHH3 | Cas9__A0A1C7DHH3__prot | 835 |
409 | R7GMQ9 | Cas9...R7GMQ9...prot | 836 |
410 | R6QHH1 | Cas9__R6QHH1mprot | 837 |
411 | A0A174HSW2 | Cas9_A0A174HSW2_prot | 838 |
412 | A0A0R2HIR8 | Cas9__A0A0R2 ΗI R8_prot | 839 |
413 | A0A0H3GNI1 | Cas9..,A0A0H3GNI1....prot | 840 |
414 | A0A0F5ZHG0 | Cas9_A0A0F5ZHG0__prot | 841 |
415 | A0A0H3J2A7 | Cas9_A0A0H3J2A7__prot | 842 |
416 | A0A166RWM5 | Cas9_A0A166RWM5_prot | 843 |
417 | A0A1E6FAD7 | Cas9_A0A1 E6FAD7_prot | 844 |
418 | A0A1E8EQS5 | Cas9__A0A1 E8EQS5_prot | 845 |
419 | A0A1E7DWS8 | Cas9__A0A1 E7DWS8_prot | 846 |
420 | A0A1E5ZAU0 | Cas9_A0A1 E5ZAU0...prot | 847 |
421 | A0A1E8EI75 | Cas9_A0A1 E8EI75_prot | 848 |
422 | R3WHR8 | Cas9_R3WH R8__prot | 849 |
423 | A0A097B8A9 | Cas9__A0A097B8A9_prot | 850 |
424 | A0A095XEU7 | Cas9__A0A095XEU7_prot | 851 |
425 | A0A0R1RFJ4 | Cas9_A0A0R1 RFJ4__prot | 852 |
426 | A0A160NBB3 | Cas9__A0A 160N BB3_prot | 853 |
Petição 870190070557, de 24/07/2019, pág. 160/401
96/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
427 | I6T669 | Cas9J6T669_prot | 854 |
428 | H1GG18 | Cas9_H 1GG18_prot | 855 |
429 | A0A017H668 | Cas9_A0A017H668_.prot | 856 |
430 | A0A121IZ21 | Cas9_A0A121IZ21_prot | 857 |
431 | A0A1B4XLG6 | Cas9__A0A1 B4XLG6 ..prot | 858 |
432 | U6S081 | Cas9_.U6S081_.prot | 859 |
433 | E6GPD8 | Cas9_E6GPD8_prot | 860 |
434 | H3NQF8 | Cas9_H3NQF8__prot | 861 |
435 | D4J3S7 | Cas9_.D4J3S7_.prot | 862 |
436 | G5JVJ9 | Cas9_G5JVJ9_prot | 863 |
437 | R9MHT9 | Cas9_R9M HT9__prot | 864 |
438 | R2SDC4 | Cas9_.R2SDC4_.prot | 865 |
439 | H7FYD8 | Cas9_.H7FYD8_.prot | 866 |
440 | A0A1D2JQJ5 | Cas9_A0A1 D2JQJ5_prot | 867 |
441 | A0A1D2LU44 | Cas9_A0A1 D2LU44_prot | 868 |
442 | C9BHR2 | Cas9...C9BHR2...prot | 869 |
443 | L2LBP5 | Cas9__L2L.BP5_.prot | 870 |
444 | R6ZAM8 | Cas9_R6ZAM8_prot | 871 |
445 | A6BJV4 | Cas9_A6BJV4_prot | 872 |
446 | A0A174GDD3 | Cas9_A0A 174G D D3_prot | 873 |
447 | C9BWE2 | Cas9_.C9BWE2_.prot | 874 |
448 | A0A173UVP4 | Cas9_A0A173UVP4__prot | 875 |
449 | R5BQB0 | Cas9_.R5BQB0_.prot | 876 |
450 | D7N6R3 | Cas9__D7N6R3_prot | 877 |
451 | A0A1C5P2V8 | Cas9.__A0A1C5P2V8_.prot | 878 |
452 | B5CL59 | Cas9_B5CL59_prot | 879 |
453 | A0A0R2JSC5 | Cas9_.A0A0R2JSC5_.prot | 880 |
454 | A0A1C6BK34 | Cas9_.A0A1C6BK34_.prot | 881 |
455 | R7KBA0 | Cas9_R7KBA0_prot | 882 |
456 | A0A0R2HM97 | Cas9_A0A0R2HMS7_prot | 883 |
457 | U7PCQ1 | Cas9_U7PCQ1_prot | 884 |
458 | R5V4T4 | Cas9_R5V4T 4_prot | 885 |
459 | A0A133QT10 | Cas9_A0A 133QT1O_prot | 886 |
Petição 870190070557, de 24/07/2019, pág. 161/401
97/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
460 | A0A0E2EP65 | Cas9_A0A0E2EP65_prot | 887 |
461 | R5MT23 | Cas9_R5MT23_prot | 888 |
462 | A0A0R2DR00 | Cas9_A0A0R2DR00_prot | 889 |
463 | R5N3I1 | Cas9__R5N3l1__prot | 890 |
464 | I0SF74 | Cas9J0SF74_prot | 891 |
465 | E6J3R0 | Cas9_E6J3R0__prot | 892 |
466 | U2YFI6 | Cas9__U2YFI6__prot | 893 |
467 | A0A0R2DIR3 | Cas9__A0A0R2DIR3__prot | 894 |
468 | U2U1P0 | Cas9JJ2U1PO.jorot | 895 |
469 | A0A134CKK1 | Cas9_A0A134CKK1_prot | 896 |
470 | A0A0R2N0I6 | Cas9__AOAOR2NOI6__prot | 897 |
471 | A0A125S8I2 | Cas9__A0A125S8i2_prot | 898 |
472 | A0A0R1ZCI7 | Cas9_A0A0R 1ZC17_prot | 899 |
473 | A0A0R1SCA3 | Cas9__A0A0R1 SCA3_prot | 900 |
474 | D9PRA6 | Cas9__D9PRA6__prot | 901 |
475 | A0A0D0ZAW2 | Cas9_A0A0D0ZAW2_prot | 902 |
476 | F9N0W8 | Cas9_F9N0W8_prot | 903 |
477 | B0RZQ7 | Cas9__B0RZQ7_prot | 904 |
478 | R6XMN7 | Cas9__R6XMN7__prot | 905 |
479 | U2SSY7 | Cas9 JJ2SSY7...prot | 906 |
480 | S4NUM0 | Cas9_S4N U MO_prot | 907 |
481 | A0A072ETA7 | Cas9_A0A072ETA7__prot | 908 |
482 | R5RU71 | Cas9_R5RU71_prot | 909 |
483 | A0A174FD97 | Cas9__A0A174FD97_prot | 910 |
484 | A0A0A8K7X7 | Cas9__A0A0A8K7X7__prot | 911 |
485 | R5Z6B4 | Cas9__R5Z6B4__prot | 912 |
486 | S1NSG8 | Cas9.S1NSG8..prot | 913 |
487 | A0A1D8P523 | Cas9_A0A1 D8P523_prot | 914 |
488 | A0A1C6IPF7 | Cas9__A0A1 C6I PF7__prot | 915 |
489 | A0A0R1MNC7 | Cas9„ A0A0R1 MNC7...prot | 916 |
490 | A0A132HQM8 | Cas9_A0A132HQM8_prot | 917 |
491 | A0A0M9VGT5 | Cas9__A0A0M9VGT5__prot | 918 |
492 | F9MP31 | Cas9__F9MP31__prot | 919 |
Petição 870190070557, de 24/07/2019, pág. 162/401
98/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
493 | A0A0R1V7X0 | Cas9__A0A0R1 V7X0__prot | 920 |
494 | A0A0X7BAB3 | Cas9__A0A0X7BAB3_prot | 921 |
495 | R7K435 | Cas9__R7K435__prot | 922 |
496 | I3Z8Z5 | Cas9J3Z8Z5__prot | 923 |
497 | A0A173YKH0 | Cas9_A0A173YKH0„prot | 924 |
498 | A0A174PI34 | Cas9_A0A174PI34_prot | 925 |
499 | A0A1C6E673 | Cas9__A0A1C6E673__prot | 926 |
500 | R5YGP2 | Cas9__R5YGP2__prot | 927 |
501 | A0A076P3F6 | Cas9..A0A076P3F6....prot | 928 |
502 | A0A176Y372 | Cas9__A0A176Y372_prot | 929 |
503 | D3I574 | Cas9__D3l574__prot | 930 |
504 | S2D876 | Cas9.S2D87S„.prot | 931 |
505 | A0A0R1F6R4 | Cas9_A0A0R1 F6R4__prot | 932 |
506 | J9YH95 | Cas9_J9YH95__prot | 933 |
507 | R5SXF4 | Cas9_R5SXF4_prot | 934 |
508 | R6P3Z6 | Cas9_R6P3Z6_prot | 935 |
509 | A0A0R1IS26 | Cas9_A0A0R1 IS26_prot | 936 |
510 | A0A0H4LAX2 | Cas9__A0A0H4LAX2__prot | 937 |
511 | A0A0K2LF21 | Cas9__A0A0K2LF21__prot | 938 |
512 | A0A0R1QGB6 | Cas9_A0A0R1QGB6„prot | 939 |
513 | A0A143W8R3 | Cas9_A0A 143W8R3_prot | 940 |
514 | M4KKI8 | Cas9__M4KKI8__prot | 941 |
515 | A0A0R1FUZ5 | Cas9_A0A0R1 FUZ5 ..prot | 942 |
516 | F6ITQ2 | Cas9_F6ITQ2_prot | 943 |
517 | A0A1E3KQ44 | Cas9_A0A1 E3KQ44__prot | 944 |
518 | A0A173WIE2 | Cas9__A0A173WI E2_prot | 945 |
519 | G4Q6A5 | Cas9_G4Q6A5„prot | 946 |
520 | A0A0K1MWW2 | Cas9_A0A0K1 MWW2_prot | 947 |
521 | A0A0H0YP06 | Cas9_A0A0H0YP06__prot | 948 |
522 | A0A0C9QP69 | Cas9_A0A0C9QP69_prot | 949 |
523 | A0A0E4H4H8 | Cas9__A0A0E4H4H8_prot | 950 |
524 | C2CKI6 | Cas9_C2CKI6_prot | 951 |
525 | A0A0M2FYH7 | Cas9_A0A0M2FYH7„prot | 952 |
Petição 870190070557, de 24/07/2019, pág. 163/401
99/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
526 | R6TGN6 | Cas9__R6TGN6__prot | 953 |
527 | I9L4B5 | Cas9J9L4B5___prot | 954 |
528 | A0A133KEN0 | Cas9__A0A133KEN0_prot | 955 |
529 | A0A139NKI7 | Cas9_A0A 139N Kl 7__prot | 956 |
530 | T5JDL4 | Cas9.T5JDL4..prot | 957 |
531 | C5F8S2 | Cas9_.C5F8S2_.prot | 958 |
532 | S4ZP66 | Cas9__S4ZP66__prot | 959 |
533 | S2LEI5 | Cas9__.S2LEI5__.prot | 960 |
534 | A0A0R1UKG9 | Cas9„ AQAQR1 UKG9....prot | 961 |
535 | A0A174P7Q9 | Cas9_A0A174P7Q9__prot | 962 |
536 | K6R5Z8 | Cas9__K6R5Z8__prot | 963 |
537 | A0A0R1S2S1 | Cas9...A0A0R1S2S1...prot | 964 |
538 | A0A0R1MEL8 | Cas9...A0A0R1 MEL8__prot | 965 |
539 | A0A0C9Q7U6 | Cas9__A0A0C9Q7U6__prot | 966 |
540 | A0A179YJ40 | Cas9_A0A179YJ40_prot | 967 |
541 | C7TEQ6 | Cas9_C7TEQ6_prot | 968 |
542 | E0NI75 | Cas9_E0NI75__prot | 969 |
543 | A0A133ZK65 | Cas9_A0A 133ZK65_prot | 970 |
544 | A0A0R1RRH5 | Cas9__.A0.A0R1 RRH5_prot | 971 |
545 | E0NJ84 | Cas9_E0NJ84„prot | 972 |
546 | A0A0R2HZC9 | Cas9...A0A0R2HZC9...prot | 973 |
547 | A0A180AER3 | Cas9__A0A180AER3__prot | 974 |
548 | D6GRK4 | Cas9_D6GRK4_prot | 975 |
549 | A0A1B3WEM9 | Cas9_A0A1 B3WEM9_prot | 976 |
550 | A0A116L128 | Cas9__A0A116L128__prot | 977 |
551 | A0A127TRM8 | Cas9__A0A127TRM8__prot | 978 |
552 | A0A0R1W1T1 | Cas9_A0A0R 1W1T1 ...prot | 979 |
553 | A0A1A5VIM0 | Cas9_A0A1A5VIM0_prot | 980 |
554 | K6RXS8 | Cas9_K6RXS8__prot | 981 |
555 | X0QNI0 | Cas9...XQQNI0...prot | 982 |
556 | R5WWQ0 | Cas9_R5WWQ0_prot | 983 |
557 | C7XMU0 | Cas9_C7XMU0_prot | 984 |
558 | D6LEV9 | Cas9__D6LEV9__prot | 985 |
Petição 870190070557, de 24/07/2019, pág. 164/401
100/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
559 | A0A128ECZ8 | Cas9_A0A128ECZ8_prot | 986 |
560 | A0A133NAH6 | Cas9..A0A133NAH6...prot | 987 |
561 | A0A0X3Y1U5 | Cas9_A0A0X3Y1 U5_prot | 988 |
562 | A0A116M370 | Cas9_A0A116M370__prot | 989 |
563 | A0A116KLL2 | Cas9...A0AT16KLL2...prot | 990 |
564 | A0A1B2IXP8 | Cas9...A0A1 B2IXP8__prot | 991 |
565 | A0A0R1LCE0 | Cas9__A0A0R1 LCEO__prot | 992 |
566 | A0A0R1WWN2 | Cas9_A0A0R1WWN2_prot | 993 |
567 | A0A0C6FZC2 | Cas9..A0A0C6FZC2...prot | 994 |
568 | A0A127X7N0 | Cas9. A0A127X7N0...prot | 995 |
569 | A0A1B4Z6K5 | Cas9__A0A1 B4Z6K5__prot | 996 |
570 | R9LW52 | Cas9_R9LW52„prot | 997 |
571 | A0A0B2XHU2 | Cas9_A0A0B2XH U2_prot | 998 |
572 | A0A1B2A6P4 | Cas9__A0A1 B2A6P4__prot | 999 |
573 | A0A0P6SHS4 | Cas9_A0A0P6SHS4_prot | 1000 |
574 | A0A0H3BZZ0 | Cas9_A0A0H3BZZ0_prot | 1001 |
575 | A0A0R1TGJ3 | Cas9_A0A0R1TGJ3_prot | 1002 |
576 | Q1JLZ6 | Cas9_Q 1J LZ6__prot | 1003 |
577 | Q48TU5 | Cas9__Q48TU5__prot | 1004 |
578 | G6CGE4 | Cas9_G6CGE4„prot | 1005 |
579 | Q1JH43 | Cas9_Q 1J H43...prot | 1006 |
580 | R5C8N0 | Cas9_R5C8N0__prot | 1007 |
581 | A0A0R1SN52 | Cas9...A0A0R 1 SN52...prot | 1008 |
582 | A0A0R2DGS6 | Cas9_A0A0R2DGS6_prot | 1009 |
583 | A0A0R1SDU2 | Cas9_A0A0R1 SDU2_prot | 1010 |
584 | A0A0D0YUU5 | Cas9__A0A0D0YUU5__prot | 1011 |
585 | S9AZZ0 | Cas9..S9AZZ0...prot | 1012 |
586 | A0A0E1XG84 | Cas9.A0A0E1XG84.prot | 1013 |
587 | R6ET93 | Cas9_R6 ET 93_prot | 1014 |
588 | S9BFF6 | Cas9_S9BFF6_prot | 1015 |
589 | A0A1B3PSQ7 | Cas9...A0A1 B3PSQ7...prot | 1016 |
590 | A0A137PP63 | Cas9_A0A137PP63__prot | 1017 |
591 | S9KSN8 | Cas9__S9KSN8__prot | 1018 |
Petição 870190070557, de 24/07/2019, pág. 165/401
101/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
592 | Q8E042 | Cas9__Q8E042__prot | 1019 |
593 | S8HGI0 | Cas9....S8HGI0...prot | 1020 |
594 | S8H4C8 | Cas9__S8H4C8_prot | 1021 |
595 | F0FD37 | Cas9__F0FD37__prot | 1022 |
596 | J3JPT0 | Cas9_J3JPT0_prot | 1023 |
597 | F8Y040 | Cas9_F8Y040_prot | 1024 |
598 | A0A0R2JE56 | Cas9__A0A0R2 J E56__prot | 1025 |
599 | A0A1A9E0X4 | Cas9__A0A1A9E0X4__prot | 1026 |
600 | A0A0E1EMN2 | Cas9_A0A0E1 EMN2_prot | 1027 |
601 | A0A1C0BC24 | Cas9__A0A 1 C0BC24_prot | 1028 |
602 | A0A1E2WAR5 | Cas9__A0A1 E2WAR5__prot | 1029 |
603 | S8FJS0 | Cas9_S8FJS0„prot | 1030 |
604 | F4FTI2 | Cas9_F4FTI2__prot | 1031 |
605 | K4Q9P5 | Cas9_K4Q9P5__prot | 1032 |
606 | M4YX12 | Cas9_M4YX12_prot | 1033 |
607 | F9HIG7 | Cas9__F9HIG7_prot | 1034 |
608 | F5WVJ4 | Cas9__F5WVJ4__prot | 1035 |
609 | D6E761 | Cas9__D6E761__prot | 1036 |
610 | I0Q2W2 | Cas9J0Q2W2__prot | 1037 |
611 | C5WH61 | Cas9_C5WH61„prot | 1038 |
612 | A0A1C2CVQ9 | Cas9_A0A1C2CVQ9_prot | 1039 |
613 | K8MQ90 | Cas9__K8MQ90__prot | 1040 |
614 | A0A0R1JG51 | Cas9..A0A0R1JG51....prot | 1041 |
615 | J9W3C2 | Cas9__J9W3C2_prot | 1042 |
616 | Q1J6W2 | Cas9_Q1 J6W2_prot | 1043 |
617 | R5GJ26 | Cas9__R5GJ26__prot | 1044 |
618 | A0A172Q7S3 | Cas9 ,,ΑΟ.ΑΙ 72Q7S3...prot | 1045 |
619 | A0A060RIR3 | Cas9_A0A060R 1 R3__prot | 1046 |
620 | A0A1C5U497 | Cas9_A0A1C5U497__prot | 1047 |
621 | S5R5C8 | Cas9....S5R5C8...prot | 1048 |
622 | A0A0W7V6X6 | Cas9_A0A0W7V6X6_prot | 1049 |
623 | A0A1C5S579 | Cas9_A0A1 C5S579__prot | 1050 |
624 | A0A125S8J0 | Cas9__A0A125S8J0__prot | 1051 |
Petição 870190070557, de 24/07/2019, pág. 166/401
102/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
625 | E0PEL3 | Cas9_E0PEL3_prot | 1052 |
626 | J4K985 | Cas9...J4K985...prot | 1053 |
627 | U2PI18 | Cas9_.U2PI18_.prot | 1054 |
628 | G5KAN2 | Cas9_G5KAN2_prot | 1055 |
629 | Q7P7J1 | Cas9_Q7P7J 1_prot | 1056 |
630 | A0A0F2D9H7 | Cas9_A0A0F2D9H7_prot | 1057 |
631 | A0A1D7ZZ65 | Cas9_A0A1 D7ZZ65_prot | 1058 |
632 | E7FPD8 | Cas9_E7FPD8_prot | 1059 |
633 | A0A176TM67 | Cas9_A0A176TM67_prot | 1060 |
634 | G6AFY6 | Cas9_G6AFY6_prot | 1061 |
635 | E9FPR9 | Cas9_E9FPR9_prot | 1062 |
636 | I7QXF2 | Cas9_.l7QXF2_.prot | 1063 |
637 | I0TCL1 | Cas9_.IOTCL1_.prot | 1064 |
638 | A0A173R3H4 | Cas9_A0A173R3H4_prot | 1065 |
639 | A0A178KKP5 | Cas9_A0A178KKP5_prot | 1066 |
640 | H6PBR9 | Cas9_.H6PBR9_.prot | 1067 |
641 | F4AF10 | Cas9_F4AF 10__prot | 1068 |
642 | A0A134C7A8 | Cas9_A0A134C7A8_prot | 1069 |
643 | A0A0R1SG79 | Cas9_A0A0R1 SG79_prot | 1070 |
644 | A0A0F2DWP8 | Cas9_.A0A0F2DWP8_.prot | 1071 |
645 | A0A0R1K630 | Cas9__A0A0R1 K630_prot | 1072 |
646 | A0A135YMA6 | Cas9_A0A135YMA6_prot | 1073 |
647 | F0I6Z8 | Cas9_.FOI6Z8_.prot | 1074 |
648 | E9FJ16 | Cas9_E9FJ 16..prot | 1075 |
649 | C2D302 | Cas9_C2 D302_prot | 1076 |
650 | Q8E5R9 | Cas9_Q8E5R9_prot | 1077 |
651 | E8JP81 | Cas9_.E8JP81_.prot | 1078 |
652 | A0A0R1RHH9 | Cas9__A0A0R1 RHH9_prot | 1079 |
653 | A0A0F3FWK9 | Cas9_A0A0F3FWK9_prot | 1080 |
654 | A0A0R2I8Q5 | Cas9_A0A0R2l8Q5_prot | 1081 |
655 | A0A150NPH1 | Cas9_.A0A150NPH1_.prot | 1082 |
656 | E7S4M3 | Cas9_E7S4M3_prot | 1083 |
657 | A0A143ASS0 | Cas9_A0A 143ASS0_prot | 1084 |
Petição 870190070557, de 24/07/2019, pág. 167/401
103/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
658 | A0A0R2HDR9 | Cas9_A0A0R2HDR9_prot | 1085 |
659 | A0A0B2JE32 | Cas9„-A0A0B2 J E32... prot | 1086 |
660 | A0A0R2KUQ3 | Cas9_A0A0R2KUQ3__prot | 1087 |
661 | A0A0W7V0H0 | Cas9_A0A0W7V0H0_prot | 1088 |
662 | R6TGA0 | Cas9_.R6TGA0_.prot | 1089 |
663 | A0A0H5B4T2 | Cas9_.A0A0H5B4T2_.prot | 1090 |
664 | U2J559 | Cas9__U2J559__prot | 1091 |
665 | A0A075SSB9 | Cas9_A0A075SSB9__prot | 1092 |
666 | A0A096B7Z5 | Cas9_.A0A096B7Z5.prot | 1093 |
667 | L9PS87 | Cas9_.L9PS87_.prot | 1094 |
668 | A0A134D9V8 | Cas9_A0A134D9V8_prot | 1095 |
669 | F7UWL3 | Cas9_.F7UWL3_.prot | 1096 |
670 | G7SP82 | Cas9_.G7SP82_.prot | 1097 |
671 | A0A0R2E213 | Cas9_A0A0R2 E213_prot | 1098 |
672 | R7I2K1 | Cas9_R7l2K1_prot | 1099 |
673 | C0WXA2 | Cas9_.C0WXA2_.prot | 1100 |
674 | A0A0Z8GCN2 | Cas9_.A0A0Z8GCN2_.prot | 1101 |
675 | R5GUN8 | Cas9_R5G U N 8_prot | 1102 |
676 | A0A116RA22 | Cas9_A0A116RA22_prot | 1103 |
677 | A0A0Z8JWB5 | Cas9_.A0A0Z8JWB5_.prot | 1104 |
678 | A0A116KAQ7 | Cas9__A0A116KAQ7_prot | 1105 |
679 | G0M2Gi | Cas9_G0M2G7_prot | 1106 |
680 | A0A1C5P5Q5 | Cas9_A0A1C5P5Q5_prot | 1107 |
681 | A0A0H1TNR9 | Cas9_A0A0H 1TN R9__prot | 1108 |
682 | F2NB82 | Cas9_F2NB82__prot | 1109 |
683 | J7TMY5 | Cas9_J7TMY5_prot | 1110 |
684 | A0A125S8I1 | Cas9_.A0A125S8H_.prot | 1111 |
685 | A0A078RYQ2 | Cas9_.A0A078RYQ2_.prot | 1112 |
686 | A0A0F3H9Z9 | Cas9_A0A0F3H9Z9_prot | 1113 |
687 | E5V117 | Cas9_.E5V117_.prot | 1114 |
688 | J4TM44 | Cas9_J4TM44_prot | 1115 |
689 | I7L6U4 | Cas9J7L6U4_prot | 1116 |
690 | R5J5B2 | Cas9_R5J5B2_prot | 1117 |
Petição 870190070557, de 24/07/2019, pág. 168/401
104/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
691 | A0A1B2ULM2 | Cas9_A0A1 B2ULM2_prot | 1118 |
692 | A0A0P6UDU2 | Cas9..A0A0P6UDU2...prot | 1119 |
693 | V8LSG7 | Cas9_V8L.SG7_prot | 1120 |
694 | D5BC98 | Cas9_D5BC98_prot | 1121 |
695 | K0MXA7 | Cas9..K0MXA7...prot | 1122 |
696 | G9WGU4 | Cas9_.G9WGU4_.prot | 1123 |
697 | A0A1C2D810 | Cas9_A0A 1C2 D810_prot | 1124 |
698 | A0A087BJ94 | Cas9_A0A087BJ94_prot | 1125 |
699 | A0A0R1S4R8 | Cas9_.A0A0R1S4R8_.prot | 1126 |
700 | E0QLT3 | Cas9_.E0QLT3_.prot | 1127 |
701 | C4VKS7 | Cas9_C4VKS7_prot | 1128 |
702 | A9DTN2 | Cas9_.A9DTN2_.prot | 1129 |
703 | K2PT21 | Cas9_.K2PT21_.prot | 1130 |
704 | E7RR33 | Cas9_E7RR33_prot | 1131 |
705 | A0A0N0CU60 | Cas9_A0A0N0CU60_prot | 1132 |
706 | A0A0P7LUX3 | Cas9_.A0A0P7LUX3_.prot | 1133 |
707 | R7D1C6 | Cas9_R7D1C6_prot | 1134 |
708 | V8BZU1 | Cas9_V8BZU 1_prot | 1135 |
709 | A0A0F4LG72 | Cas9_A0A0F4LG72_prot | 1136 |
710 | J4KB57 | Cas9_.J4KB57_.prot | 1137 |
711 | W1U735 | Cas9_W1 U735_prot | 1138 |
712 | A0A095ZV18 | Cas9_A0A095ZV 18_prot | 1139 |
713 | R5BUB1 | Cas9_.R5BUB1_.prot | 1140 |
714 | F2C4I5 | Cas9_F2C4l5_prot | 1141 |
715 | E1LI65 | Cas9_E1LI65_prot | 1142 |
716 | A0A0N0UTU1 | Cas9._A0A0N0UTU1_.prot | 1143 |
717 | C5NZ04 | Cas9_.C5NZ04_.prot | 1144 |
718 | A0A081Q742 | Cas9_.A0A081Q742_.prot | 1145 |
719 | A0A0F2DF30 | Cas9_A0A0F2DF30_prot | 1146 |
720 | A0A0F4LMR6 | Cas9_A0A0F4LMR6_prot | 1147 |
721 | A0A0E2EBU7 | Cas9_A0A0E2EBU7_prot | 1148 |
722 | A0A0E2EGB1 | Cas9_A0A0E2EGB1_prot | 1149 |
723 | A0A0C3A2P0 | Cas9_A0A0C3A2P0_prot | 1150 |
Petição 870190070557, de 24/07/2019, pág. 169/401
105/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
724 | M2CG59 | Cas9_M2CG59_prot | 1151 |
725 | R5R3T7 | Cas9...R5R3T7..prot | 1152 |
726 | D6KPM9 | Cas9_D6KPM9_prot | 1153 |
727 | U2VD49 | Cas9_U2VD49_prot | 1154 |
728 | D6S374 | Cas9_.D6S374_.prot | 1155 |
729 | A0A0R2KGU9 | Cas9_A0A0R2 KG U9_prot | 1156 |
730 | A0A0F6MNW4 | Cas9_A0A0F6M N W4__prot | 1157 |
731 | A0A0X3ARL2 | Cas9_A0A0X3ARL2_prot | 1158 |
732 | A0A088RCP8 | Cas9_.A0A088RCP8_.prot | 1159 |
733 | S3KPV3 | Cas9_.S3KPV3_.prot | 1160 |
734 | M2CIC2 | Cas9_M2CIC2_prot | 1161 |
735 | M2SLU3 | Cas9_.M2SLU3_.prot | 1162 |
736 | A0A0D4CLL6 | Cas9_.A0A0D4CLL6_.prot | 1163 |
737 | R6I3U9 | Cas9_R6l3U9_prot | 1164 |
738 | F5U0T2 | Cas9_F5U0T2_prot | 1165 |
739 | A0A0F4LIJ0 | Cas9_.A0A0F4LIJ0_.prot | 1166 |
740 | A0A0N0CQ86 | Cas9_.A0A0N0CQ86_.prot | 1167 |
741 | I3C2S4 | Cas9_l 3C2S4_prot | 1168 |
742 | U2QKG2 | Cas9_U2QKG2_prot | 1169 |
743 | D1YP75 | Cas9_.D1YP75_.prot | 1170 |
744 | A0A091BLA4 | Cas9_A0A091 BLA4_prot | 1171 |
745 | A0A100YPE0 | Cas9_A0A100YPE0_prot | 1172 |
746 | E1LBR5 | Cas9_.E1LBR5_.prot | 1173 |
747 | R5BD80 | Cas9_.R5BD80_.prot | 1174 |
748 | W3Y2C1 | Cas9_.W3Y2C1_.prot | 1175 |
749 | E1QW44 | Cas9_E1QW44_prot | 1176 |
750 | A0A134A1I6 | Cas9_.A0A134A1l6_.prot | 1177 |
751 | A0A0F4M7Y5 | Cas9_.A0A0F4M7Y5_.prot | 1178 |
752 | A0A133YSB7 | Cas9_A0A133YSB7_prot | 1179 |
753 | A0A089Y508 | Cas9_A0A089Y508_prot | 1180 |
754 | A0A162CL99 | Cas9_A0A 162CL99_.prot | 1181 |
755 | A0A133YDF1 | Cas9_A0A133YDF1_prot | 1182 |
756 | A0A133YY65 | Cas9_A0A 133Y Y65_prot | 1183 |
Petição 870190070557, de 24/07/2019, pág. 170/401
106/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
757 | A0A0B4S2L0 | Cas9_A0A0B4S2L0_prot | 1184 |
758 | A0A0R2DLB6 | Cas9._A0A0R2DLB6_.piOt | 1185 |
759 | A0A0G3MB19 | Cas9_A0A0G3MB19_prot | 1186 |
760 | A0A0Q3K6A2 | Cas9_A0A0Q3K6A2_prot | 1187 |
761 | A0A134AG29 | Cas9_A0A134AG29_.prot | 1188 |
762 | A0A0N1DXX4 | Cas9_A0A0N 1 DXX4_prot | 1189 |
763 | A0A1E4DZC0 | Cas9_A0A1 E4DZC0_prot | 1190 |
764 | J9R1Q7 | Cas9_J9R1Q7_prot | 1191 |
765 | A0A1C4DJV4 | Cas9_A0A1 C4DJV4_prot | 1192 |
766 | A0A077KK20 | Cas9_A0A077KK20_prot | 1193 |
767 | A0A085ZZC2 | Cas9_A0A085ZZC2_prot | 1194 |
768 | W1V0U5 | Cas9_W1V0U5_prot | 1195 |
769 | A0A0K9XVX7 | Cas9_.A0A0K9XVX7_.prot | 1196 |
770 | A0A1H5RY71 | Cas9_A0A1 H5RY71__prot | 1197 |
771 | A0A0J7IGI6 | Cas9_A0A0J7IGI6_prot | 1198 |
772 | A0A086AYB7 | Cas9_A0A086AYB7_prot | 1199 |
773 | A0A125S8K4 | Cas9_A0A 125S8K4__prot | 1200 |
774 | M3INT0 | Cas9_M3INT0_prot | 1201 |
775 | R5FLM1 | Cas9_R5FLM1_prot | 1202 |
776 | U5Q7L9 | Cas9_U5Q7L9_prot | 1203 |
777 | A0A1E3DW10 | Cas9_A0A1 E3DW10__prot | 1204 |
778 | K0NQV3 | Cas9_K0NQV3_prot | 1205 |
779 | J2KJ07 | Cas9._J2KJ07_.prot | 1206 |
780 | A0A0U5KB17 | Cas9_A0A0U5KB17_prot | 1207 |
781 | A0A0D6ZH65 | Cas9_A0A0D6ZH65_prot | 1208 |
782 | A0A139PB46 | Cas9_A0A139PB46_prot | 1209 |
783 | A0A139NVJ1 | Cas9_A0A139N VJ 1_prot | 1210 |
784 | A0A139NSX3 | Cas9_A0A139NSX3_prot | 1211 |
785 | E0Q490 | Cas9_E0Q490_prot | 1212 |
786 | E3ELL7 | Cas9_E3EL.L7_.prot | 1213 |
787 | A0A061CF22 | Cas9_A0A061CF22_prot | 1214 |
788 | F3UXG6 | Cas9_F3UXG6_prot | 1215 |
789 | A0A125S8K2 | Cas9_A0A125S8K2_prot | 1216 |
Petição 870190070557, de 24/07/2019, pág. 171/401
107/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
790 | A0A0B7IR20 | Cas9_A0A0B7l R20_prot | 1217 |
791 | A0A174J8H3 | Cas9_A0A174J8H3_prot | 1218 |
792 | D7IW96 | Cas9_D7IW96_prot | 1219 |
793 | A0A1A9I5Z1 | Cas9_A0A1A9l5Z1_prot | 1220 |
794 | W0EYD8 | Cas9_W0EYD8_.prot | 1221 |
795 | E2N1F9 | Cas9__E2N 1 F9__prot | 1222 |
796 | D7VKD0 | Cas9_D7VKD0_prot | 1223 |
797 | R7N9S8 | Cas9_R7N9S8_prot | 1224 |
798 | C7M7G9 | Cas9_C7M7G9_prot | 1225 |
799 | J0WLS6 | Cas9_J0WLS6_prot | 1226 |
800 | A0A174L7S6 | Cas9_A0A174L7S6_prot | 1227 |
801 | S2KA46 | Cas9_.S2KA46_.prot | 1228 |
802 | A0A0A2F4C3 | Cas9_.A0A0A2F4C3_.prot | 1229 |
803 | U2JCC9 | Cas9_U2JCC9_prot | 1230 |
804 | A0A136MV65 | Cas9_A0A136MV65_prot | 1231 |
805 | K1M8Y6 | Cas9_K1M8Y6_prot | 1232 |
806 | F9YQX1 | Cas9_.F9YQX1_.prot | 1233 |
807 | A0A0B7IQ14 | Cas9_A0A0B7IQ14_prot | 1234 |
808 | A0A0B7IB79 | Cas9_A0A0B7l B79_prot | 1235 |
809 | A0A0A2EHM8 | Cas9_A0A0A2EHM8_prot | 1236 |
810 | A0A173V1H2 | Cas9_A0A173V1 H2_.prot | 1237 |
811 | R7DKC0 | Cas9_R7DKC0_prot | 1238 |
812 | U5CHH4 | Cas9_U5CHH4_prot | 1239 |
813 | L1NKM1 | Cas9_.L1NKM1_.prot | 1240 |
814 | A0A127VAB0 | Cas9_A0A127VAB0__prot | 1241 |
815 | D7JGI6 | Cas9_D7JGI6_prot | 1242 |
816 | A0A0U3BTM1 | Cas9_A0.A0U3BTM1_.prot | 1243 |
817 | A0A0M4G8J7 | Cas9_.A0A0M4G8J7_.prot | 1244 |
818 | A0A0A6Y3B0 | Cas9_A0A0A6Y3B0_prot | 1245 |
819 | A0A015SZB2 | Cas9_A0A015SZB2_prot | 1246 |
820 | A0A0E2RG29 | Cas9_A0A0E2RG29_prot | 1247 |
821 | A0A0E2A7Q9 | Cas9_A0A0E2A7Q9_prot | 1248 |
822 | A0A015Y7X0 | Cas9_A0A015Y7X0_prot | 1249 |
Petição 870190070557, de 24/07/2019, pág. 172/401
108/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
823 | A0A0E2SQU9 | Cas9__A0A0E2SQU9__prot | 1250 |
824 | A0A0E2T2C8 | Cas9..A0A0E2T2C8..prot | 1251 |
825 | A0A017N289 | Cas9_A0A017N289__prot | 1252 |
826 | A0A015UHU2 | Cas9_A0A015U H U2__prot | 1253 |
827 | E5C8Y3 | Cas9.E5C8Y3.prot | 1254 |
828 | C2M5N8 | Cas9_.C2M5N8_.prot | 1255 |
829 | J4XAP6 | Cas9_J4XAP6_prot | 1256 |
830 | A0A1B8ZVU5 | Cas9_A0A1 B8ZVU5_prot | 1257 |
831 | A0A1E5KUU0 | Cas9_A0A1 E5KUU0_prot | 1258 |
832 | A0A1E9S993 | Cas9_.A0A1E9S993_.prot | 1259 |
833 | F0P0P2 | Cas9_F0 P0 P2_prot | 1260 |
834 | B7B6H7 | Cas9_.B7B6H7_.prot | 1261 |
835 | W1R7X2 | Cas9__W1 R7X2_.prot | 1262 |
836 | X5KBF9 | Cas9_X5KBF9_prot | 1263 |
837 | A0A0B7HB18 | Cas9_A0A0B7H B18_prot | 1264 |
838 | I8UMX3 | Cas9_J 8 U MX3_prot | 1265 |
839 | L1PRF6 | Cas9_L1 PRF6_prot | 1266 |
840 | S3CB04 | Cas9_S3CB04_prot | 1267 |
841 | A0A098LI38 | Cas9_A0A098LI38_prot | 1268 |
842 | A0A125S8K9 | Cas9__A0A125S8K9_prot | 1269 |
843 | E6K6M2 | Cas9_.E6K6M2_.prot | 1270 |
844 | A0A1E5UGK6 | Cas9_A0A1 E5UGK6_prot | 1271 |
845 | F2IKJ5 | Cas9_.F2IKJ5_.prot | 1272 |
846 | A0A150XH78 | Cas9_A0A150XH78_prot | 1273 |
847 | G8X9H3 | Cas9_G8X9H3_prot | 1274 |
848 | A0A109Q6P7 | Cas9_A0A109Q6P7_prot | 1275 |
849 | A0A101CFI9 | Cas9_.A0A101CFI9_.prot | 1276 |
850 | A0A0T0M2G2 | Cas9_.A0A0T0M2G2_.prot | 1277 |
851 | K1I305 | Cas9_K1l305_prot | 1278 |
852 | L1P954 | Cas9_L1P954_prot | 1279 |
853 | J0DFD8 | Cas9_J0DFD8_prot | 1280 |
854 | H1YII5 | Cas9_H1YII5_prot | 1281 |
855 | G2Z1C1 | Cas9_G2Z1C1_prot | 1282 |
Petição 870190070557, de 24/07/2019, pág. 173/401
109/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
856 | A0A1E5TBF5 | Cas9_A0A1 E5TBF5_prot | 1283 |
857 | A0A0K1NMP1 | Cas9_A0A0K1NMP1„prot | 1284 |
858 | A0A0E3VRY2 | Cas9_A0A0E3VRY2_prot | 1285 |
859 | A0A133Q212 | Cas9_A0A 133Q212_prot | 1286 |
860 | A0A1E4APC4 | Cas9__A0A1 E4APC4_.pr ot | 1287 |
861 | U2QLH7 | Cas9_.U2QLH7_.prot | 1288 |
862 | A0A1D3UU01 | Cas9__A0A1D3UU01_prot | 1289 |
863 | A0A096CIC5 | Cas9_A0A096CIC5_prot | 1290 |
864 | I4ZCD3 | Cas9_J4ZCD3_prot | 1291 |
865 | A0A137SV51 | Cas9_.A0A137SV51_.prot | 1292 |
866 | A0A0X8BZ89 | Cas9__A0A0X8BZ89_prot | 1293 |
867 | A0A096D253 | Cas9..,A0A096D253...prot | 1294 |
868 | A0A134B2X0 | Cas9__A0A 134B2X0__prot | 1295 |
869 | D1W1M7 | Cas9_D1W1M7_prot | 1296 |
870 | U2LB41 | Cas9_U2LB41_prot | 1297 |
871 | C9MPM6 | Cas9_C9MPM6_prot | 1298 |
872 | R7D4J2 | Cas9_R7D4J2_prot | 1299 |
873 | A0A1C5L2R1 | Cas9__A0A1C5L2R1__prot | 1300 |
874 | A0A1D3UYE2 | Cas9_A0A1 D3UYE2„prot | 1301 |
875 | R9I6A5 | Cas9_.R9l6A5_.prot | 1302 |
876 | A0A0M1W3D2 | Cas9__A0A0M 1 W3D2_prot | 1303 |
877 | R7NZZ9 | Cas9__R7NZZ9_prot | 1304 |
878 | A0A0P7AYC1 | Cas9..A0A0P7AYC1....prot | 1305 |
879 | F3ZS64 | Cas9_.F3ZS64_.prot | 1306 |
880 | B6W3J8 | Cas9_B6W3J8_prot | 1307 |
881 | I9UHX4 | Cas9_l9UHX4_prot | 1308 |
882 | F9DDR2 | Cas9_.F9DDR2_.prot | 1309 |
883 | A0A069SLB0 | Cas9_.A0A069SLB0_.prot | 1310 |
884 | K4I9M9 | Cas9__K4l9M9__prot | 1311 |
885 | F3PY63 | Cas9_F3PY63_prot | 1312 |
886 | E5WV33 | Cas9_E5VW33_prot | 1313 |
887 | R5MDQ9 | Cas9_R5M DQ9_prot | 1314 |
888 | R5K6G6 | Cas9_R5K6G6_prot | 1315 |
Petição 870190070557, de 24/07/2019, pág. 174/401
110/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
889 | S0FEG1 | Cas9__S0FEG1__prot | 1316 |
890 | A0A078PYN7 | Cas9_A0A078PYN7__prot | 1317 |
891 | E5CB73 | Cas9_E5CB73_.prot | 1318 |
892 | U6RJS5 | Cas9_U6RJS5_prot | 1319 |
893 | A0A1B7ZF33 | Cas9_A0A1 B7ZF33_prot | 1320 |
894 | C9RJP1 | Cas9_.C9RJP1__prot | 1321 |
895 | I8X6S1 | Cas9 J 8X6S 1_prot | 1322 |
896 | A0A0D0IUN5 | Cas9__A0A0D0IUN5_prot | 1323 |
897 | E1Z024 | Cas9._E1Z024.prot | 1324 |
898 | A0A173UDH4 | Cas9.. A0A173U DH4_prot | 1325 |
899 | A0A0J9G920 | Cas9__A0A0J9G920_prot | 1326 |
900 | A0A1C2BS21 | Cas9_A0A 1C2 BS21 _prot | 1327 |
901 | A0A174HS76 | Cas9_.A0A174HS76_.prot | 1328 |
902 | R6V444 | Cas9_R6V444_prot | 1329 |
903 | A0A167Y4I1 | Cas9__A0A167Y4H__prot | 1330 |
904 | R7ZSP8 | Cas9._R7ZSP8_.prot | 1331 |
905 | W4PXW0 | Cas9_W4PXW0_prot | 1332 |
906 | U2DMI6 | Cas9__U2DMI6__prot | 1333 |
907 | W4PHU4 | Cas9_W4PHU4_prot | 1334 |
908 | I4A2W8 | Cas9J4A2W8__prot | 1335 |
909 | G8XA12 | Cas9_.G8XA 12_.prot | 1336 |
910 | A0A1B9E9Q0 | Cas9_A0A1 B9E9Q0_prot | 1337 |
911 | R5CLM1 | Cas9_R5CLM1_prot | 1338 |
912 | A0A180FK19 | Cas9_A0A 180FK19...prot | 1339 |
913 | R6E3D1 | Cas9_R6E3D1_prot | 1340 |
914 | A0A101CN94 | Cas9_A0A101CN94_prot | 1341 |
915 | A0A0K8QW18 | Cas9_A0A0K8QW18_prot | 1342 |
916 | A0A1H6BLP7 | Cas9_A0A1 H6BLP7_prot | 1343 |
917 | R5ZG15 | Cas9_R5ZG 15_prot | 1344 |
918 | I0AP30 | Cas9J0AP30_prot | 1345 |
935 | Q99ZW2 | NLS2_STRP1 (SF370)cas9_Q99Z W2_NLS4_prot | 1362 |
936 | A0Q5Y3 | N LS2_cas9_A0Q5Y3_N LS4_.prot | 1363 |
Petição 870190070557, de 24/07/2019, pág. 175/401
111/306
Fileira | Coluna A No. Ac. Da Proteína | Proteína (Cas9/Cpf1) | Coluna B SEQ ID NO |
937 | J7RUA5 | NLS2__cas9__J7RUA5__NLS4__prot | 1364 |
938 | G3ECR1 | N LS2...cas9-G3ECR 1 ... N LS4__prot | 1365 |
939 | J3F2B0 | NL.S2...cas9...J3F2B0...NLS4...prot | 1366 |
940 | Q03JI6 | N LS2_cas9_Q03J I ©__ N LS4_prot | 1367 |
941 | C9X1G5 | N LS2_.cas9_.C9X1 G5_N LS4_.prot | 1368 |
942 | Q927P4 | N LS2_cas9_.Q927P4__N LS4_prot | 1369 |
943 | Q8DTE3 | NLS2_cas9_Q8DTE3_NLS4_prot | 1370 |
944 | Q9CLT2 | N LS2_cas9_Q9CLT2_N LS4_prot | 1371 |
945 | A1IQ68 | NLS2_cas9_A1 IQ68_.NLS4_.prot | 1372 |
946 | Q6NKI3 | N LS2 ,.cas9.. Q6N Kl 3_N L.S4...prat | 1373 |
947 | Q0P897 | N LS2_cas9_Q0P897_N LS4_prot | 1374 |
948 | Q03LF7 | NLS2_cas9_.Q03LF7_.NLS4._.prot | 1375 |
[0184] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção que compreende uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 como definido pelo número de acesso do banco de dados provido sob a respectiva coluna na Tabela 2 ou um homólogo, variante, fragmento ou derivado da mesma. Em particular, a proteína Cas9 codificada pode compreender ou consistir preferivelmente em uma sequência de aminoácido como indicado sob a respectiva coluna na Tabela 2 ou um homólogo, variante, fragmento ou derivado da mesma.
[0185] Especificamente, em modalidades preferidas da invenção a molécula de ácido nucleico artificial pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma das SEQ ID NOs: 428-1375, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo
Petição 870190070557, de 24/07/2019, pág. 176/401
112/306 menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0186] Em particular, a proteínas Cas9 codificada pode compreender preferivelmente pelo menos um sinal de localização nuclear (NLS), mais preferivelmente dois NLS selecionados de NLS2 e NLS4 como acima definido. Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 com sinais de localização nucleares, compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma das SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou SEQ ID NOs: 12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0187] Variantes de Cas9 funcionais preferidas compreendidas aqui incluem inter alia, mortaCas9 (dCas9) e nickases de Cas9.
[0188] O termo dCas9 refere-se a uma Cas9 com nuclease desa
Petição 870190070557, de 24/07/2019, pág. 177/401
113/306 tivada, também chamada cataliticamente inativa, Cas9 cataliticamente morta ou cas9 morta. Tais nucleases são isentas de toda ou uma porção de atividade de endonuclease e podem então ser usadas para regular genes de uma maneira guiada por RNA (Jinek, M. e outros. Science. 2012 Ago 17;337(6096):816-21). Nucleases dCas9 compreendem mutações que inativam atividade de endonuclease de Cas9, tipicamente em ambos os resíduos catalíticos (D10A no domínio RuvC-1 e H840A no domínio HNH, numeradas com relação à Cas9 de S. pyogenes, isto é, spCas9). Outros resíduos catalíticos podem, no entanto, ser mutados a fim de reduzir a atividade de um ou ambos os domínios de nuclease, dCas9 é preferivelmente incapaz de clivar dsDNA, mas retém sua habilidade em se associar com gRNAs adequados e especificamente se ligar a DNA-alvo. O mutante duplo de Cas9 com mudanças em posições de aminoácido D10A e H840A inativa completamente ambas as atividades de nuclease e nickase. Derivados de Cas9 baseados em dCas9 podem ser usados para transportar domínios efetores adicionais para uma sequência de DNA-alvo, desta maneira induzindo, por exemplo, CRISPRa ou CRISPR! (como discutido em algum outro ponto aqui).
[0189] O termo nickase de Cas9 refere-se a variantes de Cas9 que não retêm a habilidade de introduzir quebras de filamento duplo em uma sequência de ácido nucleico-alvo, mas mantêm a habilidade de se ligar a e introduzir uma quebra de filamento simples em um sítio-alvo. Tais variantes incluirão tipicamente uma mutação em um, mas não em ambos, os domínios de endonuclease Cas9 (HNH e RuvC). Desta maneira, uma mutação de aminoácido na posição D10A ou H840A em Cas, numerada em relação à Cas9 de S. pyogenes), isto é, spCas9, pode resultar na inativação da atividade catalítica de nuclease e converte Cas9 em uma nickase.
[0190] Variantes de Cas9 adicionais são conhecidas na técnica e
Petição 870190070557, de 24/07/2019, pág. 178/401
114/306 compreendidas como variantes de acordo com a presente invenção. O Pedido de Patente U.S. No. 20140273226 discute o gene Cas9 de S. pyogenes, proteína Cas9 e variantes da proteína Cas9 incluindo sequências de codificação de Cas9 otimizadas no códon específicas de hospedeiro e proteínas de fusão Cas9. O Pedido de Patente U.S. 20140315985 ensina um número grande de polipeptídeos Cas9 do tipo selvagem exemplares (por exemplo, SEQ ID NO: 1-256, SEQ ID NOS: 795-1346 do Pedido de Patente U.S> No. 20140273226) incluindo a sequência de Cas9 de S. pyogenes (SEQ ID NO: 8 do Pedido de Patente U.S. No. 20140273226). Modificações e variantes de proteínas Cas9 são também discutidas. A descrição das presentes referências é incorporada aqui em sua totalidade.
[0191] Em modalidades adicionais, ácidos nuclelcos artificiais de acordo com a invenção codificam uma proteína Cas9, ou uma isoforma, homólogo, variante, fragmento ou derivado da mesma, como indicado na Tabela 2 do PCT/EP2017/076775, que é aqui incorporado a título de referência em sua totalidade. Por exemplo, os ácidos nucleicos artificiais da invenção podem então compreender pelo menos uma sequência de codificação codificando uma proteína Cas9 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma da SEQ ID NOs: 428-1345 ou 1362-1375do PCT/EP2017/076775 ou uma isoforma, homólogo, variante, fragmento ou derivado (funcional) da mesma.
Sequências de ácido nucleico [0192] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 como aqui definido, em que a dita sequência de ácido nucleico é definida por qualquer uma de SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114
Petição 870190070557, de 24/07/2019, pág. 179/401
115/306
8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 35543567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 36503663; 3666-3679; 3682-3695; 9514-9527: 9626-9639; 9738-9751; 98509863; 9962-9975, 10074-10087; 10186-10199; 10298-10311 ;23302343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 24262439; 2442-2455; 2458-2471; 2474-2487: 2490-2503; 2506-2519; 25222535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 1020210215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 1001 ΟΙ 0023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 81468159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 82428255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 95789591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250-10263: 10362-10375; 9290-9303; 9306-9319; 9322-9335; 93389351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 94349447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; 27; 996-1009; 2156-2169; 3316-3329; 4476-4489; 56365649; 6796-6809; 7956-7969; 1010- 1913; 2170-3073; 3330-4233; 4490-5393; 5650-6553; 6810-7713; 7970-8873, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma
Petição 870190070557, de 24/07/2019, pág. 180/401
116/306 sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0193] Em modalidades preferidas, os ácidos nucleicos artificiais da invenção codificam ainda, em sua região de codificação, pelo menos um sinal de localização nuclear. A sequência de ácido nucleico codificando o(s) slnal(ais) de localização nuclear é preferivelmente fundida ao ácido nucleico codificando a proteína Cas9, ou um homólogo, variante, fragmento ou derivado da mesma, como aqui definido, de modo a facilitar transporte da dita proteína Cas9, ou seu homólogo, variante, fragmento ou derivado da mesma, para o núcleo. Em modalidades preferidas, os ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas9, ou um homólogo, variante, fragmento ou derivado da mesma, fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NOs: 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988; 11990-11996; 1199812004; 12006-12012; 12014-12020 ou qualquer sequência de ácido nucleico codificando a proteínas de SEQ ID NOs: 12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, In particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%,
Petição 870190070557, de 24/07/2019, pág. 181/401
117/306
80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0194] A presente invenção compreende a combinação benéfica de regiões de codificação de proteína associada à CRISPR com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucieico codificando uma proteína Cas9 ou um homóiogo, variante, fragmente ou derivado da mesma fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 101/ΟΙ 0183-10282-10295: 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994
Petição 870190070557, de 24/07/2019, pág. 182/401
118/306
10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 69866999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 1012210135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 81628175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 82588271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 96909703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular sequências de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0195] A presente invenção compreende a combinação benéfica de regiões de codificação de proteína associada a CRISPR com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas9 ou um homólogo, variante, fragmento ou derivado da mesma fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer SEQ ID NO selecionada do grupo consistindo em SEQ
Petição 870190070557, de 24/07/2019, pág. 183/401
119/306
ID NO: 14274, SEQ ID NO: 14275, SEQ ID NO: 14276, SEQ ID NO: 14277, SEQ ID NO: 14278, SEQ ID NO: 14279, SEQ ID NO: 14280, SEQ ID NO: 14281 e SEQ ID NO: 14282; mais preferivelmente SEQ ID NO: 14281, SEQ ID NO: 417 (HSD17B4/PSMB3.1 i.e. construto HSD17B4_ NLS2..STRP1 (SF370)-cas9_HsOpt_NLS4_PSMB3.1; Hsopt - otimização de Homo sapiens) ou SEQ ID NO:414 (Slc7a3.1 / Gnasl, i.e. construto Scl7a3.1__NLS2_STRP1(SF370)-cas9__HsOpt_NLS4_Gnas.1).
[0196] Vantajosamente, qualquer sequência de Cas9 como revelado pode ser selecionada para uso na invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cas9 e mRNAs codificando versões diferentes das respectivas sequências de proteína Cas9, isto é, sequências do tipo selvagem ou otimizadas.
[0197] Ainda, a excisão precisa do Trato CAG do Gene da Huntingtina por nickase de Cas9 está compreendida nos ensinamentos da presente invenção com referência a PMID 29535594, que é aqui incorporado a título de referência. Também, a divagem de RNA programável e reconhecimento por um Sistema CRISPR-Cas9 natural de Neisseria meningitidis está compreendida nos ensinamentos da invenção com referência a PMID 29456189 que é aqui incorporado a título de referência. Ainda, ligação e divagem dependente de RNA de CRISPR de RNAs endógenos pela Cas9 de Campylobacter jejuni são compreendidas nos ensinamentos da invenção com referência a PMID 29499139 que é aqui incorporado a título de referência. Também ativação de gene alvo in vivo através de modulação transepigenética mediada por CRISPR/Cas9 é compreendida nos ensinamentos da invenção, com referência ao PMID 29224783, que é aqui incorporado a título de referência.
[0198] Em uma modalidade adicional, a presente invenção compreende também as sequências de ácido nucleico como mostrado na Tabela 2A.
Petição 870190070557, de 24/07/2019, pág. 184/401
120/306
Tabela 2A. Sequências de Cas9 otimizadas preferidas adicionais da in venção
5‘ UTR | Cas9 incl. NLS | 3‘UTR | SEQ ID NO |
Slc7a3.1 | N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4 | Gnas.1 | 14521 |
Ubqln2.1 | N LS2J5TRP1 (SF370)-cas9(opt1 )_N LS4 | RPS9.1 | 14522 |
HSD17B4 | N LS2JSTRP 1 (SF370)-cas9(opt1 )__N LS4 | PSBM3 | 14523 |
HSD17B4 | N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4 | Gnas.1 | 14524 |
Nosip.1 | N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4 | Ndufa1.1 | 14525 |
Mp68 | N LS2JSTRP 1 (SF370)-cas9(opt1 )__N LS4 | Gnas.1 | 14526 |
Mp68 | N LS2_STRP 1 (SF370)-cas9(opt1 )_N LS4 | Ndufa1.1 | 14527 |
Slc7a3.1 | N LS2_STRP1 (SF370)-cas9(opt2)__N LS4 | Gnas.1 | 14528 |
Ubqln2.1 | N LS2JSTRP1 (SF370)-cas9(opt2)...N LS4 | RPS9.1 | 14529 |
HSD17B4 | N LS2_STRP 1 (SF370)-cas9(opt2)_N LS4 | PSBM3 | 14530 |
HSD17B4 | N LS2__STRP 1 (SF370)-cas9(opt2)_N LS4 | Gnas.1 | 14531 |
Nosip.1 | N LS2JSTRP1 (SF370)-cas9(opt2)...N LS4 | Ndufa1.1 | 14532 |
Mp68 | N LS2__STRP 1 (SF370)~cas9(opt2)_N LS4 | Gnas.1 | 14533 |
Mp68 | N LS2__STRP 1 (SF370)-cas9(opt2)_N LS4 | Ndufa1.1 | 14534 |
Slc7a3.1 | N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4 | Gnas.1 | 14535 |
Ubqln2.1 | N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4 | RPS9.1 | 14536 |
HSD17B4 | N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4 | PSBM3 | 14537 |
HSD17B4 | N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4 | Gnas.1 | 14538 |
Nosip.1 | N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4 | Ndufa1.1 | 14539 |
Mp68 | N LS2_STRP1 (SF370)-cas9(opt10)_N LS4 | Gnas.1 | 14540 |
Mp68 | N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4 | Ndufa1.1 | 14541 |
[0199] Em uma modalidade adicional, NLS2JSTRP1(SF370)~ cas9JHsOptJ\ILS4 (SEQ ID NO: 412) é combinada com as combinações de UTR como mostrado na Tabela 2A, isto é, com Slc7a3.1 (SEQ ID NO: 15/16) / Gnas.1 (SEQ ID NO: 29/30).
Tabela 2B. Sequências de Cas9 preferidas adicionais da invenção
5‘ UTR | Cas9 (Hsopt) íncl. NLS | 3‘UTR | SEQ ID NO |
Slc7a3.1 | NLS2__STRP1(SF370)-cas9__HsOpt__NLS4 | Gnas.1 | 414 |
Ubqln2.1 | NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 | RPS9.1 | 14542 |
HSD17B4(V2) | NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 | PSBM3 | 417 |
HSD17B4ÍV2) | NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 | Gnas.1 | 14543 |
Nosip.1 | NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 | Ndufa1.1 | 14544 |
Mp68 | NLS2_STRP1(SF370)~cas9_HsOpt_NLS4 | Gnas.1 | 14545 |
Mp68 | NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 | Ndufa1.1 | 14546 |
[0200] Em modalidades adicionais, as sequências de ácido nucleico
Petição 870190070557, de 24/07/2019, pág. 185/401
121/306 artificiais de acordo com a invenção podem compreender ou consistir em sequências de ácido nucleico de acordo com SEQ ID NOs: 1380 1393; 1394 - 2297; 2314™ 2327; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458
- 2471; 2474 - 2487; 2490 - 2503; 2506 - 2519; 2522 - 2535; 9498 -9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 - 10295; 2540 - 2553; 2554 - 3457; 3474 3887; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650
- 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 -10087; 10186-10199; 10298 -10311; 3700 - 3713; 3714 - 4617; 4634 - 4647; 4650 - 4663; 4666 - 4679; 4682
- 4695; 4698 -4711; 4714 - 4727; 4730 - 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530
- 9543; 9642 - 9655; 9754 -9767; 9866 -9879; 9978 - 9991; 10090 10103; 10202 - 10215; 10314-10327; 4860 - 4873; 4874-5777; 5794
- 5807; 5810 - 5823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 - 5999; 6002 - 6015; 9546 - 9559; 9658 - 9671; 9770
- 9783; 9882 - 9895; 9994 - 10007; 10106-10119; 10218 - 10231; 10330 - 10343; 6020 - 6033; 6034 - 6937; 6954 - 6967; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 -7079; 7082-7095; 7098 - 7111; 7114 - 7127; 7130-7143; 7146-7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010
- 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 7180 - 7193; 7194-8097; 8114-8127; 8130-8143; 8146-8159; 8162-8175; 8178
- 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322 - 8335; 9578 - 9591; 9690 -9703; 9802-9815; 9914-9927; 10026- 10039; 10138-10151; 10250 -10263; 10362 - 10375; 8340 - 8353; 8354 - 9257; 9274 - 9287; 9290
Petição 870190070557, de 24/07/2019, pág. 186/401
122/306
- 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 - 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466
- 9479; 9482 - 9495; 9594 -9607: 9706 - 9719; 9818-9831; 9930 - 9943; 10042 - 10055; 10154 - 10167; 10266 - 10279; 10378 -- 10391; 411; 1380 - 1393; 2540 - 2553; 3700 - 3713; 4860 - 4873; 6020 - 6033; 7180
- 7193; 8340 - 8353; 1394 - 2297; 2554 - 3457; 3714 - 4617; 4874 5777; 6034 - 6937; 7194 - 8097; 8354 - 9257; 2314 - 2327; 3474 - 3887 : 4634-4647; 5794-5807; 6954-6967; 8114-8127; 9274-9287; 413
- 425; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458 - 2471; 2474 - 2487; 2490
- 2503; 2506 - 2519; 2522 - 2535; 9498 -9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 10295; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650
- 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 -10087; 10186-10199; 10298 -10311; 4650 - 4663; 4666 - 4679; 4682 - 4695; 4698 -4711; 4714 - 4727; 4730
- 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530 - 9543; 9642 - 9655; 9754 -9767; 9866 9879; 9978-9991; 10090- 10103; 10202- 10215; 10314- 10327; 58105823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 - 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 -
QA71 - Q77H Q7&^- QO0O QftQfv OUUZ - oulu, ~ í, ~ - destra,
9994 -10007; 10106 -10119; 10218 - 10231; 10330 -10343; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 7079; 7082- 7095; 7098- 7111; 7114-7127; 7130- 7143; 7146- 7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 8130 - 8143; 8146
- 8159; 8162 - 8175; 8178 - 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322
Petição 870190070557, de 24/07/2019, pág. 187/401
123/306
8335: 9578 - 9591; 9690 - 9703; 9802 - 9815; 9914 - 9927; 10026 -10039; 10138-10151; 10250 -10263; 10362 - 10375; 9290 - 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466 - 9479; 9482 - 9495; 9594 -9607; 9706 - 9719; 9818 - 9831; 9930 - 9943; 10042 -10055; 10154 - 10167; 10266 - 10279; 10378 - 10391 do PCT/EP2017/076775 ou homólogos, fragmentos, variantes ou derivados (funcionais) das mesmas. Cpf1 [0201 ] Cpf1 (CRISPR de Prevctelia e Frandsella 1) ou ”Cas12” refere-se a endonucleases de DNA guiadas por RNA, que pertencem aos sistemas CRiSPR-Cas tipo V classe 2 putativos (Zetsche e outros, Cell. 2015 Out 22; 163(3): 759-771) e homólogos, variantes, fragmentos e derivados das mesmas. Genes codificando Cpr1 incluem o gene cpf1 de Frandsella tuíarensís subsp. novidda (cepa U112) (Sequência de Referência NCBI: NZ_CP009633.1, AW25_RS03035) ou homólogos, variantes ou fragmentos do mesmo. Com base em análise de sequência, Cpf1 contém apenas um domínio de endonuclease RuvC, e um segundo domínio de nuclease (NUC) novo putativo (Zetsche e outros, Cell. 2015 Out 22; 163(3): 759-771, Gao e outros, Cell Res. 2016 Ago;26(8):901-13).
[0202] Proteínas Cpf1 preferivelmente se associam com um crRNA formando um complexo Cpf1 :crRNA que é preferivelmente capaz de interagir especificamente com uma sequência de DNA-alvo. Complexos de Cpf1 :crRNA são preferivelmente capazes de clivar eficientemente DNAalvo seguido por um motivo adjacente protoespaçador rico em T curto (PAM) localizado 5’ do DNA-alvo, e podem introduzir quebras de filamento duplo de DNA escalonado com uma sobreposição 5’ de 4 ou 5-nt.
Seguêndas de aminoáddo [0203] Várias proteínas Cpf1 são conhecidas na técnica e são compreendidas como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cpf1 adequadas são listadas na Tabela 3
Petição 870190070557, de 24/07/2019, pág. 188/401
124/306 abaixo. Nela, cada fileira corresponde a uma proteína Cpf1 como identificado por seu número de acesso no banco de dados (primeira coluna, A, No. Ac.). A segunda coluna na Tabela 3 (B) indica a SEQ ID NO: correspondendo à respectiva sequência de aminoácido conforme provido aqui. Proteínas Cpf1 preferidas são mostradas na listagem de sequência sob SEQ ID NOs: 1346-1347; 10576-10577; e1348-1361. As sequências de mRNA otimizadas correspondentes que sâo modalidade preferida da invenção são mostradas na listagem de sequência sob SEQ ID NO: 10552; 3458-3459; 3460-34732298-2299; 4618-4619;
5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; e 9260-9273.
Tabela 3. Proteínas Cpf1
Coluna A | Coluna B | |
Fileira | No. Ac. | SEQ ID NO |
1 | U2UMQ6 | 1346 |
2 | A0Q7Q2 | 1347 |
3 | A8WNM2 | 1348 |
4 | E3LGD2 | 1349 |
5 | A0A182DWE3 | 1350 |
6 | A0A0B6KQP9 | 1351 |
7 | A0A0E1N6W4 | 1352 |
8 | V6HCU8 | 1353 |
9 | A0A0E1N9S2 | 1354 |
10 | A0A1B8PW75 | 1355 |
11 | A0A1J0L0B6 | 1356 |
12 | A0A1F3JTA5 | 1357 |
13 | A0A1G2R4W1 | 1358 |
14 | A0A1F5S360 | 1359 |
15 | A0A1F5ENJ2 | 1360 |
16 | A0A1J4U637 | 1361 |
17 | U2UMQ6 (NLS2___cpf1__U2UMQ6__NLS4__prot) | 1376 |
18 | A0Q7Q2 (NLS2__cpf1__A0Q7Q2__NLS4__prot) | 1377 |
Petição 870190070557, de 24/07/2019, pág. 189/401
125/306 [0204] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção então compreende uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 como definido pelo número de acesso no banco de dados provido sob a respectiva coluna na Tabela 3, ou um homólogo, variante, fragmento ou derivado da mesma. Em particular, a proteína Cpf1 codificada pode compreender ou consistir preferivelmente em uma sequência de aminoácido como indicado sob a respectiva coluna na Tabela 3, ou um homólogo, variante, fragmento ou derivado da mesma.
[0205] Especificamente, em modalidades preferidas a molécula de ácido nucleico artificial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma de SEQ ID NO: 1346-1347; 10576-10577; ou 1348-1361, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0206] Em particular, a proteína Cpf1 codificada pode compreender preferivelmente pelo menos um sinal de localização nuclear (NLS), mais preferivelmente dois NLS selecionados de NLS2 e NLS4 como acima definido. Em modalidades preferidas, a molécula de ácido nucleico arti
Petição 870190070557, de 24/07/2019, pág. 190/401
126/306 ficial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 com sinais de localização nuclear, compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma de SEQ ID NOs: 992-993 ou um homólogo, variante, fragmento ou derivado (funcional) do mesmo compreendendo ou consistindo em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0207] Em modalidades adicionais, ácidos nucleicos artificiais de acordo com a invenção codificam uma proteína Cpf1, ou uma isoforma, homólogo, variante, fragmento ou derivado da mesma, como indicado na Tabela 3 do PCT/EP2017/076775, que é aqui incorporado a título de referência em sua totalidade. Especificamente, a molécula de ácido nucleico artificial (RNA) da invenção pode então compreender uma sequência de codificação codificando uma proteína Cpf1 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma SEQ ID NOs: 1346-1361 ou 1376-1377 ou 10576-10577 do PCT/EP2017/076775 ou uma isoforma, homólogo, variante, fragmento ou derivado (funcional) da mesma.
Sequências de ácido nucleico [0208] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico
Petição 870190070557, de 24/07/2019, pág. 191/401
127/306 codificando uma proteína Cpf1 como definido aqui, em que a dita sequência de ácido nucleico é definida por qualquer uma das SEQ ID NOs: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 1008810089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 1007210073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 1010410105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 1012010121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 70487049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 71447145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912
Petição 870190070557, de 24/07/2019, pág. 192/401
128/306
9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525: 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377;
10407; 10414; | 10421; | 10428; | 10435; | 10442; | 10449; | 10456; | 10463; |
10470; 10477; | 10484; | 10491; | 10498; | 10505; | 10512; | 10519; | 10526; |
10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; | 10579- | ||||||
10580; 10585-10586; | 10588-10589; | 10591 | -10592; | 10594-10595; | |||
10597-10598; | 10554-10574; 10601; | 10602; | 10615; | 10616; | 10629; | ||
10630; 10643; | 10644; | 10657; | 10658; | 10671; | 10672; | 10685; | 10686; |
10699; 10700; | 10713; | 10714; | 10727; | 10728; | 10741; | 10742; | 10755; |
10756; 10769; | 10770; | 10783; | 10784; | 10797; | 10798; | 10811; | 10812; |
10825; 10826; | 10839; | 10840; | 10853; | 10854; | 10867; | 10868; | 10881; |
10882; 10603; | 10604; | 10617; | 10618; | 10631; | 10632; | 10645; | 10646; |
10659; 10660; | 10673; | 10674; | 10687; | 10688; | 10701; | 10702; | 10715; |
10716; 10729; | 10730; | 10743; | 10744; | 10757; | 10758; | 10771; | 10772; |
10785; 10786; | 10799; | 10800; | 10813; | 10814; | 10827; | 10828; | 10841; |
10842; 10855; | 10856; | 10869; | 10870; | 10883; | 10884; | 10605; | 10606; |
10619; 10620; | 10633; | 10634; | 10647; | 10648; | 10661; | 10662; | 10675; |
10676; 10689; | 10690; | 10703; | 10704; | 10717; | 10718; | 10731; | 10732; |
10745; 10746; | 10759; | 10760; | 10773; | 10774; | 10787; | 10788; | 10801; |
10802; 10815; | 10816; | 10829; | 10830; | 10843; | 10844; | 10857; | 10858; |
10871; 10872; | 10885; | 10886; | 10607; | 10608; | 10621; | 10622; | 10635; |
10636; 10649; | 10650; | 10663; | 10664; | 10677; | 10678; | 10691; | 10692; |
10705; 10706; | 10719; | 10720; | 10733; | 10734; | 10747; | 10748; | 10761; |
10762; 10775; | 10776; | 10789; | 10790; | 10803; | 10804; | 10817; | 10818; |
10831; 10832; | 10845; | 10846; | 10859; | 10860; | 10873; | 10874; | 10887; |
Petição 870190070557, de 24/07/2019, pág. 193/401
129/306
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777: 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668: 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352
9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548; ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0209] Em uma outra modalidade preferida, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 como aqui definido, em que a dita sequência de ácido nucleico é definida por qualquer uma da SEQ ID
Petição 870190070557, de 24/07/2019, pág. 194/401
130/306
NO: 10549 (i.e. AsCpfl 32L4__AsCpf1(Hsopt)-NLS3-3xHA-tag_albumina7) ou SEQ ID NO: 10550 (i.e. LbCpfl = 32L4....LbCpf1(Hsopt)NLS3-3xHA-tag_albumina7); ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0210] Em modalidades preferidas, os ácidos nucleicos artificiais da invenção codificam ainda, em sua região de codificação, pelo menos um sinal de localização nuclear. A sequência de ácido nucleico codificando o(s) sinal(ais) de localização nuclear é preferivelmente fundida ao ácido nucleico codificando a proteína Cpf1, ou seu homólogo, variante, fragmento ou derivado, como definido aqui, de modo a facilitar transporte da dita proteína Cpf 1, ou seu homólogo, variante, fragmento ou derivado, para o núcleo. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cpf 1, ou seu homólogo, fragmento, variante ou derivado, fundida a pelo menos um sinal de localização, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NOs: 10551; 10581; 10593; 10584; 10587; 10590; 10593; 10596; 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988;
Petição 870190070557, de 24/07/2019, pág. 195/401
131/306
11990-11996; 11998-12004; 12006-12012; 12014-12020 ou sequências de ácido nucleico codificando qualquer uma de uma combinação de SEQ ID NO:12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0211] Vantajosamente, as sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como Cpf1, ou seus homólogos, variantes, fragmentos ou derivados, são combinadas com a região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, os ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cpf1, ou um homólogo, variante ou fragmento da mesma, que são fundidos ainda a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID Nos: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 1008810089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487;
Petição 870190070557, de 24/07/2019, pág. 196/401
132/306
10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 1007210073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479: 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 1010410105; 10216-10217; 10328-10329; 10404: 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5Ο/Π ΚΟ/Ν· &QE& CQE7- £0*70 COQÔ· EQfM CCiAC SQOA ΕΩΟ-1· o4U~Oo41, bobo-bob/, bo/z-ba/o, booo-booy, byU4~byub, byzU~byzl, 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 1012010121; 10232-10233; 10344-10345; 10405: 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 70487049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 71447145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 99129913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526;
Petição 870190070557, de 24/07/2019, pág. 197/401
133/306
10533; | 10540; | 10547; ! | 9288-9289; 10401; 10553: 10582-1058310579- |
10580; | 10585-10586; | 10588-10589; 10591-10592; 10594-10595; | |
10597-10598; | 10554-10574; 10601; 10602; 10615; 10616; 10629; | ||
10630; | 10643; | 10644; | 10657; 10658; 10671; 10672; 10685; 10686; |
10699; | 10700; | 10713; | 10714; 10727; 10728; 10741; 10742; 10755; |
10756; | 10769; | 10770; | 10783; 10784; 10797; 10798; 10811; 10812; |
10825; | 10826; | 10839; | 10840; 10853; 10854; 10867; 10868; 10881; |
10882 | 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; | ||
10659; | 10660; | 10673; | 10674; 10687; 10688; 10701; 10702: 10715; |
10716; | 10729; | 10730; | 10743; 10744; 10757; 10758; 10771; 10772; |
10785; | 10786; | 10799; | 10800; 10813; 10814; 10827; 10828; 10841; |
10842; | 10855; | 10856; | 10869; 10870; 10883; 10884; 10605: 10606; |
10619; | 10620; | 10633; | 10634; 10647; 10648; 10661; 10662; 10675; |
10676; | 10689; | 10690; | 10703; 10704; 10717; 10718; 10731; 10732; |
10745; | 10746; | 10759; | 10760; 10773; 10774; 10787; 10788: 10801; |
10802; | 10815; | 10816; | 10829; 10830; 10843; 10844; 10857; 10858; |
10871; | 10872; | 10885; | 10886; 10607; 10608; 10621; 10622; 10635; |
10636; | 10649; | 10650; | 10663; 10664; 10677; 10678; 10691: 10692; |
10705; | 10706; | 10719; | 10720; 10733; 10734; 10747; 10748; 10761; |
10762; | 10775; | 10776; | 10789; 10790; 10803; 10804; 10817; 10818; |
10831; | 10832; | 10845; | 10846; 10859; 10860; 10873; 10874: 10887; |
10888; | 10609; | 10610; | 10623; 10624; 10637; 10638; 10651; 10652; |
10665; | 10666; | 10679; | 10680; 10693; 10694; 10707; 10708; 10721; |
10722; | 10735; | 10736; | 10749; 10750; 10763; 10764; 10777; 10778; |
10791; | 10792; | 10805; | 10806; 10819; 10820; 10833; 10834; 10847; |
10848; | 10861; | 10862; | 10875; 10876; 10889; 10890; 10611; 10612; |
10625; | 10626; | 10639; | 10640; 10653; 10654; 10667; 10668; 10681; |
10682; | 10695; | 10696; | 10709; 10710; 10723; 10724; 10737; 10738; |
10751; | 10752; | 10765; | 10766; 10779; 10780; 10793; 10794; 10807; |
10808; | 10821; | 10822; | 10835; 10836; 10849; 10850; 10863; 10864; |
Petição 870190070557, de 24/07/2019, pág. 198/401
134/306
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0212] Vantajosamente, qualquer sequência de Cpf1 como aqui revelado pode ser selecionada para uso na invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cpf1 e mRNAs codificando versões diferentes das respectivas sequências de proteína Cpf1, isto é, sequências do tipo selvagem ou otimizadas.
[0213] Em modalidades adicionais, as sequências de ácido nucleico artificiais de acordo com a invenção podem compreender ou consistir em uma sequência de ácido nucleico de acordo com SEQ ID NOs: 2298 - 2299; 3458 - 3459; 4618 - 4619; 5778 - 5779; 6938 - 6939; 8098 8099; 9258 - 9259; 2300 - 2313; 3460 - 3473; 4620 - 4633; 5780 5793; 6940 - 6953; 8100 - 8113; 9260 - 9273; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 2344 - 2345;
Petição 870190070557, de 24/07/2019, pág. 199/401
135/306
2360 - 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440
- 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960
- 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584 - 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664
- 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864 - 9865; 9976 - 9977; 10088 -10089; 10200 -10201; 10312 -10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656
- 9657; 9768-9769; 9880 - 9881; 9992 - 9993; 10104- 10105; 10216 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; ARRR - ARA7· AR79 - AR7R- ARRR - ARRQ- RQf)4 - RQDA· - RQ91 AQRR
- 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120-10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 -7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912
- 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462;
Petição 870190070557, de 24/07/2019, pág. 200/401
136/306
10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704
- 9705; 9816-9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264
- 10265; 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304-9305; 9320-9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416
- 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057;
10168 - 10169; | 10280 | - 10281; | 10392 | - 10393 | 10408; | 10415; | 10422 |
10429; 10436; | 10443; | 10450; | 10457; | 10464; | 10471; | 10478; | 10485 |
10492; 10499; | 10506; | 10513; | 10520; | 10527; | 10534; | 10541; | 10548 |
10552; 10594 - | 10595; | 10582 - | 10583; | 10585 - | 10586; | 10588 - | 10589 |
10591 - 10592; | 10594 | - 10595; | 10597 | - 10598 | 10553 | 10599; | 10600 |
10613; 10614; | 10627; | 10628; | 10641; | 10642; | 10655; | 10656; | 10669 |
10670; 10683; | 10684; | 10697; | 10698; | 10711; | 10712; | 10725; | 10726 |
10739; 10740; | 10753; | 10754; | 10767; | 10768; | 10781; | 10782; | 10795 |
10796; 10809; | 10810; | 10823; | 10824; | 10837; | 10838; | 10851; | 10852 |
10865; 10866; | 10879; | 10880; | 10601; | 10602; | 10615; | 10616; | 10629 |
10630; 10643; | 10644; | 10657; | 10658; | 10671; | 10672; | 10685; | 10686 |
10699; 10700; | 10713; | 10714; | 10727; | 10728; | 10741; | 10742; | 10755 |
10756; 10769; | 10770; | 10783; | 10784; | 10797; | 10798; | 10811; | 10812 |
10825; 10826; | 10839; | 10840; | 10853; | 10854; | 10867; | 10868; | 10881 |
10882; 10603; | 10604; | 10617; | 10618; | 10631; | 10632; | 10645; | 10646 |
10659; 10660; | 10673; | 10674; | 10687; | 10688; | 10701; | 10702; | 10715 |
10716; 10729; | 10730; | 10743; | 10744; | 10757; | 10758; | 10771; | 10772 |
10785; 10786; | 10799; | 10800; | 10813; | 10814; | 10827; | 10828; | 10841 |
10842; 10855; | 10856; | 10869; | 10870; | 10883; | 10884; | 10605; | 10606 |
Petição 870190070557, de 24/07/2019, pág. 201/401
137/306
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788: 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691: 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 2298 - 2299; 3458 - 3459; 4618 - 4619; 577A £x77Q- QOhO *
2313; 3460 - 3473; 4620 - 4633; 5780 - 5793; 6940 - 6953; 8100-8113; 9260 - 9273; 2314 - 2327; 3474 - 3887 ; 4634 - 4647; 5794 - 5807; 6954 - 6967; 8114 - 8127; 9274 - 9287; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 - 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 10553; 2344 - 2345; 2360 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440 - 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960 - 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479;
Petição 870190070557, de 24/07/2019, pág. 202/401
138/306
10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584
- 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664 - 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864
- 9865; 9976 - 9977; 10088 - 10089; 10200 - 10201; 10312 - 10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656 -9657; 9768-9769; 9880 - 9881; 9992 - 9993; 10104- 10105; 10216 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856 - 5857; 5872 - 5873; 5888 - 5889; 5904 - 5905; 5920 - 5921; 5936
- 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120-10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 -7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912
- 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361;
10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462;
10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525;
10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704
- 9705; 9816-9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264
Petição 870190070557, de 24/07/2019, pág. 203/401
139/306
- 10265: 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304-9305; 9320-9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416
- 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057;
10168 - 10169; | 10280 - 10281; | 10392 - 10393 | 10408; | 10415; | 10422; |
10429; 10436; | 10443; 10450; | 10457; 10464; | 10471; | 10478; | 10485; |
10492; 10499; | 10506; 10513; | 10520; 10527; | 10534; | 10541: | 10548; |
10554-- 10574; | 10594- 10595; | 10582- 10583 | 10585 | - 10586 | 10588 |
-- 10589; 10591 | -10592; 10594 | -10595; 10597 | -10598; 10599; 10600; | ||
10613; 10614; | 10627; 10628; | 10641; 10642; | 10655; | 10656: | 10669; |
10670; 10683; | 10684; 10697; | 10698; 10711; | 10712; | 10725; | 10726; |
10739; 10740; | 10753; 10754; | 10767; 10768; | 10781; | 10782; | 10795; |
10796; 10809; | 10810; 10823; | 10824; 10837; | 10838; | 10851: | 10852; |
10865; 10866; | 10879; 10880; | 10601; 10602; | 10615; | 10616; | 10629; |
10630; 10643; | 10644; 10657; | 10658; 10671; | 10672; | 10685; | 10686; |
10699; 10700; | 10713; 10714; | 10727; 10728; | 10741; | 10742: | 10755; |
10756; 10769; | 10770; 10783; | 10784; 10797; | 10798; | 10811; | 10812; |
10825; 10826; | 10839; 10840; | 10853; 10854; | 10867; | 10868; | 10881; |
10882; 10603; | 10604; 10617; | 10618; 10631; | 10632; | 10645: | 10646; |
10659; 10660; | 10673; 10674; | 10687; 10688; | 10701; | 10702; | 10715; |
10716; 10729; | 10730; 10743; | 10744; 10757; | 10758; | 10771; | 10772; |
10785; 10786; | 10799; 10800; | 10813; 10814; | 10827; | 10828; | 10841; |
10842; 10855; | 10856; 10869; | 10870; 10883; | 10884; | 10605; | 10606; |
10619; 10620; | 10633; 10634; | 10647; 10648; | 10661; | 10662; | 10675; |
10676; 10689; | 10690; 10703; | 10704; 10717; | 10718; | 10731; | 10732; |
10745; 10746; | 10759; 10760; | 10773; 10774; | 10787; | 10788; | 10801; |
10802; 10815; | 10816; 10829; | 10830; 10843; | 10844; | 10857; | 10858; |
10871; 10872; | 10885; 10886; | 10607; 10608; | 10621; | 10622; | 10635; |
Petição 870190070557, de 24/07/2019, pág. 204/401
140/306
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892 do PCT/EP2017/076775 ou homólogos, fragmentos, variantes ou derivados (funcionais) das mesmas.
Cas13, CasX, CasY e outras (endo)nudeases
Sequências de aminoácido [0214] Várias proteínas Cas13, CasX e CasY são conhecidas na técnica e compreendidas como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cas13, CasX e CasY adequadas são mostradas sob SEQ ID NO: 10893-10925; 10926-10998 (Cas13 i.e. WP15770004, WP18451595, WP21744063, WP21746774, ERK53440, WP31473346, CVRQ01000008, CRZ35554, WP22785443,
WP36091002, WP12985477, WP13443710, ETD76934, WP38617242, WP2664492, WP4343973, WP44065294, ADAR2DD, WP47447901, ERI81700, WP34542281, WP13997271, WP41989581, WP47431796, WP14084666, WP60381855, WP14165541, WP63744070,
WP65213424, WP45968377, ΕΗΘ06562, WP6261414, EKB06014, WP58700060, WP13446107, WP44218239, WP12458151, ERJ81987, ERJ65637, WP21665475, WP61156637, WP23846767, ERJ87335,
Petição 870190070557, de 24/07/2019, pág. 205/401
141/306
WP5873511, WP39445055, WP52912312, WP53444417,
WP12458414, WP39417390, ΕΘΑ10535, WP61156470, WP13816155, WP5874195, WP39437199, WP39419792, WP39431778,
WP46201018, WP39442171, WP39426176, WP39418912,
WP39434803, WP39428968, WP25000926, EFU31981, WP4343581, WP36884929, BAU18623, AFJ07523, WP14708441, WP36860899, WP61868553, KJJ86756, EGQ18444, EKY00089, WP36929175, WP7412163, WP44072147, WP42518169, WP44074780,
WP15024765, WP49354263, WP4919755, WP64970887,
WP61710138); 11002; 11003 (CasX, i.e. OGP07438, OHB99618); e11004-11010 (CasY, i.e. OJI08769, OGY82221, OJI06454, APG80656, OJI07455, OJI09436, PIP58309).
[0215] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como Cas13, ou seu homólogo, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas13, ou um homólogo, variante ou fragmento da mesma, que são ainda fundidos a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NO: 1101111042; 11249-11280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 1183911870; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%,
Petição 870190070557, de 24/07/2019, pág. 206/401
142/306
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. Também outras proteínas Cas13 são compreendidas na descrição da invenção, isto é, Cas13a, Cas13b, Cas13c e Cas13d (como aparente a partir de PMID 29551514 e 29551272, aqui incorporados a título de referência). Também incorporadas aqui a título de referência estão as publicações PMID 26593719, 28976959 e 29070703 relacionadas a Cas13.
[0216] Um grande número de proteínas é conhecido na técnica e compreendidos como proteínas associadas a CRISPR no contexto da presente invenção. Sequências de Cas13 preferidas da invenção são Proteína Cas13d (SEQ ID NO: 14294-14321) e suas sequências de mRNA otimizadas tendo SEQ ID NO: 14322-14349, SEQ ID NO: 1435014377, SEQ ID NO: 14378-14405, SEQ ID NO: 14406-14433, SEQ ID NO: 14434-14461, SEQ ID NO: 14462-14489 e SEQ ID NO:1449014517.
[0217] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como CasX, ou seus homólogos, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína CasX, ou um homólogo, variante ou fragmento da mesma, que são fundidos ainda a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NO: 11120
Petição 870190070557, de 24/07/2019, pág. 207/401
143/306
11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0218] Vantajosamente, qualquer sequência de Cas13, CasX ou CasY como aqui revelado ou na listagem de sequência pode ser selecionada para o uso da invenção como proteínas associadas a CRISPR no contexto da presente invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cas13, CasX ou CasY e mRNAs codificando versões diferentes das respectivas sequências de proteína Cas13, CasX ou CasY, isto é, sequências de proteína do tipo selvagem ou otimizadas.
[0219] Ainda, editores à base de adenina (ABEs) que fazem a mediação da conversão de A*T em G*C em DNA genômico como descrito no PMID 29160308 são incorporados aqui a título de referência bem como a própria publicação PMID 29160308. De acordo com os autores, ABEs introduz mutações por ponto mais eficientemente e de modo mais nítido, e com menos modificação de genoma fora do alvo, do que um método à base de nuclease de Cas9 atual, e pode instalar mutações de correção de doença ou supressão de doença em células humanas. Endonucleases ARMAN [0220] Ainda, o uso de novos sistemas CRISPR-Cas de micróbios
Petição 870190070557, de 24/07/2019, pág. 208/401
144/306 não cultivados, isto é, Cas9 de ARMAN, ARMAN-1 (ARMAN-1 de acidiphilum de Candidatus Microarcheaum) e ARMAN-4 (ARMAN-4 de acidiphilum de Candidatus Parvarchaeum) não arequa, é compreendido nos ensinamentos da invenção com referência aPMID 28005056, 20421484 e 17185602 que são aqui incorporados a título de referência. [0221] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como CasY, ou seu homólogo, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com LJTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína CasY, ou um homólogo, variante ou fragmento da mesma, que são ainda fundidos a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NO: 1112311130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 11832-11838; 11950-11956 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
qRNAs [0222] Como discutido aqui, um sistema CRISPR-Cas funcional requer tipicamente a presença de um RNA-guia (gRNA) que se associa
Petição 870190070557, de 24/07/2019, pág. 209/401
145/306 com e recruta uma proteína associada a CRISPR para uma sequência de DNA-alvo complementar. A estrutura e características do RNA-guia tipicamente dependem da escolha da proteína associada a CRISPR particular.
[0223] Como aqui usado, o termo RNA-guia então refere-se a qualquer molécula de RNA capaz de direcionar a uma proteína associada a CRISPR para uma sequência de DNA-alvo de interesse. RNAsguia (gRNAs) compreendem preferivelmente uma i) primeira região de complementaridade que é capaz de hibridizar especificamente com uma sequência de DNA-alvo e ii) uma segunda região que interage com uma proteína associada a CRISPR.
[0224] A dita região, que é tipicamente localizada na extremidade 5’ do gRNA, compreendendo uma sequência de nucleotídeo curta que é complementar a uma sequência de DNA-alvo, é também referida aqui como uma região de direcionamento”. O termo região refere-se a uma seção/segmento de uma molécula, por exemplo, uma extensão contínua de nucleotídeos em um RNA. A região de direcionamento pode ser cerca de 17-20, por exemplo, 21-23, nucleotídeos de comprimento ou pode ser mais longa ou mais curta (gRNA truncado). Ela pode preferivelmente interagir com a sequência de DNA-alvo através de ligação hidrogênio entre pares de base complementares (isto é, bases emparelhadas).
[0225] O gRNA pode ser de qualquer comprimento, contanto que ele compreenda um gene de direcionamento e seja preferivelmente capaz de recrutar uma proteína associada a CRISPR para uma sequência de DNA-alvo de uma maneira específica de sequência. Desta maneira, gRNAs podem ser de pelo menos 10, pelo menos 11, pelo menos 12, mais preferivelmente pelo menos 13, pelo menos 14, pelo menos 15 e sobretudo preferivelmente pelo menos 16 ou pelo menos 17
Petição 870190070557, de 24/07/2019, pág. 210/401
146/306 nudeotídeos ou pelo menos 18 nudeotídeos ou pelo menos 19 nucleotídeos ou pelo menos 20 nudeotídeos de comprimento. Em algumas modalidades, o gRNA compreende uma região de direcionamento que é preferivelmente de pelo menos 21, pelo menos 22, pelo menos 23, pelo menos 24, pelo menos 25 ou mais de comprimento e ii) uma segunda região que interage com uma proteína associada a CRISPR.
[0226] Como aqui usado, o termo gRNA inclui gRNAs de duas moléculas bem como RNAs de molécula única. O gRNA pode ou não compreender características de estrutura secundária para interação com a proteína associada a CRISPR.
[0227] O sistema CIRSPR~Cas9 tipo II emprega naturalmente gRNAs de duas moléculas. Tais gRNAs de duas moléculas (tracrRNA/ crRNA) compreende tipicamente uma molécula de crRNA (RNA CRISPR RNA direcionadora ou crRNA ou repetição de crRNA) e um tracrRNA correspondente (CRISPR RNA de trans-ação ou RNA ativadora ou tracrRNA). Um cRNA compreende ambas uma região de direcionamento (filamento simples) e uma extensão (região formador de dúplex) de nudeotídeos que foram uma metade do dúplex de dsRNA da região de ligação a Cas9 do gRNA. Um tracrRNA correspondente compreende uma extensão de nudeotídeos (região de formação de dúplex) que forma a outra metade do dúplex de dsRNA da região de ligação a Cas9 do gRNA. Em outras palavras, uma extensão de nudeotídeos de um crRNA é complementar a e hibridiza com uma extensão de nudeotídeos de um tracrRNA para formar o dúplex de dsRNA da região de ligação a Cas9 do gRNA. Desta maneira, cada crRNA pode ser dito ter um tracrRNA correspondente. O crRNA provê ainda a região de direcionamento de filamento simples. Desta maneira, um crRNA e um tracrRNA (como um par correspondente) hibridizam para formar um gRNA.
Petição 870190070557, de 24/07/2019, pág. 211/401
147/306 [0228] O crRNA e o tracrRNA podem ser também unidos para prover RNAs-guia de molécula simples (artificial) (RNAs-guia simples, sgRNAs). Um sgRNA compreende tipicamente um crRNA conectado em sua extremidade 3’ à extremidade 5’ de um tracrRNA através de uma sequência de alça (vide, por exemplo, Pedido de Patente U.S. No. 20140068797). Similar a crRNA, sgRNA compreende uma região de direcionamento de complementaridade com uma sequência de polinucleotídeo-alvo, tipicamente adjacente a uma segunda região que forma ligações hidrogênio de par de base que formam uma estrutura secundária, tipicamente uma estrutura de tronco. sgRNAs são tipicamente de -100 nucleotídeos de comprimento, no entanto, o termo também inclui RNAs-guia simples truncados (tru-sgRNAs) de aproximadamente 17-18 nt (Fu, Y. e outros, Nat. Biotechnol. 2014 Mar;32(3):279-84). O termo também compreende sgRNAs em miniatura funcionais com características dispensáveis removidas, que retêm um módulo essencial e conservado chamado o nexus localizado na porção de sgRNA que corresponde a tracrRNA (não crRNA) (cf. Pedido de Patente U.S. No. 20140315985 e Briner, A.E. e outros, Mol Cell. 2014 Out 23;56(2):333-9). O nexus está localizado imediatamente a jusante (isto é, localizado na direção 3’ a partir do) do tronco inferior em sistemas CRISPR~Cas9 Tipo II. O termo sgRNA também compreende mortadRNAs (dRNAs) compreendendo regiões de direcionamento encurtadas de 11-15 nucleotídeos. Tais dRNAs podem ser usados para recrutar endonucleases Cas9 cataliticamente ativas para se direcionar a sequências de DNA-alvo para alteração de expressão de gene sem indução de DSBs (cf. Dahlman,
J.E. e outros, Nat Biotechnol. 2015 Nov;33(11):1159-61). Derivados de sgRNA são também compreendidos pelo termo. Tais derivados incluem tipicamente porções ou entidades adicionais conferindo uma funcionalidade nova ou adicional. Particularmente, aptâmeros de MS2 adicionados à tetra-alça de sgRNA e/ou estruturas de tronco-alça são capazes
Petição 870190070557, de 24/07/2019, pág. 212/401
148/306 de seletivamente recrutar proteínas compreendendo os ditos domínios MS2 para o DNA-alvo (sgRNA-MS2) (cf. Konermann, S. e outros. Nature. 2015 Jan 29; 517(7536): 583-588). Modificações adicionais são também concebíveis e compreendidas aqui.
[0229] O uso de tracrRNA/crRNA ou sgRNAs como gRNAs não é limitada a proteínas Cas9. Qualquer outro sistema associado a CRISPR, preferivelmente do sistema CRISPR-Cas tipo II, pode ser usado em conexão com tais gRNAs. No entanto, outros gRNAs podem ser requeridos para assegurar funcionalidade das outras proteínas CRISPR-Cas, e tais gRNAs são também compreendidos na respectiva definição. Por exemplo, proteínas associadas a CRISPR tipo V, tal como Cpf1, são guiadas por um crRNA simples e curto (42-44 nt), compreendendo tipicamente alça tronco simples em uma sequência de repetição direta.
[0230] gRNAs, tais como tracr/RNA/crRNA, sgRNAs ou crRNAs podem ser providos através de qualquer meio adequado, por exemplo, em forma nua ou complexada como descrito aqui no contexto de moléculas de ácido nucleico artificiais, por exemplo, usando lipídeos ou carreadores (poli)catiônicos, mas são tipicamente administrados através de um vetor. Vetores adequados (como definido na seção intitulada Definições) incluem qualquer ácido nucleico que seja capaz de preferivelmente ubiquamente expressar gRNAs funcionais (isto é, que seja capaz de recrutar a respectiva proteína associada a CRISPR para a a sequência de DNA-alvo). Vetores então incluem plasmídeos e vetores virais, em particular vetores lentivirais e vetores de vírus adenoassociados (AAV).
RNAs [0231] A molécula de ácido nucleico artificial da invenção pode ser preferivelmente um RNA. Será compreendido que o termo RNA referese a moléculas de ácido ribonucleico caracterizadas pela sucessão específica de seus nucleotídeos unidos para formas as ditas moléculas
Petição 870190070557, de 24/07/2019, pág. 213/401
149/306 (isto é, sua sequência de RNA). O termo RNA” pode então ser usado para se referir a moléculas de RNA ou sequências de RNA como será compreendido prontamente pelo versado na técnica no respectivo contexto. Por exemplo, o termo RNA como usado no contexto da invenção refere-se preferivelmente a uma molécula de RNA (a dita molécula sendo caracterizada, inter alia, por sua sequência de RNA particular). O termo RNA no contexto de modificações de sequência será compreendido se relacionar a sequências de RNA modificadas, mas tipicamente inclui também as moléculas de RNA resultantes (que são modificadas com relação à sua sequência de RNA). Em modalidades preferidas, o RNA pode ser um mRNA, um RNA viral ou um RNA de replicon, preferivelmente um mRNA.
RNAs mono-, bi- e multicistrônicos [0232] De acordo com algumas modalidades da presente invenção, a molécula de ácido nucleico artificial, preferivelmente RNA, pode ser mono-, bi- ou multicistrônica, preferivelmente como aqui definido. RNAs bi- ou multicistrônicos compreendem tipicamente duas (bicistrônica) ou mais (multicistrônica) estruturas de leitura aberta (ORF). Uma estrutura de leitura aberta neste contexto é uma sequência de códon que é traduzivel em um peptídeo ou proteína. As sequências de codificação em uma molécula de ácido nucleico artificial bi- ou multicistrônica, preferivelmente RNA, preferivelmente codificam proteínas distintas como definido aqui. Molécula de ácido nucleico artificial bi- ou até mesmo multicistrônica, preferivelmente RNAs, pode codificar, por exemplo, pelo menos duas, três, quatro, cinco, seis ou mais (preferivelmente diferentes) proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas) como aqui definido. O termo codificando duas ou mais proteínas pode significar, sem ser limitado ao mesmo, que a molécula de ácido nucleico artificial bi- ou até mesmo multicistrônica, preferivelmente RNA, pode codificar, por exemplo, pelo menos duas, três, quatro, cinco, seis
Petição 870190070557, de 24/07/2019, pág. 214/401
150/306 ou mais (preferivelmente diferentes) proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas).
[0233] Em algumas modalidades, as sequências de codificação codificando duas ou mais proteínas associadas a CRISPR, ou homólogos, variantes, fragmentos ou derivados das mesmas como aqui definido, podem ser separadas no RNA bis- ou multicistrônico por pelo menos uma sequência IRES (sítio de entrada ribossomal interno). O termo IRES (sítio de entrada ribossomal interno) refere-se a uma sequência de RNA que permite início de tradução. Um IRES pode funcionar como um sítio de ligação de ribossomo único, mas pode também servir para prover uma molécula de ácido nucleico artificial bi~ ou até mesmo multicistrônica, preferivelmente RNA como acima definido, que codifica várias proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas), que devem ser traduzidas pelos ribossomos independentemente umas das outras. Exemplos de sequências de IRES, que podem ser usadas de acordo com a invenção, são aquelas derivadas de picornavírus (por exemplo, FMDV), pestvirus (CFFV), poliovirus (PV), vírus da encefalomiocardite (ECMV), vírus da doença do pé e da boca (FMDV), vírus da hepatite C (HCV), vírus da febre suína clássica (CSFV), vírus do leucoma do camundongo (MLV), vírus da imunodeficiência simiana (SIV) ou vírus da paralisia do grilo (CrPV).
[0234] De acordo com modalidades adicionais, a pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode codificar pelo menos duas, três, quatro, cinco, seis, sete, oito e mais proteínas associadas a CRISPR (ou homólogos, variantes, fragmentos ou derivados das mesmas) como aqui definido ligadas com ou sem uma sequência ligante de aminoácido, em que a dita sequência ligante pode compreender ligantes rígidos ligantes flexíveis, ligantes cliváveis (por exemplo, peptídeos de autocliva
Petição 870190070557, de 24/07/2019, pág. 215/401
151/306 gem) ou uma combinação dos mesmos. Ligantes exemplares são descritos na seção intitulada Derivados. A respectiva descrição é aplicável à ligação de proteínas associadas a CRISP múltiplas, mutatis mutandis. Nela, proteínas associadas a CRISPR como aqui definido podem ser idênticas ou diferentes ou uma combinação das mesmas.
[0235] Preferivelmente, a molécula de ácido nucleico artificial, preferivelmente RNA, compreende um comprimento de cerca de 50 a cerca de 20000, ou 100 a cerca de 20000 nucleotídeos, preferivelmente de cerca de 250 a cerca de 20000 nucleotídeos, mais preferivelmente de cerca de 500 a cerca de 10000, ainda mais preferivelmente de cerca de 500 a cerca de 5000.
[0236] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode ainda ser de filamento simples ou filamento duplo. Quando provida como um RNA de filamento duplo, a molécula de ácido nucleico artificial compreende preferivelmente um filamento de senso e um de antissenso correspondente.
Modificações de ácido nucleico [0237] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, da Invenção, ou qualquer outro ácido nucleico definido aqui (por exemplo, um vetor), podem ser providas na forma de ácidos nucleicos modificados. Modificações de ácido nucleico adequadas compreendidas no contexto da presente invenção são descritas abaixo. A expressão qualquer outro ácido nucleico como aqui definido pode, mas tipicamente não, refere-se a gRNAs.
[0238] De acordo com modalidades preferidas, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (sequência) da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é modificada como aqui definido. Uma modificação como aqui definido preferivelmente leva a uma estabilização da dita molécula de ácido nucleico artificial, preferivelmente RNA. Mais preferivelmente,
Petição 870190070557, de 24/07/2019, pág. 216/401
152/306 a invenção então provê uma molécula de ácido nucleico artificial estabilizada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).
[0239] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (para qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode então ser provida como uma molécula de ácido nucleico artificial estabilizada, preferivelmente RNA, em particular mRNA, isto é, que é essencialmente resistente à degradação in vivo (por exemplo, por uma exoou endo-nuclease).
[0240] Tal estabilização pode ser realizada, por exemplo, por uma estrutura principal de fosfato modificada da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Uma modificação de estrutura principal em relação à presente invenção é uma modificação em que fosfatos da estrutura principal dos nucleotídeos contidos no dito RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são quimicamente modificados. Nucleotídeos que podem ser preferivelmente usados nesta relação incluem, por exemplo, uma estrutura principal de fosfato modificada com fosforotioato, preferivelmente pelo menos um dos oxigênios fosfato contidos na estrutura principal de fosfato sendo substituídos por um átomo de enxofre. Molécula de ácido nucleico artificial estabilizada, preferivelmente RNAs (ou outros ácidos nucleicos, em particular RNAs, como aqui definido) podem incluir ainda, por exemplo: análogos de fosfato não iônicos tais como, por exemplo, fosfonatos de alquila e arila, em que o oxigênio fosfato carregado é substituído por um grupo alquila ou arila, ou fosfodiésteres e alquilfosfotriésteres, em que o resíduo de oxigênio carregado está presente em forma alquilada. Tais modificações de estrutura principal incluem tipica
Petição 870190070557, de 24/07/2019, pág. 217/401
153/306 mente, sem implicar qualquer limitação, modificados do grupo consistindo em metilfosfonato, fosforamidatos e fosforotioatos (por exemplo, citidina-5’-O-(1 -tiofosfato)).
[0241 ] Abaixo, modificações específicas são descritas, as quais são preferivelmente capazes de estabilizar a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui).
Modificações químicas [0242] O termo modificação como aqui usado pode se referir a modificações químicas compreendendo modificações de estrutura principal bem como modificações de açúcar ou modificações de base.
[0243] Neste contexto, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode conter análogos/modificações de nucleotídeo (nucleotídeos ou nucleosídeos modificados), por exemplo, modificações de estrutura principal, modificações de açúcar ou modificações de base.
[0244] Uma modificação de estrutura principal em relação à presente invenção é uma modificação em que fosfatos da estrutura principal dos nucleotídeos contidos na dita molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), aqui são quimicamente modificados. Uma modificação de açúcar em relação à presente invenção é uma modificação química do açúcar dos nucleotídeos do ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Ainda, uma modificação de base em relação à presente invenção é uma modificação química da porção de base dos nucleotídeos da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Neste contexto, análogos de nucleotídeo ou modificações são
Petição 870190070557, de 24/07/2019, pág. 218/401
154/306 preferivelmente selecionados a partir de análogos de nucleotídeo que sâo aplicáveis para transcrição e/ou tradução.
Modificações de açúcar [0245] Ácidos nuclelcos (quimicamente) modificados, em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de açúcar, isto é, nucleosídeos/nucleotídeos que são modificados em sua porção açúcar.
[0246] Por exemplo, o grupo 2’ hidroxila (OH) pode ser modificado ou substituído com um número de diferentes substituintes óxi ou desóxi. Exemplos de modificações de grupo óxi-2’ hidroxila incluem, mas não estão limitados a, alcóxi ou arilóxi (-OU, por exemplo, R ··· H, alquila, cicloalquila, arila, aralquila, heteroarila ou açúcar); polietilenoglioóis (PEG), -O(CH2CH2O)nCH2CH2OR; ácidos nuclelcos bloqueados (LNA), em que a 2’ hidroxila está conectada, por exemplo, por uma ponte metileno, ao carbono 4’ do mesmo açúcar ribose; e grupos amino (-Ο-amino, em que o grupo amino, por exemplo, NRR, pode ser alquilamino, dialquilamino, heterociclila, arilamino, diarilamino, heteroarilamino ou di-heteroarilamino, etileno diamina, poliamino) ou aminoalcóxi.
[0247] Modificações desóxi incluem hidrogênio, amino (por exemplo, NH2; alquilamino, dialquilamino, heterociclila, arilamino, diaril amino, heteroaril amino, di-heteroaril amino ou aminoácido); ou o grupo amino pode ser ligado ao açúcar através de um ligante, em que o ligante compreende um ou mais dos átomos deC, Ne O.
[0248] O grupo açúcar pode conter também um ou mais carbonos que possuem a configuração estereoquímica oposta àquela do carbono correspondente em ribose. Desta maneira, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode incluir nucleotídeos contendo, por exemplo, arabinose como o açúcar.
Petição 870190070557, de 24/07/2019, pág. 219/401
155/306
Modificações de Estrutura Principal:
[0249] Ácidos nucleicos (químicamente modificados), em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de estrutura principal, isto é, nucleosídeos/nucleotídeos que são modificados em sua estrutura principal de fosfato.
[0250] Os grupos fosfato da estrutura principal podem ser modificados substituindo um ou mais dos átomos de oxigênio com um substitute diferente. Ainda, os nucleosídeos e nudeotídeos modificados podem incluir a substituição integral de uma porção fosfato não modificada com um fosfato modificado como aqui descrito.
[0251] Exemplos de grupos fosfato modificados incluem, mas não estão limitados a, fosforotioato, fosforoselenatos, borano fosfatos, ésteres de borano fosfato, hidrogênio fosfonatos, fosforamidatos, alquil ou aril fosfonatos e fosforotriésteres. Fosforoditioatos têm ambos oxigênios de não ligados substituídos por enxofre. O ligante fosfato também pode ser modificado pela substituição de um oxigênio de ligação com nitrogênio (fosforamidatos em ponte), enxofre (fosforotioatos em ponte) e carbono (metileno-fosfonatos em ponte).
Modificações de base:
[0252] Ácidos nucleicos (quimicamente) modificados, em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de (núcleo-)base, isto é, nucleosídeos/nucleotídeos que são modificados em sua porção nucleobase.
[0253] Exemplos de nucleobases encontradas em RNA incluem, mas não estão limitados a, adenina, guanina, citosina e uracila. Por exemplo, os nucleosídeos e nudeotídeos descritos aqui podem ser quimicamente modificados na face do sulco principal. Em algumas modalidades, as modificações químicas de sulco prindpal podem incluir um grupo amino, um grupo tiol, um grupo alquila ou um grupo halo.
Petição 870190070557, de 24/07/2019, pág. 220/401
156/306 [0254] Em algumas modalidades, os análogos/modificações de nucleotídeo são selecionados de modificações de base, que são preferivelmente selecionadas de 2~amino-6-cloropurinoribosídeo-5-trifosfato,
2-Aminopurino-ribosideo-5'-trifosfato; 2-aminoadenosina-5'-trifosfato, 2,Amino-2,”desoxicitldino-trifosfato) 2-tiocitidlno-5'-trifosfato, 2-tiourldino-5!-trifosfato, Z'-Fluortimidino-S'-trifosfato, 2s-O~Metil-inosina-5!-trifosfato 4-tiouridino-5'-trifosfato, 5-aminoalilcitidino-5'-trifosfato, 5-aminoaliluridino-5'-trifosfato, 5-bromocitidino-5!-trifosfato, 5-bromouridino-5'trifosfato, 5-Bromo-2'-desoxicitidino-5'-trifosfato, 5-Bromo-2'-desoxiuridino-5'-trifosfato, 5-iodocitidino-5'-trifosfato, 5-lodo-2'-desoxicitidino-5'trifosfato, 5-iodouridino~5’-trifosfato, S-lodo-Z’-desoxiuridino-S'-trifosfato,
5-metilcitidino-5'-trifosfato, 5-metiluridino-5'-trifosfato, 5-Propinil-2'-desoxicitídino-õ-trífosfato, 5-Propinil-2,-desoxíuridino-5'-trifosfatoi 6-azacitidino-58-trifosfato, e-azauridino-S’-trifosfato, 6-cloropurinoribosídeo-5'~ trifosfato, 7-desazaadenosina-5'-trifosfato, 7-desazaguanosina-5’-trifosfato, 8-azaadenosina-5'-trifosfato, 8-azidoadenosina-5'-trifosfato, benzímidazol-ribosídeo-5'~trifosfato, N1 ~metiladenosina~5'~trifosfato, N1 -metilguanosina-5'-trifosfato, N6-metiladenosina-5'-trifosfato, 06-metilguanoslna-õ-trifosfato, pseudouridino-5'-trifosfatoou puromicin-5-trifosfato, xantosina-5s-trifosfato. Preferência particular é dada a nucleotídeos para modificações de base selecionadas do grupo de nucleotídeos modificados na base consistindo em 5-metilcitidino-5'-trifosfato, 7-desazaguanosina-5'~trifosfato, 5-bromocitidino-5'-trifosfato e pseudouridino~5'~trifos~ fato.
[0255] Em algumas modalidades, nucleosídeos modificados incluem piridin-4-ona ribonucleosídeo, 5-aza-uridina, 2-tio-5-aza-uridina,
2- tiouridina, 4-tio-pseudouridina, 2-tio-pseudouridina, 5-hidroxiuridina,
3- metiluridina, 5-carboximetil-uridina, 1-carboximetil-pseudouridina, 5propinil-uridina, 1-propinil-pseudouridina, 5-taurinometiluridina, 1-taurinometil-pseudouridina, 5-taurinometil-2-tio-uridina, 1-taurinometil-4-tio
Petição 870190070557, de 24/07/2019, pág. 221/401
157/306 uridina, 5-metil-uridina, 1-metil-pseudouridina, 4-tio-1-metil-pseudouridina, 2-tio-1-metil-pseudouridina, 1-metil-1-desaza-pseudouridina, 2-tio1 -metil~1-desaza-pseudouridina, di-hidrouridina, di~hidropseudouridina,
2-tio-di-hidrouridina, 2-tio-di-hidropseudouridina, 2-metoxiuridina, 2-metóxi-4-tio-uridina, 4-metóxi-pseudouridina e 4-metóxi-2-tio-pseudouridina.
[0256] Em algumas modalidades, nucieosídeos modificados incluem 5-aza-citidina, pseudoisocitidína, 3-metil-citidina, N4-acetilcitidina, 5-formilcitidina, N4-metilcitidina, 5-hidroximetilcitidina, 1-metilpseudoisocitidina, pirrol-citidina, pirrol-pseudoisocitidina, 2-tio-citidina,
2-tio-5-metil~citidina, 4-tio-pseudoisocitidina, 4-tio~ 1 -metil-pseudoisocitl· dina, 4-tio-1 -metil-1 -desaza-pseudoisocitidina, 1 -metil-1 -desaza-pseudoisocitidina, zebularina, 5-aza-zebularina, 5-metil-zebularina, 5-aza-2tio-zebularina, 2-tio-zebularina, 2-metóxi-citidina, 2-metóxi~5~metil-citi~ dina, 4-metóxi-pseudoisocitidina e 4^βΙόχί~1~η'ΊβίΗ-ρ36υΰοί3οαίίΰΙη3.
[0257] Em outras modalidades, nucieosídeos modificados incluem 2~aminopurina, 2, 6-diaminopurina, 7-desaza-adenina, 7-desaza~8~aza~ adenina, 7-desaza-2-amínopurina, 7-desaza-8-aza-2-aminopurina, 7desaza-2,6-diaminopurína, 7-desaza-8-aza-2,6-diaminopurina, 1 -metiladenosina, N6~metiladenosina, N6-isopenteniladenosina, N6-(cis-hi~ droxi-isopenteniQadenosina, 2-metiltio-N6-(cis-hidróxi-isopentenil) adenosina, N6-glícínilcarbamoiladenosina, N6-treonilcarbamoiladenosina, 2~metiltio-N6-treonil carbamoiladenosina, N6,N6~dimetiladenosina, 7metiladenina, 2-metiltio-adenina e 2-metóxi-adenina.
[0258] Em outras modalidades, nucieosídeos modificados incluem inosina, 1 -Metil-inosina, wiosina, wibutosina, 7-desaza-guanosina, 7-desaza-8-aza-guanosina, 6-tio-guanosina, 6-tio-7-desaza-guanosina, 6tio-7-desaza-8-aza-guanosina, 7-metil-guanosina, 6-tio-7-metil-guanosina, 7-metilinosina, 6-metóxi-guanosina, 1-metilguanosina, N2-metilguanosina, N2,N2-dimetilguanosina, 8-oxo-guanosina, 7-metil-8-oxo
Petição 870190070557, de 24/07/2019, pág. 222/401
158/306 guanosina, 1-metik6-tio-guanosina, N2-metil-6-tio-guanosina e N2,N2dimetik6-tio-guanosina.
[0259] Em algumas modalidades, o nucleotídeo pode ser modificado na face de sulco principal e pode incluir substituição de hidrogênio em C-5 de uracila com um grupo metila ou um grupo halo. Em modalidades específicas, um nucleosídeo modificado é 5'-O-(1~tiofosfato)~adenosina, 5'-O-(1-tiofosfato)-citidina, 5!-O-(1-tiofosfato)-guanosina, 5-0(l-tiofosfato)-uridina ou 5'-O-(1-tiofosfato)-pseudouridina.
[0260] Em algumas modalidades, o RNA modificado da invenção (ou qualquer outro ácido nucleico modificado, em particular RNA, como aqui definido) pode compreender modificações de nucleosídeo selecionadas de 6-aza-citidina, 2-tio-citidina, a-tio-citidina, Pseudo-iso-citidina,
5- aminoalil-uridina, 5-iodo-uridina, N1-metikpseudouridina, 5,6-di-hk drouridina, o-tio-uridina, 4-tio-uridina, 6-aza-uridina, 5-hidróxi-uridina, desóxktimidina, 5-metikuridina, Pirrol-citidina, inosina, o-tio-guanosina,
6- metil-guanosina, 5-metikcitdina, 8-oxo-guanosina, 7-desaza-guanosina, N1-metikadenosina, 2-amino-6-Cloro-purina, N6-metil-2-amino~ purina, Pseudo-iso-citidina, 6-Cloro-purina, N6-metikadenosina, a-tioadenosina, 8-azido-adenosina, 7-desaza-adenosina.
[0261] Em algumas modalidades, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), não compreende nenhuma das modificações químicas como aqui descrito. Tais ácidos nucleicos artificiais modificados podem, não obstante, compreender uma modificação de lipídeo ou uma modificação de sequência como descrito abaixo.
Modificações de lipídeo [0262] De acordo com modalidades adicionais, moléculas de ácido nucleico artificiais, preferivelmente RNAs, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) contêm pelo
Petição 870190070557, de 24/07/2019, pág. 223/401
159/306 menos uma modificação de lipídeo.
[0263] Tal molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA da invenção (ou dito ácido nucleico, em particular RNA, descrito aqui) tipicamente compreende (i) uma molécula de ácido nucleico artificial, preferivelmente RNA como definido aqui (ou dito ácido nucleico, em particular RNA), (ii) pelo menos um ligante covalentemente ligado com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito ácido nucleico, em particular RNA) e (iii) pelo menos um lipídeo covalentemente ligado com o respectivo ligante.
[0264] Alternativamente, a molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA (ou outro ácido nucleico como definido aqui), compreende pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) e pelo menos um lipídeo (bifuncional) covalentemente ligado (sem um ligante) com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA). [0265] Alternativamente, a molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) compreende (i) uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), (ii) pelo menos um ligante covalentemente ligado com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) e (iii) pelo menos um lipídeo covalentemente ligado com o respectivo ligante, e também (iv) pelo menos um lipídeo (bifuncional) covalentemente ligado (sem um ligante) com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou outro dito ácido nucleico, em particular RNA). [0266] Neste contexto, é particularmente preferido que a modificação de lipídeo esteja presente nas extremidades terminais de uma mo
Petição 870190070557, de 24/07/2019, pág. 224/401
160/306 lécula de ácido nucleico artificial linear, preferivelmente RNA (ou qualquer outro ácido nucleico definido aqui).
Modificações de Sequência [0267] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção, preferivelmente um mRNA, ou qualquer outro ácido nucleico como definido aqui é modificado na sequência, isto é, compreende pelo menos uma modificação de sequência como descrito abaixo. Sem desejar ser limitado por teoria específica, tais modificações de sequência podem aumentar a estabilidade e/ou aumentar a expressão das moléculas de ácido nucleico artificiais da invenção, preferivelmente RNAs.
Modificação de teor de G/C [0268] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, mais preferivelmente mRNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode ser modificada, e então estabilizada, através da modificação de seu teor de guanosina/citosina (G/C), preferivelmente através da modificação do teor de G/C da pelo menos uma sequência de codificação. Em outras palavras, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) e preferivelmente sua sequência pode ser de G/C modificada.
[0269] Uma sequência de ácido nucleico com G/C modificada (preferivelmente RNA) tipicamente refere-se a um ácido nucleico (preferivelmente RNA) compreendendo uma sequência de ácido nucleico (preferivelmente RNA) que é baseada em uma sequência de ácido nucleico do tipo selvagem modificada (preferivelmente RNA) e compreende um número alterado de nucleotídeos de guanosina e/ou citosina comparado com a dita sequência de ácido nucleico do tipo selvagem (preferivelmente RNA). Tal número alterado de nucleotídeos de G/C
Petição 870190070557, de 24/07/2019, pág. 225/401
161/306 pode ser gerado substituindo códons contendo nucleotídeos de adenosina ou timidina por códons sinônimos contendo nucleotídeos de guanosina ou citosina. Desta maneira, as substituições de códon preferivelmente não alteram os resíduos de aminoácido codificados, mas alteram exclusivamente o teor de G/C do ácido nucleico (preferivelmente RNA). [0270] Em uma modalidade particularmente preferida da presente invenção, o teor de G/C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificado, particularmente aumentado, comparado com o teor de G/C da sequência de codificação do respectivo ácido nucleico do tipo selvagem, isto é, não modificado. A sequência de aminoácido codificada pela molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é preferivelmente não modificada comparado com a sequência de aminoácido codificada pelo respectivo ácido nucleico do tipo selvagem, preferivelmente RNA.
[0271] Tal modificação da molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é baseada no fato de que a sequência de qualquer região de RNA (ou outro ácido nucleico) a ser traduzido é importante para tradução eficiente do dito RNA (ou dito outro ácido nucleico). Desta maneira, a composição do RNA (ou dito outro ácido nucleico) e a sequência de vários nucleotídeos são importantes. Em particular, sequências tendo um teor de G (guanosina)/C (citosina) aumentado são mais estáveis do que as sequências tendo um teor de A (adenosina)/U (uracila) aumentado.
[0272] De acordo com a invenção, os códons da molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro
Petição 870190070557, de 24/07/2019, pág. 226/401
162/306 ácido nucleico, em particular RNA, como definido aqui) são então variados comparado com o respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico), enquanto retendo a sequência de aminoácido traduzida, de modo que elas incluem uma quantidade aumentada de nucleotídeos de G/C.
[0273] Em relação ao fato que vários códons codificam um e o mesmo aminoácido (a chamada degeneração do código genético), os códons mais favoráveis para a estabilidade podem ser determinados (o chamado uso de códon alternativo). Dependendo do aminoácido a ser codificado pela molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), há várias possibilidades para modificação de sua sequência de ácido nucleico, comparado com sua sequência do tipo selvagem. No caso de aminoácidos, que são codificados por códons, que contêm exclusivamente nucleotídeos G ou C, nenhuma modificação do códon é necessária.
[0274] Desta maneira, os códons para Pro (CCC ou CCG), Arg (CGC ou CGG), Ala (GCC ou GCG) e Gly (GGC ou GGG) não requerem modificação, uma vez que nenhum A ou U está presente. Em contraste, códons que contêm nucleotídeos A e/ou U podem ser modificados através de substituição de outros códons, que codificam os mesmos aminoácidos, mas não contêm nenhum A e/ou U. Exemplos desses são: os códons para Pro podem ser modificados de CCU ou CCA para CCC ou CCG; os códons para Arg podem ser modificados de CGU ou CGA ou AAGA ou AGG para CGC ou CGG; os códons para Ala podem ser modificados de GCU ou GCA para GCC ou GCG; os códons para Gly para podem modificados de GGU ou GGA para GGC ou GGG. Em outros casos, embora nucleotídeos A ou U não possam ser eliminados dos códons, é, no entanto, possível diminuir o teor de A e U usando códons que contêm um teor menor de nucleotídeos A e/ou U. Exemplos desses
Petição 870190070557, de 24/07/2019, pág. 227/401
163/306 são: os códons para Phe podem ser modificados de UUU para UUC; os códons para Leu podem ser modificados de UUA, UUG, CUU ou CUA para CUC ou CUG; os códons para Ser podem ser modificados de UCU ou UCA ou AGU para UCC, UCG ou AGC; o códon para Tyr pode ser modificado de UAU para UAC; o códon para Cys pode ser modificado de UGU para UGC; o códon para His pode ser modificado de CAU para CAC; o códon para Gin pode ser modificado de CAA para CAG; os códons para He podem ser modificados de AUU ou AUA para AUG; os codons para Thr podem ser modificados de ACU ou ACA para AGO ou ACG; o códon para Asn pode ser modificado de AAU para AAC; o códon para Lys pode ser modificado de AAA para AAG; os códons para Vai podem ser modificados de GUU ou GUA para GUC ou GUG; o códon para Asp pode ser modificado de GAU para GAC; o códon para Glu pode ser modificado de GAA para GAG; o códon de parada UAA pode ser modificado para UAG ou UGA, No caso dos códons para Met (AUG) e Trp (UGG), por outro lado, nâo há nenhuma possibilidade de modificação de sequência. As substituições listadas acima podem ser usadas ou individualmente ou em todas as combinações possíveis para aumentar o teor de G/C da sequência de ácido nucleico artificial da invenção, preferivelmente sequência de RNA (ou qualquer outra sequência de ácido nucleico como aqui definido) comparado com sua sequência de ácido nucleico do tipo selvagem particular (Isto é, a sequência original). Desta maneira, por exemplo, todos os códons para Thr ocorrendo na sequência do tipo selvagem podem ser modificados para ACC (ou ACG). Preferivelmente, no entanto, por exemplo, combinações das possibilidades de substituição acima são usadas:
substituição de todos os códons codificando Thr na sequência original (RNA do tipo selvagem) para ACC (ou ACG) e substituição de todos os códons originalmente codificando
Petição 870190070557, de 24/07/2019, pág. 228/401
164/306
Ser para UCC (ou UCG ou AGC); substituição de todos os códons co dificando He na sequência original para AUC e substituição de todos os codons originalmente codificando Lys para AAG e substituição de todos os códons originalmente codificando Tyr para UAC; substituição de todos os códons codificando Vai na sequência original para GLJC (ou GUG) e substituição de todos os códons originalmente codificando Glu para GAG e substituição de todos os códons originalmente codificando Ala para GCC (ou GCG) e substituição de todos os códons originalmente codificando Arg para CGC (ou CGG); substituição de todos os códons codificando
Va! na sequência original para GUC (ou GUG) e substituição de todos os códons originalmente codificando
Glu para GAG e substituição de todos os códons originalmente codificando Ala para GCC (ou GCG) e substituição de todos os códons originalmente codificando Gly para GGC (ou GGG) e substituição de todos os códons originalmente codificando
Asn para AAC; substituição de todos os códons codificando Vai na se quência original para GUC (ou GUG) e substituição de todos os códons originalmente codificando Phe para UUC e substituição de todos os códons originalmente codificando Cys para UGC e substituição de todos os códons originalmente codificando
Leu para CUG (ou CUC) e substituição de todos os códons originalmente codificando
Petição 870190070557, de 24/07/2019, pág. 229/401
165/306
Gin para CAG e substituição de todos os códons originalmente codificando Pro para CCC (ou CCG); etc.
[0275] Preferivelmente, o teor de G/C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) é aumentado em pelo menos 7%, mais preferivelmente em pelo menos 15%, particularmente preferivelmente em pelo menos 20%, comparado com o teor de G/C da sequência de codificação do ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), que codifica pelo menos uma proteína como aqui definido.
[0276] De acordo com modalidades preferidas, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, mais preferivelmente pelo menos 70%, ainda mais preferivelmente pelo menos 80% e sobretudo preferivelmente pelo menos 90%, 95% ou até mesmo 100% dos códons substituídos na região codificando uma proteína associada a CRISPR, ou um homólogo, variante, fragmento ou derivado como definido aqui ou a sequência inteira da sequência de RNA do tipo selvagem, são substituídos, desta maneira aumentando o teor de G/C da dita sequência.
[0277] Neste contexto, é particularmente preferível aumentar o teor de G/C da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), preferivelmente de sua pelo menos uma sequência de codificação, para o máximo (isto é, 100% dos códons substituíveis) comparado com a sequência do tipo selvagem.
[0278] Uma modificação preferida adicional da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é baseada na constatação que a eficiência de tradução é também determinada por
Petição 870190070557, de 24/07/2019, pág. 230/401
166/306 uma frequência diferente na ocorrência dos tRNAs em células. Desta maneira, se os chamados códons raros estiverem presentes na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA) para um grau aumentado, a sequência de RNA correspondente modificada (ou dito outro ácido nucleico, em particular RNA) é traduzida em um grau significantemente mais pobre do que no caso onde códons codificando tRNAs relativamente frequentes estão presentes.
[0279] Em algumas modalidades preferidas, em molécula de ácido nucleico artificial modificada, preferivelmente RNAs (ou qualquer outro ácido nucleico) definido aqui, a região que codifica uma proteína é modificada comparado com a região correspondente do ácido nucleico do tipo selvagem, preferivelmente RNA, de modo que pelo menos um códon da sequência do tipo selvagem, que codifica um tRNA que é relativamente raro na célula, é trocado por um códon, que codifica um tRNA que é relativamente frequente na célula e carrega o mesmo aminoácido que o tRNA relativamente raro.
[0280] Desta maneira, as sequências da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são modificadas de modo que códons para os quais tRNAs frequentemente ocorrendo estão disponíveis são inseridos. Em outras palavras, de acordo com a invenção, através desta modificação todos os códons da sequência do tipo selvagem, que codificam um tRNA que é relativamente raro na célula, podem ser em cada caso trocados por um códon, que codifica um tRNA que é relativamente frequente na célula e que, em cada caso, carrega o mesmo aminoácido que o tRNA relativamente raro. Quais tRNAs ocorrem relativamente frequente na célula e que, em contraste, ocorrem relativamente raramente, é conhecido de um versado na técnica: c.f., por
Petição 870190070557, de 24/07/2019, pág. 231/401
167/306 exemplo, Akashi Curr. Opin. Genet. Dev. 2001, 11(6): 660-666. Os códons que usam para o aminoácido particular o tRNA que ocorre com mais frequência, por exemplo, o códon Gly, que usa o tRNA, que ocorre com mais frequência na célula (humana), são particularmente preferidos.
[0281] De acordo com a invenção, é particularmente preferível ligar o teor de G/C sequencial que é aumentado, em particular maximizado, na molécula de ácido nucleico artificial modificada, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), com os códons frequentes sem modificação da sequência de aminoácido codificada que é codificada pela sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA. Tais modalidades preferidas permitem a provisão de uma molécula de ácido nucleico artificial eficientemente traduzida e estabilizada (modificada), preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido).
[0282] A determinação de uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido) como descrito acima (teor de G/C aumentado; troca de tRNAs) pode ser realizada usando o programa de computador explicado no WO02/098443, cujo teor é incluído em seu escopo integral na presente invenção. Usando este programa de computador, a sequência de nucleotídeo de qualquer ácido nucleico desejado, em particular RNA, pode ser modificada com o auxílio do código genético ou a sua natureza degenerativa de modo que um teor de G/C máximo resulta, em combinação com o uso de códons que codificam tRNAs ocorrendo o mais frequentemente possível na célula, a sequência de aminoácido codificada pelo ácido nucleico modificado, em particular RNA, preferivelmente não sendo modificada comparado com a sequência não modificada.
[0283] Alternativamente, é também possível modificar apenas o teor
Petição 870190070557, de 24/07/2019, pág. 232/401
168/306 de G/C ou apenas o uso de códon comparado com a sequência original. O código-fonte em Visual Basic 6.0 (ambiente de desenvolvimento usado: Microsoft Visual Studio Enterprise 6.0 com Servicepack 3) é também descrito no WO 02/098443.
Modificação de teor de A/U [0284] Em modalidades adicionais da presente invenção, o teor de A/U no ambiente do sítio de ligação de ribossomo da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é aumentado comparado com o teor de A/U no ambiente do sítio de ligação de ribossomo de seu respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA).
[0285] Esta modificação (um teor de A/U aumentado ao redor do sitio de ligação de ribossomo) aumenta a eficiência de ligação de ribossomo à dita molécula de ácido artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Uma ligação efetiva dos ribossomos ao sítio de ligação de ribossomo (sequência Kozak) por sua vez tem o efeito uma tradução eficiente da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).
Modificações de DSE [0286] De acordo com modalidades adicionais da presente invenção, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode ser modificada com relação a elementos de sequência potencialmente desestabilizadores. Particuiarmente, a sequência de codificação e/ou a região não traduzida 5’ e/ou 3’ da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), pode ser modificada comparado com o respectivo ácido
Petição 870190070557, de 24/07/2019, pág. 233/401
169/306 nudeico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nudeico do tipo selvagem), de modo que ela não contenha quaisquer elementos de sequência desestabilizadores, a sequência de aminoácido codificada da molécula de ácido nudeico artificial modificada, preferivelmente RNA (ou dito outro ácido nudeico, em particular RNA), preferivelmente não sendo modificada comparado com seu respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nudeico do tipo selvagem).
[0287] É conhecido que, por exemplo, em sequências dos RNAs eucarióticos, elementos de sequência desestabilizadores (DSE) ocorrem, aos quais proteínas de sinal se ligam e regulam a degradação en~ zimática de RNA in vivo. Para estabilização adicional da molécula de ácido nucleico artificial modificada, preferivelmente RNA, opdonalmente na região que codifica uma proteína associada a CRISPR como definido aqui, ou qualquer outro ácido nucleico como aqui definido, uma ou mais tais modificações comparado com a região correspondente do ácido nucleico do tipo selvagem, preferivelmente RNA, podem então ser realizadas, de modo que quaisquer ou substancialmente quaisquer elementos de sequência desestabilizadores estão contidos na mesma.
[0288] De acordo com a invenção, DSE presente nas regiões não traduzidas (3’- e/ou 5’-UTR) pode também ser eliminada na molécula de ácido nudeico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), portais modificações. Tais sequências de desestabilização são, por exemplo, sequências ricas em AU (AURES), que ocorrem nas seções 3’-UTR de vários RNAs instáveis (Caput e outros, Proc. Natl. Acad. Sei. USA 1986, 83: 1670 a 1674). A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é então preferivelmente modificada comparado com o respectivo ácido nudeico do tipo selvagem, preferivelmente RNA (ou dito
Petição 870190070557, de 24/07/2019, pág. 234/401
170/306 respectivo outro ácido nucleico do tipo selvagem) de modo que a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), não contenha quaisquer de tais sequências de desestabilização. Isso também se aplica àqueles motivos de sequência que são reconhecidos por possíveis endonucleases, por exemplo, a sequência GAACAAG, que está contida no segmento 3’LJTR do gene codificando o receptor de transferrina (Binder e outros, EMBO J. 1994, 13: 1969 a 1980). Esses motivos de sequência sâo também preferivelmente removidos da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).
Sequências adaptadas para uso de códon humano [0289] Uma modificação preferida adicional da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é baseada na constatação que códons codificando o mesmo aminoácido tipicamente ocorrem em frequências diferentes. De acordo com modalidades preferidas adicionais, na molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), a sequência de codificação é modificada comparado com a região correspondente do respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico do tipo selvagem), de modo que a frequência dos códons codificando o mesmo aminoácido corresponde à frequência de ocorrência natural daquele códon de acordo com o uso de códon humano como, por exemplo, mostrado na Tabela 4.
[0290] Por exemplo, no caso do aminoácido alanina (Ala) presente em uma sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), a sequência de codificação do tipo
Petição 870190070557, de 24/07/2019, pág. 235/401
171/306 selvagem é preferivelmente adaptada de um modo que o códon GCC seja usado com uma frequência de 0,40, o códon GCT seja usado com uma frequência de 0,28, o códon !'GCA seja usado com uma frequência de 0,22 e o códon GCG seja usado com uma frequência de 0,10, etc.
(vide Tabela 4).
Tabela 4. Tabela de uso de códon humano
Aminoácido | códon | fração | /1000 | Aminoácido | códon | fração | /1000 |
Ala | GCG | 0,10 | 7,4 | Pro | CCG | 0,11 | 6,9 |
Ala | GCA | 0,22 | 15,8 | Pro | CCA | 0,27 | 16,9 |
Ala | GCT | 0,28 | 18,5 | Pro | CCT | 0,29 | 17,5 |
Ala | GCC* | 0,40 | 27,7 | Pro | CCC* | 0,33 | 19,8 |
Cys | TGT | 0,42 | 10,6 | Gin | CAG* | 0,73 | 34,2 |
Cys | TGC* | 0,58 | 12,6 | Gin | CAA | 0,27 | 12,3 |
Asp | GAT | 0,44 | 21,8 | Arg | AGG | 0,22 | 12,0 |
Asp | GAC* | 0,56 | 25,1 | Arg | AGA* | 0,21 | 12,1 |
Glu | GAG* | 0,59 | 39,6 | Arg | CGG | 0,19 | 11,4 |
Glu | GAA | 0,41 | 29,0 | Arg | CGA | 0,10 | 6,2 |
Phe | TTT | 0,43 | 17,6 | Arg | CGT | 0,09 | 4,5 |
Phe | TTC* | 0,57 | 20,3 | Arg | CGC | 0,19 | 10,4 |
Gly | GGG | 0,23 | 16,5 | Ser | AGT | 0,14 | 12,1 |
Gly | GGA | 0,26 | 16,5 | Ser | AGC* | 0,25 | 19,5 |
Gly | GGT | 0,18 | 10,8 | Ser | TCG | 0,06 | 4,4 |
Gly | GGC* | 0,33 | 22,2 | Ser | TCA | 0,15 | 12,2 |
His | CAT | 0,41 | 10,9 | Ser | TCT | 0,18 | 15,2 |
His | CAC* | 0,59 | 15,1 | Ser | TCC | 0,23 | 17,7 |
He | ATA | 0,14 | 7,5 | Thr | ACG | 0,12 | 6,1 |
He | ATT | 0,35 | 16,0 | Thr | ACA | 0,27 | 15,1 |
He | ATC* | 0,52 | 20,8 | Thr | ACT | 0,23 | 13,1 |
Lys | AAG* | 0,60 | 31,9 | Thr | ACC* | 0,38 | 18,9 |
Lys | AAA | 0,40 | 24,4 | Vai | GTG* | 0,48 | 28,1 |
Leu | TTG | 0,12 | 12,9 | Vai | GTA | 0,10 | 7,1 |
Leu | TTA | 0,06 | 7,7 | Vai | GTT | 0,17 | 11,0 |
Leu | CTG* | 0,43 | 39,6 | Vai | GTC | 0,25 | 14,5 |
Leu | CTA | 0,07 | 7,2 | Trp | TGG* | 1 | 13,2 |
Leu | CTT | 0,12 | 13,2 | Tyr | TAT | 0,42 | 12,2 |
Leu | CTC | 0,20 | 19,6 | Tyr | TAG* | 0,58 | 15,3 |
Met | ATG* | 1 | 22,0 | Parada | TGA* | 0,61 | 1,6 |
Asn | AAT | 0,44 | 17,0 | Parada | TAG | 0,17 | 0,8 |
Asn | AAC* | 0,56 | 19,1 | Parada | TAA | 0,22 | 1,0 |
*: códon mais frequente
Petição 870190070557, de 24/07/2019, pág. 236/401
172/306
Sequência otimizada no códon [0291 ] Como descrito acima, é preferido de acordo com a invenção que todos os códons da sequência do tipo selvagem que codificam um tRNA, que é relativamente raro na célula, sejam trocados por um códon que codifica um tRNA, que é relativamente frequente na célula e que, em cada caso, carrega o mesmo aminoácido que o tRNA relativamente raro.
[0292] Desta maneira, é particularmente preferido que os códons mais frequentes sejam usados para cada aminoácido codificado (vide Tabela 4, os códons mais frequentes são marcados com asteriscos). Tal procedimento de otimização aumenta o índice de adaptação do códon (CAI) e por fim maximiza o CAI. No contexto da invenção, sequências com CAI aumentado ou maximizado são referidas como sequências com códon otimizado e/ou sequências com CAI aumentado e/ou maximizado. De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular, RNA, como aqui definido) compreende pelo menos uma sequência de codificação, em que a sequência de codificação é otimizada no códon como aqui descrito. Mais preferivelmente, o índice de adaptação de códon (CAI) da pelo menos uma sequência de codificação é pelo menos 0,5, pelo menos 0,8, pelo menos 0,9 ou pelo menos 0,95. Sobretudo mais preferivelmente, o índice de adaptação do códon (CAI) da pelo menos uma sequência de codificação é 1.
[0293] Por exemplo, no caso do aminoácido alanina (Ala) presente na sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), a sequência de codificação do tipo selvagem é adaptada de um modo que o códon humano mais frequente GCC é sempre usado para o dito aminoácido, ou para o aminoácido Cisteína
Petição 870190070557, de 24/07/2019, pág. 237/401
173/306 (Cys), a sequência do tipo selvagem é adaptada de um modo que o códon humano mais frequente TGC é sempre usado para o dito aminoácido, etc.
Sequências otimizadas em C [0294] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificada através da modificação, preferivelmente aumento, do teor de citosina (C) da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), em particular em sua pelo menos uma sequência de codificação.
[0295] Em modalidades preferidas, o teor de C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificado, preferivelmente aumentado, comparado com o teor de C da sequência de codificação do respectivo ácido nucleico do tipo selvagem (não modificado). A sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção preferivelmente não é modificada comparado com a sequência de aminoácido codificada pelo respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou o respectivo outro ácido nucleico do tipo selvagem).
[0296] Em modalidades preferidas, a dita molécula de ácido nucleico modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é modificada de modo que pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70% ou 80% ou pelo menos 90% do teor de citosina máximo teoricamente possível ou até mesmo um teor de citosina máximo é atingido.
[0297] Em modalidades preferidas adicionais, pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% ou até mesmo 100% dos
Petição 870190070557, de 24/07/2019, pág. 238/401
174/306 códons do ácido nucleico do tipo selvagem, preferivelmente RNA, sequências que são otimizáveis no teor de citosina são substituídas por códons tendo um teor de citosina mais alto do que os presentes na sequência do tipo selvagem.
[0298] Em modalidades preferidas adicionais, alguns dos códons da sequência de codificação do tipo selvagem podem ser ainda modificados de modo que um códon para um tRNA relativamente raro na célula é trocado por um códon para um tRNA relativamente frequente na célula, contanto que o códon substituído por um tRNA relativamente frequente carregue o mesmo aminoácido que o tRNA relativamente raro do códon do tipo selvagem original. Preferivelmente, todos dos códons para um tRNA relativamente raro são substituídos por um códon para um tRNA relativamente frequente na célula, exceto códons codificando aminoácidos, que são exclusivamente codificados por códons não contendo nenhuma citosina, ou exceto glutamina (Gin), que é codificada por dois códons, cada um contendo o mesmo número de citosinas.
[0299] Em modalidades preferidas adicionais da presente invenção, a molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificada de modo que pelo menos 80%, ou pelo menos 90%, do teor de citosina máximo teoricamente possível ou até mesmo um teor de citosina máximo seja obtido por meio de códons, que codificam tRNAs relativamente frequentes na célula, em que a sequência de aminoácido permanece sem modificação.
[0300] Devido à degeneração do código genético de ocorrência natural, mais de um códon pode codificar um aminoácido particular. Desta maneira, 18 de 20 aminoácidos de ocorrência natural sâo codificados por mais de um códon (com Tryp e Met sendo uma exceção), por exemplo, por 2 códons (por exemplo, Cys, Asp, Glu), por três códons (por exemplo, He), por 4 códons (por exemplo, Al, Gly, Pro) ou por 6 códons
Petição 870190070557, de 24/07/2019, pág. 239/401
175/306 (isto é, Leu, Arg, Ser). No entanto, nem todos os códons codificando o mesmo aminoácido são utilizados com a mesma frequência sob condições in vivo. Dependendo de cada organismo único, um perfil de uso de códon típico é estabelecido.
[0301 ] O termo códon com teor de citosina otimizável como usado dentro do contexto da presente invenção refere-se a códons que exibem um teor menor de citosinas do que outros códons codificando o mesmo aminoácido. Desta maneira, qualquer códon do tipo selvagem, que possa ser substituído por um outro códon codificando o mesmo aminoácido e exibindo um número maior de citosina do que aquele códon, é considerado ser otimizável em citosina (otimizável em C). Qualquer tal substituição de um códon do tipo selvagem otimizável em C pelo códon com C otimizada específico dentro de uma sequência de codificação do tipo selvagem aumenta seu teor de C total e reflete uma sequência de RNA modificada enriquecida em C.
[0302] De acordo com algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) e em particular sua pelo menos uma sequência de codificação, compreende ou consiste em uma sequência maximizada em C contendo códons com C otimizada para todos os códons potencialmente com C otimizável. Desta maneira, 100% ou todos dos códons com C otimizável teoricamente são preferivelmente substituídos por códons com C otimizada em todo o comprimento da sequência de codificação.
[0303] Neste contexto, códons com teor de citosina otimizável são códons que contêm um número menor de citosinas do que outros códons codificando o mesmo aminoácido. Qualquer um dos códons GCG, GCA, GCU codifica o aminoácido Ala, que pode ser trocado pelo códon GCC codificando o mesmo aminoácido, e/ou o códon UGLJ que codifica Cys pode ser trocado pelo códon
Petição 870190070557, de 24/07/2019, pág. 240/401
176/306
UGC codificando o mesmo aminoácido e/ou o códon GAU que codifica Asp pode ser trocado peio códon GAC codificando o mesmo aminoácido, e/ou o códon UUU que codifica Phe pode ser trocado pelo códon UUC codificando o mesmo aminoácido, e/ou qualquer um dos códons GGG, GGA, GGU que codificam Gly pode ser trocado pelo códon GGC codificando o mesmo aminoácido, e/ou o códon CAU que codifica His pode ser trocado pelo códon CAC codificando o mesmo aminoácido, e/ou qualquer um dos códons AUA, AUU que codificam lie pode ser trocado pelo códon AUC, e/ou qualquer um dos códons UUG, UUA, CUG, CUU codificando Leu pode ser trocado pelo códon CUC codificando esses aminoácidos, e/ou o códon AAU que codifica Asn pode ser trocado pelo códon AAC codificando o mesmo aminoácido, e/ou qualquer um dos códons COG, CCA, CCU codificando Pro pode ser trocado pelo códon CCC codificando o mesmo aminoácido, e/ou qualquer um dos códons AGG, AGA, CGG, CGU codificando Arg pode ser trocado pelo códon CGC codificando o mesmo aminoácido, e/ou qualquer um dos códons AGU, AGC, UCG, UCA, UCU codificando Ser pode ser trocado pelo códon UCC codificando o mesmo aminoácido, e/ou qualquer um dos códons ACG, ACU codificando Thr pode ser trocado pelo códon ACC codificando o mesmo aminoácido, e/ou qualquer um dos códons GUG, GUA, GUU codificando Vai pode ser trocado pelo códon GUC codificando o mesmo aminoácido,
Petição 870190070557, de 24/07/2019, pág. 241/401
177/306 e/ou o códon UAU codificando Tyr pode ser trocado pelo códon UAC codificando o mesmo aminoácido.
[0304] Em qualquer um dos casos acima, o número de citosinas é aumentado em 1 por códon trocado. Troca de todos os códons não C otimizada (correspondendo a códons otimizáveis em C) da sequência de codificação resulta em uma sequência de codificação maximizada em C. No contexto da invenção, pelo menos 70%, preferivelmente pelo menos 80%, mais preferivelmente pelo menos 90%, dos códons não C otimizada dentro da pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são substituídos por códons com C otimizada.
[0305] Pode ser preferido que para alguns aminoácidos a porcentagem de códons com C otimizável substituídos por códons com C otimizada seja menos do que 70%, enquanto para outros aminoácidos a porcentagem de códons substituídos é maior do que 70% para satisfazer a porcentagem total de otimização de C de pelo menos 70% de todos os códons do tipo selvagem com C otimizável da sequência de codificação. [0306] Preferivelmente, em uma molécula de ácido nucleico artificial otimizada em C, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), pelo menos 50% dos códons do tipo selvagem com C otimizável para qualquer dado aminoácido são substituídos por códons otimizados em C, por exemplo, qualquer RNA enriquecido em C modificado (ou outro ácido nucleico, em particular RNA) contém preferivelmente pelo menos 50% de códons otimizados em C nas posições de códon do tipo selvagem com C otimizável codificando qualquer um dos aminoácidos mencionados acima Ala, Cys, Asp, Phe, Gly, His, He, Leu, Asn, Pro, Arg, Ser, Thr, Vai e Tyr, preferivelmente pelo menos 60%.
Petição 870190070557, de 24/07/2019, pág. 242/401
178/306 [0307] Neste contexto, códons codificando aminoácidos, que não sâo otimizáveis no teor de citosina e que são, no entanto, codificados por pelo menos dois códons, podem ser usados sem nenhum processo de seleção adicional. No entanto, o códon da sequência do tipo selvagem que codifica um tRNA relativamente raro na célula, por exemplo, uma célula humana, pode ser trocado por um códon que codifica um tRNA relativamente frequente na célula, em que ambos codificam o mesmo aminoácido. Desta maneira, o códon relativamente raro GAA codificando Glu pode ser trocado pelo códon relativamente frequente GAG codificando o mesmo aminoácido, e/ou o códon relativamente raro AAA codificando Lys pode ser trocado pelo códon frequente relativo AAG codificando o mesmo aminoácido, e/ou o códon relativamente raro GAA codificando Gin pode ser trocado pelo códon relativamente frequente CAG codificando o mesmo aminoácido.
[0308] Neste contexto, os aminoácidos Met (AUG) e Trp (UGG), que são codificados por apenas um códon cada um, permanecem sem modificação. Códons de parada não são otimizados no teor de citosina, no entanto, os códons de parada relativamente raros âmbar, ocre (UAA, UAG) podem ser trocados pelo códon de parada relativamente frequente opal (UGA).
[0309] As substituições únicas listadas acima podem ser usadas individualmente bem como em todas as combinações possíveis a fim de otimizar o teor de citosina da molécula de ácido nucleico artificial modificada, preferivelmente RNA, comparado com a sequência do tipo selvagem.
[0310] Desta maneira, a pelo menos uma sequência de codificação como definido aqui pode ser mudada comparado com a sequência de
Petição 870190070557, de 24/07/2019, pág. 243/401
179/306 codificação do respectivo ácido nucleico do tipo selvagem, preferivelmente RNA, de tal maneira que um aminoácido codificado por pelo menos dois ou mais códons, dos quais um compreende uma citosina adicional, tal códon pode ser trocado pelo códon otimizado em C compreendendo uma citosina adicional, em que o aminoácido é preferivelmente não alterado comparado com a sequência do tipo selvagem.
[0311] De acordo com modalidades particularmente preferidas, a combinação da invenção compreende uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo (em adição às 5’ UTR e 3’ UTR especificadas aqui) pelo menos uma sequência de codificação como definido aqui, em que (a) o teor de G/C da pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, é aumentada comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico do tipo selvagem correspondente (preferivelmente RNA) e/ou (b) em que o teor de C da pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico do tipo selvagem correspondente (preferivelmente RNA) e/ou (c) em que os códons na pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, e em que a sequência de aminoácido codificada pela molécula de ácido nucleico artificial, preferivelmente RNA, não está sendo preferivelmente modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico do tipo selvagem correspondente (preferivelmente RNA).
Petição 870190070557, de 24/07/2019, pág. 244/401
180/306
Sequências de Ácido Nucleico Modificadas [0312] As modificações de sequência indicadas acima podem em geral ser aplicadas a qualquer uma das sequências de ácido nucleico descritas aqui, e são particularmente compreendidas ser aplicadas às sequências de codificação compreendendo ou consistindo em sequências de ácido nucleico codificando proteínas associadas a CRISPR como aqui definido, e opcionalmente NLS ou outras porções, domínios ou marcadores de peptídeo ou proteína. As modificações (incluindo modificações químicas, modificações de lipídeo e modificações de sequência) podem, se adequado ou necessário, se combinadas umas com as outras em qualquer combinação, contanto que as modificações combinadas não Interfiram umas com as outras, e preferivelmente contanto que a proteína associada a CRISPR codificada (e a NLS, sequência de sinal, marcador de proteína/peptídeo) preferivelmente retenha sua funcionalidade ou propriedade biológica desejada, como acima definido.
[0313] Em modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína associada a CRISPR, em que a dita sequência de codificação foi modificada como descrito acima.
[0314] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína Cas9 ou um homólogo, variante, fragmento ou derivado da mesma, em que a dita sequência de codificação compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 1018610199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391;
Petição 870190070557, de 24/07/2019, pág. 245/401
181/306
2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 99789991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 58265839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 59225935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 95469559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 70187031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 81948207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 82908302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 99149927; 10026-10039; 10138-10151; 10250-10263; 10362-10375; 92909303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 93869399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 94829495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo
Petição 870190070557, de 24/07/2019, pág. 246/401
182/306
97%, de identidade de sequência com qualquer uma dessas sequências.
[0315] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína Cpf1 ou um homólogo, variante, fragmento ou derivado da mesma, em que a dita sequência de codificação compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 69686969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 1020010201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543 2344-2345; 23602361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 24562457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 95129513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 46804681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 47764777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 95449545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840Petição 870190070557, de 24/07/2019, pág. 247/401
183/306
5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 59365937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 95609561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208P9AQ· R97R· 89ΑΠ S941 &9RA P9R7· 8979 ^97^- 8988 898Q8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-105831057910580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755;
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;
10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715;
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606;
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
Petição 870190070557, de 24/07/2019, pág. 248/401
184/306
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente
Petição 870190070557, de 24/07/2019, pág. 249/401
185/306 peto menos 85%, ainda mais preferivelmente peto menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0316] O ácido nudeico artificial de acordo com a invenção pode, na(s) mesma região(ões) (ácido nudeico monocistrônico) ou diferente^) (ácido nudeico multicistrônico), codificar mais proteínas ou peptídeo. As respectivas sequências de ácido nudeico de codificado podem ser submetidas às mesmas modificações de sequência como descrito acima. Em particular, a sequência de codificação do ácido nucleico artificial da invenção pode compreender uma ou mais sequências codificando um ou mais sinais de localização nuclear (NLS), que são preferivelmente fundidos à sequência de ácido nudeico codificando a proteína associada a CRISPR. Essas sequências podem ser modificadas como descrito acima, também.
[0317] As sequências de codificação modificadas (ou ’'otimizadas) podem ser combinadas com qualquer uma das UTRs reveladas aqui.
[0318] Desta maneira, em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem pelo menos um elemento de 5’ UTR como aqui definido, pelo menos um elemento de 3’ UTR como aqui definido e uma sequência de codificação codificando uma proteína Cas9 ou Cpf1 ou um homólogo, variante, fragmento ou derivado (funcional) do mesmo, em que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO:413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 1040210408; 10554; 10599-10612 (HSD17B4 / Gnas.1); SEQ ID NO:414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626 (Slc7a3.1 / Gnas.1); SEQ ID NO:415; 2362-2377; 3522-3537: 4682-4697; 5842-5857; 70027017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640
Petição 870190070557, de 24/07/2019, pág. 250/401
186/306 (ATP5A1 / CASP.1); SEQ ID NO:416; 2378-2393; 3538-3553; 46984713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654 (Ndufa4.1 / PSMB3.1); SEQ ID NO:417; 23942409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 93549369; 10430-10436; 10558; 10655-10668 (HSD17B4 / PSMB3.1); SEQ ID NO:418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 (RPL32var / albumina7); SEQ ID NO:419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696 (32L4 / albumina7); SEQ ID NO:420; 2442-2457; 36023617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710 (HSD17B4 / CASP1.1); SEQ ID NO:421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724 (Slc7a3.1 / CASP1.1); SEQ ID NO:422; 2474-2489; 3634-3649; 4794-4809; 59545969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 1072510738 (Slc7a3.1 / PSMB3.1); SEQ ID NO:423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 1047210478; 10564; 10739-10752 (Nosip.1 / PSMB3.1); SEQ ID NO:424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766 (Ndufa4.1 / RPS9.1); SEQ ID NO:425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 71627177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780 (HSD17B4 / RPS9.1); SEQ ID NO:9498- 9609; 10493-10499; 10567; 10781-10794 (ATP5A1 / Gnas.1); SEQ ID NO:9610-9721; 1050010506; 10568; 10795-10808 (Ndufa4.1 / COX6B1.1); SEQ ID NO:97229833; 10507-10513; 10569; 10809-10822 (Ndufa4.1 / Gnas.1); SEQ ID NO:9834-9945; 10514-10520; 10570; 10823-10836 (Ndufa4.1 / Ndufal. 1); SEQ ID NO:9946-10057; 10521-10527; 10571; 10837-10850 (Nosip.1 / Ndufal.1); SEQ ID N0:10058-10169; 10528-10534; 10572;
Petição 870190070557, de 24/07/2019, pág. 251/401
187/306
10851-10864 (Rpl31.1 / Gnas.1); SEQ ID N0:10170-10281; 1053510541; 10573; 10865-10878 (TUBB4B.1 /RPS9.1); SEQ ID NO:1028210393; 10542-10548; 10574; 10879-10892 (Ubqln2.1 / RPS9.1) ou urn homólogo, variante ou fragmento de qualquer uma das ditas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. É facilmente aparente para um versado na técnica qual SEQ ID NO pertence a qual proteína (Cas9 ou Cpf1) pela orientação dada na linha Outras informações na listagem de sequência sob <223>, onde é revelado se a respectiva SE ID NO: lembra um produto de mRNA variante de Cpf1 ou um produto de mRNA variante de Cas9.
5’ Cap [0319] De acordo com modalidades preferidas da invenção, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA) como aqui definido, pode ser modificada através da adição de uma chamada estrutura ‘5’ cap’, que preferivelmente estabiliza a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) como descrito aqui.
[0320] Um 5’ cap é uma entidade, tipicamente uma entidade nucleotídeo modificado, que geralmente faz capeamento da extremidade 5’ de um mRNA maduro. Um 5’ cap pode ser tipicamente formado por um nucleotídeo modificado, particularmente por um derivado de um nucleotídeo guanina. Preferivelmente, o 5’ cap é ligado ao terminal 5’ através
Petição 870190070557, de 24/07/2019, pág. 252/401
188/306 de uma ligação 5’-5’-trifosfato. Um 5’ cap pode ser metilado, por exemplo, m7GpppN, em que N é o nucleotídeo 5’ terminal do ácido nucleico carregando o 5’ cap, tipicamente a extremidade 5’ de um mRNA. M7GpppN é a estrutura 5’-cap, que ocorre naturalmente em mRNA transcrito por polimerase II e então preferivelmente não é considerado uma modificação compreendida em um mRNA modificado neste contexto. Desta maneira, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender uma m7GpppN como 5’-cap, mas ainda a dita molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou outro ácido nucleico), compreende tipicamente pelo menos uma modificação adicional como definido aqui. [0321] Exemplos adicionais de estruturas 5’ cap incluem glicerila, resíduo desóxi abásico invertido (porção), nucleotídeo de 4’,5’-metileno, nucleotídeo de l-(beta-D-eritrofuranosila), nucleotídeo de 4’-tio, nucleotídeo carbocíclico, nucleotídeo de 1,5-anidroexitol, L-nucleotídeos, alfanucleotídeo, nucleotídeo base modificado, nucleotídeo de treo-pentofuranosil, nucleotídeo de 3’,4’-seco acíclico, nucleotídeo de 3,4-di-hidroxibutila acíclico, nucleotídeo de 3,5-dí-hidroxipentila acíclico, porção de nucleotídeo invertida 3’,3’, porção abásica invertida 3’,3’, porção de nucleotídeo invertida 3’-2’, porção abásica invertida 3’-2’, fosfato de 1,4butanodiol, 3’-fosforamídato, hexilfosfato, fosfato de aminoexila, 3’-fosfato, 3’-fosforotioato, fosforoditioato ou porção metilfosfonato em ponte ou não em ponte. Essas estruturas 5’-cap modificadas são consideradas como pelo menos uma modificação neste contexto.
[0322] Estruturas 5’-cap modificadas particularmente preferidas são cap1 (metilação da ribose do nucleotídeo adjacente de m7G), cap2 (metilação adicional da ribose do 2o nucleotídeo a jusante de m7G), cap3 (metilação adicional da ribose do 3o nucleotídeo a jusante de m7G), cap4 (metilação da ribose no 4o nucleotídeo a jusante de m7G), ARCA
Petição 870190070557, de 24/07/2019, pág. 253/401
189/306 (análogo de cap antirreverso), ARCA modificado (por exemplo, ARCA modificado com fosforotioato), CleanCap (TriLink) ou uma estrutura de Cap como revelado no WO2017053297A1 (aqui incorporado a titulo de referência), inosina, Nl-metil-guanosina, 2!-fluor-guanosina, 7-desazaguanosina, 8-oxo-guanosina, 2-amíno-guanosina, LNA-guanosina e 2azido-guanosina.
[0323] De acordo com modalidades preferidas, o ácido nucleico artificial compreende um grupo metila na posição 2’-0 da posição ribose2’-0 do primeiro nucleotídeo adjacente à estrutura de cap na extremidade 5’ do RNA (cap-1). Tipicamente, metilação pode ser obtida através da ação de Cap 2’-O~Metiltransferase, utilizando ácidos nucleicos artificiais capeados m7GpppN (preferivelmente RNA) como um substrato e S-adenosinametionina (SAM) como um doador de metila para metilar RNA capeado (cap~0) resultando na estrutura cap-1. A estrutura cap-1 foi relatada aumentar a eficiência de tradução de mRNA e desta maneira pode ajudar a melhorar a eficácia de expressão do ácido nucleico artificial da invenção, preferivelmente RNA, descrito aqui.
Poli(A) [0324] De acordo com modalidades preferidas adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) contém uma sequência de poli(A).
[0325] Uma sequência de poli(A), também chamada cauda poli(A) ou cauda 3’-poii(A), é tipicamente compreendida ser uma sequência de nucleotídeos de adenosina, por exemplo, de até cerca de 400 nucleotídeos de adenosina, por exemplo, de a partir de cerca de 20 a cerca de 400, preferivelmente de a partir de cerca de 50 a cerca de 400, mais preferivelmente de a partir de cerca de 50 a cerca de 300, ainda mais preferivelmente de a partir de cerca de 50 a cerca de 250, sobretudo preferivelmente de a partir de cerca de 60 a cerca de 250 nucleotídeos
Petição 870190070557, de 24/07/2019, pág. 254/401
190/306 de adenosina. Como aqui usado, uma sequência de ροΠ(Α) pode também compreender cerca de 10 a 200 nucleotídeos de adenosina, preferivelmente cerca de 10 a 100 nucleotídeos de adenosina, mais preferivelmente cerca de 40 a 80 nucleotídeos de adenosina ou ainda mais preferivelmente cerca de 50 a 70 nucleotídeos de adenosina. Uma sequência de poli(A) está tipicamente localizada na extremidade 3’ de um RNA, em particular um mRNA.
[0326] Desta maneira, em modalidades preferidas adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) contém em seu terminal 3’ uma cauda poli(A) de tipicamente cerca de 10 a 200 nucleotídeos de adenosina, preferivelmente cerca de 10 a 100 nucleotídeos de adenosina, mais preferivelmente cerca de 40 a 80 nucleotídeos de adenosina ou ainda mais preferivelmente cerca de 50 a 70 nucleotídeos de adenosina.
[0327] Preferivelmente, a sequência de poli(A) na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA), é derivada de um modelo de DNA através de transcrição de RNA in vitro. Alternativamente, a sequência de poli(A) pode ser também obtida in vitro através de métodos comuns de síntese química sem ser necessariamente transcrita a partir de um progenitor de DNA.
[0328] Além disso, sequências de poli(A), ou caudas de poli(A), podem ser geradas através de poliadenilação enzimática da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA) usando kits de poliadenilação comercialmente disponíveis e protocolos correspondentes conhecidos na técnica. Poliadenilação é tipicamente compreendida ser a adição de uma sequência de poli(A) a uma molécula de ácido nucleico, tal como uma molécula de RNA, por exemplo, um mRNA prematuro. Poliadenilação
Petição 870190070557, de 24/07/2019, pág. 255/401
191/306 pode ser induzida por um chamado sinal de poliadenilação. O sinal está preferivelmente localizado dentro de uma extensão de nudeotídeos na extremidade 3’ do mRNA a ser poliadenilado. Um sinal de poliadenilação compreende tipicamente um hexâmero consistindo em nucleotídecs adenina e uradl/timina, preferivelmente a sequência de hexâmero AAUAAA. Outras sequências, preferivelmente sequências de hexâmero, são também concebíveis. Poliadenilação tipicamente ocorre durante processamento de um pré-mRNA (também chamado mRNA prematuro). Tipicamente, maturação de RNA (de pré-mRNA para mRNA maduro) compreende uma etapa de poliadenilação.
[0329] Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender um sinal de poliadenilação que provê poliadenilação a um RNA (transcrito) através de fatores de proteína específicos (por exemplo, fator de especificidade de divagem e poliadenilação (CPSF), fator de estimulação de divagem (CstF), fatores de divagem I e II (CF I e CF II), polimerase de poli(A) (PAP)).
[0330] Neste contexto, um sinal de poliadenilação de consenso é preferido compreendendo a sequência de consenso NN(U/T)ANA. Em um aspecto particularmente preferido, o sinal de poliadenilação compreende uma das sequências que seguem: AA(U/T)AAA ou A(U/T)(U/T) AAA (em que uridina está geralmente presente em RNA e timidina está geralmente presente em DNA).
Poli(C) [0331] De acordo com modalidades preferidas adidonais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) contém uma cauda poli(C) no terminal 3’ de tipicamente cerca de 10 a
Petição 870190070557, de 24/07/2019, pág. 256/401
192/306
200 nucleotídeos citosina, preferivelmente cerca de 10 a 100 nucieotídeos citosina, mais preferivelmente cerca de 20 a cerca de 70 nucleotídeos citosina ou ainda mais preferivelmente cerca de 20 a 60 ou até mesmo 10 a 40 nucleotídeos citosina.
Alça-tronco de histona (HSL) [0332] Em algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) compreende uma sequência/estrutura de alça-tronco de histona (HSL). Tais sequências de alça-tronco de histona são preferivelmente selecionadas de sequências de alça-tronco de histona como revelado no WO2012/019780, cuja descrição é aqui incorporada a título de referência.
[0333] Uma sequência de alça-tronco de histona, adequada para ser usada na presente invenção, é preferivelmente selecionada de pelo menos uma da fórmula (I) ou (II) que segue:
fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) fórmula (li) (sequência de tronco-alça com elementos limítrofes de tronco):
[N0-2GN3..5] [No_4(ü/T)No_4] [Ns-sCIfe] tronco! silçsj troncok em que:
Ni-β [N0-2GN3-5] [No^(U/T)No^] [N3-5CN0-2]
-----! '--.....------------------· ·, '---' 5-------y-----Ύ tronco! tronco! a^a tronco2 tronco2 , ... . elemento limítrofe elemsmo hmltrote elementos limítrofes de troncol ou tronco2 hh-s é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de
Petição 870190070557, de 24/07/2019, pág. 257/401
193/306 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C, ou um análogo de nucleotídeo do mesmo;
troncol [N0-2GN3-5] é complementar reverso ou parcialmente complementar reverso com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotídeos;
em que No-2Ó uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, GeC ou um análogo de nucleotídeo do mesmo;
em que N3-5 θ uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma, contanto que sua nucleotídeo citidina complementar seja substituída por guanosina;
sequência de alça [N0-4(U/T)N0-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nucleotídeos;
em que cada N0-4 é independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucleotídeo selecionada de A, U, T, G e C ou um análogo de nucleotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva
Petição 870190070557, de 24/07/2019, pág. 258/401
194/306 de entre 5 a 7 nudeotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;
em que N0-2 é uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contendo que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;
em que 0 troncol e 0 tronco2 são capazes de emparelhamento de base um com 0 outro formando uma sequência reversa complementar, em que 0 emparelhamento de base pode ocorrer entre 0 troncol e 0 tronco2, por exemplo, emparelhamento de base WatsonCrick de nudeotídeos A e U/T ou G e C ou por emparelhamento de base não Watson Crick, por exemplo, emparelhamento de base wobble, emparelhamento de base Watson-Crick, emparelhamento de base Hoogsteen, emparelhamento de base Hoogsten ou são capazes de emparelhamento de base um com 0 outro formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre 0 troncol e tronco2, com base em que uma ou mais bases no tronco não têm uma base complementar na sequência de complementaridade reversa do outro tronco.
[0334] De acordo com uma modalidade preferida, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender pelo menos uma sequência de tronco-alça de histona (HSL)
Petição 870190070557, de 24/07/2019, pág. 259/401
195/306 de acordo com peto menos uma da fórmula (Ia) ou (Ha) específica que segue:
fórmula (Ia) (sequência de tronco-alça sem elementos limítrofes de tronco):
[No-tGNw] [Ni.3(U/T)N0.2] [N3.5CN0.1] x__________ç,y -----------v' tronco 1 alça tronco 2 fórmula (Ha) (sequência de tronco-alça com elementos limítrofes de tronco):
N2-5 IW1GN3-5] [Ni-3(U/T)N0_2] [N3-5CN0-1] N2-5
.... · ----------------...-----------------. ..J--· ·--
V tronco 1 troncol alça. tronco2 tronco2 elemento limítrofe elemento limítrofe em que:
N, C, G, T e U são como acima definido.
[0335] De acordo com uma modalidade mais particularmente preferida adicional, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) pode compreender peto menos uma sequência de tronco-alça de histona de acordo com peto menos uma da fórmula (Ib) ou (llb) específica que segue:
Fórmula (Ib) (sequência de tronco-alça sem elementos limítrofes de fes de tronco):
[N1GN4] [N2(U/T)Ni] [N4CN1]
V M y ·.
tronco! atoa trooco2 fórmula (llb) (sequência de tronco-alça com elementos limítrofes de tronco):
Petição 870190070557, de 24/07/2019, pág. 260/401
196/306
N4-5 [N1GN4] [N2(U/T)Ni] [N4CN1] N4-5 \__________' „__________X.---------,.--------V V trancol troncol alça tronco2 tronccS elemento limítrofe elemento limítrofe em que
N, C, G, T e U são como acima definido.
[0336] Uma sequência de tronco-alça de histona particularmente preferida é a sequência CAAAGGCTCTTTTCAGAGCCACCA ou mais preferivelmente a sequência de RNA correspondente CAAAGGCUCUUUUCAGAGCCACCA.
Porções de miRNA [0337] Em uma modalidade adicional, porções de não codificação, isto é, por exemplo, porções de miRNA, são combinadas com as sequências da invenção. Porções de não codificação podem ser selecionadas de sequências de ácido nucleico de uma ou mais reveladas na lista que segue: uma 5’-UTR;
uma 3-UTR;
uma porção de miRNA;
um Cap;
uma sequência de poli(C) uma sequência de tronco-alça de histona uma sequência de poli(A) ou um sinal de poliadenilação;
uma porção de IRES uma porção grampo de cabelo.
porções para proteínas de ligação a RNA uma porção que previne degradação de 3’-5’ porções que regulam taxas de declínio de RNA
Petição 870190070557, de 24/07/2019, pág. 261/401
197/306 [0338] Os acima são termos genéricos. Porções específicas que se encaixam nesses termos genéticos são também providas pela presente invenção. Detalhes de porções da lista acima, incluindo sequências pertencentes às modalidades específicas, são providos abaixo.
[0339] Embora a lista acima proveja itens na forma singular, é igualmente possível que mais de uma porção respectiva seja selecionada. Porções de ácido nucleico não incluídas na lista acima podem ser igualmente selecionadas. Preferivelmente, pelo menos um módulo ou porção é da lista acima.
[0340] Em modalidades típicas, pelo menos uma porção 5’-UTR e/ou pelo menos uma porção 3!~UTR é selecionada. Preferivelmente, pelo menos uma 5’-UTR e pelo menos uma 3’-UTR é selecionada.
[0341 ] Um miRNA pode ser também selecionado como uma porção na presente invenção. Qualquer porção de miRNA conhecida na técnica pode ser selecionada. Tal porção pode ser selecionada de sequênciasalvo de microRNA, sequências de microRNA ou sementes de microRNA. Por exemplo, sequências de miRNA (sequências-alvo de microRNA, sequências de microRNA ou sementes de microRNA) são descritas nos WO2015085318A2, US2005/0261218, US20170211066, WO2017201332, WO2017201328, WO2017201349, WO2017201347, WO2017201348, WO2017201342, WO2017201346, US20160177295, WO2014113089, EP2946014, W02016100812, WO2013126803 e US2005/0059005 (todas as referências mencionadas são aqui incorporadas a título de referência). Identificação de microRNA, regiões-alvo de microRNA e seus padrões de expressão e papel em biologia foram relatados (Bonauer e outros, Curr Drug Targets 2010 11 :943-949; Anand e Cheresh, Curr Opin Hematol 2011, 18: 171-176; Contreras eRao Leukemia, 2012 26:404-413; Barrel, Cell, 2009 136:215-233; Landgraf e outros Cell, 2007 129: 1401-1414 todas as referências mencionadas acima são aqui incorporadas a título de referência).
Petição 870190070557, de 24/07/2019, pág. 262/401
198/306 [0342] Em geral, microRNAs (ou miRNA) são RNAs de não codificação de 19-25 nucleotídeos de comprimento. miRNAs se ligam a 3’UTR de moléculas de ácido nucleico. Isso causa sub-regulagem de expressão de gene, ou através da redução da estabilidade da molécula de ácido nudeico ou inibindo tradução. Como um módulo da presente invenção, os polinucleotídeos da presente invenção podem compreender uma sequências-alvo de microRNA, sequências de microRNA ou sementes de microRNA.
[0343] Como aqui usado, o termo sítio de microRNA refere-se a uma sequência de polinucleotídeo à qual microRNA pode se ligar ou de outro modo se associar. Ligação tipicamente ocorre através de hibridização Watson-Crick; mas qualquer outra associação estável do microRNA com a sequência-alvo no ou adjacente ao sítio de microRNA é também compreendida no conceito de sítio de microRNA de acordo com a presente invenção.
[0344] Em geral, uma sequência de microRNA compreende uma região semente, isto é, uma sequência tipicamente na região de posições 2-8 de um microRNA maduro. A sequência de região de semente tem complementaridade Waston-Crick perfeita com a sequência-alvo de miRNA. Tal semente de microRNA pode compreender posições 2-8 ou, alternativamente, 2-7 do microRNA maduro. Desta maneira, em uma modalidade, uma semente de microRNA compreende 7 nucleotídeos (por exemplo, nucleotídeos 2-8 do microRNA maduro), em que o sítio de complementaridade de semente no alvo de miRNA correspondente é flanqueado por uma adenina (A) oposto à posição 1 de microRNA. Em uma outra modalidade, uma semente de microRNA compreende 6 nucleotídeos (por exemplo, nucleotídeos 2-7 do microRNA maduro), em que o sítio de complementaridade de semente no alvo de miRNA correspondente é flanqueado por adenina (A) oposto à posição de microRNA 1. As respectivas moléculas de ácido nucleico são reveladas
Petição 870190070557, de 24/07/2019, pág. 263/401
199/306 em Grimson e outros; Mol Cell. 2007 Jul 6;27(1 ):91 -105.
[0345] Na presente invenção, uma sequência-alvo de microRNA é tipicamente projetada para ser compreendida em uma 3’-UTR ou de outro modo 3’ (a montante) de uma estrutura de leitura aberta. Em tal caso, a sequência-alvo de miRNA é pensada se direcionar à molécula para degradação ou tradução reduzida, contanto que um microRNA correspondente em questão esteja disponível. Isso permite controlar quaisquer efeitos fora do alvo indesejados quando da administração da molécula de ácido nucleico da presente invenção.
[0346] No caso de não ser desejado traduzir um mRNA no fígado, mas o mRNA é transportado para o fígado ou de outro modo termina nele, então miR-122, um microRNA abundante no fígado, pode inibir a expressão do ácido nucleico da presente invenção, se um ou múltiplos sítios-alvo de miR-122 estiverem presentes (por exemplo, projetado) na região 3’-UTR do polinucleotídeo na presente invenção. Introdução de um ou múltiplos sítios de ligação para microRNA diferente pode ser engenheirada para influenciar mais (por exemplo, diminuir) a longevidade, estabilidade e tradução de proteína de polinucleotídeos.
[0347] Em contraste, no caso de ser realmente desejado traduzir um mRNA, sítios de ligação de microRNA podem ser engenheirados a partir de (isto é, removidos de) sequências em que eles ocorrem, por exemplo, a fim de aumentar a expressão de proteína em tecidos específicos. Por exemplo, um ou mais sítios de ligação de miR-122 podem ser removidos para melhorar a expressão da proteína no fígado.
[0348] Desta maneira, regulagem de expressão em tecidos específicos pode ser realizada através de introdução ou remoção de um ou vários sítios de ligação de microRNA. Por exemplo, microRNAs são conhecidos regular mRNA, e desta maneira expressão de proteína, sem limitação no fígado (miR-122), coração (miR-ld, miR-149), células endoteliais (miR-17-92, miR-126), tecido adiposo (let-7, miR-30c), rim (miR
Petição 870190070557, de 24/07/2019, pág. 264/401
200/306
192, miR-194, miR-204), células mieloides (miR-142-3p, miR-142-5p), miR-16, mlR-21, miR223, miR-24, miR-27), músculo (mlR-133, miR206) e células epiteliais do pulmão (let-7, miR-133, miR-126). MicroRNA pode também regular processos biológicos complexos, tal como angiogênese (miR-132) (por exemplo, Anand e Cheresh, Curr. Opin. Hematol. 2011, 18: 171-176).
[0349] Desta maneira, em geral, de acordo com o princípio de projeto modular da presente invenção, sítios de ligação para microRNAs podem ser removidos ou introduzidos, a fim de adaptar a expressão da expressão de polinucleotídeo para os tipos de célula ou tecidos desejados ou ao contexto de processos biológicos relevantes. Listagens de sequências de miRNA e sítios de ligação estão disponíveis para o público. Qualquer sequência revelada na literatura discutida aqui pode ser usada no contexto da presente invenção: exemplos de microRNA que direcionam expressão de gene específica de tecido ou doença são listados em Getner e Naldini, Tissue Antigens. 2012, 80:393-403. Um exemplo de incorporação de sítios de semente de microRNA é incorporação de sítios de mlR-142 a um vetor lentiviral expressando UGT1A1, que causa expressão reduzida em células apresentando antígeno, levando à ausência de uma resposta imune contra o UGT1A1 viralmente expresso como revelado em Schmitt e outros, Gastroenterology 2010; 139:999-1007; Gonzalez-Asequinolaza e outros, Gastroenterology 2010, 139:726-729. Desta maneira, incorporação de um ou mais sítios de semente de m!R142 em mRNA é pensada ser importante no caso de tratamento de pacientes com deficiências de proteína completa (UGT1A1 tipo I, pacientes deficientes em LDLR, pacientes Pompe negativos em CRIM, etc). Desta maneira, a molécula de ácido nucleico da presente invenção pode ser projetada para se adequar a tais propósitos. Qualquer polinucleotídeo pode ser selecionado, que seja caracterizado
Petição 870190070557, de 24/07/2019, pág. 265/401
201/306 por peto menos 80% de identidade, pelo menos 85% de identidade, preferivelmente pelo menos 90% de identidade e mais preferivelmente pelo menos 95% de identidade com qualquer uma de tais sequências de miRNA.
[0350] Devido aos padrões de expressão diferentes de microRNA em tipos de células diferentes, a presente invenção permite projetar especificamente moléculas de polinucleotídeo para expressão direcionada em tipos de célula específicos ou sob condições biológicas específicas. Através de introdução de sítios de ligação de microRNA específicos de tecido, polinucleotídeos podem ser projetados para expressão de proteína em um tecido ou no contexto de uma condição biológica.
[0351] Em uma modalidade da Invenção, a molécula de ácido nucleico artificial da invenção codificando uma proteína associada a CRISPR (por exemplo, Cas9, Cpf1) da invenção compreende pelo menos uma sequência de miRNA selecionada do grupo consistindo em hsa-miR-27a-3p, hsa-miR-99b-5p, hsa-miR-21-5p, hsa-miR-142-5p, hsa-míR-27a~3p, hsa-míR-21~5p, hsa-miR-223~3p, hsa-miR-150~5p e hsa-mlR-142-5p.
Construtos [0352] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção, que compreende peto menos uma sequência de codificação como aqui definido compreende pelo menos uma 5’ UTR e peto menos uma 3’ UTR como aqui descrito, e opcionalmente pelo menos um tronco-alça de histona.
[0353] A 3’ UTR da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender ainda uma sequência de poli(A) e/ou poli(C) como aqui definido.
[0354] Os elementos únicos da 3’ UTR podem ocorrer aí em qual
Petição 870190070557, de 24/07/2019, pág. 266/401
202/306 quer ordem de 5’ a 3’ ao longo da sequência da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção.
[0355] Ainda, elementos adicionais como aqui descrito também podem estar contidos, tal como uma sequência de estabilização como definido aqui (por exemplo, derivada da UTR de um gene da globina), sequências de IRES, etc. Cada um dos elementos pode também ser repetido na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pelo menos uma vez (particularmente em construtos di- ou multicistrônicos), por exemplo, duas vezes ou mais. Como um exemplo, os elementos únicos podem estar presentes na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção na ordem que segue: 5’-sequência de codificação-tronco-alça de histona-sequência de poli(A)/(C) 3’; ou
5’-sequência de codificação-sequência de poli(A)/(C)-tronco-alça de h istona-3’; ou
5’-sequência de codificação-tronco-alça de histona-sinal de poliadenilação-3’; ou
5’-sequência de codificação-sinal de poliadenilação-tronco-alça de histona-3’; ou
5’-sequência de codificação-histona alça-tronco-alça-tronco de histonasequência de poli(A)/(C)-3’; ou
5’-sequência de codificação-tronco-alça de histona-tronco-alça de histona-sinal de poliadenilação~3’; ou
5!-sequência de codificação-sequência de estabilização-sequência de poli(A)/(C)-tronco-alça de histona-3’; ou
5’-sequência de codificação, sequência de estabilização-sequência de poli(A)/(C)-sequência de poli-(A)/(C)-tronco-alça de histona-3’, etc.
[0356] De acordo com modalidades adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, preferivelmente compreende
Petição 870190070557, de 24/07/2019, pág. 267/401
203/306 ainda pelo menos um dos elementos estruturais que seguem: uma estrutura de histona-tronco-alça, preferivelmente uma histona-tronco-aiça na região não traduzida 3’; uma estrutura de 5’-cap; uma cauda de poliA; ou uma sequência de poli(C).
[0357] De acordo com algumas modalidades, é particularmente preferido que se, em adição a uma proteína associada a CRISPR, um peptídeo ou proteína adicional for codificado por pelo menos uma sequência de codificação como definido aqui-o peptídeo ou proteína codificado preferivelmente não é nenhuma proteína histona, nem proteína repórter (por exemplo, Luciferase, GFP e suas variantes (tal como eGFP, RFP ou BFP) e/ou nenhum marcador ou proteína de seleção, incluindo alfaglobina, galactocinase e Xantina:Guanina fosforribostil transferase (GPT), hipoxantina-guanina fosforribosiltransferase (HGPRT), beta galactosidase, galactocinase, fosfatase alcalina, fosfatase alcalina embriônica secretada (SEAP) ou um gene de resistência (tal como um gene de resistência contra neomicina, puromicina, higromicina e zeocina). Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica um gene repórter ou um gene marcador. Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica luciferase. Em outras modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica GFP ou uma variante da mesma.
[0358] Especificamente, moléculas de ácido nucleico artificiais, em particular RNAs, de acordo com a invenção podem compreender preferivelmente na direção 5’ para 3’, os elementos que seguem:
a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1
b) um elemento de 5’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como aqui definido, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com
Petição 870190070557, de 24/07/2019, pág. 268/401
204/306
SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma;
c) pelo menos uma sequência de codificação como aqui definido;
d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3!~UTR como definido aqui, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 23; 25; 27; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,
e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nudeotídeos de adenosina,
f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nudeotídeos cisteína, e
g) opcionalmente um tronco-alça de histona.
[0359] Construtos de ácido nucleico artificias preferidos são discutidos em detalhes abaixo.
Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de GNAS [0360] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130
Petição 870190070557, de 24/07/2019, pág. 269/401
205/306
8145; 9290-9305; 10402-10408; 10554; 10599-10612, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3! UTR derivado de GNAS:
[0361] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 414; 23462361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 93069321; 10409-10415; 10555; 10613-10626, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo
Petição 870190070557, de 24/07/2019, pág. 270/401
206/306
97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de ATP5A1 e elemento de 3’ UTR derivado de CASP1 [0362] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de ATP5A1, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 81628177; 9322-9337; 10416-10422; 10556; 10627-10640, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de NDUFA4 e elemento de 3! UTR derivado de PSMB3:
[0363] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR
Petição 870190070557, de 24/07/2019, pág. 271/401
207/306 de urn gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nudeico artificial compreende ou consiste em uma sequência de ácido nudeico de acordo com SEQ ID NO: 416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nudeico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de PSMB3 [0364] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436: 10558; 10655-10668, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%,
Petição 870190070557, de 24/07/2019, pág. 272/401
208/306 preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de RPL32 e elemento de 3’ UTR derivado de ALB:
[0365] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de RPL32, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5! UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de CASP1:
[0366] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo
Petição 870190070557, de 24/07/2019, pág. 273/401
209/306 menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3’ UTR derivado de CASP1 [0367] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência
Petição 870190070557, de 24/07/2019, pág. 274/401
210/306 de ácido nucleico tendo, em ordem crescente de preferência, peio menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3’ UTR derivado de PSMB3 [0368] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738, ou uma variante ou um fragmento de qualquer uma das ditas sequencais, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Petição 870190070557, de 24/07/2019, pág. 275/401
211/306
Elemento de 5’ UTR derivado de NOSIP e elemento de 3! UTR derivado de PSMB3:
[0369] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NOSIP, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 82908305; 9459-9450; 10472-10478; 10564; 10739-10752, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de NDUFA4 e elemento de 3' UTR derivado de RPS9 [0370] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante
Petição 870190070557, de 24/07/2019, pág. 276/401
212/306 do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 83068321; 9466-9481; 10479-10485; 10565; 10753-10766, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de RPS9:
[0371] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos
Petição 870190070557, de 24/07/2019, pág. 277/401
213/306
80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0372] Em outras modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento 5’ UTR e 3’ UTR como descrito aqui abaixo (ou de um homólogo, um fragmento ou variante da mesma), em que o ácido nucleico artificial compreende ou consiste em um a sequência de ácido nucleico de acordo com a SEQ ID NO: em parênteses atrás da combinação de UTR específica:
ATP5A1 / Gnas.1 (SEQ ID NO: 9498- 9609; 10493-10499; 10567; 10781-10794);
Ndufa4.1 / COX6B1.1 (SEQ ID NO: 9610-9721; 10500-10506; 10568; 10795-10808);
Ndufa4.1 / Gnas.1 (SEQ ID NO: 9722-9833; 10507-10513; 10569; 10809-10822);
Ndufa4.1 / Ndufal. 1 (SEQ ID NO: 9834-9945; 10514-10520; 10570; 10823-10836);
Nosip.1 / Ndufal.1 (SEQ ID NO: 9946-10057; 10521-10527; 10571; 10837-10850);
Rpl31.1 / Gnas.1 (SEQ ID NO: 10058-10169; 10528-10534; 10572; 10851-10864);
TUBB4B.1 ZRPS9.1 (SEQ ID NO: 10170-10281; 10535-10541; 10573; 10865-10878);
Ubqln2.1 / RPS9.1 (SEQ ID NO: 10282-10393; 10542-10548; 10574; 10879-10892).
Complexação [0373] Em modalidades preferidas, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer
Petição 870190070557, de 24/07/2019, pág. 278/401
214/306 outro ácido nucleico como aqui descrito) é provida em uma forma complexada, isto é, complexada ou associada com um ou mais compostos (poli-)catiônicos, preferivelmente com polímeros (poli-jcatiônicos, peptídeos (poli-jcatiônicos ou proteínas, por exemplo, protamina, polissacarídeos (poli)catiônicos e/ou lipídeos (poli-)catiônicos. Neste contexto, o termo complexado ou associado refere-se à combinação essencialmente estável da pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico) com um ou mais dos compostos mencionados acima em complexos ou arranjos maiores sem ligação covalente.
Lipídeos [0374] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção é complexada ou associada com lipídeos (em particular lipídeos catiônicos e/ou neutros) para formar um ou mais lipossomos, lipoplexos, nanopartículas de lipídeo ou nanolipossomas.
[0375] Desta maneira, em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é provida na forma de uma formulação à base de lipídeo, em particular na forma de lipossomas, lipoplexos e/ou nanopartículas de lipídeo compreendendo a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA).
Nanopartículas de lipídeo [0376] De acordo com algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é complexada ou associada com lipídeos (em particular lipídeos catiônicos e/ou neutros) para formar uma ou mais nanopartículas de lipídeo.
Petição 870190070557, de 24/07/2019, pág. 279/401
215/306
Em algumas modalidades, a(s) nanopartícula(s) da invenção compreende(m) pelo menos uma molécula de ácido nucleico artificial codificando uma proteína associada a CRISPR como aqui descrito, em ainda pelo menos um gRNA como aqui descrito.
[0377] Preferivelmente, nanopartículas de lipídeo (LNPs) compreendem: (a) pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), (b) um lipídeo catiônico, (c) um agente de redução de agregação (tal como lipídeo de polietileno glicol (PEG) ou lipídeo modificado com PEG), (d) opcionalmente um lipídeo não catiônico (tal como um lipídeo neutro) e (e), opcionalmente, um esterol.
[0378] Em algumas modalidades, LNPs compreendem, em adição à pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), (i) pelo menos um lipídeo catiônico; (ii) um lipídeo neutro; (iii) um esterol, por exemplo, colesterol; e (iv) um PEG-lipídeo, em uma razão molar de cerca de 20-60% de lipídeo catiônico:5-25% de lipídeo neutro:25~55% de esterol; 0,5-15% de PEG-lipídeo.
[0379] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), pode ser formulada em um aminoálcool lipidoide. Aminoálcoois lipidoides que podem ser usados na presente invenção podem ser preparados através dos métodos descritos na Patente U.S. No. 8.450.298, aqui incorporada a título de referência em sua totalidade.
(i) Lipídeos catiônicos [0380] LNPs podem incluir qualquer lipídeo catiônico adequado para formação de uma nanopartícula de lipídeo. Preferivelmente, o lipídeo catiônico carrega uma carga positiva líquida em pH mais ou menos fisiológico.
Petição 870190070557, de 24/07/2019, pág. 280/401
216/306 [0381] O lipídeo catiônico pode ser um amino lipídeo. Como aqui usado, o termo amino lipídeo pretende incluir aqueles lipídeos tendo uma ou duas cadeias alquila do ácido graxo ou graxas e um grupo amino principal (incluindo um grupo alquilamino ou dialquilamino) que pode ser protonado para formar um lipídeo catiônico em pH fisiológico.
[0382] O lipídeo catiônico pode ser, por exemplo, cloreto de N,Ndíoleil·N,Ndimetilamônio (DODAC), brometo de N,N-diestearil~N,N~dl·metilamônio (DDAB), cloreto de 1,2-dioleoiltrimetil amônio (DOTAP) (também conhecido como cloreto de N(2,3dioleoil0xi)propil)N,N,N-trimetilamônio e Sal de cloreto de 1 ^dioleiloxhS-trimetilaminopropano), cloreto de N~(1-(2,3-dioleilóxi)propil)-N,N,N-trimetilamônio (DOTMA), N,Ndimetil2,3- dioleilóxi)propilamina (DODMA), 1,2DiLinoieilóxi-N,Ndimetilaminopropano (DLinDMA), 1,2--ΟίΙίηοί©ηίΙόχΕ-Ν,N--dimetHaminopropano (DLenDMA), 1,2~dH-linolenilóxi~N,N~dimetilaminopropano (y~ DLenDMA), 1,2-Dilinolellcarbamoilóxi3 dimetilaminopropano (DLin-CDAP), UZ-DilinoleioxhS-idimetilaminojacetoxipropano (DLin-DAC), 1,2Dilinoleióxi-S-morfolinopropano (DLin-MA), 1,2~Dilinoleoil~3~ dimetilaminopropano (DLinDAP), l,2”Dilinoieiitio~3~dimetiiaminopropano (DLin-SDMA), 1 Unoleoil2linoleilóxl-3-dimetilaminopropano (DLIn-2-DMAP), Sal de cloreto de 1,2~dilinoleilóxi~3~trimetilaminopropano (DLin~TMA.CI), Sal de cloreto de 1,2-dilinoleoil-3- trimetilaminopropano (DLin-TAP.CI), 1,2-ΟΙΙΙηοΙβΙΙόχί3(Ν- metllpiperazino)propano (DLin-MPZ) ou 3-(N,NDilinoleilamino)~1,2-propanodiol (DLinAP), 3~(N,N~Dioleilamino)-1,2propanodio (DOAP), 1,2-Dilinoleiloxo~3-(2--N,N dimetilamino)etoxipro~ pano (DLin-EG-DM A), 2,2-Dilinolell-4“dlmetilaminometil-[1,3]-dloxolana (DLin-K-DMA) ou análogos dos mesmos, (3aR,5s,6aS)”N,N-dimetil2,2di((9Z, 12Z)- octadeca-9,12~dienil)tetrahidro~3aH“Ciclopenta[d][1,3]d io~ xol-5-amina, (6Z,9Z,28Z,31Z)~heptatriaconta--6,9,28,31~tetraen-19~il 4(dimetilamino)butanoato (MC3), 1,1'-(2-(4-(2-((2-(bis(2-hidroxidode
Petição 870190070557, de 24/07/2019, pág. 281/401
217/306 cn)amino)etn)(2”Mdr0xHdodecH)armno)etH)piperazin-J”H)etnaz:anediH)dk dodecan-2-ol (C12-200), 2,2“dHinoieH~4~(2~dimetnaminoetH)~[1,3]-dioxolana (DLin-K~C2~DMA), 2,2-diHnoleil-4-dimetilaminometil-[l,3]-dioxolana (DLin-K-DMA), (6Z,9Z,28Z,31 Z)-heptatriaconta-6,9,28,31 -tetraen-19-il
4-(dimetilamino) butanoato (DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-heptatriaconta-6,9,28,3 l-tetraen-W-ilóxij-N^-dimetilpropan-l-amina (MC3 Éter), 4-((6Z,9Z,28Z,31 Z)-heptatriaconta-6,9,28,31-tetraen-19-ilóxi)N,N-dimetilbutan-1-amina (MC4 Éter) ou qualquer combinação de qualquer um dos acima.
[0383] Outros Hpídeos catiônicos incluem, mas não estão limitados a, brometo de N,N-distearil~N,N~dimetilamônio (DDAB), 3P-(N-(Ns,Ns-di~ metilaminoetano)-carbamoil)colesterol (DC-Choi), trifluoracetato de N(1-(2,3-dioleilóxi)propil)-N-2-(esperminocarboxamido)etil)-N,N-dimetilamônio (DOSPA), dioctadecilamidoglicil carboxispermina (DOGS), 1,2dileoil-sn-3-fosfoetanolamina (DOPE), 1,2-dioleoH-3-dimetilarnônio propane (DODAP), brometo de N-(1,2-dimiristiloxiprop-3-il)-N,N-dimetil-Nhidroxietil amônio (DMRIE) e 2,2~Dilinoleil~4~dirnetHaminoetH~[1,3]-dio~ xolana (XTC). Ainda, preparações comerciais de Hpídeos catiônicos podem ser usadas, tais como, por exemplo, LIPOFECTIN (incluindo DOTMA e DOPE, disponíveis da GIBCO/BRL) e LIPOFECTAMINE (compreendendo DOSPA e DOPE, disponíveis da GIBCO/BRL).
[0384] Outros Hpídeos catiônicos adequados são revelados nas Publicações Internacionais Nos. WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709 e WO 2011/153493; Publicações de Patente U.S. Nos. 2011/0256175, 2012/0128760 e 2012/0027803; Patentes U.S. Nos. 8.158.601; e Love e outros, PNAS, 107(5), 1864-69, 2010.
[0385] Outros lipídeos de aminoácido adequados incluem aqueles tendo grupos de ácido graxo alternativos e outros grupos dialquilamino, incluindo aqueles em que os substituintes alquila são diferentes (por
Petição 870190070557, de 24/07/2019, pág. 282/401
218/306 exemplo, N-etil-N-metilamino e N-propil-N-etilamino). Em geral, amino lipídeos tendo menos cadeias acila saturadas são mais facilmente dimensionados, particularmente quando os complexos devem ser dimensionados abaixo de cerca de 0,3 microns, para propósitos de esterilização do filtro. Amino lipídeos contendo ácidos graxos insaturados com comprimentos de cadeia de carbono na faixa de C14 a C22 podem ser usados. Outras bases podem ser também usadas para separar o grupo amino e a porção de ácido graxo ou alquila graxa do amino lipídeo.
[0386] Em algumas modalidades, amino lipídeos ou catiônicos têm pelo menos um grupo protonável ou desprotonável, de modo que o lipídeo é positivamente carregado em um pH em ou abaixo do pH fisiológico (por exemplo, pH 7,4) e neutro em um segundo pH, preferivelmente em ou acima do pH fisiológico. Será, por certo, compreendido que a adição ou remoção de prótons como uma função de pH é um processo de equilíbrio, e que a referência a um lipídeo carregado ou neutro referese à natureza da espécie predominante e não requer que todo o lipídeo esteja presente na forma carregada ou neura. Lipídeos que têm mais de um grupo protonável ou desprotonável, ou que são zwitteriônicos, não são excluídos de uso na invenção.
[0387] Em algumas modalidades, os lipídeos protonáveis têm uma pKa do grupo protonável na faixa de cerca de 4 a cerca de 11, por exemplo, uma pKa de cerca de 5 a cerca de 7.
[0388] LNPs podem incluir dois ou mais lipídeos catiônicos. Os lipídeos catiônicos podem ser selecionados para contribuir com propriedades vantajosas diferentes. Por exemplo, lipídeos catiônicos que diferem em propriedades tais como pKa de amina, estabilidade química, meiavida em circulação, meia-vida em tecido, acúmulo líquido em tecido ou toxidez podem ser usados na LNP. Em particular, os lipídeos catiônicos podem ser escolhidos de modo que as propriedades da LNP mista são mais desejáveis do que as propriedades de uma LNP única de lipídeos
Petição 870190070557, de 24/07/2019, pág. 283/401
219/306 individuais.
[0389] Em algumas modalidades, o lipídeo catiônico está presente em uma razão de a partir de cerca de 20% em mol a cerca de 70 ou 75% em mol ou de a partir de 45 a cerca de 65% em mol ou cerca de 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 ou cerca de 70% em mol do lipídeo total presente na LNP. Em modalidades adicionais, as LNPs compreendem de a partir de cerca de 25% a cerca de 75% em uma base molar de lipídeo catiônico, por exemplo, de a partir de cerca de 20 a cerca de 70%, de a partir de cerca de 35 a cerca de 65%, de a partir de cerca de 45 a cerca de 65%, cerca de 60%, cerca de 50% ou cerca de 40% em uma base molar (com base em 100% de moles totais de lipídeo na nanopartícula de lipídeo). Em algumas modalidades, a razão de lipídeo catiônico para ácido nucleico é de a partir de cerca de 3 a cerca de 15, tal como de a partir de cerca de 5 a cerca de 13 ou de a partir de cerca de 7 a cerca de 11.
[0390] Em algumas modalidades, o lipossoma pode ter uma razão molar de átomos de nitrogênio no lipídeo catiônico para os fosfatos no RNA (razão N:P) entre 1:1 e 20:1 como descrito na Publicação Internacional No. W02013/006825A1, aqui incorporada a título de referência em sua totalidade. Em outras modalidades, o lipossoma pode ter uma razão N:P de mais de 20:1 ou menos de 1:1.
[0391] Em alguns aspectos, o lipídeo é selecionado do grupo consistindo em 98N12-5, C12-200 e CKK-E12. Em uma modalidade, os ácidos nucleicos podem ser formulados em um lipidoide aminoálcool. Lipidoides aminoálcool que podem ser usados na presente invenção podem ser preparados através dos métodos descritos na Patente U.S. No. 8.450.298, aqui incorporada a título de referência em sua totalidade.
[0392] Em uma outra modalidade, lipídeos ionizáveis podem ser compostos como revelado na Publicação Internacional No. WO2015/ 074085A1, Pedidos U.S. Nos. 61/905.724 e 15/614.499, WO2015
Petição 870190070557, de 24/07/2019, pág. 284/401
220/306
074085A1 ou Patentes ou Pedidos U.S. Nos. 9.593.077, 61/905.724, 9.593,077, 9.567.296, 15/614.499 e 9,567,296, aqui incorporados a título de referência em sua totalidade.
[0393] Lipídeos ionizáveis podem ser também os compostos como revelado nas Tabelas 1, 2 e 3 e reivindicações 1-24 da Publicação Internacional No. WO2017/075531A1, aqui incorporada a título de referência em sua totalidade. Em uma outra modalidade, lipídeos ionizáveis podem ser também os compostos como revelado na Publicação Internacional No. W02015/074085A1 (i.e. ATX-001 até ATX-032 ou os compostos como mencionado em 1-26), Pedidos U.S. Nos. 61/905.724 e 15/614,499 ou Patentes U.S. Nos. 9.593.077 e 9.567.296, aqui incorporadas a título de referência em sua totalidade.
(ii) Lipídeos neutros e não catiônicos [0394] O lipídeo não catiônico pode ser um lipídeo neutro, um lipídeo anlônlco ou um lipídeo anfifático. Lipídeos neutros, quando presentes, podem ser qualquer um de várias espécies de lipídeo que existem ou em uma forma zwitteriônica não carregada ou neutra em pH fisiológico. Tais lipídeos incluem, por exemplo, diacilfosfatidilcolina, diacilfosfatidiletanolamina, ceramica, esfingomielina, di-hidroesfingomielina, cefalina e cerebrosídeos. A seleção de lipídeos neutros para uso nas partículas descritas aqui é geralmente guiada através de consideração de, por exemplo, tamanho da LNP e estabilidade da LNP na corrente sanguínea. Preferivelmente, o lipídeo neutro é um lipídeo tendo dois grupos acila (por exemplo, diacilfosfatidilcolina e diacilfosfatidiletanolamina).
[0395] Em algumas modalidades, os lipídeos neutros contêm ácidos graxos saturados com comprimentos de cadeia de carbono na faixa de Ci0 a C20. Em outras modalidades, lipídeos neutros com ácidos graxos mono ou di-insaturados com comprimentos de cadeia de carbono na faixa de C10 a C20 são usados. Ainda, lipídeos neutros tendo misturas
Petição 870190070557, de 24/07/2019, pág. 285/401
221/306 de cadeias de ácido graxo insaturado ou não insaturado podem ser usados.
[0396] Lipídeos neutros adequados incluem, mas não estão limitados a, diestearoilfosfatidilcolina (DSPC), dioleoilfosfatidilcolina (DOPC), dípalmitoilfosfatidilcolina (DPPC), dioleoHfosfatidilglicerol (DOPG), dipalmitoilfosfatidilglicerol (DPPG), dioleoil-fosfatidiletanolamina (DOPE), palmitoiloleoilfosfatidilcolina (POPC), palmitoiloleoilfosfatidiletanolamina (POPE), 4-(N-maleimidometH)-cicloexanO1Carboxílato de dioleoil-fosfatidiletanolamina (DOPE-mal), dipalmitoil fosfatidil etanolamina (DPPE), dimiristoilfosfoetanolamina (DMPE), dimiristoil fosfatidilcolina (DMPC), distearoil-fosfatidil-etanolamina (DSPE), SM, 16~0~monometil PE, 16-0dimetil PE, 18-1-trans PE, 1-stearoil-2-oleoil-fosfatidietanolamina (SOPE), colesterol ou uma mistura dos mesmos. Lipídeos aniônicos adequados para uso em LNPs incluem, mas não estão limitados a, fosfatidilglicerol, cardiolipina, diacilfosfatidilserina, ácido diacilfosfatídico, N-dodecanoil fosfatidiletanoloamina, N-succinil fosfatidiletanolamina, N-glutaril fosfatidiletanolamina, lisilfosfatidilglicerol e outros grupos de modificação aniônicos unidos a lipídeos neutros.
[0397] Lipídeos anfífáticos referem-se a qualquer material adequado, em que a porção hidrofóbica do material de lipídeo orienta para uma fase hidrofóbica, enquanto a porção hidrofílica orienta para a fase aquosa. Tais compostos incluem, mas não estão limitados a, fosfolipídeos, aminolipídeos e esfingolipídeos. Fosfolipídeos representativos incluem esfingomielina, fosfatidilcolina, fosfatidiletanolamina, fosfatidiiserina, fosfatidilinositol, ácido fosfatídico, palmitoiloleoil fosfatdilcolina, IIsofosfatidilcolina, lisofosfatidiletanolamina, dípalmitoilfosfatidilcolina, dioleoilfosfatidilcolina, distearoilfosfatidilcolina ou dilinoleoilfosfatidilcolina. Outros compostos isentos de fósforo, tais como esfingolipídeos, famílias de glicoesfingolipídeo, diacilgliceróis e beta-aciloxiácidos, podem ser também usados.
Petição 870190070557, de 24/07/2019, pág. 286/401
222/306 [0398] Em algumas modalidades, o lipídeo não catiônico está presente em uma razão de a partir de cerca de 5% em mol a cerca de 90% em mol, cerca de 5% em mo! a cerca de 10% em mol, cerca de 5, 10,
15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85 ou cerca de 90% em mol do lipídeo total presente na LNP.
[0399] Em algumas modalidades, LNPs compreendem de a partir de cerca de 0% a cerca de 15 ou 45% em uma base molar de lipídeo neutro, por exemplo, de a partir de 3 a cerca de 12% ou de a partir de cerca de 5 a cerca de 10%. Por exemplo, LNPs podem incluir cerca de 15%, cerca de 10%, cerca de 7,5% ou cerca de 7,1% de lipídeo neutro em uma base molar (com base em 100% de moles totais de lipídeo na LNP).
[0400] O esterol é preferivelmente colesterol.
[0401] O esterol pode estar presente em uma razão de cerca de 10% em mol a cerca de 60% em mol ou cerca de 25% em mol a cerca de 40% em mol da LNP. Em algumas modalidades, o esterol está presente em uma razão de cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 ou cerca de 60% em mol do lipídeo total presente na LNP. Em outras modalidades, LNPs compreendem de a partir de cerca de 5% a cerca de 50% em uma base molar do esterol, por exemplo, cerca de 15% a cerca de 45%, cerca de 20% a cerca de 40%, cerca de 48%, cerca de 40%, cerca de 38,5%, cerca de 35%, cerca de 34,4%, cerca de 31,5% ou cerca de 31% em uma base molar (com base em 100% em moles totais na LNP).
(iv) Agentes de Redução de Agregação [0402] O agente de redução de agregação pode ser um lipídeo capaz de reduzir agregação.
[0403] Exemplos de tais lipídeos incluem, mas não estão limitados
Petição 870190070557, de 24/07/2019, pág. 287/401
223/306 a, lipídeos modificados com poiietileno glicol (PEG), monosiaiogangliosídeo Gml e oligômeros de poliamida (PAG) tais como aqueles descritos na Patente U.S. No. 6.320.017, que é aqui incorporada a titulo de referência em sua totalidade. Outros compostos com porções não carregadas, hidrofílicas, de barreira estérica, que previnem agregação durante formulação, tal como PEG, Gml ou ATTA, podem ser também acoplados a lipídeos. Lipídeos ATTA são descritos, por exemplo, na Patente U.S. No. 6.320.017, e conjugados de PEG-lipídeo são descritos, por exemplo, nas Patentes U.S. Nos. 5.820.873, 5.534.499 e 5.885.613, cada uma das quais é aqui incorporada a título de referência em sua totalidade.
[0404] O agente de redução de agregação pode ser, por exemplo, selecionado de um polietilenoglicol (PEG)-lipídeo incluindo, sem limitação, um PEG-diacilglicerol (DAG), um PEG-dialquilglicerol, um PEG-di~ alqulipropila (DAA), um PEG-fosfolipídeo, um PEG-ceramida (Cer) ou uma mistura dos mesmos (tal como PEG-Cerl4 ou PEG-Cer20). O conjugado PEG-DAA pode ser, por exemplo, um PEG-dilauriloxipropila (C12), um PEG-dimirlstiloxiproplia (C14), um PEG-dipalmltiloxipropila (C16) ou um PEG-diestearoilpropila (C18). Outros lipídeo peguilados incluem, mas não estão limitados a, poiietileno glicol-didimiristoil glicerol (C14-PEG ou PEG-C14, onde PEG tem um peso molecular médio de 2000 (Da) (PEG-DMG); (R)-2,3-bis(octadecilóxi)propil-1-(metoxi poli(etileno glicol)2000)propilcarbamato) (PEG-DSG); PEG-carbamoil~1,2-di~ miristiloxipropilamina, em que PEG tem um peso molecular médio de 2000 Da (PEG-cDMA); N-Acetilgalactosamina-((R)-2,3-bis(octadecilóxi)propil-1 -(metóxi poli(etileno glicol)2000)propilcarbamato)) (GalNAcPEG-DSG); mPEG (mw2000)-diastearoilfosfatidil-etanolamina (PEGDSPE); e poiietileno glicol-dipalmitoilglicerol (PEG-DPG).
[0405] Em algumas modalidades, o agente de redução de agrega
Petição 870190070557, de 24/07/2019, pág. 288/401
224/306 ção é PEG-DMG. Em outras modalidades, o agente de redução de agregação é PEG-c-DMA.
[0406] Em uma outra modalidade, PEG-lipídeos podem ser também os compostos como revelado na US20150376115A1 ou WO2015199952, aqui incorporados a título de referência em sua totalidade. Composição de LNP [0407] A composição de LNPs pode ser influenciada pela, inter alia, seleção do componente de lipídeo catiônico, o grau de saturação de lipídeo catiônico, a natureza da PEGuilação, a razão de todos os componentes e parâmetros biofísicos tal como seu tamanho. Em um exemplo de Semple e outros (Semple e outros, Nature Biotech. 2010 28: 172176; aqui incorporado a título de referência em sua totalidade), a composição de LNP foi composta de 57,1% de lipídeo catiônico, 7,1% de dipalmitoilfosfatidilcolina, 34,3% de colesterol e 1,4% de PEG-c-DMA (Basha e outros, Moi Ther. 2011 19:2186-2200; aqui incorporados a título de referência em sua totalidade).
[0408] Em algumas modalidades, LNPs podem compreender de a partir de cerca de 35 a cerca de 45% de lipídeo catiônico, de a partir de cerca de 40% a cerca de 50% de lipídeo catiônico, de a partir de cerca de 50% a cerca de 60% de lipídeo catiônico e/ou de a partir de cerca de 55% a cerca de 65% de lipídeo catiônico. Em algumas modalidades, a razão de lipídeo para ácido nucleico pode variar de a partir de cerca de 5:1 a cerca de 20:1, de a partir de cerca de 10:1 a cerca de 25:1, de a partir de cerca de 15:1 a cerca de 30:1 e/ou pelo menos 30:1.
[0409] O peso molecular médio da porção de PEG nos Hpídeos modificados com PEG pode variar de a partir de cerca de 500 a cerca de 8.000 Daltons (por exemplo, de a partir de cerca de 1.000 a cerca de 4.000 Daltons). Em uma modalidade preferida, o peso molecular médio da porção de PEG é cerca de 2.000 Daltons.
[0410] A concentração do agente de redução de agregação pode
Petição 870190070557, de 24/07/2019, pág. 289/401
225/306 variar de a partir de cerca de 0,1 a cerca de 15% em mol, por 100% de moles totais de lipídeo na NLP. Em algumas modalidades, LNPs incluem menos do que cerca de 3, 2 ou 1 por cento em mol de PEG ou do iipídeo modificado com PEG, com base nos moles totais de lipídeo na LNP. Em modalidades adicionais, LNPs compreendem de a partir de cerca de 0,1% a cerca de 20% do lipídeo modificado em PEG em uma base molar, por exemplo, cerca de 0,5 a cerca de 10%, cerca de 0,5 a cerca de 5%, cerca de 10%, cerca de 5%, cerca de 3,5%, cerca de 1,5%, cerca de 0,5% ou cerca de 0,3% em uma base polar (com base em 100% de moles totais de Hpídeos na LNP).
[0411] LNPs diferentes tendo razões molares variáveis de lipídeo catiônico, lipídeo não catiônico (ou neutro), esterol (por exemplo, coiesteroi) e agente de redução de agregação (tal como um lipídeo modificado com PEG) em uma base molar (com base nos moles totais de lipídeo nas nanopartículas de iipídeo) como mostrado na Tabela 5 abaixo. Em modalidades preferidas, a formulação de nanopartícula de lipídeo da invenção consiste essencialmente em uma mistura de lipídeo em razões molares de cerca de 20-70% de lipídeo catiônico:5-45% de lipídeo neutro:20-55% de colesterol, 0,5-15% de lipídeo modificado com PEG, mais preferivelmente em razões molares de cerca de 20-60% de lipídeo catiônico:5-25% de lipídeo neutro:25-55% de colesterol:0,5-15% de lipídeo modificado com PEG.
Petição 870190070557, de 24/07/2019, pág. 290/401
Tabela 5. Formulações à base de lipídeo
No. | Razão molar de lipídeo (com base em 100% de moles totais de lipídeo na nanopartícula de lipídeo) | |||
Lipídeo catiônico | Lipídeo não catiônico (ou Neutro) | Este rol | Agente de redução de agregação (por exemplo, PEG-lipídeo) | |
1 | de a partir de cerca de 35% a cerca de 65% | de a partir de cerca de 3% a cerca de 12% ouou 15 % | de a partir de cerca de 15% a cerca de 45 % | de a partir de cerca de 0,1% a cerca de 10% (preferivelmente de a partir de cerca de 0,5% a cerca de 2% ou 3% |
2 | de a partir de cerca de 20% a cerca de 70% | de a partir de cerca de 5% a cerca de 45% | de a partir de cerca de 20% a cerca de 55% | de a partir de cerca de 0,1% a cerca de 10% (preferivelmente de a partir de cerca de 0.5% a cerca de 2% ou 3% |
3 | de a partir de cerca de 45% a cerca de 65% | de a partir de cerca de 5% a cerca de 10% | de a partir de cerca de 5% a cerca de 45% | de a partir de cerca de 0,1% a cerca de 3% |
4 | de a partir de cerca de 20% a cerca de 60% | de a partir de cerca de 5% a cerca de 25% | de a partir de cerca de 25% a cerca de 40% | de a partir de cerca de 0,1% a cerca de 5% (preferivelmente de a partir de cerca de 0,1% a cerca de 3%) |
5 | cerca de 40% | cerca de 10% | de a partir de cerca de 25% a cerca de 55% | cerca de 10% |
6 | cerca de 35% | cerca de 15% | cerca de 10% | |
7 | cerca de 52% | cerca de 13% | cerca de 5% | |
8 | cerca de 50% | cerca de 10% | cerca de 1,5% |
226/306
Petição 870190070557, de 24/07/2019, pág. 291/401
227/306 [0412] Em algumas modalidades, LNPs ocorrem como lipossomas ou lipoplexos como descrito em mais detalhes abaixo.
Tamanho da LNP [0413] Em algumas modalidades, LNPs têm um tamanho de diâmetro médio de a partir de cerca de 50 nm a cerca de 300 nm, tal como de a partir de cerca de 50 nm a cerca de 250 nm, por exemplo, de a partir de cerca de 50 nm a cerca de 200 nm.
[0414] Em algumas modalidades, LNPs menores podem ser usadas. Tais partículas podem compreender um diâmetro de abaixo de 0,1 um até 100 nm, tal como, mas não limitado a, menos de 0,1 um, menos de 1,0 um, menos de 5 um, menos de 10 um, menos de 15 um, menos de 20 um, menos de 25 um, menos de 30 um, menos de 35 um, menos de 40 um, menos de 50 um, menos de 55 um, menos de 60 um, menos de 65 um, menos de 70 um, menos de 75 um, menos de 80 um, menos de 85 um, menos de 90 um, menos de 95 um, menos de 100 um, menos de 125 um, menos de 150 um, menos de 175 um, menos de 200 um, menos de 225 um, menos de 250 um, menos de 275 um, menos de 300 um, menos de 325 um, menos de 350 um, menos de 375 um, menos de 400 um, menos de 425 um, menos de 450 um, menos de 475 um, menos de 500 um, menos de 525 um, menos de 550 um, menos de 575 um, menos de 600 um, menos de 625 um, menos de 650 um, menos de 675 um, menos de 700 um, menos de 725 um, menos de 750 um, menos de 775 um, menos de 800 um, menos de 825 um, menos de 850 um, menos de 875 um, menos de 900 um, menos de 925 um, menos de 950 um, menos de 975 um. Em uma outra modalidade, ácidos nucleicos podem ser derivados usando LNPs menores que podem compreender um diâmetro de a partir de cerca de 1 nm a cerca de 100 nm, de a partir de cerca de 1 nm a cerca de 10 nm, cerca de 1 nm a cerca de 20 nm, de a partir de cerca de 1 nm a cerca de 30 nm, de a partir de cerca de 1 nm a cerca de 40 nm, de a partir de cerca de 1 nm a cerca de 50 nm,
Petição 870190070557, de 24/07/2019, pág. 292/401
228/306 de a partir de cerca de 1 nm a cerca de 60 nm, de a partir de cerca de 1 nm a cerca de 70 nm, de a partir de cerca de 1 nm a cerca de 80 nm, de a partir de cerca de 1 nm a cerca de 90 nm, de a partir de cerca de 5 nm a cerca de 100 nm, de a partir de cerca de 5 nm a cerca de 10 nm, cerca de 5 nm a cerca de 20 nm, de a partir de cerca de 5 nm a cerca de 30 nm, de a partir de cerca de 5 nm a cerca de 40 nm, de a partir de cerca de 5 nm a cerca de 50 nm, de a partir de cerca de 5 nm a cerca de 60 nm, de a partir de cerca de 5 nm a cerca de 70 nm, de a partir de cerca de 5 nm a cerca de 80 nm, de a partir de cerca de 5 nm a cerca de 90 nm, cerca de 10 a cerca de 50 nM, de a partir de cerca de 20 a cerca de 50 nm, de a partir de cerca de 30 a cerca de 50 nm, de a partir de cerca de 40 a cerca de 50 nm, de a partir de cerca de 20 a cerca de 60 nm, de a partir de cerca de 30 a cerca de 60 nm, de a partir de cerca de 40 a cerca de 60 nm, de a partir de cerca de 20 a cerca de 70 nm, de a partir de cerca de 30 a cerca de 70 nm, de a partir de cerca de 40 a cerca de 70 nm, de a partir de cerca de 50 a cerca de 70 nm, de a partir de cerca de 60 a cerca de 70 nm, de a partir de cerca de 20 a cerca de 80 nm, de a partir de cerca de 30 a cerca de 80 nm, de a partir de cerca de 40 a cerca de 80 nm, de a partir de cerca de 50 a cerca de 80 nm, de a partir de cerca de 60 a cerca de 80 nm, de a partir de cerca de 20 a cerca de 90 nm, de a partir de cerca de 30 a cerca de 90 nm, de a partir de cerca de 40 a cerca de 90 nm, de a partir de cerca de 50 a cerca de 90 nm, de a partir de cerca de 60 a cerca de 90 nm e/ou de a partir de cerca de 70 a cerca de 90 nm.
[0415] Em algumas modalidades, a LNP pode ter um diâmetro maior do que 100 nm, maior do que 150 nm, maior do que 200 nm, maior do que 250 nm, maior do que 300 nm, maior do que 350 nm, maior do que 400 nm, maior do que 450 nm, maior do que 500 nm, maior do que 550 nm, maior do que 600 nm, maior do que 650 nm, maior do que 700 nm, maior do que 750 nm, maior do que 800 nm, maior do que 850 nm,
Petição 870190070557, de 24/07/2019, pág. 293/401
229/306 maior do que 900 nm, maior do que 950 nm ou maior do que 1000 nm. [0416] Em outras modalidades, LNPs têm uma distribuição de tamanho de partícula de modo único (isto é, elas não são nem bi- ou polimodais).
Outros componentes [0417] LNPs podem compreender ainda um ou mais Hpídeos e/ou outros componentes em adição àqueles mencionados acima.
[0418] Outros lipídeos podem ser incluídos nas composições de lipossoma para uma variedade de propósitos, tal como prevenir oxidação de lipídeo ou prender ligantes sobre a superfície do lipossoma. Qualquer número de Hpídeos pode estar presente em LNPs, incluindo lipídeos an~ fifáticos, neutros, catiônicos e aniônicos. Tais lipídeos podem ser usados sozinhos ou em combinação.
[0419] Componentes adicionais que podem estar presentes em uma LNP incluem componentes de estabilização em bicamada compreendendo tais oligômeros de poliamida (vide, por exemplo, Patente U.S. No. 6.320.017, que é aqui incorporada a título de referência em sua totalidade), peptídeos, proteínas e detergentes.
Lipossomas [0420] Em algumas modalidades, moléculas de ácido nucleico artificiais, preferivelmente RNAs da combinação da invenção (ou qualquer outro ácido nucleico como aqui definido), são formuladas como lipossomas.
[0421 ] Lipossomas à base de lipídeo catiônico são capazes de complexar com ácidos nucleicos negativamente carregados (por exemplo, RNAs) através de interações eletrostáticas, resultando em complexos que oferecem biocompatibilidade, toxidez baixa e possibilidade da produção em larga escala requerida para aplicações clínicas in vivo. Lipossomas podem fundir com a membrana piasmática para absorção; uma
Petição 870190070557, de 24/07/2019, pág. 294/401
230/306 vez dentro da célula, lipossomas são processados através da via endocítica e o ácido nucleico é então liberado do endossoma/carreador para o citoplasma. Lipossomas têm sido há muito tempo percebidos como veículos de administração de fármaco devido à sua biocompatibilidade superior, dado que os lipossomas são basicamente análogos de membranas biológicas, e podem ser preparados a partir de ambos fosfolipídeos naturais e sintéticos (Int. J. Nanomedicine. 2014; 9: 1833-1843).
[0422] Lipossomas tipicamente consistem em uma bicamada de lipídeo que pode ser composta de (fosfo)Hpídeos catiônicos, aniônicos ou neutros e colesterol, que encerra um núcleo aquoso. Ambas a bicamada de lipídeo e o espaço aquoso podem incorporar compostos hidrofóbicos ou hidrofílicos, respectivamente. Lipossomas podem ter uma ou mais membranas de lipídeo. Lipossomas podem ser de camada única, referidos como unilamelares, ou de camadas múltiplas, referidos como muitilamelares.
[0423] Características e comportamento de lipossoma in vivo podem ser modificados através da adição de um revestimento de polímero hidrofílico, por exemplo, polietileno (PEG), para a superficie do Hpossoma conferir estabilização estérica. Ainda, lipossomas podem ser usados para direcionamento específico por ligantes de anexação (por exemplo, anticorpos, peptídeos e carboidratos) à sua superficie ou à extremidade terminal das cadeias de PEG anexadas (Front. Pharmacol. 2015 Dez 1;6:286).
[0424] Lipossomas estão tipicamente presentes como vesículas esféricas e podem variar em tamanho de 20 nm a alguns microns.
[0425] Lipossomas podem ser de tamanhos diferentes tal como, mas não limitado a, uma vesícula multilamelar (MLV) que pode ser de centenas de nanômetros de diâmetro e pode conter uma série de bícamadas concêntricas separadas por compartimentos aquosos estreitos, uma veículo unicelular pequena (SUV) que pode ser menor do que 50
Petição 870190070557, de 24/07/2019, pág. 295/401
231/306 nm de diâmetro e uma vesícula unilamelar grande (LUV) que pode ser entre 50 e 500 nm de diâmetro. Projeto de lipossomas pode incluir, mas não é limitado a, opsoninas ou ligantes a fim de melhorar a anexação de Hpossomas a tecido não saudável ou ativar eventos tal como, mas não limitado a, endocitose. Lipossomas podem conter um pH baixo ou alto a fim de melhorar a administração das formulações farmacêuticas. [0426] Como um exemplo não limitante, lipossomas tais como veículos de membrana sintética podem ser preparados através dos métodos, aparelhos e dispositivos descritos nas Publicações de Patente Nos. LJS20130177638, US20130177637, US20130177636, US20130177635, US20130177634, US20130177633, US20130183375, US20130183373 e US20130183372, os conteúdos de cada uma são aqui incorporados a título de referência em sua totalidade. A molécula de ácido nucieico artificial, preferivelmente RNA, da invenção, composição (farmacêutica) ou kit (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), pode ser encapsulada pelo lipossoma ou ela pode estar contida em um núcleo aquoso que pode então ser encapsulado pelo lipossoma (vide Pub. Internacionais Nos. WO2012031046, WO2012031043, WO2012030901 e WO2012006378 e Publicações de Patente U.S. Nos. US20130189351, US20130195969 e US20130202684; os conteúdos de cada uma são aqui incorporados a título de referência em sua totalidade.
[0427] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), pode ser formulada em lipossomas tais como, mas não limitado a, lipossomas DiLa2 (Marina Biotech, Bothell, WA), SMARTICLES® (Marina Biotech, Bothell, WA), lipossomas baseados em DOPC neutra (1,2-dioleoil-sn-glicero-3-fosfocoHna) (por exemplo, administração de siRNA para câncer ovariano (Landen e outros, Cancer Biology & Therapy 2006 5(12)1708-1713); aqui incorporados a
Petição 870190070557, de 24/07/2019, pág. 296/401
232/306 título de referência em sua totalidade) e iipossomas revestidos com hialuronano (Quiet Therapeutics, Israel).
Lipoplexos [0428] Em algumas modalidades, moléculas de ácido nucleico artificial, preferivelmente RNAs (ou qualquer outro ácido nucleico como aqui definido) são formuladas como lipoplexos, isto é, bicamadas de lipídeo catiônico intercaladas entre camadas de ácido nucleico.
[0429] Lipídeos catiônicos, tais como DOTAP, (1 ,2-dloleoil-3-trimetilamônio-propano) e DOTMA metil sulfato de (N-[1-(2,3-dioleoilóxi)propil]-N,N,N-trimetil-amônio) podem formar complexos ou lipoplexos com ácidos nucleicos negativamente carregados para formar nanopartículas através de interação eletrostática, provendo eficiência de transfecção in vitro alta.
Nanolipossomas [0430] Em algumas modalidades, moléculas de ácido nucleico artificial, preferivelmente RNAs (ou qualquer outro ácido nucleico como aqui definido) são formuladas como nanolipossomas à base de lipídeo neutro tais como nanolipossomas baseados em 1,2-dioleoil-sn-glicero-
3-fosfatidilcolina (DOPC) (Adv. Drug Deliv. Rev. 2014 Fev; 66: 110116.).
Emulsões [0431] Em algumas modalidades, moléculas de ácido nucleico artificiais, preferivelmente RNAs (ou qualquer outro ácido nucleico como definido aqui) são formuladas como emulsões. Em uma outra modalidade, as ditas moléculas de ácido nucleico artificiais, preferivelmente RNAs, são formuladas em uma emulsão óleo-em-água catiônica onde a partícula da emulsão compreende um núcleo de óleo e um lipídeo catiônico que pode interagir com o(s) ácido(s) nucleico(s) ancorando a molécula à partícula da emulsão (vide Pub. Internacional No. WO2012006380; aqui
Petição 870190070557, de 24/07/2019, pág. 297/401
233/306 incorporada a título de referência em sua totalidade). Em algumas modalidades, a dita molécula de ácido nucleico artificial, preferivelmente RNA, é formulada em uma emulsão água-em-óleo compreendendo uma fase hidrofóbica contínua em que a fase hidrofílica é dispersa. Como um exemplo não limitante, a emulsão pode ser feita através dos métodos descritos na Publicação Internacional No. WO201087791, cujos conteúdos são aqui incorporados a título de referência em sua totalidade. Compostos e carreadores (poli-jcatiônicos [0432] Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada ou associada com um composto catiônico ou policatiônico (composto (poli-)catiônico) e/ou um carreador polimérico.
[0433] O termo composto (poli-)catiônico refere-se tipicamente a uma molécula carregada, que é positivamente carregada (cátion) em um valor de pH de tipicamente a partir de 1 a 9, preferivelmente em um valor de pH de ou abaixo de 9 (por exemplo, de a partir de 5 a 9) de ou abaixo de 8 (por exemplo, de a partir de 5 a 8), de ou abaixo de 7 (por exemplo, de a partir de 5 a 7), sobretudo preferivelmente em um pH fisiológico, por exemplo, de a partir de 7,3 a 7,4.
[0434] Desta maneira, um composto (poli-)catiônico pode ser qualquer composto ou polímero positivamente carregado, preferivelmente um peptídeo ou proteína catiônico, que é positivamente carregado sob condições fisiológicas, particularmente sob condições fisiológicas in vivo. Um peptídeo ou proteína (poli-)catiônico pode conter pelo menos um aminoácidos positivamente carregado ou mais de um aminoácido positivamente carregado, por exemplo, selecionado de Arg, His, Lys ou Om.
Aminoácidos, peptídeos e proteínas (poii-)catiônicos [0435] Compostos (poli-)catiônicos sendo agentes particularmente
Petição 870190070557, de 24/07/2019, pág. 298/401
234/306 preferidos para complexação ou associação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem protamina, nucleolina, espermina ou espermidina, ou outros peptídeos ou proteínas catiônicos, tais como poli-L-lisina (PLL), poli-arginina, polipeptídeos básicos, peptídeos de penetração em célula (CPPs), incluindo peptídeos de ligação a HIV, HIV-1 Tat (HIV), peptídeos derivados de TAT, Penetratina, peptídeos derivados ou análogos de VP22, HSV P22 (Herpes simplex), MAP, KALA ou domínios de transdução de proteína (PTDs), PpT620, peptídeos ricos em prolína, peptídeos ricos em arginina, peptídeos ricos em lisina, MPG-peptídeo(s), Pep-1, oligômeros L, peptídeo(s) catíôníco(s), peptídeos derivados de Antennapedia (particularmente de Drosophila antennapedia), pAntp, plsl, FGF, Lactoferrína, Transportana, Buforina2, Bac715-24, SynB, SynB(1), pVEC, peptídeos derivados de hCT, SAP ou histonas.
[0436] Mais preferivelmente, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada com um ou mais policátions, preferivelmente com protamina ou oligofectamina (discutido abaixo), sobretudo preferivelmente com protamina. Neste contexto protamina é particularmente preferida.
[0437] Ainda, proteínas ou peptídeos (poli-)catiônicos preferidos podem ser selecionados das proteínas ou peptídeos que seguem tendo a fórmula total (III) que segue:
(Arg)i;(Lys)m;(His)n;(Orn)o;(Xaa)x, (fórmula (III)) em que I + m + n +o + x = 8-15, e I, m, n ou o Independentemente uns dos outros podem ser qualquer número selecionado de 0, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15, contanto que o teor total de Arg, Lys, His e Orn represente pelo menos 50% de todos os aminoácidos do oli
Petição 870190070557, de 24/07/2019, pág. 299/401
235/306 gopeptídeo; e Xaa pode ser qualquer aminoácido selecionado de aminoácidos nativos (= de ocorrência natural) ou não nativos exceto por Arg, Lys, His ou Orn; e x pode ser qualquer número selecionado de 0, 1,2, 3 ou 4, contanto que o teor total de Xaa não exceda 50% de todos os aminoácidos do oligopeptídeo. Peptídeos catiônicos particularmente preferidos neste contexto são, por exemplo, Arg?, Args, Argg, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R, etc. Neste contexto, a descrição do WO 2009/030481 é incorporada aqui a título de referência. Polissacarídeos (poli-jcatiônicos [0438] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem polissacarídeos (poH-)catiônicos, por exemplo, quitosana, polibreno, polímeros catiônicos, por exemplo, polietilenoimina (PEI).
Lipídeos (poL-)catiõnlcos [0439] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem lipídeos (poli-jcatiônicos, por exemplo, DTMA: cloreto de [1~(2,3~sioleióxi)propil)]”N,N,N-trimetilamônlo, DMRIE, di-C14-amidina, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: Dioleil fosfatidiletanol-amina, DOSPA, DODAB, DOIC, DMEPC, DOGS: Dioctadecilamidoglicilespermina, DIMRI: bromato de dimiristo-oxipropil dimetil hidroxietil amônio, DOTAP: dioleoilóxi-3-(trimetllamonlo)propano, DC-6-14: cloreto de O,O-ditetradecanoll-N”(alfatrimetilamonioacetyl)dietanolamina, CLIP1: cloreto de rac-[(2,3-dioctadeciloxipropil)(2-hidroxietil)]-dimetilam0nio, CLIP6: rac-[2(2,3-di-hexadeciloxipropil-oximetilóxi)etil]trimetilamônto, CLIP9: rac-[2(2,3”di-hexadeciloxipropil-oxisuccinilóxi)etil]-tnmetilamônio ou oligofectamina.
Petição 870190070557, de 24/07/2019, pág. 300/401
236/306
Polímeros (ooli-jcatiônicos [0440] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) inclui polímeros (poH-jcatiônicos, por exemplo, poliaminoácidos modificados, tais como polímeros de beta~aminoácido ou poliamidas reversas, etc., polietilenos modificados, tal como PVP brometo de poli(N~etH~4--vínnpíndínio)), etc., acrilatos modificados, tal como pDMAEMA (poli(dimetilaminoetil metacrilato)), etc., amidoamina modificadas tal como pAMAM (poli(amidoamina)), etc., polibeta-aminoéster modificado (PBAE), tais como polímeros de diacrilato-co-õ-amino-lpentanol de 1,4-butanodiol modificados na extremidade com diamina, etc., dendrímeros, tais como dendrímeros de polipropilamina ou dendrímeros à base de pAMA, etc., polHmina(s), tais como PEI: poli(etilenoi~ mina), poH(propilenoimina), etc., polialilaminas, polímeros à base de estrutura principal de açúcar, tais como polímeros à base de ciclodextrina, polímeros à base de dextrano, quitosana, etc., polímeros à base de estrutura principal de silano, tais como copolímeros de PMOXA-PDMS, etc., polímeros em bloco consistindo em uma combinação de um ou mais blocos catiônicos (por exemplo, selecionados de um polímero catiônico como mencionado acima) e de um ou mais blocos hidrofílicos ou hidrofóbicos (por exemplo, polietilenoglicol).
Carreadores ooliméricos [0441] De acordo com modalidades preferidas, molécula de ácido nudeico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada ou associada com um carreador polimérico.
[0442] Um carreador polimérico usado de acordo com a invenção seria um carreador polimérico formado por componentes catiônicos reticulados com dissulfeto. Os componentes catiônicos reticulados com
Petição 870190070557, de 24/07/2019, pág. 301/401
237/306 dissulfeto podem ser iguais ou diferentes uns dos outros. O carreador polimérico também pode conter componentes adicionais.
[0443] É também particularmente preferido que o carreador polimérico usado de acordo com a presente invenção compreenda misturas de peptideos, proteínas ou polímeros catiônicos e opcionalmente componentes adicionais como aqui definido, que sejam reticulados por ligações dissulfeto como descrito aqui. Neste contexto, a descrição do WO2012/013326 é aqui incorporada a título de referência.
[0444] Neste contexto, os componentes catiônicos, que formam base para o carreador polimérico através de reticulação com dissulfeto, são tipicamente selecionados de qualquer peptídeo, proteína ou polímero (poli-)catiônico adequado para este propósito, particularmente qualquer peptídeo, proteína ou polímero (poli-)catiônico capaz de complexação com, e desta maneira preferivelmente condensação, da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido). O peptídeo, proteína ou polímero (poli-)catiônico é preferivelmente uma molécula linear, no entanto, peptideos, proteínas ou polímeros (poli-)catiônicos ramificados podem também ser usados.
[0445] Cada proteína, peptídeo ou polímero (poli-)catiônico de reticulação com dissulfeto do carreador polimérico, que pode ser usado para complexar a molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido) contém pelo menos uma porção -SH, sobretudo preferivelmente pelo menos um resíduo cisteína ou qualquer grupo químico adicional exibindo uma porção -SH, capaz de formação de uma ligação dissulfeto quando da condensação com pelo menos uma proteína, peptídeo ou polímero (poli-)catiônico adicional como componente catiônico do carreador polimérico como mencionado aqui.
[0446] Como definido acima, o carreador polimérico, que pode ser
Petição 870190070557, de 24/07/2019, pág. 302/401
238/306 usado para complexar a molécula de ácido nucleico artificial, preferivelmente RNA, da Invenção (ou qualquer outro ácido nucleico como aqui definido) pode ser formado por componentes catiônicos (ou policatiônicos) reticulados com dissulfeto. Preferivelmente, tais peptídeos ou proteínas ou polímeros (poli-)catiônicos do carreador pollmérico, que compreendem ou são adicionalmente modificados para compreender pelo menos uma porção --SH, são selecionados de proteínas, peptídeos e polímeros como aqui definido.
[0447] Em algumas modalidades, o carreador polimérico pode ser selecionado de uma molécula carreadora polimérica de acordo com a fórmula (IV) genérica:
L-P1S-[S-P2-S]n-S-P3-L fórmula (IV) em que
P1 e P3 são diferentes ou idênticos um ao outro e representam uma cadeia de polímero hidrofílico linear ou ramificada, cada P1 e P3 exibindo pelo menos uma porção -SH capaz de formar uma ligação dissulfeto quando da condensação com componente P2, ou alternativamente com (AA), (AA)x ou [(AAx)]z, se tais componentes forem usados como um ligante entre P1 e P2e P2) e/ou com componentes adicionais (por exemplo, (AA), (AA)X, [(AAX]Z ou L), a cadeia de polímero hidrofílico linear ou ramificada selecionada independentemente uma da outra de polietileno glicol (PEG), poli-A/-(2-hidroxípropil)metacrílamida, poli-2(metacriloilóxi)etil fosforilcolinas, po!i(hidroxialquil L-asparagina), poli(2~ (metacriloilóxi)etil fosforilcolina), hidroxietilamido ou poli(hidroxialquil Lglutamina), em que a cadeia de polímero hidrofílico exibe um peso molecular de cerca de 1 kDa a cerca de 100 kDa, preferivelmente de cerca de 2 kDa a cerca de 25 kDa; ou mais preferivelmente de cerca de 2 kDa a cerca de 10 kDa, por exemplo, cerca de 5 kDa a cerca de 25 kDa ou kDa a cerca de 10 kDa;
P2 é um peptídeo ou proteína (poli-)catiônico, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 303/401
239/306 como definido acima para o carreador poHmérico formado por componentes catiônicos reticulados com dissulfeto, e preferivelmente tendo um comprimento de cerca de 3 a cerca de 100 aminoácidos, mais preferivelmente tendo um comprimento de cerca de 3 a cerca de 50 aminoácidos, ainda mais preferivelmente tendo um comprimento de cerca de 3 a cerca de 25 aminoácidos, por exemplo, um comprimento de cerca de 3 a 10, 5 a 15, 10 a 20 ou 15 a 25 aminoácidos, mais preferivelmente um comprimento de cerca de 5 a cerca de 20 e ainda mais preferivelmente um comprimento de cerca de 10 a cerca de 20; ou é um polímero (poli-)catiônico, por exemplo, como definido acima para o carreador polimérico formado por componentes catiônicos reticulados com dissulfeto, tipicamente tendo um peso molecular de cerca de 0,5 kDa a cerca de 30 kDa, incluindo um peso molecular de cerca de 1 kDa a cerca de 20 kDa, ainda mais preferivelmente de cerca de 1,5 kDa a cerca de 10 kDa ou tendo um peso molecular de cerca de 0,5 kDa a cerca de 100 kDa, incluindo um peso molecular de cerca de 10 kDa a cerca de 50 kDa, ainda mais preferivelmente de cerca de 10 kDa a cerca de 30 kDa;
cada P2 exibindo peto menos duas porções -SH capazes de formar uma ligação dissulfeto quando da condensação com componentes P2 adicionais ou componentes(s) P1 e/ou P3 ou alternativamente com componentes adicionais (por exemplo, (AA), (AA)X ou [(AAX]Z);
-S-S- é uma ligação dissulfeto (reversível) (os parênteses são omitidos para uma melhor capacidade de leitura), em que S representa preferivelmente enxofre ou uma porção de carreamento -SH, que formou uma ligação dissulfeto (reversível). A ligação dissulfeto (reversível) é preferivelmente formada através da condensação de porções SH de qualquer um dos componentes P1 e P2, P2 e P2 ou P2 e P3, ou opcionalmente de componentes adicionais como aqui definido (por exemplo, L, (AA), (AA)X, [(AA)X]Z, etc). A porção -SH pode ser parte da estrutura desses componentes ou adicionada por uma modificação
Petição 870190070557, de 24/07/2019, pág. 304/401
240/306 como definido abaixo;
L é um ligante ótimo, que pode estar presente ou não, e pode ser selecionado independente dos outros de RGD, Transferrina, Folato, um peptídeo de sinal ou sequência de sinal, um sinal ou sequência de localização, um sinal ou sequência de localização nuclear (NLS), um anticorpo, um peptídeo de penetração celular (por exemplo, TAT ou KALA), um ligante de um receptor (por exemplo, citocinas, hormônios, fatores de crescimento, etc.), moléculas pequenas (por exemplo, carboidratos tipo manose ou galactose ou ligantes sintéticos), agonistas de molécula pequena, inibidores ou antagonistas de receptores (por exemplo, análogos peptidomiméticos de RGD) ou qualquer proteína adicional como aqui definido, etc.;
n é um inteiro tipicamente selecionado de uma faixa de cerca de 1 a 50, preferivelmente de a uma faixa de cerca de 1,2 ou 3 a 30, mais preferivelmente de uma faixa de cerca de 1,2, 3, 4 ou 5 a 25 ou uma faixa de cerca de 1, 2, 3, 4, ou 5 a 20 ou uma faixa de cerca de 1, 2, 3, 4 ou 5 a 15 ou uma faixa de cerca de 1, 2, 3, 4 ou 5 a 10, incluindo, por exemplo, uma faixa de cerca de 4 a 9, 4 a 10, 3 a 20, 4 a 20, 5 a 20 ou 10 a 20 ou uma faixa de cerca de 3 a 15, 4 a 15, 5 a 15 ou 10 a 15 ou uma faixa de cerca de 6 a 11 ou 7 a 10. Sobretudo preferivelmente, n está em uma faixa de cerca de 1, 2, 3, 4, ou 5 a 10, mais preferivelmente em uma faixa de cerca de 1,2, 3 ou 4 a 9, em uma faixa de cerca de 1,2, 3 ou 4 a 8 ou em uma faixa de cerca de 1, 2 ou 3 a 7. [0448] Neste contexto, a descrição do WO2011/026641 é incorporada aqui a título de referência. Cada um dos polímeros hidrofílicos P1 e P3 exibe tipicamente pelo menos uma porção -SH, em que a pelo menos uma porção -SH é capaz de formar uma ligação dissulfeto quando da reação com componente P2 ou com componente (AA) ou (AA)x, se usada como um ligante entre P1 e P2 ou P3 e P2 como definido abaixo e opcionalmente com um componente adicional, por exemplo, L
Petição 870190070557, de 24/07/2019, pág. 305/401
241/306 e/ou (AA) ou (AA)x, por exemplo, se duas ou mais porções -SH estiverem contidas. As subfórmulas que seguem P1-S-S-P2 e P2-S-S-P3 dentro da fórmula genérica (IV) acima (os parênteses são omitidos para melhor capacidade de leitura), em que qualquer um de S, P1 e P3 é como aqui definido, tipicamente representam uma situação em que uma porção -SH de polímeros hidrofílicos P1 e P3 foi condensada com uma porção -SH de componente P2 de fórmula genérica (IV) acima, em que ambos enxofres dessas porções -SH formam uma ligação dissulfeto S-S- como aqui definido na fórmula (IV). Essas porções -SH são tipicamente providas por cada um dos polímeros hidrofílicos P1 e P3, por exemplo, através de uma cisteína interna ou qualquer aminoácido ou composto (modificado) adicional que carregue uma porção -SH. Desta maneira, as subfórmulas P1-S-S-P2 e P2-S-S-P3 podem ser também escritas como P1-Cys-Cys-P2 e P2~Cys~Cys~P3, se a porção -SH for provida por uma cisteína, em que o termo Cys-Cys representa duas cisternas acopladas através de uma ligação dissulfeto, não através de uma ligação peptídica. Neste caso, o termo -S-S- nessas fórmulas também podem ser escritos como -S-Cys, como -Cys-S ou como -Cys-Cys. Neste contexto, o termo -Cys-Cys- não representa uma ligação peptídica, mas uma ligação de duas cisteínas através de suas porções -SH para formar uma ligação dissulfeto. Desta maneira, o termo -Cys-Cys também pode ser compreendido geralmente como -(Cys-S)-(S-Cys), em que neste caso específico S indica o enxofre da porção -SH de cisteína. Da mesma maneira, os termos -S-Cys e -Cys-S indicam uma ligação dissulfeto entre uma porção contendo -SH e uma cisteína, que pode ser também escrita como -S-(S-Cys) e -(Cys-S)-S. Alternativamente, os polímeros hidrofílicos P1 e P3 podem ser modificados com uma porção -SH, preferivelmente através de uma reação química com um composto carregando uma porção -SH, de modo que cada um dos polímeros hidrofílicos P1 e P3 carrega pelo menos uma tal porção -SH.
Petição 870190070557, de 24/07/2019, pág. 306/401
242/306
Tal composto carregando uma porção -SH pode ser, por exemplo, uma cisteína (adicional) ou qualquer aminoácido adicional (modificado), que carregue uma porção -SH. Tal composto pode também ser qualquer composto ou porção nâo amino, que contenha ou permita introduzir uma porção -SH nos polímeros hidrofílicos P1 e P3 como aqui definido. Tais compostos não amino podem ser anexados aos polímeros hidrofílicos P1 e P3 de fórmula (IV) do carreador polimérico de acordo com a presente invenção através de reações químicas ou ligação de compostos, por exemplo, através de ligação de um ácido 3-tio propiônico ou tioimolano, através de formação de amida (por exemplo, ácidos carboxílicos, ácidos sulfônicos, aminas, etc.), através de adição Michael (por exemplo, porções de maleinimida, carbonilas α,β-insaturadas, etc.) através de química click (por exemplo, azidas ou alcinas), através de metátese de alceno/alcina (por exemplo, alcenos ou alcinas), formação de imina ou hidrozona (aldeídos ou cetonas, hidrazinas, hidroxilaminas, aminas), reações de complexação (avidina, biotina, proteína G) ou componentes que permitam reações de substituição do tipo Sn (por exemplo, halogenoalcanos, tióis, álcoois, aminas, hidrazinas, hidrazidas, ésteres de ácido sulfônico, sais de oxifosfônio) ou outras porções químicas que podem ser utilizadas na anexação de componentes adicionais. Um derivado de PEG particularmente preferido neste contexto é alfa-Metóxiomega-mercapto poli(etileno glicol). Em cada caso, a porção -SH, por exemplo, de uma cisteína ou de qualquer aminoácido ou composto adicional (modificado), pode estar presente nas extremidades terminais ou internamente em qualquer posição de polímeros hidrofílicos P1 e P3. Como definido aqui, cada um de polímeros hidrofílicos P1 e P3 tipicamente exibe pelo menos uma porção -SH preferivelmente em uma extremidade terminal, mas pode também conter duas ou até mesmo mais porções -SH, que podem ser usadas para adicionalmente anexar componentes adicionais como aqui definido, preferivelmente peptídeos ou
Petição 870190070557, de 24/07/2019, pág. 307/401
243/306 proteínas funcionais adicionais, por exemplo, um ligante, um componente de aminoácido (AA) ou (AA)X, anticorpos, peptídeos de penetração celular ou peptídeos aumentadores (por exemplo, TAT, KALA), etc. Razão em peso e razão N/P [0449] Em algumas modalidades da invenção, a molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico), está associada com ou complexada com um composto (poli-)catiônico ou um carreador polimérico, opcionalmente em uma razão em peso selecionada de uma faixa de cerca de 6:1 (p/p) a cerca de 0,25:1 (p/p), mais preferivelmente de a partir de cerca de 5:1 (p/p) a cerca de 0,5:1 (p/p), ainda mais preferivelmente de cerca de 4:1 (p/p) a cerca de 1:1 (p/p) ou cerca de 3:1 (p/p) a cerca de 1:1 (p/p) e sobretudo preferivelmente uma razão de cerca de 3:1 (p/p) a cerca de 2:1 (p/p) de ácido nucleico para composto (poli)-catiônico e/ou carreador polimérico, ou opcionalmente em uma razão de nitrogenio/fosfato (N/P) de ácido nucleico para composto (poii-)catiônico e/ou carreador polimérico na faixa de cerca de 0,1-10, preferivelmente em uma faixa de cerca de 0,3-4 ou 0,3-1 e sobretudo preferivelmente na faixa de cerca de 0,5-1 ou 0,7-1 e ainda mais preferivelmente em uma faixa de cerca de 0,3-0,9 ou 0,50,9. Mais preferivelmente, a razão N/P da pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais policátlons está na faixa de cerca de 0,1 a 10, Incluindo uma faixa de cerca de 0,3 a 4, de cerca de 0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5. [0450] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) pode ser também associada com um veículo, agente de transfecção ou complexação para aumento da eficiência de transfecção da dita molécula de ácido nucleico artificial, preferivelmente RNA.
[0451] Neste contexto, é particularmente preferido que a composi
Petição 870190070557, de 24/07/2019, pág. 308/401
244/306 ção (farmacêutica) da invenção compreenda a molécula de ácido nucleico artificial, preferivelmente RNA, que é complexada pelo menos parcialmente com um composto (poli-)catiônico e/ou um carreador poll· mérico, preferivelmente proteínas ou peptídeos catiônicos. Neste contexto, a descrição do WO 2010/037539 e WO 2012/113513 é incorporada aqui a título de referência. Parcialmente significa que apenas uma parte da dita molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um composto (poli-)catiônico e/ou carreador polimérico, enquanto o resto da dita molécula de ácido nucleico artificial, preferivelmente RNA, está presente em forma não complexada (livre).
[0452] Preferivelmente, a razão molar da molécula de ácido nucleico artificial complexada, preferivelmente RNA, para a molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma razão molar de cerca de 0,001:1 a cerca de 1:0,001, incluindo uma razão de cerca de 1:1. Mais preferivelmente a razão de molécula de ácido nucleico artificial complexada, preferivelmente RNA, para molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma faixa de cerca de 5:1 (p;p) a cerca de 1:10 (p/p), mais preferivelmente de uma faixa de cerca de 4:1 (p/p) a cerca de 1:8 (p/p), a inda mais preferivelmente de uma faixa de cerca de 3:1 (p/p) a cerca de 1:5 (p/p) ou 1:3 (p/p) e sobretudo preferivelmente a razão de molécula de ácido nucleico artificial complexada, preferivelmente RNA, para a molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma razão de cerca de 1:1 (p/p).
[0453] A molécula de ácido nucleico artificial complexada, preferivelmente RNA, da invenção é preferivelmente preparada de acordo com uma primeira etapa através da complexação da molécula de ácido nucleico artificial, preferivelmente RNA, com um composto (poli-)catiônico e/ou com um carreador polimérico, preferivelmente como aqui definido,
Petição 870190070557, de 24/07/2019, pág. 309/401
245/306 em uma razão específica para formar um complexo estável. Neste contexto, é altamente preferível que nenhum composto (poli-)catiônico livre ou carreador polimérico ou apenas uma quantidade insignificantemente pequena does mesmos permaneça na fração da molécula de ácido nucleico artificial complexada, preferivelmente RNA, após complexação da dita molécula de ácido nucleico artificial, preferivelmente RNA. Desta maneira, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, e o composto (poli-)catiônico e/ou o carreador polimérico na fração do RNA complexado é tipicamente selecionada em uma faixa de modo que a molécula de ácido nucleico artificial, preferivelmente RNA, é totalmente complexada e nenhum composto (polijcatiônico livre ou carreador polimérico ou apenas uma quantidade insignificantemente pequena permanece na dita fração.
[0454] Preferivelmente, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, para o composto (poli-)catiônico e/ou carreador polimérico, preferivelmente como aqui definido, é selecionada de uma faixa de cerca de 6:1 (p/p) a cerca de 0,25:1 (p/p), mais preferivelmente de a partir de cerca de 5:1 (p/p) a cerca de 0,5:1 (p/p), ainda mais preferivelmente de cerca de 4:1 (p/p) a cerca de 1:1 (p/p) ou de cerca de 3:1 (p/p) a cerca de 1:1 (p/p), e sobretudo preferivelmente uma razão de cerca de 3:1 (p/p) a cerca de 2:1 (p/p).
[0455] Alternativamente, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, para o composto (poli-)catiônico e/ou o carreador polimérico pode ser também calculada com base na razão de nitrogênio/fosfato (razão N/P) do complexo inteiro. No contexto da presente invenção, uma razão N/P está preferivelmente na faixa de cerca de 0,1-10, preferivelmente na faixa de cerca de 0,3-4 e sobretudo preferivelmente em uma faixa de cerca de 0,5-2 ou 0,7-2 com relação à razão de molécula de ácido nucleico artificial, preferivelmente RNA, para composto (poli-)catiônico e/ou carreador polimérico, preferivelmente
Petição 870190070557, de 24/07/2019, pág. 310/401
246/306 como definido aqui, no complexo, e sobretudo preferivelmente em uma faixa de cerca de 0,7-1,5, 0,5-1 ou 0,7-1, e ainda mais preferivelmente em uma faixa de cerca de 0,3-0,9 ou 0,5-0,9, preferivelmente contanto que o composto (poli-)catiônico no complexo seja uma proteína ou peptídeo (poli-)catiônico e/ou o carreador polimérico como definido acima.
[0456] Em outras modalidades, molécula de ácido nucleico artificial, preferivelmente RNA, pode ser provida e usada em forma livre ou nua sem estar associada com qualquer veículo, agente de transfecção ou complexação adicional.
Administração direcionada [0457] Em aigumas modalidades, compostos (poli-)catiônicos, carreadores, lipossomas ou LNPs podem ser formulados para administração direcionada para atingir diversos órgãos e/ou tipos de célula. Como um exemplo não limitante, o composto (poli-jcatiônico, carreador, lipossoma ou LNP pode ser formulado para administração direcionada ao fígado. O composto (poH-)catiônico, carreador, lipossoma ou LNP usado para administração direcionada pode incluir, mas não é limitado a, composto (poli-)catiônico, carreador, lipossomas ou LNPs descritos aqui. Os RNAs da invenção podem codificar conjugados, por exemplo, proteínas terapêuticas ou fragmentos ou variantes das mesmas, covalentemente ligados a um carreador ou grupo de direcionamento.
[0458] Grupos de direcionamento podem ser proteínas, por exemplo, glicoproteínas, ou peptídeos, por exemplo, moléculas tendo uma afinidade específica com um coligante, ou anticorpo, por exemplo, um anticorpo que se liga a um tipo de célula especificado tal como uma célula epitelial, queratinócitos ou similar. Grupos de direcionamento podem também incluir hormônios e receptores de hormônio. Eles podem também incluir espécies não peptídicas, tais como lipídeos, lectinas, carboidratos, vitaminas, cofatores, lactose multivalente, galactose mul
Petição 870190070557, de 24/07/2019, pág. 311/401
247/306 tivalente, N-acetil-galactosamina, N-actil-glucosamina manose multivalente, fucose multivalente ou aptâmeros. O grupo de direcionamento pode ser qualquer ligante que seja capaz de direcionamento a um receptor específico.
[0459] Em algumas modalidades, as moléculas de ácido nucleico artificiais, preferivelmente RNA, e opcionalmente composições (farmacêuticas) ou kits compreendendo as mesmas, são adaptadas para direcionamento ao(para dentro do) fígado. Tais moléculas de ácido nucleico artificiais, preferivelmente RNAs, e opcionalmente composições (farmacêuticas) ou kits compreendendo as mesmas, podem ser particularmente adequados para tratamento, prevenção ou atenuação de doenças metabólicas, por exemplo, doença metabólica causada por erros genéticos inatos, por exemplo, doenças relacionadas à deficiência de ornitina transcarbamilase.
Composição (farmacêutica) [0460] Em um aspecto adicional, a presente invenção provê uma composição compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com a invenção, e pelo menos um carreador ou excipiente farmaceuticamente aceitável. A composição de acordo com a invenção é preferivelmente provida como uma composição farmacêutica.
[0461] A molécula de ácido nucleico artificial, preferivelmente RNA, pode ser provida como parte da composição (farmacêutica) em forma complexada ou livre como descrito em qualquer outro ponto aqui ou uma mistura das mesmas.
[0462] A composição (farmacêutica) de acordo com a invenção pode compreender ainda pelo menos um gRNA, ou um vetor provendo o mesmo, como definido em qualquer outro ponto aqui.
[0463] A composição (farmacêutica) de acordo com a invenção pode compreender ainda pelo menos um agente ativo adicional útil para
Petição 870190070557, de 24/07/2019, pág. 312/401
248/306 tratamento da doença ou condição que é submetida à terapia com a molécula de ácido nucleico artificial, preferivelmente RNA, ou composição (farmacêutica) compreendendo a mesma.
Excipientes e carreadores farmaceuticamente aceitáveis [0464] Preferivelmente, a composição (farmacêutica) de acordo com a invenção compreende pelo menos um carreador e/ou excipiente farmaceuticamente aceitável. O termo farmaceuticamente aceitável refere-se a um composto ou agente que é compatível com um ou mais agente(s) ativo(s) (aqui: molécula de ácido nucleico artificial, preferivelmente RNA) e não interfere com e/ou substancialmente reduz suas atividades farmacêuticas. Carreadores farmaceuticamente aceitáveis têm preferivelmente pureza suficientemente alta e toxidez suficientemente baixa para torna-los adequados para administração a um indivíduo a ser tratado.
Excipientes [0465] Excipientes farmaceuticamente aceitáveis podem exibir papéis funcionais diferentes e incluem, sem limitação, diluentes, cargas, agentes de volume, carreadores, deslntegrantes, ligantes, lubrificantes, glídantes, revestimentos, solventes e cossolventes, agentes de tamponamento, conservantes, adjuvantes, antioxidantes, agentes umectantes, agentes antiespumantes, agentes de espessamento, agentes adoçantes, agentes saborizantes e umectantes.
[0466] Para composições (farmacêuticas) em forma líquida, excipientes farmaceuticamente aceitáveis úteis em geral incluem solventes, diluentes ou carreadores tais como água (livre de pírógeno), soluções salinas (isotônicas) tal como solução salina tamponada com fosfato ou citrato, óleos fixos, óleos vegetais, tais como, por exemplo, óleo de amendoim, óleo de semente de algodão, óleo de sésamo, óleo de oliva, óleo de milho, etanol, polióis (por exemplo, glicerol, propileno glicol, polietileno glicol e similar); lecítina; tensoativos; conservantes tais como
Petição 870190070557, de 24/07/2019, pág. 313/401
249/306 álcool de benzila, parabenos, clorobutanol, fenol, ácido ascórbico, timerosal e similar; agentes isotônicos tais como açúcares, poliálcoois tal como manitol, sorbitol ou cloreto de sódio; monoestearato de alumínio ou gelatina; antioxidantes tal como ácido ascórbico ou bissulfito de sódio; agentes de quelaçâo tal como ácido etilenodiaminotetraacético (EDTA); tampões tais como acetatos, citratos ou fosfatos e agentes para o ajuste de tonicidade tal como cloreto de sódio ou dextrose. O pH pode ser ajustado com ácidos ou bases, tal como ácido clorídrico ou hidróxido de sódio. Tampões podem ser hipertônicos, isotônicos ou hipotônicos com referência ao meio de referência específico, isto é, o tampão pode ter um teor de sal maior, idêntico ou menor com referência ao meio de referência específico, em que preferivelmente tais concentrações dos sais mencionados acima podem ser usadas, que nâo levam a dano de células devido à osmose ou outros efeitos de concentração. Meios de referência são, por exemplo, líquidos ocorrendo em métodos in vivo, tais como sangue, linfa, líquidos citosólicos ou outros líquidos corporais ou, por exemplo, líquidos que podem ser usados como meios de referência em métodos in vitro, tais como tampões ou líquidos comuns. Tais tampões ou líquidos comuns são conhecidos de um versado na técnica. Solução de Ringer com lactato é particularmente preferida como uma base líquida.
[0467] Para composições (farmacêuticas) em forma (semi-)sólida, excipientes farmaceuticamente aceitáveis úteis incluem ligantes tais como celulose microcristalina, goma tragacanto ou gelatina; amido ou lactose; açúcares, tais como, por exemplo, lactose, glicose e sacarose; amidos, tais como, por exemplo, amido de milho ou amido de batata; celuloses e seus derivados, tais como, por exemplo, carboximetilcelulose de sódio, etilcelulose, acetato de celulose; desintegrantes tais como ácido algínico; lubrificantes tais como estearato de magnésio; glidantes
Petição 870190070557, de 24/07/2019, pág. 314/401
250/306 tais como ácido esteárico, estearato de magnésio; sulfato de cálcio, dióxido de silício coloidal e similar; agentes adoçantes tais como sacarose ou sacarina; e/ou agentes saborizantes tais como hortelã-pimenta, salioilato de metila ou aromatizante de laranja.
Carreadores [0468] Carreadores farmaceuticamente aceitáveis adequados são tipicamente escolhidos com base na formulação da composição (farmacêutica).
[0469] Composições (farmacêuticas) líquidas administradas através de injeção e em particular através de injeção i.v. devem ser estéreis e estáveis sob as condições de fabricação e armazenamento. Tais composições são tipicamente formuladas como soluções aquosas parenteralmente aceitáveis que são livres de pirógeno, têm pH aceitável, são isotônicas e mantêm estabilidade do(s) ingrediente(s) ativo(s).
[0470] Carreadores farmaceuticamente aceitáveis particularmente úteis para composições (farmacêuticas) líquidas de acordo com a invenção incluem água, tipicamente água livre de pirógeno; solução salina isotônica ou soluções (aquosas) tamponadas, por exemplo, fosfato, citrato, etc., soluções tamponadas. Particularmente para injeção das composições (farmacêuticas) da invenção, água ou preferivelmente um tampão, mais preferivelmente um tampão aquoso, pode ser usado, contendo um sal de sódio, preferivelmente pelo menos 50 mM de um sal de sódio, sal de cálcio, preferivelmente pelo menos 0,01 mM de um sal de cálcio, e opcionalmente um sal de potássio, preferivelmente pelo menos 3 mM de um sal de potássio.
[0471] De acordo com modalidades preferidas, os sais de sódio, cálcio e, opcionalmente, potássio, podem ocorrer na forma de suas halogenidas, por exemplo, cloretos, iodetos ou brometos, na forma de seus hidróxidos, carbonates, hidrogeno carbonates ou sulfates, etc. Sem ser limitado aos mesmos, exemplos de sais de sódio incluem, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 315/401
251/306
NaCI, Nal, NaBr, Na2CO3, NaHCOs, NazSCri, exemplos dos sais de potássio opcionais incluem, por exemplo, KCI, Kl, KBr, K2CO3, KHCO3, K2SO4, e exemplos de sais de cálcio incluem, por exemplo, CaCb, Cab, CaBf2, CaCCh, CaSCu, Ca(OH)2. Ainda, ânions orgânicos dos cátions mencionados acima podem estar contidos no tampão.
[0472] De acordo com modalidades mais preferidas, o tampão adequado para propósitos de injeção como acima definido pode conter sais selecionados de cloreto de sódio (NaCI), cloreto de cálcio (CaCb) e opcionalmente cloreto de potássio (KCI), em que ânions adicionais podem estar presentes em adição aos cloretos. CaCb pode também ser substituído por um outro sal tal como KCI. Tipicamente, os sais no tampão de injeção estão presentes em uma concentração de pelo menos 50 mM de cloreto de sódio (NaCI), pelo menos 3 mM de cloreto de potássio (KCI) e pelo menos 0,01 mM de cloreto de cálcio (CaCb). O tampão de injeção pode ser hipertrófico, isotônico ou hipotônico com referência ao meio de referência específico, isto é, o tampão pode ter um teor de sal maior, idêntico ou menor com referência ao meio de referência específico, em que preferivelmente tais concentrações dos sais mencionados acima podem ser usadas, as quais não levem a dano de células devido à osmose e outros efeitos de concentração. Meios de referência são, por exemplo, líquidos de ocorrência em métodos in vivo” tais como sangue, linfa, líquidos citosóllcos ou outros líquidos corporais ou, por exemplo, líquidos que podem ser usados como meios de referência em métodos ’7n vitro, tais como tampões ou líquidos comuns. Tais tampões ou líquidos comuns são conhecidos de um versado na técnica. Solução de Ringer com Lactato é particularmente preferida como uma base líquida. Formulação [0473] Em geral, composições (farmacêuticas) para administração tópica podem ser formuladas como cremes, unguentos, géis, pastas ou pós. Composições (farmacêuticas) para administração oral podem ser
Petição 870190070557, de 24/07/2019, pág. 316/401
252/306 formuladas como comprimidos, cápsulas, líquidos, pós ou em um formato de liberação sustentada. No entanto, de acordo com modalidades preferidas, a composição (farmacêutica) da invenção é administrada parenteralmente, em particular através de injeção intradermal ou intramuscular, e é desta maneira formulada em forma líquida ou liofilizada para administração parenteral como discutido em um outro ponto aqui. Formulações parenterais são tipicamente armazenadas em frascos, bolsas IV, ampolas, cartuchos e seringas pré-cheias e podem ser administradas como injeções, Inalantes ou aerossóis, com injeções sendo preferidas.
Formulações liofilizadas [0474] Em modalidades preferidas adicionais, a composição (farmacêutica) é provida em forma liofilizada. Preferivelmente, a composição (farmacêutica) liofilizada é reconstituída em um tampão adequado, vantajosamente baseado em um carreador aquoso, antes da administração, por exemplo, solução de Ringer com Lactato, que é preferida, solução de Ringer, uma solução tampão de fosfato. Em algumas modalidades, a composição (farmacêutica) de acordo com a invenção contém pelo menos duas, três, quatro, cinco, seis ou mais moléculas de ácido nucleico artificiais, preferivelmente RNAs, que são providas separadamente em forma liofilizada (opcionalmente junto com pelo menos um aditivo adicional) e que são preferivelmente reconstituídas separadamente em um tampão adequado (tal como solução de Ringer com Lactato) antes do seu uso de modo a permitir administração individual de cada uma da dita molécula de ácido nucleico artificial, preferivelmente RNAs.
Formulações líquidas [0475] Em modalidades preferidas adicionais, a composição (farmacêutica) é provida na forma de uma solução salina ou uma formulação à base de lipídeo. Formulações à base de lipídeo podem compreender
Petição 870190070557, de 24/07/2019, pág. 317/401
253/306 lipossomas, Hpoptexos, nanolipossomas e nanopartículas de lipídeo que sâo descritos acima na seção intitulada Complexação.
Kit [0476] Em um aspecto adicional, a presente invenção refere-se a um kit de kit de partes compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, e/ou a composição (farmacêutica). O kit pode compreender ainda pelo menos um gRNA (ou vetor provendo o mesmo).
[0477] Os componentes mencionados acima podem ser, cada um, providos na forma de uma composição farmacêutica no kit de partes. Até agora, as definições e explicações providas acima para a composição (farmacêutica) são igualmente aplicáveis aos componentes individuais do kit de partes, mutatis mutandis.
[0478] Por exemplo, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, e opcionalmente o pelo menos um gRNA ou ácido nucleico codificando o mesmo, podem ser providos independentemente um do outro - em forma liofilizada ou líquida, opcionalmente junto com um ou mais carreador(es), excipientes ou agentes adicionais farmaceuticamente aceitáveis como descrito acima no contexto da composição farmacêutica.
[0479] Opcionalmente, o kit de partes pode compreender pelo menos um agente adicional como aqui definido no contexto da composição farmacêutica, agentes antimicrobianos, inibidores de RNase, agentes de solubilização ou similar.
[0480] O kit de partes pode ser um kit de duas ou mais partes e compreende tipicamente os componentes em recipientes adequados. Por exemplo, cada recipiente pode estar na forma de frascos, garrafas, garrafas para apertar, jarras, mangas vedadas, envelopes ou bolsas, tubos ou embalagens de blister ou qualquer outra forma adequada con
Petição 870190070557, de 24/07/2019, pág. 318/401
254/306 tanto que o recipiente seja configurado de modo a prevenir mistura imatura de componentes. Cada um dos componentes diferentes pode ser provido separadamente, ou alguns dos componentes diferentes podem ser providos juntos (isto é, no mesmo recipiente). Um recipiente pode ser também um compartimento ou uma câmara dentro de um frasco, um tubo, uma jarra ou um envelope ou uma manga ou uma embalagem de blister ou uma garrafa, contanto que os teores de um compartimento não sejam capazes de se associar fisicamente com os teores de um outro compartimento antes de sua mistura deliberada pelo farmacêutico ou médico.
[0481] O kit de partes pode conter ainda instruções técnicas com informação sobre a administração e dosagem de quaisquer um de seus componentes.
Uso médico e tratamento [0482] A molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes definido aqui pode ser usado para propósitos médicos humanos e também para veterinários, preferivelmente para propósitos médicos humanos.
[0483] De acordo com um aspecto adicional, a invenção refere-se então à molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes para uso como um medicamento.
[0484] A molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes sâo inter alia úteis para tratamento e/ou profilaxia de doenças condescendentes a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse. [0485] De acordo com um aspecto adicional, a invenção refere-se então à molécula de ácido nucleico artificial, preferivelmente RNA, ou à
Petição 870190070557, de 24/07/2019, pág. 319/401
255/306 composição (farmacêutica) ou kit de partes para uso em um método de terapia de gene e/ou para tratamento de uma doença condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse. Tais doenças podem ser selecionadas de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias, doenças infecciosas, doenças metabólicas, doenças neurais, doenças cardlovasculares ou outras doenças ou condições.
[0486] Terapia de gene envolve preferivelmente maturação (isto é, restauração, aumento, diminuição ou inibição) de expressão de gene em um indivíduo a fim de obter um efeito terapêutico. Para esta finalidade, terapia de gene tipicamente compreende a introdução de ácidos nucleicos em células. O termo refere-se em geral à manipulação de um genoma para propósitos terapêuticos e inclui o uso de tecnologias de edição de genoma para correção de mutações que podem causar doença, a adição de genes terapêuticos ao genoma, a remoção de genes ou sequências de genoma prejudiciais e a modulação de expressão de gene. Terapia de gene pode envolver transformação /n vivo ou ex vivo das células hospedeiras.
[0487] O termo tratamento ou tratando” de uma doença inclui prevenção ou proteção contra a doença (isto é, fazendo com que os sintomas clínicos não se desenvolvam); inibição da doença (isto é, parando ou suprimindo o desenvolvimento de sintomas clínicos; e/ou aliviando a doença (isto é, causando a regressão de sintomas clínicos). Como será compreendido, não é sempre possível distinguir entre prevenção e supressão de uma doença ou distúrbio uma vez que o evento ou eventos indutor(es) finais podem ser desconhecidos ou latentes. Desta maneira, o termo profilaxia será compreendido constituir um tipo de tratamento que compreende ambos prevenção e supressão. O termo
Petição 870190070557, de 24/07/2019, pág. 320/401
256/306 tratamento então inclui profilaxia.
[0488] O termo indivíduo ou paciente como aqui usado geralmente inclui humanos e animais não humanos e preferivelmente mamíferos (por exemplo, primatas não humanos, incluindo marmotas, micos, macacos-aranha, macacos-coruja, macacos-vervet, macacos-esquilo e babuínos, macacas, chimpanzés, orangotangos, gorilas; vacas; cavalos: ovelha; porcos; galinha; gatos; cachorros; camundongos; rato; coelhos; porquinhos-da-índia; etc.), incluindo animais e modelos de doença quiméricos e transgênicos. No contexto da presente invenção, o termo indivíduo refere-se preferivelmente a um primata não humano ou um humano, sobretudo preferivelmente um humano.
[0489] Desta maneira, a presente invenção provê ainda métodos de tratamento de doenças condescendentes a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse, através da administração a um indivíduo com necessidade de uma quantidade farmaceuticamente eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes. Tais métodos podem compreender uma primeira etapa opcional de preparação da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes, e uma segunda etapa compreendendo administração (de uma quantidade farmaceuticamente e/ou terapeuticamente eficaz da) dita molécula de ácido nucleico artificial, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes a um paciente/indivíduo com necessidade do mesmo.
[0490] Administração é preferivelmente realizada parenteralmente, por exemplo, através de injeção subcutânea, intramuscular ou intradermal, preferivelmente através de injeção intramuscular ou intradermal, mais preferivelmente através de injeção intradermal. Preferivelmente,
Petição 870190070557, de 24/07/2019, pág. 321/401
257/306 injeção é realizada usando injeção com agulha convenciona ou injeção de jato (sem agulha), preferivelmente usando injeção de jato (sem agulha).
[0491 ] A invenção refere-se também ao uso da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes, preferivelmente para ativação, inativação, manipulação ou modulação, preferivelmente para indução ou aumento, da expressão de um gene de interesse.
Vias de administração [0492] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes pode ser administrado, por exemplo, sistemicamente ou localmente.
[0493] Vias para administração sistêmica em geral incluem, por exemplo, vias transdermal, oral, parenteral, incluindo injeções subcutâneas, intravenosas, intramusculares, intra-arteriais, intradermais e intraperitoneais e/ou vias de administração intranasal.
[0494] Vias para administração local em geral incluem, por exemplo, vias de administração tópica, mas também injeções intradermais, transdermais, subcutâneas ou intramusculares ou injeções intralesionais, intratumorais, intracraniais, intrapulmonares, intracardiais e sublinguais.
[0495] É ainda concebível usar vias de administração diferentes para componentes diferentes da molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes, por exemplo, no caso da dita composição (farmacêutica) ou kit de partes compreender vários ácidos nucleicos diferentes (tal como pelo menos um ácido nucleico artificial codificando uma proteína associada a CRISPR e pelo menos um gRNA ou um vetor provendo o mesmo).
[0496] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica)
Petição 870190070557, de 24/07/2019, pág. 322/401
258/306 ou kit de partes é administrada através de uma via parenteral, preferivelmente através de vias intradermal, subcutânea ou intramuscular. Preferivelmente, a dita molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes é administrada através de injeção, por exemplo, injeção subcutânea, intramuscular ou intradermal, que pode ser injeção sem agulha e/ou com agulha. Desta maneira, em modalidades preferidas, o uso médico e/ou método de tratamento de acordo com a presente invenção envolve administração da dita molécula de ácido nucleico artificial, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes através de injeção subcutânea, intramuscular ou intradermal, preferivelmente através de injeção intramuscular ou intradermal, mais preferivelmente através de injeção intradermal. Tal injeção pode ser dada usando injeção com agulha convencional ou injeção de jato (sem agulha), preferivelmente usando injeção de jato (sem agulha).
Regime de administração [0497] Os componentes da composição (farmacêutica) ou kit de partes da invenção, isto é, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, e opcionalmente pelo menos um outro ácido nucleico (por exemplo, gRNA ou vetor provendo o mesmo) podem ser administrados a um indivíduo com necessidade do mesmo várias vezes por dia, diariamente, dia sim dia não, semanalmente ou mensalmente; e pode ser administrada sequencialmente ou simultaneamente. Os ditos componentes podem ser administrados a um indivíduo com necessidade dos mesmos através de vias de administração diferentes como definido acima.
[0498] De acordo com algumas modalidades preferidas, os componentes da composição (farmacêutica) da invenção são administrados simultaneamente (isto é, ao mesmo tempo a traves das mesmas vias de administração ou diferentes).
Petição 870190070557, de 24/07/2019, pág. 323/401
259/306 [0499] De acordo com outras modalidades preferidas, os componentes da composição da invenção (farmacêutica) ou kits de parte são administrados separadamente (isto é, sequencialmente em pontos de tempo diferentes e/ou através de vias de administração diferentes). Tal esquema de administração sequencial é também referido como administração “escalonada no tempo. Administração escalonada no tempo pode significar que a molécula de ácido nucleico artificial, preferivelmente RNA, é administrada, por exemplo, antes, concomitante ou subsequente ao gRNA ou vetor provendo o mesmo, ou vice-versa.
Dose [0500] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit é preferivelmente administrado em uma quantidade segura e terapeuticamente eficaz.
[0501] Como aqui usado, quantidade segura e terapeuticamente eficaz significa uma quantidade do(s) agente(s) ativo(s) que é suficiente para elicitar uma resposta biológica ou medicinal desejada em um tecido, sistema, animal ou humano que está sendo acompanhado. Uma quantidade segura e terapeuticamente eficaz é preferivelmente suficiente para a indução de uma modificação positiva da doença a ser tratada, isto é, para alivio dos sintomas da doença sendo tratada, redução de progressão de doença ou profilaxia dos sintomas da doença sendo prevenida. Ao mesmo tempo, no entanto, uma quantidade segura e terapeuticamente eficaz é pequena o suficiente para evitar efeitos colaterais sérios, quer dizer permitir uma relação sensível entre vantagem e risco.
[0502] Uma quantidade segura e terapeuticamente eficaz variará ainda mais em relação à condição particular sendo tratada e também com a idade, condição física, peso corporal, sexo e dieta do paciente a ser tratado, a severidade da condição, a duração do tratamento, a natu
Petição 870190070557, de 24/07/2019, pág. 324/401
260/306 reza da terapia acompanhante, do carreador ou excipiente farmaceuticamente aceitável particular, do regime de tratamento e fatores similares. Uma quantidade segura e (terapeuticamente) eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, pode ser ainda selecionada dependendo do tipo de molécula de ácido nucleico artificial, preferivelmente RNA, por exemplo, RNA monocistrônico, bl·- ou até mesmo multicistrônico, uma vez que um RNA bi- ou até mesmo multicistrônico pode levar a uma expressão significantemente maior da(s) proteína(s) associada(s) a CRISPR codificada(s) do que o uso de uma quantidade igual de um RNA monocistrônico.
[0503] Eficácia terapêutica e toxidez da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes podem ser determinadas através de procedimentos farmacêuticos padrão em culturas de célula ou animais experimentais, por exemplo, para determinação da LD50 (a dose ietai para 50% da população) e da ED50 (a dose terapeuticamente eficaz em 50% da população). A razão de dose entre efeitos tóxicos e terapêuticos é o índice terapêutico e pode ser expressa como a razão LD50/ED50. Ácidos nucleicos artificiais, preferivelmente RNAs, composições (farmacêuticas) ou kits de partes que exibem índices terapêuticos grandes são geralmente preferidos. Os dados obtidos a partir dos ensaios de cultura de célula e estudos animais podem ser usados na formulação de uma faixa de dosagem para uso em humanos. A dosagem de tais compostos se encontra preferivelmente dentro de uma faixa de concentrações em circulação que incluem a ED50 com pouca ou nenhuma toxidez.
[0504] Por exemplo, doses terapeuticamente eficazes da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes descritos aqui podem variar de a partir de cerca de 0,001 mg a 10 mg, preferivelmente de a partir de cerca de 0,01 mg a 5 mg, mais preferivelmente de a partir de cerca de 0,1 mg
Petição 870190070557, de 24/07/2019, pág. 325/401
261/306 a 2 mg por unidade de dose ou de a partir de cerca de 0,01 nmol a 1 mmol por unidade de dose, em particular de a partir de 1 nmol a 1 mmol por unidade de dosagem, preferivelmente de a partir de 1 pmol a 1 mmol por unidade de dosagem. É também compreendido que a dose terapeuticamente eficaz da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode variar (por kg de peso corporal) de a partir de cerca de 0,01 mg/kg a 10 g/kg, preferivelmente de a partir de 0,05 mg/kg a 5 g/kg, mais preferivelmente de a partir de cerca de 0,1 mg/kg a 2,5 g/kg.
[0505] Quantidades seguras e terapeuticamente eficazes da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes a serem administradas podem ser determinadas através de experimentos de rotina, por exemplo, usando modelos animais. Tais modelos incluem, sem implicar nenhuma limitação, modelos de coelho, ovelha, camundongo, rato, cachorro e primata não humano.
Doenças [0506] Tecnologias CRISPR podem ser empregadas para uma variedade de propósitos, incluindo ínativação ou ativação funcional de genes, edição de gene ou ativação ou inibição de transcrição. A molécula de ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção pode então ser usada para tratamento de uma variedade de doenças. Ela é particularmente compreendida para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de uma proteína associada a CRISPR codificada por pelo menos uma sequência de codificação da molécula de ácido nucleico artificial.
[0507] Preferivelmente, a doença a ser tratada é condescendente a tratamento através de ativação, ínativação ou manipulação (por exemplo, introdução ou remoção de uma mutação) de um gene de interesse,
Petição 870190070557, de 24/07/2019, pág. 326/401
262/306 ou através da modulação (isto é, alteração, indução, aumento, redução, prevenção ou rompimento) de sua expressão.
[0508] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para induzir inativações de gene (isto é, tornar genes não funcionais ou remover genes do genoma). Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando proteínas associadas a CRISPR exibindo atividade de endonuclease podem ser utilizadas, as quais são capazes de introduzir DSBs no DNA genômico. Os ditos DSBs podem induzir união de extremidade não homologa (NHEJ), resultando na inserção ou deleção aleatória de extensões curtas de nudeotídeos levando ao rompimento da estrutura de leitura de códon (frameshifts), resultando em transcritos errôneos e ablação de expressão de gene (perda de função). Esta estratégia pode, por exemplo, ser útil para inativação de genes que fazem a mediação de proliferação e sobrevivência de célula de tumor ou para remoção viral integrada do genoma da célula hospedeira.
[0509] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para induzir ativações de gene (isto é, introduzir genes novos ou modificados no genoma). Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando proteínas associadas a CRISPR exibindo atividade de nickase podem ser utilizadas, as quais são então capazes de introduzir Nicks (isto é, hidrolise das ligações fosfodiéster de um filamento do DNA genômico de filamento duplo) no DNA genômico. Tais nicks preferivelmente induzem reparo direcionado à homologia (HDR), resultando na incorporação de um segmento de DNA com regiões tendo homologia com as sequências flanqueando ambos os lados da quebra de
Petição 870190070557, de 24/07/2019, pág. 327/401
263/306 filamento duplo de DNA. Usando HDR, qualquer sequência de DNA desejada pode ser inserida no DNA genômico para induzir, por exemplo, perda de função, ganho de função ou função (neomórfica) alterada ou para investigar variantes de estado funcional desconhecido. Para utilizar HDR para editar o genoma, o modelo de reparo de DNA com a sequência desejada é tipicamente provido junto com o ácido nucleico artificial da invenção (e o gRNA). Esta estratégia pode ser, por exemplo, útil para inativação de genes terapêuticos.
[0510] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para modular expressão de gene, e em particular transcrição de gene. Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando derivados de proteína associada a CRISPR compreendendo domínios efetores adequados podem ser utilizadas. Os domínios efetores podem interagir com um gene-alvo (ou uma sequência reguladora operavelmente ligada ao mesmo) para modular sua expressão. Esta abordagem pode ser útil para qualquer doença que esteja associada com uma expressão indesejada (presente ou ausente, aumentada ou diminuída) de um gene-alvo de interesse.
Câncer [0511] Em modalidades preferidas, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit é usado para tratamento ou profilaxia de câncer.
[0512] Como aqui usado, o termo câncer refere-se a um neoplasma caracterizado pela proliferação descontrolada e geralmente rápida de células que tendem a invadir tecido circundante e metastatizar para sítios distantes no corpo. O termo compreende neoplasmas benignos e malignos. Malignidade em câncer é tipicamente caracterizada por
Petição 870190070557, de 24/07/2019, pág. 328/401
264/306 anaplasia, invasividade e metástase; enquanto males benignos tipicamente não tem nenhuma dessas propriedades. Os termos incluem neoplasmas caracterizados por crescimento de tumor bem como cânceres do sangue e sistema linfático.
[0513] Em algumas modalidades, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção pode ser usado como um medicamento, em particular para tratamento de tumor ou doenças de câncer. Neste contexto, tratamento envolve preferivelmente aplicação intratumoral, especialmente através de injeção intratumoral. Desta maneira, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção podem ser usados para preparação de um medicamento para tratamento de tumor ou doenças de câncer, o dito medicamento sendo particularmente adequado para aplicação intratumoral (administração) para tratamento de tumor ou doenças de câncer.
[0514] Preferivelmente, tumor e doenças de câncer como mencionado aqui são selecionados de tumor e doenças de câncer que incluem preferivelmente, por exemplo, Leucemia linfoblástica aguda, Leucemia mieloide aguda, Carcinoma adrenocortical, Cânceres relacionados à AIDS, Linfoma relacionado à AIDS, Câncer anal, Câncer de apêndice, Astrocitoma, Carcinoma de célula basal, Câncer do duto da bile, Câncer de bexiga, Câncer ósseo, Osteossarcoma/Histiocitoma fibroso maligno, Glioma do tronco cerebral, Tumor cerebral, Astrocitoma cerebelar, Astrocitoma cerebral/Glioma maligno, Ependimoma, Meduloblastoma, Tumores neuroectodermais primitivos supratentoriais, Glioma da via visual e hipotalâmico, Câncer de mama, Adenomas/carcinoides brônquicos, Linfoma de Burkitt, Tumor carcinoide da infância, Tumor carcinoide gastrintestinal, Carcinoma de primário desconhecido, Linfoma do sistema nervoso central primário, Astrocitoma cerebelar da infância, Astrocitoma
Petição 870190070557, de 24/07/2019, pág. 329/401
265/306 cerebral da infância/Glioma maligno, Câncer cervical, Cânceres da infância, Leucemia linfocítica crônica, Leucemia mielógena crônica, Distúrbios mieloproliferativos crônicos, Câncer de cólon, Linfoma cutâneo de célula T, Tumor desmoplástico de pequenas células redondas, Câncer endometrial, Ependimoma, Câncer esofageal, Sarcoma de Ewing na família Ewlng de tumores, Tumor de célula germinativa extracraniano da infância, Tumor de célula germinativa extragonadal, Câncer do duto da bile extraepático, Melanoma intraocular, Retinoblastoma, Câncer da vesícula biliar, Câncer gástrico (Estômago), Tumor carcinoide gastrintestinal, Tumor estromal gastrintestinal (GIST), Tumor de célula germinativa extracraniano, extragonadal ou ovariano, Tumor trofoblástlco gestacional, Glioma do tronco cerebral, Astrocitoma Cerebral da infância, Glioma da Via Visual da Infância e Hipotalâmico, Carcinoide gástrico, Lecemia de célula pilosa, Câncer de cabeça e pescoço, Câncer do coração, Câncer hepatocelular (fígado), Linfoma de Hodgkin, Câncer hipofaringeal, Glioma hipotalâmico e da via visual da infância, Melanoma intraocular, Carcinoma de célula ilhota (Pâncreas endócrino), Sarcoma de Kaposi, Câncer renal (câncer de célula renal), Câncer Laringeal, Leucemias, Leucemia linfoblástica aguda, Leucemia mieloide aguda, Leucemia linfocítica aguda, Leucemia mielógena crônica, Leucemia de célula pilosa, Câncer de Lábios e Cavidade Oral, Lipossarcoma, Câncer de Fígado, Câncer de Pulmão de não Pequenas Células, Câncer de Pulmão de Pequenas Células, Linfomas, Linfoma relacionada à AIDS, Linfoma de Burkitt, Linfoma de célula T cutâneo, Linfoma de Hodgkin, Linfomas não Hodgkin, Linfoma do Sistema Nervoso Central Primário, Macroglobulinemia de Waldenstrõn, Histiocitoma Fibroso Maligno de Osso/Osteossarooma, Meduloblastoma da Infância, Melanoma, Melanoma Intraocular (Olho), Carcinoma de célula de Merkel, Mesotelioma Maligno Adulto, Mesotelioma da Infância, Câncer de Pescoço Escamoso Metastático com Primário Oculto, Câncer de Boca, Síndrome da
Petição 870190070557, de 24/07/2019, pág. 330/401
266/306
Neoplasia Endócrina Múltipla da Infância, Mieloma Múltiplo/Neoplasma de Célula do Plasma, Micose Fungoide, Síndromes Mlelodisplásticas, Doenças Mielodisplásticas/Mieloproliferativas, Leucemia Mielógena Crônica, Leucemia Mieloide Aguda do Adulto, Leucemia Mieloide Aguda da Infância, Mieloma Múltiplo (Câncer da Medula-óssea), Distúrbios Mieloproliferativos Crônicos, Câncer da cavidade nasal e seio paranasal, Carcinoma nasofaringeal, Neuroblastoma, Câncer oral, Câncer orofaringeal, Osteossarcoma/histiocitoma fibroso maligno de osso, Câncer ovariano, Câncer epitelial ovariano (Tumores epiteliais-estromais da superficie), Tumor de célula germinativa ovariano, Tumor ovariano de potencial maligno baixo, Câncer pancreático, Câncer pancreático de célula ilhota, Câncer do seio paranasal e cavidade nasal, Câncer da paratireoide, Câncer de pênis, Câncer faringeal, Feocromocitoma, Astrocitoma pineal, Germinoma pineal, Pineoblastoma da infância e tumores neuroectodermais primitivos supratentoriais, Adenoma da pituitária, Neoplasia de célula do plasma/Mieloma múltiplo, Blastoma pleuropulmonar, Linfoma do sistema nervoso central primário, Câncer de próstata, Câncer retal, Carcinoma de célula renal (câncer de rim), Câncer da pélvis renal e ureter, Retinoblastoma, Rabdomiossarcoma da infância, Câncer da glândula salivar, Sarcoma da família Ewing de tumores, Sarcoma de Kaposi, Sarcoma de tecido mole, Sarcoma uterino, Sindrome de Sézary, Câncer de pele (não melanoma), câncer de pele (melanoma), Carcinoma de pele de célula de Merkel, Câncer do intestino delgado, Carcinoma de célula escamosa, Câncer de pescoço escamoso metastático com primário oculto, Tumor neuroectodermal primitivo supratentorial da infância, Câncer testicular, Câncer de garganta, Tlmoma da infância, Timoma e Câncer tímico, Câncer da tíreoide, Câncer da tireoide da infância, Câncer de célula transitório da pélvis renal e ureter, Tumor trofoblástico gestacional, Câncer uretral, Câncer uterino endometrial, Sarcoma uterino, Câncer vaginal, Glioma da via visual e hipotalâmico da
Petição 870190070557, de 24/07/2019, pág. 331/401
267/306 infância, Câncer vulvar, macroglobulinemia de Waldenstrom e tumor de Wilms da infância (câncer de rim).
[0515] Exemplos especialmente preferidos de tumores ou cânceres que são adequados para administração intratumoral são câncer de próstata, câncer de pulmão, câncer de mama, câncer de cérebro, câncer de cabeça e pescoço, câncer da tireoide, câncer de cólon, câncer de estômago, câncer de fígado, câncer de pâncreas, câncer ovariano, câncer de pele, bexiga urinária, útero e cérvice.
Doenças infecciosas [0516] A combinação da invenção, composição farmacêutica ou kit pode ser usado para tratamento de doenças infecciosas. O termo infecção ou doença infecciosa refere-se à invasão e multiplicação de micro-organismos tais como bactérias, vírus e parasitas que não estão normalmente presentes dentro do corpo. Uma infecção pode não causar quaisquer sintomas e ser subclínica ou ela pode causar sintomas e ser clinicamente aparente. Uma infecção pode permanecer localizada ou ela pode se espalhar através do sangue ou sistema linfático para se tomar sistêmica. Doenças infecciosas neste contexto incluem, preferivelmente, doenças Infecciosas virais, bacterianas, fúngicas ou protozoológicas.
[0517] Os ácidos nucleicos artificiais da invenção, preferivelmente RNAs, são considerados particularmente úteis para remoção de genomas virais integrados ao genoma da célula hospedeira. Erradicação de vírus das células hospedeiras por proteínas associadas a CRISPR codificadas pelos ácidos nucleicos artificiais, preferivelmente RNAs, da invenção é preferivelmente aplicável a qualquer vírus de DNA ou vírus de RNA que tenha um intermediário do e DNA em seu ciclo de vida. Desta maneira, os ácidos nucleicos artificiais, preferivelmente RNAs, composições (farmacêuticas) e kits de acordo com a invenção são particularmente compreendidos para tratamento de infeção por Papilomavírus
Petição 870190070557, de 24/07/2019, pág. 332/401
268/306
HPV16 e HPV18, infecção pelo vírus da Hepatite B (HBV), vírus EpsteinBarr (EBV), Infecção por HIV-1, infecção por Herpesvirus (incluindo infecção por herpesvirus associado a sarcoma de Kaposi (KSHV, HHV8)) e infecção por Poliomavirus (incluindo vírus de carcinoma de célula de Merkel (MCV), poliomavirus JC (JCV) e Infecção por poliomavirus BK (BKV) e doenças infecciosas associadas.
Terapia de combinação [0518] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser também usada em terapia de combinação. Qualquer outra terapia útil para tratamento ou prevenção das doenças e distúrbios definidos aqui pode ser combinada com os usos e métodos revelados aqui.
[0519] Por exemplo, o indivíduo recebendo a molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser um paciente com câncer, preferivelmente como definido aqui, ou uma condição relacionada, recebendo quimioterapia (por exemplo, quimioterapia de primeira linha ou segunda linha), radioterapia, quimiorradiação (combinação de quimioterapia e radioterapia), inibidores de tirosina cinase (por exemplo, inibidores de tirosina cinase EGFR), terapia de anticorpo e/ou moléculas de ponto de checagem inibidoras e/ou estimuladoras (por exemplo, inibidores de CTLA4) ou um paciente, que obteve resposta parcial ou doença estável após ter recebido um ou mais dos tratamentos especificados acima. Ou o indivíduo recebendo a molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser um paciente com uma doença infecciosa, preferivelmente como definido aqui, recebendo terapia com antibiótico, antifúngica ou antiviral.
[0520] Em um aspecto adicional, a presente invenção então referese também ao uso da molécula de ácido nucleico artificial da invenção,
Petição 870190070557, de 24/07/2019, pág. 333/401
269/306 preferivelmente RNA, composição (farmacêutica) ou kit de partes para suporte de uma outra terapia de câncer, uma doença infecciosa ou qualquer outra doença condescendente a tratamento com a dita molécula de ácido nucleico artificial, composição (farmacêutica) ou kit.
[0521 ] Apoio do tratamento ou profilaxia de câncer pode ser qualquer combinação de um método de terapia para câncer convencional tal como cirurgia, terapia de radiação, quimioterapia (por exemplo, quimioterapia de primeira linha ou segunda linha), quimiorradiação, tratamento com inibidores de tirosina cinase, tratamento com moléculas de ponto de checagem inibidoras e/ou estimuladoras, preferivelmente inibidores de CTLA4, terapia de anticorpo ou qualquer combinação dessas, e uma terapia usando uma molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes como aqui definido.
[0522] Administração da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser realizada antes da, simultaneamente e/ou subsequentemente à administração de um outro agente terapêutico ou submetendo o paciente a uma outra terapia que seja útil para tratamento da doença ou condição particular a ser tratada.
ITENS [0523] Em vista do acima, a invenção pode ser caracterizada pelos itens que seguem:
1. Uma molécula de ácido nucleico artificial compreendendo
a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISP;
b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 e NDUFA4; e
Petição 870190070557, de 24/07/2019, pág. 334/401
270/306
c. peto menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 e RPS9.
2. A molécula de ácido nucleico artificial, de acordo com o item 1, em que cada um dos ditos genes compreende a sequência de DNA de ocorrência natural e homólogos, variantes, fragmentos e sequências de RNA correspondentes da mesma.
3. A molécula de ácido nucleico artificial, de acordo com o item 1 ou 2, compreendendo
a. pelo menos um elemento de 5’ UTR derivado de um gene HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene GNAS ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo;
b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo; ou
c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e peto menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3
Petição 870190070557, de 24/07/2019, pág. 335/401
271/306 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3
Petição 870190070557, de 24/07/2019, pág. 336/401
272/306 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1, ou de um homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, fragmento ou variante do mesmo; ou
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1, ou de um homólogo, um fragmento ou variante da mesma; ou
Petição 870190070557, de 24/07/2019, pág. 337/401
273/306
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo; ou
p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo; ou
q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante do mesmo; ou
s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante do mesmo;
Petição 870190070557, de 24/07/2019, pág. 338/401
274/306
t. peto menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene, ou de um homólogo, fragmento ou uma variante do mesmo, e peto menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo.
4. A molécula de ácido nucleico artificial, de acordo com o item 3, compreendendo elementos de UTR de acordo com d, e, g ou I.
5. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 4, em que
- o dito elemento de 5’ UTR derivado de um gene de HSD17B4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 1 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou um fragmento ou uma variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 2, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 2 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de RPL32 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 21 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%,
Petição 870190070557, de 24/07/2019, pág. 339/401
275/306
97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 21, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 22, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 22 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de NDUFA4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 9, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 9 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 10, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de SLC7A3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 15, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 16, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico
Petição 870190070557, de 24/07/2019, pág. 340/401
276/306 de acordo com SEQ ID NO: 16 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de urn gene de NOSIP compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 11, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 12, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de ATP5A1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 5, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 6, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de ASAH1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 3, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de
Petição 870190070557, de 24/07/2019, pág. 341/401
277/306 ácido nucleico de acordo com SEQ ID NO: 3 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 4, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de Mp68 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 7, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 7 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 8, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de Rpl31 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 13, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 14, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de TUBB4B
Petição 870190070557, de 24/07/2019, pág. 342/401
278/306 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 17, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 18, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de Ubqln2 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 19, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 19 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 20, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de GNAS compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29 ou um fragmento ou variante da mesma; uma sequência de RNA de acordo SEQ ID NO: 30, ou
Petição 870190070557, de 24/07/2019, pág. 343/401
279/306 uma sequência de RNA tendo, em ordem crescente de preferência, peto menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucieico de acordo com SEQ ID NO: 30 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de CASP1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25, ou uma sequência de DNA tendo, em ordem crescente de preferência, peto menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nudeico de acordo com SEQ ID NO: 25 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 26, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de PSMB3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 23, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 24, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24, ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de ALB compreende ou consiste em uma sequência de DNA de acordo com
Petição 870190070557, de 24/07/2019, pág. 344/401
280/306
SEQ ID NO: 35, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 35 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 36, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de RPS9 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 33, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 33 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 34, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de COX6B1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 27, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO:
Petição 870190070557, de 24/07/2019, pág. 345/401
281/306
28, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28, ou um fragmento ou uma variante da mesma; ou
- o dito elemento de 3’ UTR derivado de um gene de Ndufal compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 31, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 32, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 32 ou um fragmento ou uma variante da mesma.
6. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 5, em que a proteína associada a CRISPR compreende proteínas do tipo selvagem associadas a CRISPR, homólogos, variantes, fragmentos e derivados das mesmas.
7. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 6, em que a dita proteína associada a CRISPR é selecionada de
Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX ou CasY.
8. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 7, em que o dito ácido nucleico artificial compreendendo uma sequência de ácido nucleico codificando uma proteína associada a CRISPR compreendendo ou consistindo em uma sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441;
Petição 870190070557, de 24/07/2019, pág. 346/401
282/306
10999-11001; 442-1345, ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% identidade de sequência com a sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma variante ou fragmento de qualquer uma dessas sequências.
9. A molécula de ácido nucleico artificial, de acordo com o item 8, em que os ditos derivados da proteína associada a CRISPR compreendem pelo menos um domínio efetor adicional, opcionalmente selecionado de KRAB, CSD, WRPW, VP64, p65AD e Mxi.
10. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 9, em que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS), opcionalmente selecionado de um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964, e um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382: 384; 11957: 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou um NLS tendo uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de
Petição 870190070557, de 24/07/2019, pág. 347/401
283/306 acordo com: 12021-14274.
11. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 10, em que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando uma proteína ou marcador de peptídeo.
12. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 11, em que a pelo menos uma região de codificação da dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NO: 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 11591-11593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714-4617; 4874-5777; 60346937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 46344647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 35063519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 36023615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 95149527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 23782391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 24742487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 97229735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-1028210295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 58105823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 59065919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 60026015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999;
Petição 870190070557, de 24/07/2019, pág. 348/401
284/306
7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066-7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 81788191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 82748287' 8290-8302' 8306-8319' 8322-8335' 9678-9591'9690-9703' 98029815; 9914-9927; 10026-10039; 10138-10151; 10250 -10263; 1036210375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
13. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 12, em que a dita molécula de ácido nucleico artificial compreende uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 10552; 3458-3459; 3460-3473; 22982299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259; 23002313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 34883489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 35203521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 36163617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 95289529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 23602361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456
Petição 870190070557, de 24/07/2019, pág. 349/401
285/306
2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 95129513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 46804681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 47764777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 95449545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 58405841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 59365937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 95609561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 1057910580; 10585-10586; 10588-10589; 10591-10592; 10594-10595;
Petição 870190070557, de 24/07/2019, pág. 350/401
286/306
10597-· | 10598; | 10554-10574; 10601; | 10602; | 10615; | 10616; | 10629; |
10630; | 10643; | 10644; 10657; 10658; | 10671; | 10672; | 10685; | 10686; |
10699; | 10700; | 10713; 10714; 10727; | 10728; | 10741; | 10742; | 10755; |
10756; | 10769; | 10770; 10783; 10784; | 10797; | 10798; | 10811; | 10812; |
10825; | 10826; | 10839; 10840; 10853; | 10854; | 10867; | 10868; | 10881; |
10882; | 10603; | 10604; 10617; 10618; | 10631; | 10632; | 10645; | 10646; |
10659; | 10660; | 10673; 10674; 10687; | 10688; | 10701; | 10702; | 10715; |
10716; | 10729; | 10730; 10743; 10744; | 10757; | 10758; | 10771; | 10772; |
10785; | 10786; | 10799; 10800; 10813; | 10814; | 10827; | 10828; | 10841; |
10842; | 10855; | 10856; 10869; 10870; | 10883; | 10884; | 10605; | 10606; |
10619; | 10620; | 10633; 10634; 10647; | 10648; | 10661; | 10662; | 10675; |
10676; | 10689; | 10690; 10703; 10704; | 10717; | 10718; | 10731; | 10732; |
10745; | 10746; | 10759; 10760; 10773; | 10774; | 10787; | 10788; | 10801; |
10802; | 10815; | 10816; 10829; 10830; | 10843; | 10844; | 10857; | 10858; |
10871; | 10872; | 10885; 10886; 10607; | 10608; | 10621; | 10622; | 10635; |
10636; | 10649; | 10650; 10663; 10664; | 10677; | 10678; | 10691; | 10692; |
10705; | 10706; | 10719; 10720; 10733; | 10734; | 10747; | 10748; | 10761; |
10762; | 10775; | 10776; 10789; 10790; | 10803; | 10804; | 10817; | 10818; |
10831; | 10832; | 10845; 10846; 10859; | 10860; | 10873; | 10874; | 10887; |
10888; | 10609; | 10610; 10623; 10624; | 10637; | 10638; | 10651; | 10652; |
10665; | 10666; | 10679; 10680; 10693; | 10694; | 10707; | 10708; | 10721; |
10722; | 10735; | 10736; 10749; 10750; | 10763; | 10764; | 10777; | 10778; |
10791; | 10792; | 10805; 10806; 10819; | 10820; | 10833; | 10834; | 10847; |
10848; | 10861; | 10862; 10875; 10876; | 10889; | 10890; | 10611; | 10612; |
10625; | 10626; | 10639; 10640; 10653; | 10654; | 10667; | 10668; | 10681; |
10682; | 10695; | 10696; 10709; 10710; | 10723; | 10724; | 10737; | 10738; |
10751; | 10752; | 10765; 10766; 10779; | 10780; | 10793; | 10794; | 10807; |
10808; | 10821; | 10822; 10835; 10836; | 10849; | 10850; | 10863; | 10864; |
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448
Petição 870190070557, de 24/07/2019, pág. 351/401
287/306
9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450: 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
14. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 13, em que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 11011-11042; 112491128011131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 11044-11116; 11282-11354: 1116411236; 11400-11472; 11518-11590; 11636-11708; 11754-11826;
11872-11944; 11011-11042; 11249-11280; 11044-11116; 1128211354; 11131-11162; 11367-11398; 11485-11516; 11603-11634;
11721-11752; 11839-11870; 11164-11236; 11400-11472; 1151811590; 11636-11708; 11754-11826; 11872-11944; 11120-11122;
11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712;
11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 1183211838; 11950-11956 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
15. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 14, em que a dita molécula de ácido nucleico artificial é um RNA.
16. O RNA, de acordo com o item 15, em que o RNA é mono-, bí
Petição 870190070557, de 24/07/2019, pág. 352/401
288/306 ou multicistrônico.
17. O RNA, de acordo com o item 14 ou 15, em que o RNA é um mRNA, um RNA viral ou um RNA de replicou.
18. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 17, em que o dito ácido nucleico artificial é um ácido nucleico modificado, preferivelmente um ácido nucleico estabilizado.
19. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 18, em que
- o teor de G/C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que
- o teor de C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que
- os códons na pelo menos uma região de codificação do ácido nucleico artificial são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação do dito aácido nucleico artificial,
- em que a sequência de aminoácido codificada pelo ácido nucleico artificial preferivelmente não está sendo modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico artificial do tipo selvagem correspondente.
20. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 19, que compreende uma estrutura de 5’-CAP, preferivelmente m7GpppN ou Cap1.
21. O ácido nucleico artificial, preferivelmente RNA, de
Petição 870190070557, de 24/07/2019, pág. 353/401
289/306 acordo com qualquer um de 1 a 20, que compreende pelo menos um tronco-alça de histona.
22. O ácido nucleico artificial, preferivelmente RNA, de acordo com o item 21, em que o pelo menos um tronco-alça de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (I) ou (II) abaixo:
fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) [NÜ-2GN3-5] [No-4(U/T)No-4] [N3.5CN0.2J '-------v<----------V----------tronco 1 ajça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):
Ni-6 [N0-2GN3-5] [NO-4(U/T)No-4] [N3-5CN0-2] Ni-6
------V------y *—r—; * ¥ troncol troncol tronco2 tronco2 elemento limítrofe elemento limítrofe em que:
elementos Hmítrofes de troncol ou tronco2 Ni-s é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de 2 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C, ou um análogo de nucleotídeo do mesmo, troncol [N0-2GN3-5] é reverso complementar ou parcialmente reverso complementar com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotídeos;
em que Nwé uma sequência consecutiva de 0 a 2, preferi
Petição 870190070557, de 24/07/2019, pág. 354/401
290/306 velmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucieotídeo selecionado de A, U, T, G e C ou um análogo de nucieotídeo do mesmo;
em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucieotídeo selecionado de A, U, T, GeC ou um análogo de nucieotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma, contanto que sua nucieotídeo citidina complementar no tronco2 seja substituída por guanosina;
sequência de alça [No-4(U/T)No-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nudeotídeos;
em que cada No-4 é independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucieotídeo selecionada de A, U, T, G e C ou um análogo de nudeotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva de entre 5 a 7 nudeotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro seledonado de um nudeotídeo selecionado de A, U, T, G e C ou um análogo de nucieotídeo do mesmo;
em que No-zé uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nudeotídeo selecionado de
Petição 870190070557, de 24/07/2019, pág. 355/401
291/306
A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contendo que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;
em que o troncol e o tronco2 são capazes de emparelhamento de base um com o outro formando uma sequência reversa complementar, em que o emparelhamento de base pode ocorrer entre o troncol e o tronco2, ou formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre o troncol e tronco2.
24. O ácido nucleico artificial, preferivelmente RNA, de acordo com o item 19 ou 20, em que a pelo menos uma histona alçatronco compreende uma sequência de ácido nucleico de acordo com a fórmula (Ia) ou (Ha) abaixo:
fórmula (Ia) (sequência de alça-tronco sem elementos limítrofes de tronco) [N0.1GN3-5] [Ni-3(U/T)No-2] [N3-5CN0-1] <_____________________________/ X K, troncol a;ç:3 tronco2 fórmula (Ha) (sequência de tronco-alça com elementos limítrofes de tronco):
N2-5 [N(mGN3-5] [NiXU/T)No-2] [N3-5CN0-1] N2-5 '—r'·' ''..............>·-.............' -----------yl y J ’V>
troncol troncol a|ça tronco2 tronco2 efements limítrofe elemento limítrofe
25. O ácido nucleico artificial, preferivelmente RNA, de
Petição 870190070557, de 24/07/2019, pág. 356/401
292/306 acordo com qualquer um dos itens 1 a 24, compreendendo opcionalmente uma sequência de poli(A), compreendendo preferivelmente 10 a 200, 10 a 11,40 a 80 ou 50 a 70 nucleotídeos de adenosina.
26. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 25, compreendendo opcionalmente uma sequência de poli(C), compreendendo preferivelmente 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos de citosina.
27. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 26, o qual compreende, preferivelmente na direção 5’ para 3!, os elementos que seguem:
a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1,
b) um elemento de 5!-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como definido em qualquer um dos itens 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma,
c) pelo menos uma sequência de codificação como definido em qualquer um dos itens 7 a 13,
d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3’-UTR como definido em qualquer um dos itens 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 15; 17; 19; 21; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,
e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina,
f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos
Petição 870190070557, de 24/07/2019, pág. 357/401
293/306 cisteína, e
g) opcionalmente um tronco-alça de histona (HSL).
28. Composição compreendendo a molécula de ácido nucleico artificial, preferivelmente um RNA, de acordo com qualquer um dos itens 1 a 26, e um carreador e/ou excipiente farmaceuticamente aceitável.
29. A composição, de acordo com o item 28, em que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais compostos catiônicos ou policatiônicos, preferivelmente com polímeros catiônicos ou policatiônicos, peptídeos ou proteínas catiônicos ou policatiônicos, por exemplo, protamina, polissacarídeos catiônicos ou policatiônicos e/ou lipídeos catiônicos ou policatiônicos.
30. A composição, de acordo com o item 29, em que a razão N/P da molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais peptídeos ou proteínas catiônicos ou policatiônicos está na faixa de cerca de 0,1 a 10, incluindo uma faixa de cerca de 0,3 a 4, de cerca de0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5.
31. A composição, de acordo com qualquer um dos itens 28 a 30, em que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais lipídeos, desta maneira formando lipossomas, nanopartículas de lipídeo e/ou lipoplexos.
32. A composição, de acordo com qualquer um dos itens 28 a 31, compreendendo ainda pelo menos um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionar a proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
33. Kit, preferivelmente kit de partes, compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27 ou a composição de acordo com qualquer
Petição 870190070557, de 24/07/2019, pág. 358/401
294/306 um dos itens 28 a 32, e opcionalmente um veículo líquido e/ou opcionalmente instruções técnicas com informação sobre a administração e dosagem da molécula de ácido nucleico artificial ou da composição.
34. O kit, de acordo com o item 33, em que o kit contém como uma parte solução de Ringer com Lactato.
35. O kit, de acordo com o item 33 ou 34, compreendendo ainda um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligada à mesma.
36. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso como um medicamento.
37. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com o item 33 a 35 para uso em terapia de gene.
38. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso em um método de modulação da expressão de um gene de interesse, compreendendo administração a um paciente com necessidade da mesma (a) a dita molécula de ácido nucleico artificial, preferivelmente RNA, a dita composição ou dito kit e (b) um RNAguia (gRNA) ou um ácido nucleico codificando o mesmo, o dito sgRNA sendo capaz de direcionar a proteína associada a CRISPR a um gene de interesse ou um elemento regulador operavelmente ligado ao mesmo.
39. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de
Petição 870190070557, de 24/07/2019, pág. 359/401
295/306 acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de proteína associada a CRISPR codificada por pelo menos uma sequência de codificação.
40. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com o item 33 a 35 para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente à ativação, inativação ou manipulação de um gene de interesse ou através da modulação da expressão de um gene de interesse.
41. A molécula de ácido nucleico artificial, preferivelmente RNA, composição ou kit para uso de acordo com o item 40, em que a dita doença, distúrbio ou condição é selecionado de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias e doenças infecciosas.
42. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para aumento da expressão da dita proteína associada a CRISPR, opcionalmente em terapia de gene.
43. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR codificada.
44. Um método para modulação da expressão de um gene de interesse compreendendo as etapas de:
Petição 870190070557, de 24/07/2019, pág. 360/401
296/306
a) provisão de uma molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27;
b) provisão de um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma,
c) contato de uma célula, tecido ou organismo com a dita molécula de ácido nucleico artificial, preferivelmente RNA, e dita gRNA ou ácido nucleico codificando o mesmo sob condições adequadas para modular eficácia de expressão do dito gene de interesse.
45. Um método de tratamento ou prevenção de um distúrbio, em que o método compreende administração a um indivíduo com necessidade do mesmo de uma quantidade eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, da composição de acordo com qualquer um dos itens 28 a 32 ou do kit de acordo com os itens 33 a 35, e um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
46. O método, de acordo com o item 45, em que o distúrbio é uma doença, distúrbio ou condição condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através da modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR.
47. O método, de acordo com o item 45 ou 46, em que o distúrbio é uma doença, distúrbio ou condição condescendente através da ativação, inativação ou através da mutação de um gene de interesse ou através da alteração da expressão de um gene de interesse.
48. Um método para aumento da eficácia de expressão de
Petição 870190070557, de 24/07/2019, pág. 361/401
297/306 uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo uma região de codificação codificando uma proteína associada a CRISPR, o dito método compreendendo (a) associação da dita região de codificação com pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP ou NDUFA4 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante da mesma;
(b) associação da dita região de codificação com pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB ou RPS9 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou uma variante da mesma; e (c) obtenção de uma molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 47. DESCRIÇÃO DAS FIGURAS [0524] A Figura 1 mostra o efeito de combinação de UTR diferentes sobre o nível de expressão de Cas9 em células HeLa como detalhado no Exemplo 1 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1.
[0525] A Figura 2 mostra o efeito de combinações de UTR diferentes sobre o nível de expressão de Cas9 em células Hek293T como detalhado no Exemplo 2 (ln~Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1.
[0526] A Figura 3 mostra o efeito de combinações de UTR diferentes sobre o nível de expressão de Cas9 em células HepG2 como detalhado no Exemplo 1 (Western blot). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0527] A Figura 4 mostra o nível de expressão de construtos de
Petição 870190070557, de 24/07/2019, pág. 362/401
298/306 mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 2 (Western blot). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0528] A Figura 5 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 2 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0529] A Figura 6 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 1 (In-Cell Western) em comparação com um mRNA de Cas9 comercialmente disponível. O eixo y é normalizado para mostrar um nível de expressão de 100% para o mRNA de Cas9 comercial.
[0530] A Figura 7 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 1 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0531] A Figura 8 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células Hek293T como detalhado no Exemplo 2 (In-Cell Western) em comparação com um mRNA de Cas9 comercialmente disponível.
[0532] A Figura 9 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HepG2 como detalhado no Exemplo 2 (Western blot) em comparação com um mRNA de Cas9 comercialmente disponível. O eixo y é normalizado para mostrar um nível de expressão de 100% para o mRNA de Cas9 comercial.
[0533] A Figura 10 mostra atividade de edição de DNA de spCas9 expressa a partir de construtos de mRNA como detalhado no Exemplo 3 através do ensaio de nuclease de incompatibilidade/ensaio de detecção de incompatibilidade. A: amplificação por PCR, B: ensaio de detecção de incompatibilidade.
Petição 870190070557, de 24/07/2019, pág. 363/401
299/306 [0534] A Figura 11 mostra um nível de expressão de construtos de mRNA de Cpf1 otimizados em HepG2 em relação a RPL32/ALB7 em %. O eixo y é normalizado para mostrar um nível de expressão de 100% para mRNA de Cpf1 da combinação de UTR RPL32/ALB7.
[0535] A Figura 12 mostra o nível de expressão de construtos de mRNA de Cpf1 otimizados em HeLa em relação a RPL32/ALB7 em %. O eixo y é normalizado para mostrar um nível de expressão de 100% para mRNA de Cpf1 da combinação de UTR RPL32/ALB7.
Exemplos [0536] Abaixo são apresentados exemplos particulares ilustrando várias modalidades e aspectos da invenção. No entanto, a presente invenção não deve ser limitada em escopo pelas modalidades específicas descritas aqui. As preparações e exemplos que seguem são dados para permitir que aqueles versados na técnica compreendam mais claramente e pratiquem a presente invenção. A presente invenção, no entanto, não é limitada em escopo pelas modalidades exemplificadas, que são pretendidas como ilustração de aspectos únicos da invenção apenas, e métodos que são funcionalmente equivalentes estão dentro do escopo da invenção. Na verdade, várias modificações da invenção em adição àquelas descritas aqui se tornarão prontamente aparentes àqueles versados na técnica a partir da descrição acima, figuras acompanhantes e exemplos abaixo. Todas tais modificações se encaixam no escopo das reivindicações apensas.
Exemplo 1: detecção de expressão de Cas9 em células HeLa, Hek293T e HepG2 usando Análises In-Cell Western e Western Blot [0537] As células foram semeadas em placas de 96 poços (Microplaca Nunc Preta c/ Fundo Óptico Transparente; Thermo Fisher) com uma densidade de 10.000 células/poço para HeLa; 20.000 células/poço para Hek293T e HEPG2) em um meio celular completo compatível (200 μΙ). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da
Petição 870190070557, de 24/07/2019, pág. 364/401
300/306 transfecção, o meio completo foi substituído com 50 μΙ de meio Opti-MEM livre de soro (Thermo Físher). 100 ng de cada mRNA, isto é, SEQ ID NO: 14274 (RPL32/ALB7.1), SEQ ID NO: 14275 (HSD17B4/CASP1.1), SEQ ID NO: 14276 (SLC7A3.1/PSMB3.1), SEQ ID NO: 14277 (SLC7A3.1/CASP1.1), SEQ ID NO: 14278 (NOSIP.1/PSMB3.1), SEQ ID NO: 14279 (NDUFA4.1/RPS9.1), SEQ ID NO: 14280 (NDUFA4.1Z PSMB3.1), SEQ ID NO: 14281 (HSD17B4/PSMB3.1) e SEQ ID NO: 14282 (HSD17B4/RPS9.1) foram lipocomplexados usando Lipofectamine 3000 em 50 μί de Opti-MEM com uma razão de mRNA:Upofectamina 3000 de 1:1,5. mRNAs Hpocomplexados foram então adicionados a placas de 96 poços correspondentes. Três horas após a transfecção, o meio completo foi substituído com 100 μί de meio celular completo. As células foram mantidas ainda por 24 horas a 37° C, CO2 5% antes da realização de ln~Cell Western.
[0538] Para análise In-Cell Western (HeLa e Hek293T), as células foram lavadas duas vezes com PBS1X e fixadas com uma solução de metanol/acetona (1:1) por 10 minutos. Após a fixação, as células foram subsequentemente lavadas três vezes com PBS1X por 5 minutos cada uma. Para evitar ligações não específicas, as células foram bloqueadas por 1 hora em temperatura ambiente com tampão de bloqueio Odyssey (PBS, LI-COR) suplementado com Triton X100 0,01% e então incubadas por 1 hora e meia com anticorpos primários, isto é, anticorpos de coelho policlonais contra spCas9 (1/1000; #632606; Clontech/Takara). As células foram então lavadas 4 vezes com Tween-20 0,1 % em PBS1X por 5 minutos sob agitação suave (80 rpm).
[0539] Subsequentemente, anticorpos secundários, isto é, anticorpos policlonais anticoelho de cabra infrared dye® 800 CW (1/250; LICOR), foram misturados com Cell-Tag 700 Stain (1/5000; LI-COR) em tampão de bloqueio Odyssey e incubados no escuro por uma hora em temperatura ambiente. Uma etapa de lavagem foi realizada como acima
Petição 870190070557, de 24/07/2019, pág. 365/401
301/306 descrito antes da varredura usando o sistema de imagem Odyssey® CLx (LI-COR). Quantificação relativa (800/700) foi obtida usando Image Studio™ Life Software. Fluorescência de base obtida a partir de poços lipofectados com mRNA foi subtraída para medição e os resultados comparados com a expressão de um RNA de codificação de Cas9 comercialmente disponível (TriLink BioTechnologies, LLC, No. Cat. L-6125).
[0540] Para células HepG2, a análise foi realizada usando Western blot. As placas foram lavadas duas vezes em PBS1X e incubadas diretamente com 50 μί de tampão de carregamento de amostra 1X (Biorad) contendo Endonuclease de Benzonase (Mlllipore) por 20 minutos em temperatura ambiente. As placas foram então incubadas a 95° C por 5 minutos e centrifugadas.
[0541] 15 μΙ de lisatos foram processados em 10% de géis MiniProtean TGX (Biorad) e transferidos para membranas de nitrocelulose (100V; 90 minutos). As membranas foram lavadas três vezes com Triton X100 0,1 em PBS por dez minutos cada uma e saturadas com 100% de leite em PBS1C de um dia para o outro a 4o C.
[0542] Anticorpos de coelho policlonais spCas9 (1/1000; #632606; Clontech/Takara) e um anticorpo Anti-beta Actina monoclonal de camundongo controle (1/10000; ab6276; Abeam) em 5% de leite em PBS1X foram incubados por uma hora em temperatura ambiente. As membranas foram subsequentemente lavadas três vezes em Tween-20 0,1% em TBS1X. Anticorpos policlonal anticoelho de cabra Infrared dye® 800 CW e anticamundongo de cabra Infrared dye® (1/7500 e 1/10000, respectivamente, foram usados para detecção). A etapa de lavagem como descrito abaixo foi repetida três vezes antes da varredura usando sistema de imagem Odyssey® CLx (LI-COR). Intensidade da faixa e quantificação relativa foram realizadas usando Studio™ Lite Software (LI-COR).
[0543] mRNAs codificando Cas9 compreendendo as combinações
Petição 870190070557, de 24/07/2019, pág. 366/401
302/306 de UTR de acordo com a invenção exibem expressão aumentada (Figura 1, Figura 3, Figura 7) que é altamente superior comparado com mRNA de Cas9 comercialmente disponível (Figura 6).
Exemplo 2: detecção de expressão de Cas9 em células HeLa usando análise Western blot [0544] Células HeLa foram semeadas em placas de 12 poços (Nunc; Thermo Fisher) com uma densidade final de 200.000 células/poço para HeLa em meio celular completo (RPMI; Soro bovino fetal 10%; penicilina/estreptomicina 1% e L-Glutamina 1%; Lonza). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da transfecção, 0 meio completo foi substituído com 750 μΙ de meio Opti-MEM sem soro (Thermo Fisher). Um pg de mRNA codificando Cas9, isto é, SEQ ID NO: 14274 (RPL32/ALB7.1), SEQ ID NO: 14275 (HSD17B4/CASP1.1), SEQ ID NO: 14276 (SLC7A3.1/PSMB3.1), SEQ ID NO: 14277 (SLC7A3.1Z CASP1.1), SEQ ID NO: 14278 (NOSIP.1/PSMB3.1), SEQ ID NO: 14279 (NDUFA4.1/RPS9.1), SEQ ID NO: 14280 (NDUFA4.1/PSMB3.1), SEQ ID NO: 14281 (HSD17B4/PSIVIB3.1) e SEQ ID NO: 14282 (HSD17B4Z RPS9.1), compreendendo a combinação de UTR da invenção (cf. Legendas na Figura) foi Hpocomplexado usando Lipofectamina 3000 em 250 μΙ de Opti-MEM com uma razão de mRNA:Lipofectamina 3000 de 1:1,5. mRNAs lipocomplexados foram então adicionados a cada poço. Três horas após transfecção, 0 meio completo foi substituído com 1 ml de meio celular completo. As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização da extração de proteína.
[0545] Os poços foram lavados duas vezes em PBS1X e incubados diretamente com 100 μΙ de tampão de carregamento de amostra 1X (Biorad) contendo Endonuclease de Benzonase (Millipore) por 20 minutos em temperatura ambiente. As células foram raspadas e os lisatos transferidos para tubos Eppendorf. As amostras foram então desnaturadas a 95° C por 5 minutos, esfriadas em gelo por cinco minutos e centrifugadas em
Petição 870190070557, de 24/07/2019, pág. 367/401
303/306 uma velocidade máxima por dois minutos antes do carregamento.
[0546] 15 μΙ de lisatos foram processados em 10% de géis MiniProtean TGX (Biorad) e transferidos para membranas de nitrocelulose (100V; 90 minutos). As membranas foram lavadas três vezes com Triton X100 0,1 em PBS por dez minutos cada uma e saturadas com 100% de leite em PBS1C de um dia para o outro a 4o C.
[0542] Anticorpos de coelho policlonais spCas9 (1/1000; #632606; Clon-tech/Takara) e um anticorpo Anti-beta Actina monoclonal de camundongo (1/10000; ab6276; Abeam) em 5% de leite em PBS1X foram incubados por uma hora em temperatura ambiente. As membranas foram subsequentemente lavadas três vezes em Tween-20 0,1% em TBS1X. Anticorpos policlonal anticoelho de cabra Infrared dye® 800 CW e anticamundongo de cabra Infrared dye® (1/7500 e 1/10000, respectivamente, foram usados para detecção). A etapa de lavagem como descrito abaixo foi repetida três vezes antes da varredura usando sistema de imagem Odyssey® CLx (LI-COR). Intensidade da faixa e quantificação relativa foram realizadas usando Studio™ Lite Software (LI-COR).
[0543] Expressão de Cas9 a partir dos mRNAs da invenção foi comparada com a expressão a partir de um RNA codificando Cas9 comercialmente disponível (TriLink BioTechnologies, LLC, No. Cat. L-6125). mRNAs codificando Cas9 compreendendo as combinações de UTR de acordo com a invenção exibem expressão aumentada (Figura 2, Figura 4, Figura 5) que é altamente superior comparado com mRNA de Cas9 comercialmente disponível (Figuras 8, Figura 9).
Exemplo 3: determinação de atividade de spCas9 in vitro usando ensaio de detecção de incompatibilidade [0547] As células foram semeadas em placas de 96 poços com uma densidade de 50.000 células/poço para HeLa em um meio celular completo (200 μΙ de RPMI; soro bovino fetal 10%; penicilina/estreptomicina 1% e L-Glutamina 1%; Lonza). As células foram mantidas a 37° C, CO2
Petição 870190070557, de 24/07/2019, pág. 368/401
304/306
5% por 24 horas, No dia da transfecção, cem ng de mRNA de spCas9 (SEQ ID NO: 14274 = RPL32/ALB7.1, SEQ ID NO: 14281 = HSD17B4/PSMB3.1 - cada mRNA uma vez sem adição de poliadenilação enzimática e uma vez com poliadenilaçâo enzimática adicional; como referência RNA codificando Cas9 comercialmente disponível TriLink BioTechnologies, LLC, No. Cat. L-6125 foi usado) foram lipocomplexados com uma mistura de crRNA contra peptidilpropil isomerase B humana (PPIB, isto é, Ciclofilina B; Dharmacon; SO-2544646G) (25nM) e tracrRNA (25nM; Dharmacon; U-002000-20) usando transfecção de mRNA TranslT® (Mirus Bio). Como controles negativos mRNA de spCas9 ou RNAs-guia ou ambos foram omitidos na mistura de transfecção. Um volume final de 10 μΙ foi adicionado ao meio na placa de 96 poços. Três horas após a transfecção, o meio complexo foi substituído com 100 μΙ de meio celular completo. As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização da extração de células.
[0548] As cavidades foram lavadas uma vez com PBS1X e as células Usadas a 56° C por 30 minutos usando 100 μΙ de tampão Phusion HF 1X contendo 1 mg/ml de Proteinase K e 0,5 mg/ml de RNAse A (Thermo Fisher). Uma etapa de desnaturação a 95° C por 5 minutos foi adicionada no final da lise.
[0549] Cinco μΙ de lisatos de célula foram usados para amplificação por PCR de fragmento hPPIB usando primers específicos contra PPIB humano (Edit~R PPIB crRNA Control Kit; UK-007060; Dharmacon) e po~ limerase de DNA de alta fidelidade Phusion hot-start II (Thermo Fisher). Condições de PCR para amplificação foram 0 que segue:
1) etapa de desnaturação: 98° C por 3 min;
2) Reação cíclica de PCR touchdown 10x (desnaturação 98° C por 10 seg; anelamento de tochdown 72° C-1° C/ciclo por 15 seg; extensão 72° C por 30 seg);
3) reação cíclica de PCR normal 25x (desnaturação 98° C
Petição 870190070557, de 24/07/2019, pág. 369/401
305/306 por 10 seg; anelamento 62° C por 15 seg: extensão 72° C por 30 seg):
4) extensão final 72° C por 10 minutos.
[0550] Amostras de PCR foram então aquecidas a 95° C por 10 minutos e lentamente resfriadas para temperatura ambiente por mais de 15 minutos.
[0551] O ensaio de detecção de incompatibilidade foi feito usando 10 μΙ de reação de PCR, Tampão NEB 2 e endonuclease T7 (New Englang BioLabs) durante um período de incubação de 25 min a 37° C. O volume de reação todo foi imediatamente processado em gel de agarose 2%. A faixa esperada foi 505 pb (nenhuma edição) ou respectivamente 330 pb e 174 pb (com edição).
[0552] spCas9 expressa a partir dos mRNAs compreendendo a combinação de LJTR da invenção foi capaz de editar DNA-alvo e então funcional (Figuras 10A, B).
Exemplo 4: detecção de expressão de Cpf1 em células HeLa, Hek293T e HepG2 usando In-Cell Western [0553] As células foram semeadas em placas de 96 poços (Microplaca Nunc Preta c/ Fundo Óptico Transparente; Thermo Fisher) com uma densidade de 10.000 células/poço para HeLa; 20.000 células/poço para HEPG2 e Hek293T) em um meio celular completo compatível como usado antes (200 μΙ). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da transfecção, 100 ng de mRNA, isto é, SEQ ID NO: 10549 (RPL32/ALB7), SEQ ID NO: 14289 (Mp68/Gnas.1), SEQ ID NO: 14290 (Ndufa4.1/PSMB3.1), SEQ ID NO: 14291 (HSD17B4/Gnas.1), SEQ ID NO: 14292 (HSD17B4/PSMB3.1) e SEQ ID NO: 14293 (Ndufa4.1/Alb7) (para transfecção de células HeLa e Hek293T) e 500 ng de mRNA, isto é, a SEQ ID NO idêntica (HepG2) foram lipocomplexados usando Lipofectamine Messenger Max em 50 ui de Opti-MEM com uma razão de mRNA:Lipofectamine Messenger Max de 1:1,5. mRNAs lipocomplexados foram então adicionados às placas de 96 poços correspondentes.
Petição 870190070557, de 24/07/2019, pág. 370/401
306/306
As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização de In-Cell Western.
[0554] Para análise In-Cell Western (HeLa, HepG2 e Hek293T), as células foram lavadas três vezes com PBS1X e fixadas com paraformaldeído 4% por 10 minutos. Após a fixação, as células foram subsequentemente lavadas três vezes com PBS1X por 5 minutos cada uma e permeabilizadas com Triton X100 2% em PBS por 15 minutos. Para evitar ligações não específicas, as células foram bloqueadas por 1 hora em temperatura ambiente com tampão de bloqueio Odyssey (PBS, LI-COR) e então incubadas por 1 hora e meia com anticorpos primários, isto é, anticorpos de coelho policlonais contra HA9 (1/1000; H6808; Sigma Aldrich). As células foram então lavadas 4 vezes com Tween-20 0,1% em PBS1X por 5 minutos sob agitação suave (80 rpm).
[0539] Subsequentemente, anticorpos secundários, isto é, anticorpos policlonais anticoelho de cabra Infrared dye® 800 CW (1/500; LICOR), foram misturados com Cell-Tag 700 Stain (1/5000; LI-COR) em tampão de bloqueio Odyssey e incubados no escuro por uma hora em temperatura ambiente. Uma etapa de lavagem foi realizada como acima descrito antes da varredura usando o sistema de imagem Odyssey® CLx (LI-COR). Quantificação relativa (800/700) foi obtida usando Image Studio™ Life Software. Fluorescência de base obtida a partir de poços lipofectados com mRNA foi subtraída para medição e os resultados comparados com a expressão de mRNA padrão da requerente.
[0555] mRNAs codificando Cpf1 compreendendo as combinações de UTR de acordo com a invenção exibem expressão fortemente aumentada que foi altamente superior comparado com um mRNA de Cpf1 de referência RPL32/Alb7. Expressão é dada com relação à RPL32/ALB7 em % como aparente a partir da Figura 11 e da Figura 12 (células HepG2 e HeLa).
Claims (47)
- REIVINDICAÇÕES1. Molécula de ácido nucleico artificial caracterizada pelo fato de que compreendea. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISPR;b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em SLC7A3, ATP5A1, RPL32, HSD17B4, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 e NDUFA4; ec. pelo menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 e RPS9.
- 2. Molécula de ácido nucleico artificial, de acordo com a reivindicação 1, caracterizada pelo fato de que cada um dos ditos genes compreende a sequência de DNA de ocorrência natural e homólogos, variantes, fragmentos e sequências de RNA correspondentes da mesma.
- 3. Molécula de ácido nucleico artificial, de acordo com a reivindicação 1 ou 2, caracterizada pelo fato de que compreendea. pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene GNAS ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo;b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS,Petição 870190070557, de 24/07/2019, pág. 23/4012/29 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo; ouc. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; oud. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; oue. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ouf. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; oug. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1Petição 870190070557, de 24/07/2019, pág. 24/4013/29 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ouh. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; oui. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ouj. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ouk. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; oul. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9Petição 870190070557, de 24/07/2019, pág. 25/401
- 4/29 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; oum. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou uma variante do mesmo; oun. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1, ou de um homólogo, um fragmento ou variante do mesmo; oun. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ouo. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou uma variante do mesmo; oup. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou uma variante do mesmo; ouq. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivadoPetição 870190070557, de 24/07/2019, pág. 26/401
- 5/29 de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou uma variante do mesmo; our. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou uma variante do mesmo; ous. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou uma variante do mesmo;t. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ouu. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo.4. Molécula de ácido nucleico artificial, de acordo com a reivindicação 3, caracterizada pelo fato de que compreendendo elementos de UTR de acordo com d, e, g ou I.5. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 4, caracterizada pelo fato de que-o dito elemento de 5’ UTR derivado de um gene de HSD17B4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 1 ou uma sequência de DNA tendo, em ordemPetição 870190070557, de 24/07/2019, pág. 27/401
- 6/29 crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou um fragmento ou uma variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 2, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 2 ou um fragmento ou uma variante da mesma;- o dito elemento de 5’ UTR derivado de um gene de RPL32 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 21 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 21 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 22 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 22 ou um fragmento ou uma variante da mesma;-o dito elemento de 5’ UTR derivado de um gene de NDUFA4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 9 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 9 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 10 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%Petição 870190070557, de 24/07/2019, pág. 28/401
- 7/29 ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10 ou um fragmento ou uma variante da mesma;- o dito elemento de 5’ UTR derivado de urn gene de SLC7A3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 15 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 16 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 16 ou um fragmento ou uma variante da mesma;- o dito elemento de 5’ UTR derivado de um gene de NOSIP compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 11 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 12 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12 ou um fragmento ou uma variante da mesma;- o dito elemento de 5’ UTR derivado de um gene de ATP5A1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 5 ou uma sequência de DNA tendo, em ordem crescentePetição 870190070557, de 24/07/2019, pág. 29/401
- 8/29 de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 6 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6 ou um fragmento ou uma variante da mesma;o dito elemento de 5’ UTR derivado de um gene de ASAH1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 3 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 3 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 4 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4 ou um fragmento ou uma variante da mesma;o dito elemento de 5’ UTR derivado de um gene de Mp68 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 7 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 7 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 8 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8 ou um fragmento ou uma variante da mesma;Petição 870190070557, de 24/07/2019, pág. 30/401
- 9/29 o dito elemento de 5’ UTR derivado de um gene de Rpl31 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 13 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 14 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14 ou um fragmento ou uma variante da mesma;o dito elemento de 5’ UTR derivado de um gene de TUBB4B compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 17 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 18 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18 ou um fragmento ou uma variante da mesma;o dito elemento de 5’ UTR derivado de um gene de Ubqln2 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 19 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência dePetição 870190070557, de 24/07/2019, pág. 31/401
- 10/29 ácido nucleico de acordo com SEQ ID NO: 19 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 20 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20 ou um fragmento ou uma variante da mesma;-o dito elemento de 3’ UTR derivado de um gene de GNAS compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29 ou um fragmento ou variante da mesma; uma sequência de RNA de acordo SEQ ID NO: 30 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 30 ou um fragmento ou uma variante da mesma;- o dito elemento de 3’ UTR derivado de um gene de CASP1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 25 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 26 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26 ou um fragmento ou uma variante da mesma;Petição 870190070557, de 24/07/2019, pág. 32/401
- 11/29- o dito elemento de 3’ UTR derivado de um gene de PSMB3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 23 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 24 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24, ou um fragmento ou uma variante da mesma;-o dito elemento de 3’ UTR derivado de um gene de ALB compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 35 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 35 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 36 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36 ou um fragmento ou uma variante da mesma;-o dito elemento de 3’ UTR derivado de um gene de RPS9 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 33 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência dePetição 870190070557, de 24/07/2019, pág. 33/401
- 12/29 ácido nucleico de acordo com SEQ ID NO: 33 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 34 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34 ou um fragmento ou uma variante da mesma;- o dito elemento de 3’ UTR derivado de um gene de COX6B1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 27 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 28 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28 ou um fragmento ou uma variante da mesma; ou- o dito elemento de 3’ UTR derivado de um gene de Ndufal compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 31 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 32 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 32 ou um fragmento ou uma variante daPetição 870190070557, de 24/07/2019, pág. 34/401
- 13/29 mesma.6. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 5, caracterizada pelo fato de que a proteína associada a CRISPR compreende proteínas do tipo selvagem associadas a CRISPR, homólogos, variantes, fragmentos e derivados das mesmas.7. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 6, caracterizada pelo fato de que a dita proteína associada a CRISPR é selecionada de Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX ou CasY.8. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 7, caracterizada pelo fato de que o dito ácido nucleico artificial compreende uma sequência de ácido nucleico codificando uma proteína associada a CRISPR compreendendo ou consistindo em uma sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma variante ou fragmento de qualquer uma dessas sequências.9. Molécula de ácido nucleico artificial, de acordo com a reivindicação 8, caracterizada pelo fato de que os ditos derivados da proteína associada a CRISPR compreendem pelo menos um domínio efetor adicional, opcionalmente selecionado de KRAB, CSD, WRPW, VP64, p65AD e Mxi.10. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 9, caracterizada pelo fato de que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS),Petição 870190070557, de 24/07/2019, pág. 35/401
- 14/29 opcionalmente selecionado de um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964, e um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 1195811964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou um NLS tendo uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com: 12021-14274.11. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 10, caracterizada pelo fato de que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando uma proteína ou marcador de peptídeo.12. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 11, caracterizada pelo fato de que a pelo menos uma região de codificação da dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 60206033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 1159111593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714Petição 870190070557, de 24/07/2019, pág. 36/401
- 15/294617; 4874-5777; 6034-6937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10ΠΟΙ 0183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 999410007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 69866999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 1012210135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 81628175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 82588271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 96909703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%Petição 870190070557, de 24/07/2019, pág. 37/401
- 16/29 ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.13. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 12, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial compreende uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 46484649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985;Petição 870190070557, de 24/07/2019, pág. 38/401
- 17/296000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 81608160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 82568257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 1015210153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 10579-10580; 10585-10586; 1058810589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657;10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714;10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783;10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840;10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617;10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674;10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743;10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800;10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869;10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634;10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703;10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760;Petição 870190070557, de 24/07/2019, pág. 39/401
- 18/2910773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829;10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886;10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663;10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720;10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789;10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846;10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623;10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680;10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749;10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806;10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875;10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640;10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709;10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766;10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835;10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892;9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 1005610057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.14. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 13, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQPetição 870190070557, de 24/07/2019, pág. 40/401
- 19/29ID NOs: 11011-11042; 11249-1128011131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 1104411116; 11282-11354; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11011-11042; 1124911280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 1116411236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11120-11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366; 11242-11248; 11478-11484; 1159611602; 11714-11720; 11832-11838; 11950-11956 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.15. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 14, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial é um RNA.16. RNA, de acordo com a reivindicação 15, caracterizado pelo fato de que o RNA é mono-, bi- ou multicistrônico.17. RNA, de acordo com a reivindicação 14 ou 15, caracterizado pelo fato de que o RNA é um mRNA, um RNA viral ou um RNA de replicon.18. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 17, caracterizado pelo fato de que o dito ácido nucleico artificial é um ácido nucleico modificado, preferivelmente um ácido nucleico estabilizado.19. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 18, caracterizado pelo fato de quePetição 870190070557, de 24/07/2019, pág. 41/401
- 20/29- o teor de G/C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que- o teor de C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que- os códons na pelo menos uma região de codificação do ácido nucleico artificial são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação do dito ácido nucleico artificial,-em que a sequência de aminoácido codificada pelo ácido nucleico artificial preferivelmente não está sendo modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico artificial do tipo selvagem correspondente.20. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 19, caracterizado pelo fato de que compreende uma estrutura de 5’-CAP, preferivelmente m7GpppN ou Cap1.
- 21. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 20, caracterizado pelo fato de que compreende pelo menos um tronco-alça de histona.
- 22. Ácido nucleico artificial, preferivelmente RNA, de acordo com a reivindicação 21, caracterizado pelo fato de que o pelo menos um tronco-alça de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (I) ou (II) abaixo:fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco)Petição 870190070557, de 24/07/2019, pág. 42/40121/29 [N0.2GN3-5] [N0-4(U/T)hM [N3-5CN0.2] tronco1 alça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):Ni-6 [N0-2GN3-5] [N(m(U/T)N(m] [N -.sCNg-,·] Ni-b troncoi troncoí gjça tronco2 tronco2 elemento limítrofe elemento limítrofe em que elementos limítrofes de troncoí ou tronco2 N1-6 é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de 2 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, troncoí [N0-2GN3-5] é reverso complementar ou parcialmente reverso complementar com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotideos;em que Νο-2θ uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma,Petição 870190070557, de 24/07/2019, pág. 43/40122/29 contanto que sua nucleotídeo citidina complementar no tronco2 seja substituída por guanosina;sequência de alça [No-4(U/T)No-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nucleotídeos;em que cada Νο-4θ independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucleotídeo selecionada de A, U, T, G e C ou um análogo de nucleotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva de entre 5 a 7 nucleotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;em que Νο-2θ uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contanto que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;em que0 troncol e 0 tronco2 são capazes de emparelhamento de base um com 0 outro formando uma sequência reversa complementar, em que 0 emparelhamento de base pode ocorrer entre 0 troncol e 0Petição 870190070557, de 24/07/2019, pág. 44/401
- 23/29 tronco2, ou formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre o troncol e tronco2.23. Ácido nucleico artificial, preferivelmente RNA, de acordo com a reivindicação 21 ou 22, caracterizado pelo fato de que a pelo menos uma alça-tronco de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (Ia) ou (IIa) abaixo:fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) [No-iGNm] [Ni-3(U/T)No-2] [Nj-sCNo-i] vtroncol alça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):N2-5 [N0-1GN3-5] [Ni-3(U/T)N0-2] [N3-5CN0-i] N2-s troncol tfOnCOl aiça tronco2 troncoZ elemento limítrofe elemento hmrtrofe
- 24. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 23, caracterizado pelo fato de que compreende opcionalmente uma sequência de poli(A), preferivelmente compreendendo 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina.
- 25. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 24, caracterizado pelo fato de que compreende opcionalmente uma sequência de poli(C), compreendendo preferivelmente 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos de citosina.Petição 870190070557, de 24/07/2019, pág. 45/40124/29
- 26. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 25, caracterizado pelo fato de que compreende, preferivelmente na direção 5’ para 3’, os elementos que seguem:a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1,b) um elemento de 5’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como definida em qualquer uma das reivindicações 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma,c) pelo menos uma sequência de codificação como definida em qualquer uma das reivindicações 7 a 13,d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3’-UTR como definida em qualquer uma das reivindicações 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 15; 17; 19; 21; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina,f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos cisteína, eg) opcionalmente um tronco-alça de histona (HSL).
- 27. Composição caracterizada pelo fato de que compreende a molécula de ácido nucleico artificial, preferivelmente um RNA, comoPetição 870190070557, de 24/07/2019, pág. 46/40125/29 definida em qualquer uma das reivindicações 1 a 26, e um carreador e/ou excipiente farmaceuticamente aceitável.
- 28. Composição, de acordo com a reivindicação 27, caracterizada pelo fato de que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais compostos catiônicos ou policatiônicos, preferivelmente com polímeros catiônicos ou policatiônicos, peptídeos ou proteínas catiônicos ou policatiônicos, por exemplo, protamina, polissacarídeos catiônicos ou policatiônicos e/ou lipídeos catiônicos ou policatiônicos.
- 29. Composição, de acordo com a reivindicação 28, caracterizada pelo fato de que a razão N/P da molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais peptídeos ou proteínas catiônicos ou policatiônicos está na faixa de cerca de 0,1 a 10, incluindo uma faixa de cerca de 0,3 a 4, de cerca de0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5.
- 30. Composição, de acordo com qualquer uma das reivindicações 27 a 29, caracterizada pelo fato de que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais lipídeos, desta maneira formando lipossomas, nanopartículas de lipídeo e/ou lipoplexos.
- 31. Composição, de acordo com qualquer uma das reivindicações 27 a 30, caracterizada pelo fato de que compreende ainda pelo menos um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionar a proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
- 32. Kit, preferivelmente kit de partes, caracterizado pelo fato de que compreende a molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, ou composição como definida em qualquer uma das reivindicações 27Petição 870190070557, de 24/07/2019, pág. 47/40126/29 a 31, e opcionalmente um veículo líquido e/ou opcionalmente instruções técnicas com informação sobre a administração e dosagem da molécula de ácido nucleico artificial ou da composição.
- 33. Kit, de acordo com a reivindicação 32, caracterizado pelo fato de que o kit contém como uma parte solução de Ringer com Lactato.
- 34. Kit, de acordo com a reivindicação 32 ou 33, caracterizado pelo fato de que compreende ainda um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNAalvo de interesse ou um elemento regulador operavelmente ligada à mesma.
- 35. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento.
- 36. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso em terapia de gene.
- 37. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso em um método de modulação da expressão de um gene de interesse, compreendendo administração a um paciente com necessidade da mesma (a) a dita molécula de ácido nucleico artificial, preferivelmente RNA, a dita composição ou dito kit e (b) um RNA-guia (gRNA)Petição 870190070557, de 24/07/2019, pág. 48/40127/29 ou um ácido nucleico codificando o mesmo, o dito sgRNA sendo capaz de direcionar a proteína associada a CRISPR a um gene de interesse ou um elemento regulador operavelmente ligado ao mesmo.
- 38. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, a composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de proteína associada a CRISPR codificada pela pelo menos uma sequência de codificação.
- 39. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente à ativação, inativação ou manipulação de um gene de interesse ou através da modulação da expressão de um gene de interesse.
- 40. Molécula de ácido nucleico artificial, preferivelmente RNA, composição ou kit para uso de acordo com a reivindicação 39, caracterizados pelo fato de que a dita doença, distúrbio ou condição é selecionado de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias e doenças infecciosas.
- 41. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, composição como definida em qualquer uma das reivindicações 27 a 31, ou kit como definido nas reivindicações 32 a 34, caracterizados pelo fato de serem para aumento da expressão da dita proteína associada a CRISPR, opcionalmente em terapia de gene.Petição 870190070557, de 24/07/2019, pág. 49/40128/29
- 42. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, composição como definida em qualquer uma das reivindicações 27 a 31, ou kit como definida nas reivindicações 32 a 34, caracterizados pelo fato de serem para modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR codificada.
- 43. Método para modulação da expressão de um gene de interesse caracterizado pelo fato de que compreende as etapas de:a) prover uma molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26;b) prover um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma,c) contatar uma célula, tecido ou organismo com a dita molécula de ácido nucleico artificial, preferivelmente RNA, e dito gRNA ou ácido nucleico codificando o mesmo sob condições adequadas para modular eficácia de expressão do dito gene de interesse.
- 44. Método de tratamento ou prevenção de um distúrbio caracterizado pelo fato de que compreende administração a um indivíduo com necessidade do mesmo de uma quantidade eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, da composição como definida em qualquer uma das reivindicações 27 a 31, ou do kit como definido nas reivindicações 32 a 34, e um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
- 45. Método, de acordo com a reivindicação 44, caracterizadoPetição 870190070557, de 24/07/2019, pág. 50/40129/29 pelo fato de que o distúrbio é uma doença, distúrbio ou condição condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através da modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR.
- 46. Método, de acordo com a reivindicação 44 ou 45, caracterizado pelo fato de que o distúrbio é uma doença, distúrbio ou condição condescendente através da ativação, inativação ou através da mutação de um gene de interesse ou através da alteração da expressão de um gene de interesse.
- 47. Método para aumento da eficácia de expressão de uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo uma região de codificação codificando uma proteína associada a CRISPR, caracterizado pelo fato de que compreende (a) associar a dita região de codificação com pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP ou NDUFA4 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante da mesma;(b) associar a dita região de codificação com pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB ou RPS9 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou uma variante da mesma; e (c) obter uma molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 46.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP2017057110 | 2017-03-24 | ||
EP2017076775 | 2017-10-19 | ||
PCT/EP2018/057552 WO2018172556A1 (en) | 2017-03-24 | 2018-03-23 | Nucleic acids encoding crispr-associated proteins and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112019015244A2 true BR112019015244A2 (pt) | 2020-04-14 |
Family
ID=61801946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112019015244A BR112019015244A2 (pt) | 2017-03-24 | 2018-03-23 | ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos |
Country Status (11)
Country | Link |
---|---|
US (2) | US11739335B2 (pt) |
EP (1) | EP3601576A1 (pt) |
JP (2) | JP2020513824A (pt) |
KR (1) | KR20190133699A (pt) |
CN (1) | CN110914433A (pt) |
AU (1) | AU2018240515A1 (pt) |
BR (1) | BR112019015244A2 (pt) |
CA (1) | CA3050616A1 (pt) |
MX (1) | MX2019011215A (pt) |
SG (2) | SG10202110491PA (pt) |
WO (1) | WO2018172556A1 (pt) |
Families Citing this family (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109045289A (zh) | 2013-02-22 | 2018-12-21 | 库瑞瓦格股份公司 | 疫苗接种和抑制pd-1途径的组合 |
JP6896421B2 (ja) | 2013-08-21 | 2021-06-30 | キュアバック アーゲー | 呼吸器合胞体ウイルス(rsv)ワクチン |
WO2016073990A2 (en) | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
DE202015010000U1 (de) | 2014-12-12 | 2023-07-03 | CureVac SE | Artifizielle Nukleinsäuremoleküle für eine verbesserte Proteinexpression |
EP3294885B1 (en) | 2015-05-08 | 2020-07-01 | CureVac Real Estate GmbH | Method for producing rna |
AU2016261358B2 (en) | 2015-05-11 | 2021-09-16 | Editas Medicine, Inc. | Optimized CRISPR/Cas9 systems and methods for gene editing in stem cells |
EP3744843A1 (en) | 2015-05-29 | 2020-12-02 | CureVac Real Estate GmbH | A method for producing and purifying rna, comprising at least one step of tangential flow filtration |
AU2016276702B2 (en) | 2015-06-09 | 2022-07-28 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for improving transplantation |
EP3786294A1 (en) | 2015-09-24 | 2021-03-03 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
WO2017081110A1 (en) | 2015-11-09 | 2017-05-18 | Curevac Ag | Rotavirus vaccines |
EP3701963A1 (en) | 2015-12-22 | 2020-09-02 | CureVac AG | Method for producing rna molecule compositions |
SG11201806340YA (en) | 2016-02-17 | 2018-09-27 | Curevac Ag | Zika virus vaccine |
US11920174B2 (en) | 2016-03-03 | 2024-03-05 | CureVac SE | RNA analysis by total hydrolysis and quantification of released nucleosides |
US11597924B2 (en) | 2016-03-25 | 2023-03-07 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
WO2017180694A1 (en) | 2016-04-13 | 2017-10-19 | Editas Medicine, Inc. | Cas9 fusion molecules gene editing systems, and methods of use thereof |
US10337051B2 (en) * | 2016-06-16 | 2019-07-02 | The Regents Of The University Of California | Methods and compositions for detecting a target RNA |
US11293021B1 (en) | 2016-06-23 | 2022-04-05 | Inscripta, Inc. | Automated cell processing methods, modules, instruments, and systems |
JP2019532644A (ja) | 2016-09-30 | 2019-11-14 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | Rna誘導型核酸修飾酵素及びその使用方法 |
US11279923B2 (en) | 2016-11-28 | 2022-03-22 | Curevac Ag | Method for purifying RNA |
WO2018115507A2 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Henipavirus vaccine |
WO2018115527A2 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Mers coronavirus vaccine |
CA3084252A1 (en) | 2017-03-28 | 2018-10-04 | Caribou Biosciences, Inc. | Crispr-associated (cas) protein |
EP3615672A1 (en) | 2017-04-28 | 2020-03-04 | Editas Medicine, Inc. | Methods and systems for analyzing guide rna molecules |
CN110997908A (zh) | 2017-06-09 | 2020-04-10 | 爱迪塔斯医药公司 | 工程化的cas9核酸酶 |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
KR20220104847A (ko) | 2017-06-30 | 2022-07-26 | 인스크립타 인코포레이티드 | 자동 세포 처리 방법, 모듈, 기기 및 시스템 |
EP3652312A1 (en) | 2017-07-14 | 2020-05-20 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
US10476825B2 (en) | 2017-08-22 | 2019-11-12 | Salk Institue for Biological Studies | RNA targeting methods and compositions |
EP3673069A1 (en) | 2017-08-22 | 2020-07-01 | CureVac AG | Bunyavirales vaccine |
MX2020003995A (es) * | 2017-10-19 | 2020-07-22 | Curevac Ag | Nuevas moleculas de acido nucleico artificiales. |
CN117487776A (zh) | 2017-11-01 | 2024-02-02 | 加利福尼亚大学董事会 | Casz组合物和使用方法 |
US11692002B2 (en) | 2017-11-08 | 2023-07-04 | CureVac SE | RNA sequence adaptation |
US11931406B2 (en) | 2017-12-13 | 2024-03-19 | CureVac SE | Flavivirus vaccine |
SG11202005760PA (en) | 2017-12-21 | 2020-07-29 | Curevac Ag | Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna |
KR20200124702A (ko) * | 2018-02-23 | 2020-11-03 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | 신규한 cas9 오르소로그 |
US11795456B2 (en) * | 2018-04-16 | 2023-10-24 | Georgia Tech Research Corporation | MRNA driven expression of RNA editors for treatment of pathologies |
US10526598B2 (en) | 2018-04-24 | 2020-01-07 | Inscripta, Inc. | Methods for identifying T-cell receptor antigens |
US10858761B2 (en) | 2018-04-24 | 2020-12-08 | Inscripta, Inc. | Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells |
AU2019292919A1 (en) | 2018-06-30 | 2021-03-11 | Inscripta, Inc. | Instruments, modules, and methods for improved detection of edited sequences in live cells |
US11142740B2 (en) | 2018-08-14 | 2021-10-12 | Inscripta, Inc. | Detection of nuclease edited sequences in automated modules and instruments |
RU2706298C1 (ru) * | 2018-09-14 | 2019-11-15 | Закрытое Акционерное Общество "Биокад" | НУКЛЕАЗА PaCas9 |
WO2020081808A1 (en) * | 2018-10-18 | 2020-04-23 | Chan Zuckerberg Biohub, Inc. | Methods and compositions involving thermostable cas9 protein variants |
BR112021011372A2 (pt) | 2018-12-14 | 2021-08-31 | Pioneer Hi-Bred International, Inc. | Novos sistemas crispr-cas para edição de genoma |
WO2020142739A1 (en) * | 2019-01-04 | 2020-07-09 | Mammoth Biosciences, Inc. | COMPOSITIONS AND METHODS FOR DETECTING MODIFIED NUCLEIC ACIDS AND AMPLIFYING ssDNA |
WO2020161342A1 (en) | 2019-02-08 | 2020-08-13 | Curevac Ag | Coding rna administered into the suprachoroidal space in the treatment of ophtalmic diseases |
WO2020168234A1 (en) * | 2019-02-14 | 2020-08-20 | Metagenomi Ip Technologies, Llc | Enzymes with ruvc domains |
MX2021010559A (es) | 2019-03-07 | 2021-12-15 | Univ California | Polipéptidos efectores de crispr-cas y métodos de uso de estos. |
US10815467B2 (en) | 2019-03-25 | 2020-10-27 | Inscripta, Inc. | Simultaneous multiplex genome editing in yeast |
US11001831B2 (en) | 2019-03-25 | 2021-05-11 | Inscripta, Inc. | Simultaneous multiplex genome editing in yeast |
US20220213456A1 (en) * | 2019-04-30 | 2022-07-07 | Emendobio Inc. | Novel omni crispr nucleases |
CN113939593A (zh) | 2019-06-06 | 2022-01-14 | 因思科瑞普特公司 | 用于递归的核酸指导的细胞编辑的处治 |
GB2600274A (en) | 2019-06-07 | 2022-04-27 | Scribe Therapeutics Inc | Engineered CasX systems |
WO2021011504A1 (en) * | 2019-07-12 | 2021-01-21 | Duke University | Nanoparticle systems for targeted delivery of crispr/cas13 and methods of using same |
TW202120688A (zh) * | 2019-08-12 | 2021-06-01 | 美商生命編輯公司 | Rna導引之核酸酶及其活性片段及變體以及使用方法 |
WO2021102059A1 (en) | 2019-11-19 | 2021-05-27 | Inscripta, Inc. | Methods for increasing observed editing in bacteria |
WO2021118626A1 (en) * | 2019-12-10 | 2021-06-17 | Inscripta, Inc. | Novel mad nucleases |
AU2020408995A1 (en) * | 2019-12-16 | 2022-06-23 | BASF Agricultural Solutions Seed US LLC | Codon-optimized Cas9 endonuclease encoding polynucleotide |
AU2020407048A1 (en) | 2019-12-18 | 2022-06-09 | Inscripta, Inc. | Cascade/dCas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells |
AU2021213705A1 (en) | 2020-01-27 | 2022-06-16 | Inscripta, Inc. | Electroporation modules and instrumentation |
US11576966B2 (en) | 2020-02-04 | 2023-02-14 | CureVac SE | Coronavirus vaccine |
US11241493B2 (en) | 2020-02-04 | 2022-02-08 | Curevac Ag | Coronavirus vaccine |
KR20220161383A (ko) | 2020-03-31 | 2022-12-06 | 메타지노미, 인크. | 클래스 ii, 유형 ii crispr 시스템 |
WO2021211598A1 (en) * | 2020-04-14 | 2021-10-21 | University Of Massachusetts | Dcas13-mediated therapeutic rna base editing for in vivo gene therapy |
TW202208626A (zh) * | 2020-04-24 | 2022-03-01 | 美商生命編輯公司 | Rna引導核酸酶及其活性片段與變體,以及使用方法 |
US20210332388A1 (en) | 2020-04-24 | 2021-10-28 | Inscripta, Inc. | Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells |
US11946077B2 (en) | 2020-06-04 | 2024-04-02 | Emendobio Inc. | OMNI-59, 61, 67, 76, 79, 80, 81, and 82 CRISPR nucleases |
US11299731B1 (en) | 2020-09-15 | 2022-04-12 | Inscripta, Inc. | CRISPR editing to embed nucleic acid landing pads into genomes of live cells |
WO2022098681A2 (en) * | 2020-11-03 | 2022-05-12 | Caspr Biotech Corporation | Novel class 2 crispr-cas rna-guided endonucleases |
EP4240426A1 (en) * | 2020-11-05 | 2023-09-13 | New York University | Enhancement of predictable and template-free gene editing by the association of cas with dna polymerase |
US11512297B2 (en) | 2020-11-09 | 2022-11-29 | Inscripta, Inc. | Affinity tag for recombination protein recruitment |
AU2021405281A1 (en) | 2020-12-22 | 2023-07-06 | CureVac SE | Rna vaccine against sars-cov-2 variants |
CA3204158A1 (en) * | 2021-01-04 | 2022-07-07 | Juhan Kim | Mad nucleases |
JP2024502387A (ja) * | 2021-01-05 | 2024-01-18 | マーチ・セラピューティクス,インコーポレーテッド | 核酸を検出するための方法 |
US11332742B1 (en) | 2021-01-07 | 2022-05-17 | Inscripta, Inc. | Mad nucleases |
IL305036A (en) * | 2021-02-08 | 2023-10-01 | Emendobio Inc | A CRISPR nuclease called OMNI 103 |
US11884924B2 (en) | 2021-02-16 | 2024-01-30 | Inscripta, Inc. | Dual strand nucleic acid-guided nickase editing |
WO2022272294A1 (en) * | 2021-06-23 | 2022-12-29 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods for efficient retron recruitment to dna breaks |
IL310732A (en) * | 2021-08-13 | 2024-04-01 | Emendobio Inc | New CRSPR nucleases OMNI 115, 124, 127, 144-149, 159, 218, 237, 248, 251-253 and 251 |
IL309505A (en) | 2021-09-03 | 2024-02-01 | CureVac SE | Lipid nanoparticles for nucleic acid delivery |
WO2023102407A2 (en) * | 2021-12-01 | 2023-06-08 | Emendobio Inc. | Engineered high activity omni-79 nuclease variants |
WO2023114953A2 (en) * | 2021-12-17 | 2023-06-22 | Beam Therapeutics Inc. | Novel crispr enzymes, methods, systems and uses thereof |
WO2023139557A1 (en) * | 2022-01-24 | 2023-07-27 | LifeEDIT Therapeutics, Inc. | Rna-guided nucleases and active fragments and variants thereof and methods of use |
WO2023150637A1 (en) * | 2022-02-02 | 2023-08-10 | Inscripta, Inc. | Nucleic acid-guided nickase fusion proteins |
CN114807104B (zh) * | 2022-04-11 | 2024-02-20 | 西南大学 | 肺炎克雷伯菌噬菌体裂解酶及其制备方法和应用 |
WO2024042165A2 (en) * | 2022-08-26 | 2024-02-29 | UCB Biopharma SRL | Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases |
Family Cites Families (163)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5534499A (en) | 1994-05-19 | 1996-07-09 | The University Of British Columbia | Lipophilic drug derivatives for use in liposomes |
US5820873A (en) | 1994-09-30 | 1998-10-13 | The University Of British Columbia | Polyethylene glycol modified ceramide lipids and liposome uses thereof |
US5885613A (en) | 1994-09-30 | 1999-03-23 | The University Of British Columbia | Bilayer stabilizing components and their use in forming programmable fusogenic liposomes |
US6320017B1 (en) | 1997-12-23 | 2001-11-20 | Inex Pharmaceuticals Corp. | Polyamide oligomers |
ES2340532T3 (es) | 2001-06-05 | 2010-06-04 | Curevac Gmbh | Arnm con un contenido g/c aumentado que codifica para un antigeno bacteriano y utilizacion del mismo. |
EP2428571B1 (en) | 2001-09-28 | 2018-07-18 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | MicroRNA molecules |
DE10162480A1 (de) | 2001-12-19 | 2003-08-07 | Ingmar Hoerr | Die Applikation von mRNA für den Einsatz als Therapeutikum gegen Tumorerkrankungen |
DE10229872A1 (de) | 2002-07-03 | 2004-01-29 | Curevac Gmbh | Immunstimulation durch chemisch modifizierte RNA |
CA2533701A1 (en) | 2003-07-31 | 2005-02-17 | Isis Pharmaceuticals, Inc. | Oligomeric compounds and compositions for use in modulation of small non-coding rnas |
DE10335833A1 (de) | 2003-08-05 | 2005-03-03 | Curevac Gmbh | Transfektion von Blutzellen mit mRNA zur Immunstimulation und Gentherapie |
DE102004042546A1 (de) | 2004-09-02 | 2006-03-09 | Curevac Gmbh | Kombinationstherapie zur Immunstimulation |
DE102005023170A1 (de) | 2005-05-19 | 2006-11-23 | Curevac Gmbh | Optimierte Formulierung für mRNA |
DE102006035618A1 (de) | 2006-07-31 | 2008-02-07 | Curevac Gmbh | Nukleinsäure der Formel (I): GlXmGn, insbesondere als immunstimulierendes Adjuvanz |
DE102006061015A1 (de) | 2006-12-22 | 2008-06-26 | Curevac Gmbh | Verfahren zur Reinigung von RNA im präparativen Maßstab mittels HPLC |
DE102007001370A1 (de) | 2007-01-09 | 2008-07-10 | Curevac Gmbh | RNA-kodierte Antikörper |
WO2009030254A1 (en) | 2007-09-04 | 2009-03-12 | Curevac Gmbh | Complexes of rna and cationic peptides for transfection and for immunostimulation |
WO2009046739A1 (en) | 2007-10-09 | 2009-04-16 | Curevac Gmbh | Composition for treating prostate cancer (pca) |
WO2009046738A1 (en) | 2007-10-09 | 2009-04-16 | Curevac Gmbh | Composition for treating lung cancer, particularly of non-small lung cancers (nsclc) |
JP5749494B2 (ja) | 2008-01-02 | 2015-07-15 | テクミラ ファーマシューティカルズ コーポレイション | 核酸の送達のための改善された組成物および方法 |
CA2710534C (en) | 2008-01-31 | 2018-09-04 | Curevac Gmbh | Nucleic acids of formula (i) (nuglxmgnnv)a and derivatives thereof as an immunostimulating agent/adjuvant |
EP3112477A1 (en) | 2008-02-28 | 2017-01-04 | The Ohio State University Research Foundation | Microrna-based methods and compositions for the diagnosis, prognosis and treatment of prostate related disorders |
AU2009238175C1 (en) | 2008-04-15 | 2023-11-30 | Arbutus Biopharma Corporation | Novel lipid formulations for nucleic acid delivery |
WO2010037408A1 (en) | 2008-09-30 | 2010-04-08 | Curevac Gmbh | Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof |
AU2009303345B2 (en) | 2008-10-09 | 2015-08-20 | Arbutus Biopharma Corporation | Improved amino lipids and methods for the delivery of nucleic acids |
WO2010048536A2 (en) | 2008-10-23 | 2010-04-29 | Alnylam Pharmaceuticals, Inc. | Processes for preparing lipids |
JP6087504B2 (ja) | 2008-11-07 | 2017-03-01 | マサチューセッツ インスティテュート オブ テクノロジー | アミノアルコールリピドイドおよびその使用 |
HUE037082T2 (hu) | 2008-11-10 | 2018-08-28 | Arbutus Biopharma Corp | Új lipidek és készítmények terápiás hatóanyagok szállítására |
WO2010087791A1 (en) | 2009-01-27 | 2010-08-05 | Utc Power Corporation | Distributively cooled, integrated water-gas shift reactor and vaporizer |
US20120101148A1 (en) | 2009-01-29 | 2012-04-26 | Alnylam Pharmaceuticals, Inc. | lipid formulation |
JP5769701B2 (ja) | 2009-05-05 | 2015-08-26 | テクミラ ファーマシューティカルズ コーポレイションTekmira Pharmaceuticals Corporation | 脂質組成物 |
DK2440183T3 (en) | 2009-06-10 | 2018-10-01 | Arbutus Biopharma Corp | Improved lipid formulation |
EP2459231B1 (de) | 2009-07-31 | 2016-06-08 | Ethris Gmbh | Rna mit einer kombination aus unmodifizierten und modifizierten nucleotiden zur proteinexpression |
US20110053829A1 (en) | 2009-09-03 | 2011-03-03 | Curevac Gmbh | Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids |
WO2011069529A1 (en) | 2009-12-09 | 2011-06-16 | Curevac Gmbh | Mannose-containing solution for lyophilization, transfection and/or injection of nucleic acids |
WO2011127456A2 (en) | 2010-04-09 | 2011-10-13 | Pacira Pharmaceuticals, Inc. | Method for formulating large diameter synthetic membrane vesicles |
NZ605079A (en) | 2010-06-03 | 2015-08-28 | Alnylam Pharmaceuticals Inc | Biodegradable lipids for the delivery of active agents |
NZ606591A (en) | 2010-07-06 | 2015-02-27 | Novartis Ag | Cationic oil-in-water emulsions |
US20130171241A1 (en) | 2010-07-06 | 2013-07-04 | Novartis Ag | Liposomes with lipids having an advantageous pka-value for rna delivery |
EP2449113B8 (en) | 2010-07-30 | 2015-11-25 | CureVac AG | Complexation of nucleic acids with disulfide-crosslinked cationic components for transfection and immunostimulation |
WO2012019630A1 (en) | 2010-08-13 | 2012-02-16 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein |
ES2918649T3 (es) | 2010-08-31 | 2022-07-19 | Glaxosmithkline Biologicals Sa | Liposomas pegilados para el suministro de ARN que codifica un inmunógeno |
RU2577983C2 (ru) | 2010-08-31 | 2016-03-20 | Новартис Аг | Липиды, подходящие для липосомной доставки кодирующей белок рнк |
MX341989B (es) | 2010-08-31 | 2016-09-09 | Novartis Ag * | Liposomas pequeños para el suministro de arn que codifica el inmunogeno. |
WO2012089225A1 (en) | 2010-12-29 | 2012-07-05 | Curevac Gmbh | Combination of vaccination and inhibition of mhc class i restricted antigen presentation |
WO2012116715A1 (en) | 2011-03-02 | 2012-09-07 | Curevac Gmbh | Vaccination in newborns and infants |
WO2012113413A1 (en) | 2011-02-21 | 2012-08-30 | Curevac Gmbh | Vaccine composition comprising complexed immunostimulatory nucleic acids and antigens packaged with disulfide-linked polyethyleneglycol/peptide conjugates |
WO2012116714A1 (en) | 2011-03-02 | 2012-09-07 | Curevac Gmbh | Vaccination in elderly patients |
ES2861428T3 (es) | 2011-07-06 | 2021-10-06 | Glaxosmithkline Biologicals Sa | Liposomas que presentan una relación N:P útil para suministro de moléculas de ARN |
WO2013113326A1 (en) | 2012-01-31 | 2013-08-08 | Curevac Gmbh | Pharmaceutical composition comprising a polymeric carrier cargo complex and at least one protein or peptide antigen |
EP2623121A1 (en) | 2012-01-31 | 2013-08-07 | Bayer Innovation GmbH | Pharmaceutical composition comprising a polymeric carrier cargo complex and an antigen |
WO2013113325A1 (en) | 2012-01-31 | 2013-08-08 | Curevac Gmbh | Negatively charged nucleic acid comprising complexes for immunostimulation |
WO2013120497A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein |
WO2013120500A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded tumour antigen |
WO2013120499A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly (a) sequence or a polyadenylation signal for increasing the expression of an encoded pathogenic antigen |
WO2013120498A1 (en) | 2012-02-15 | 2013-08-22 | Curevac Gmbh | Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded allergenic antigen or an autoimmune self-antigen |
US9352042B2 (en) | 2012-02-24 | 2016-05-31 | Protiva Biotherapeutics, Inc. | Trialkyl cationic lipids and methods of use thereof |
ES2660459T3 (es) | 2012-03-27 | 2018-03-22 | Curevac Ag | Moléculas de ácido nucleico artificiales |
AU2013242404B2 (en) | 2012-03-27 | 2018-08-30 | CureVac SE | Artificial nucleic acid molecules for improved protein or peptide expression |
EP2831240B1 (en) * | 2012-03-27 | 2017-11-15 | CureVac AG | Artificial nucleic acid molecules comprising a 5'top utr |
CN104321432B (zh) | 2012-03-27 | 2018-08-10 | 库瑞瓦格股份公司 | 包含5′top utr的人工核酸分子 |
EA038924B1 (ru) | 2012-05-25 | 2021-11-10 | Те Риджентс Оф Те Юниверсити Оф Калифорния | Способы и композиции рнк-специфической модификации днк-мишени и рнк-специфической модуляции транскрипции |
US20150306249A1 (en) | 2012-05-25 | 2015-10-29 | Curevac Gmbh | Reversible immobilization and/or controlled release of nucleic acid containing nanoparticles by (biodegradable) polymer coatings |
CA2897941A1 (en) | 2013-01-17 | 2014-07-24 | Moderna Therapeutics, Inc. | Signal-sensor polynucleotides for the alteration of cellular phenotypes |
CN109045289A (zh) | 2013-02-22 | 2018-12-21 | 库瑞瓦格股份公司 | 疫苗接种和抑制pd-1途径的组合 |
AU2014235794A1 (en) | 2013-03-14 | 2015-10-22 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
CA2915834A1 (en) | 2013-06-17 | 2014-12-24 | Massachusetts Institute Of Technology | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
DK3019619T3 (da) | 2013-07-11 | 2021-10-11 | Modernatx Inc | Sammensætninger, der omfatter syntetiske polynukleotider, som koder for crispr-beslægtede proteiner, og syntetiske sgrna'er, og anvendelsesfremgangsmåder |
JP6896421B2 (ja) | 2013-08-21 | 2021-06-30 | キュアバック アーゲー | 呼吸器合胞体ウイルス(rsv)ワクチン |
RU2016109938A (ru) | 2013-08-21 | 2017-09-26 | Куревак Аг | Композиция и вакцина для лечения рака предстательной железы |
WO2015024667A1 (en) | 2013-08-21 | 2015-02-26 | Curevac Gmbh | Method for increasing expression of rna-encoded proteins |
CA2915712A1 (en) | 2013-08-21 | 2015-02-26 | Margit SCHNEE | Rabies vaccine |
SG11201510748PA (en) | 2013-08-21 | 2016-03-30 | Curevac Ag | Composition and vaccine for treating lung cancer |
CA2915730A1 (en) | 2013-08-21 | 2015-02-26 | Karl-Josef Kallen | A combination rsv/influenza a vaccine |
ES2806575T3 (es) | 2013-11-01 | 2021-02-18 | Curevac Ag | ARN modificado con propiedades inmunoestimuladoras disminuidas |
AU2014348212C1 (en) | 2013-11-18 | 2018-11-29 | Arcturus Therapeutics, Inc. | Ionizable cationic lipid for RNA delivery |
US20170173128A1 (en) | 2013-12-06 | 2017-06-22 | Moderna TX, Inc. | Targeted adaptive vaccines |
WO2015101415A1 (en) | 2013-12-30 | 2015-07-09 | Curevac Gmbh | Artificial nucleic acid molecules |
SG11201603144QA (en) | 2013-12-30 | 2016-07-28 | Curevac Ag | Artificial nucleic acid molecules |
AU2014375404C1 (en) | 2013-12-30 | 2020-11-19 | CureVac Manufacturing GmbH | Methods for RNA analysis |
CA2935878C (en) | 2014-03-12 | 2023-05-02 | Curevac Ag | Combination of vaccination and ox40 agonists |
CA2936286A1 (en) | 2014-04-01 | 2015-10-08 | Curevac Ag | Polymeric carrier cargo complex for use as an immunostimulating agent or as an adjuvant |
MX2016016170A (es) | 2014-06-10 | 2017-03-28 | Curevac Ag | Metodos y medios para aumentar la produccion de arn. |
SI3766916T1 (sl) | 2014-06-25 | 2023-01-31 | Acuitas Therapeutics Inc. | Formulacije novih lipidov in lipidnih nanodelcev za dostavo nukleinskih kislin |
DE202015010000U1 (de) | 2014-12-12 | 2023-07-03 | CureVac SE | Artifizielle Nukleinsäuremoleküle für eine verbesserte Proteinexpression |
EP3233113A1 (en) | 2014-12-16 | 2017-10-25 | CureVac AG | Ebolavirus and marburgvirus vaccines |
EP3233132A4 (en) | 2014-12-19 | 2018-06-27 | Modernatx, Inc. | Terminal modifications of polynucleotides |
AU2015373404B2 (en) * | 2014-12-30 | 2021-09-09 | CureVac SE | Artificial nucleic acid molecules |
WO2016165825A1 (en) | 2015-04-13 | 2016-10-20 | Curevac Ag | Method for producing rna compositions |
WO2016165831A1 (en) | 2015-04-17 | 2016-10-20 | Curevac Ag | Lyophilization of rna |
JP6912384B2 (ja) | 2015-04-22 | 2021-08-04 | キュアバック アーゲー | 癌疾患の処置のための、rna含有組成物 |
SG11201708867UA (en) | 2015-04-30 | 2017-11-29 | Curevac Ag | Immobilized poly(n)polymerase |
SG11201708681SA (en) | 2015-04-30 | 2017-11-29 | Curevac Ag | Method for in vitro transcription using an immobilized restriction enzyme |
US10179918B2 (en) * | 2015-05-07 | 2019-01-15 | Sangamo Therapeutics, Inc. | Methods and compositions for increasing transgene activity |
EP3294885B1 (en) | 2015-05-08 | 2020-07-01 | CureVac Real Estate GmbH | Method for producing rna |
US11559570B2 (en) | 2015-05-15 | 2023-01-24 | CureVac SE | Prime-boost regimens involving administration of at least one mRNA construct |
WO2016184575A1 (en) | 2015-05-20 | 2016-11-24 | Curevac Ag | Dry powder composition comprising long-chain rna |
EP3297682B1 (en) | 2015-05-20 | 2021-07-14 | CureVac AG | Dry powder composition comprising long-chain rna |
EP4098743A1 (en) | 2015-05-29 | 2022-12-07 | CureVac AG | Method for adding cap structures to rna using immobilized enzymes |
EP3744843A1 (en) | 2015-05-29 | 2020-12-02 | CureVac Real Estate GmbH | A method for producing and purifying rna, comprising at least one step of tangential flow filtration |
US20180245074A1 (en) | 2015-06-04 | 2018-08-30 | Protiva Biotherapeutics, Inc. | Treating hepatitis b virus infection using crispr |
WO2016203025A1 (en) | 2015-06-17 | 2016-12-22 | Curevac Ag | Vaccine composition |
EP4239080A3 (en) | 2015-07-01 | 2023-11-01 | CureVac Manufacturing GmbH | Method for analysis of an rna molecule |
US10501768B2 (en) | 2015-07-13 | 2019-12-10 | Curevac Ag | Method of producing RNA from circular DNA and corresponding template DNA |
US20200085852A1 (en) | 2015-08-05 | 2020-03-19 | Curevac Ag | Epidermal mrna vaccine |
EP3332019B1 (en) | 2015-08-07 | 2019-12-18 | CureVac AG | Process for the in vivo production of rna in a host cell |
CN108138187B (zh) | 2015-08-10 | 2022-07-19 | 库瑞瓦格房地产有限公司 | 增加环状dna分子复制的方法 |
CN108026537B (zh) * | 2015-08-28 | 2022-02-08 | 库瑞瓦格股份公司 | 人工核酸分子 |
EP4276189A3 (en) | 2015-09-21 | 2024-01-17 | TriLink BioTechnologies, LLC | Initiating capped oligonucleotide primers for synthesizing 5'-capped rnas |
EP3362576A1 (en) | 2015-10-12 | 2018-08-22 | CureVac AG | Automated method for isolation, selection and/or detection of microorganisms or cells comprised in a solution |
CN113636947A (zh) | 2015-10-28 | 2021-11-12 | 爱康泰生治疗公司 | 用于递送核酸的新型脂质和脂质纳米颗粒制剂 |
US20180312545A1 (en) | 2015-11-09 | 2018-11-01 | Curevac Ag | Optimized nucleic acid molecules |
WO2017081110A1 (en) | 2015-11-09 | 2017-05-18 | Curevac Ag | Rotavirus vaccines |
WO2017108087A1 (en) | 2015-12-21 | 2017-06-29 | Curevac Ag | Inlay for a culture plate and corresponding method for preparing a culture plate system with such inlay |
EP3701963A1 (en) | 2015-12-22 | 2020-09-02 | CureVac AG | Method for producing rna molecule compositions |
WO2017109161A1 (en) | 2015-12-23 | 2017-06-29 | Curevac Ag | Method of rna in vitro transcription using a buffer containing a dicarboxylic acid or tricarboxylic acid or a salt thereof |
EP3414340B1 (en) | 2016-02-12 | 2023-08-09 | CureVac SE | Method for analyzing rna |
EP3417069A1 (en) | 2016-02-15 | 2018-12-26 | CureVac AG | Method for analyzing by-products of rna in vitro transcription |
SG11201806340YA (en) | 2016-02-17 | 2018-09-27 | Curevac Ag | Zika virus vaccine |
US11920174B2 (en) | 2016-03-03 | 2024-03-05 | CureVac SE | RNA analysis by total hydrolysis and quantification of released nucleosides |
WO2017162297A1 (en) | 2016-03-24 | 2017-09-28 | Curevac Ag | Immobilized inorganic pyrophosphatase (ppase) |
EP3445392A1 (en) | 2016-04-22 | 2019-02-27 | CureVac AG | Rna encoding a tumor antigen |
EP3448427A1 (en) | 2016-04-29 | 2019-03-06 | CureVac AG | Rna encoding an antibody |
EP3452086A1 (en) | 2016-05-04 | 2019-03-13 | CureVac AG | Influenza mrna vaccines |
EP3452101A2 (en) | 2016-05-04 | 2019-03-13 | CureVac AG | Rna encoding a therapeutic protein |
WO2017191264A1 (en) | 2016-05-04 | 2017-11-09 | Curevac Ag | Nucleic acid molecules and uses thereof |
US20180126003A1 (en) | 2016-05-04 | 2018-05-10 | Curevac Ag | New targets for rna therapeutics |
US20190275170A1 (en) | 2016-05-18 | 2019-09-12 | Modernatx, Inc. | Polynucleotides encoding jagged1 for the treatment of alagille syndrome |
MA45053A (fr) | 2016-05-18 | 2019-03-27 | Modernatx Inc | Polynucléotides codant pour un régulateur de conductance transmembranaire de fibrose kystique pour le traitement de la fibrose kystique |
JP7210287B2 (ja) | 2016-05-18 | 2023-01-23 | モダーナティエックス・インコーポレイテッド | Ii型シトルリン血症の治療のためのシトリンをコードするポリヌクレオチド |
CA3024624A1 (en) | 2016-05-18 | 2017-11-23 | Modernatx, Inc. | Polynucleotides encoding porphobilinogen deaminase for the treatment of acute intermittent porphyria |
WO2017201348A1 (en) | 2016-05-18 | 2017-11-23 | Modernatx, Inc. | Polynucleotides encoding galactose-1-phosphate uridylyltransferase for the treatment of galactosemia type 1 |
WO2017201332A1 (en) | 2016-05-18 | 2017-11-23 | Modernatx, Inc. | Polynucleotides encoding acyl-coa dehydrogenase, very long-chain for the treatment of very long-chain acyl-coa dehydrogenase deficiency |
EP3458590B9 (en) | 2016-05-18 | 2021-08-18 | ModernaTX, Inc. | Polynucleotides encoding -galactosidase a for the treatment of fabry disease |
EP3464619A1 (en) | 2016-05-25 | 2019-04-10 | CureVac AG | Novel biomarkers |
US20190336611A1 (en) | 2016-06-09 | 2019-11-07 | Curevac Ag | Hybrid carriers for nucleic acid cargo |
EP3468609A1 (en) | 2016-06-09 | 2019-04-17 | CureVac AG | Cationic carriers for nucleic acid delivery |
WO2017212009A1 (en) | 2016-06-09 | 2017-12-14 | Curevac Ag | Hybrid carriers for nucleic acid cargo |
US20190381180A1 (en) | 2016-06-09 | 2019-12-19 | Curevac Ag | Hybrid carriers for nucleic acid cargo |
SG10201913631TA (en) | 2016-08-19 | 2020-03-30 | Curevac Ag | Rna for cancer therapy |
BR112019008481A2 (pt) | 2016-10-26 | 2020-03-03 | Curevac Ag | Vacinas de mrna de nanopartículas lipídicas |
US11279923B2 (en) | 2016-11-28 | 2022-03-22 | Curevac Ag | Method for purifying RNA |
WO2018104540A1 (en) | 2016-12-08 | 2018-06-14 | Curevac Ag | Rnas for wound healing |
CN110582304A (zh) | 2016-12-08 | 2019-12-17 | 库尔维科公司 | 用于治疗或预防肝脏疾病的rna |
WO2018115507A2 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Henipavirus vaccine |
WO2018115525A1 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Lassa virus vaccine |
WO2018115527A2 (en) | 2016-12-23 | 2018-06-28 | Curevac Ag | Mers coronavirus vaccine |
EP3595715A1 (en) | 2017-03-17 | 2020-01-22 | CureVac AG | Rna vaccine and immune checkpoint inhibitors for combined anticancer therapy |
US20230064106A1 (en) | 2017-05-17 | 2023-03-02 | Curevac Real Estate Gmbh | Method for determining at least one quality parameter of an rna sample |
BR112019028280A2 (pt) | 2017-07-04 | 2020-07-14 | Curevac Ag | moléculas de ácido nucleico |
EP3673069A1 (en) | 2017-08-22 | 2020-07-01 | CureVac AG | Bunyavirales vaccine |
JP2021500863A (ja) | 2017-09-29 | 2021-01-14 | インテリア セラピューティクス,インコーポレイテッド | ゲノム編集用のポリヌクレオチド、組成物および方法 |
MX2020003995A (es) | 2017-10-19 | 2020-07-22 | Curevac Ag | Nuevas moleculas de acido nucleico artificiales. |
US11692002B2 (en) | 2017-11-08 | 2023-07-04 | CureVac SE | RNA sequence adaptation |
US11931406B2 (en) | 2017-12-13 | 2024-03-19 | CureVac SE | Flavivirus vaccine |
SG11202005760PA (en) | 2017-12-21 | 2020-07-29 | Curevac Ag | Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna |
EP3773702A2 (en) | 2018-04-05 | 2021-02-17 | CureVac AG | Novel yellow fever nucleic acid molecules for vaccination |
SG11202008225PA (en) | 2018-04-17 | 2020-11-27 | Curevac Ag | Novel rsv rna molecules and compositions for vaccination |
WO2020002525A1 (en) | 2018-06-27 | 2020-01-02 | Curevac Ag | Novel lassa virus rna molecules and compositions for vaccination |
MX2020013148A (es) | 2018-06-28 | 2021-03-02 | CureVac RNA Printer GmbH | Biorreactor para la transcripcion in vitro de arn. |
TW202039534A (zh) | 2018-12-14 | 2020-11-01 | 美商美國禮來大藥廠 | KRAS變體mRNA分子 |
SG11202106666UA (en) | 2018-12-21 | 2021-07-29 | Curevac Ag | Methods for rna analysis |
CN113453707A (zh) | 2018-12-21 | 2021-09-28 | 库瑞瓦格股份公司 | 用于疟疾疫苗的rna |
-
2018
- 2018-03-23 JP JP2019551949A patent/JP2020513824A/ja active Pending
- 2018-03-23 CA CA3050616A patent/CA3050616A1/en active Pending
- 2018-03-23 CN CN201880020941.8A patent/CN110914433A/zh active Pending
- 2018-03-23 SG SG10202110491PA patent/SG10202110491PA/en unknown
- 2018-03-23 KR KR1020197030080A patent/KR20190133699A/ko not_active Application Discontinuation
- 2018-03-23 AU AU2018240515A patent/AU2018240515A1/en active Pending
- 2018-03-23 EP EP18713883.9A patent/EP3601576A1/en active Pending
- 2018-03-23 BR BR112019015244A patent/BR112019015244A2/pt unknown
- 2018-03-23 US US16/496,518 patent/US11739335B2/en active Active
- 2018-03-23 WO PCT/EP2018/057552 patent/WO2018172556A1/en active Application Filing
- 2018-03-23 SG SG11201906297Q patent/SG11201906297QA/en unknown
- 2018-03-23 MX MX2019011215A patent/MX2019011215A/es unknown
-
2023
- 2023-07-03 US US18/346,686 patent/US20230332163A1/en active Pending
- 2023-12-26 JP JP2023219252A patent/JP2024038121A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN110914433A (zh) | 2020-03-24 |
EP3601576A1 (en) | 2020-02-05 |
RU2019132890A (ru) | 2021-04-26 |
SG11201906297QA (en) | 2019-10-30 |
MX2019011215A (es) | 2020-02-12 |
US20210403925A1 (en) | 2021-12-30 |
JP2024038121A (ja) | 2024-03-19 |
US20230332163A1 (en) | 2023-10-19 |
RU2019132890A3 (pt) | 2021-07-14 |
SG10202110491PA (en) | 2021-11-29 |
CA3050616A1 (en) | 2018-09-27 |
AU2018240515A1 (en) | 2019-08-01 |
WO2018172556A1 (en) | 2018-09-27 |
KR20190133699A (ko) | 2019-12-03 |
US11739335B2 (en) | 2023-08-29 |
JP2020513824A (ja) | 2020-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112019015244A2 (pt) | ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos | |
US20230158126A1 (en) | Rna for treatment or prophylaxis of a liver disease | |
JP6666391B2 (ja) | 化学修飾mRNA | |
US20220296628A1 (en) | Rna combinations and compositions with decreased immunostimulatory properties | |
US20220340886A1 (en) | Therapeutics for glycogen storage disease type iii | |
WO2016011306A2 (en) | Terminal modifications of polynucleotides | |
WO2016022914A1 (en) | Compositions and methods for the treatment of ophthalmic diseases and conditions | |
WO2016100812A1 (en) | Terminal modifications of polynucleotides | |
WO2013056670A1 (zh) | 小干扰RNA及其应用和抑制plk1基因表达的方法 | |
CA3184474A1 (en) | Phenylalanine hydroxylase variants and uses thereof | |
CA3171750A1 (en) | Mrnas for treatment or prophylaxis of liver diseases | |
WO2023219933A1 (en) | Compositions and methods for delivery of nucleic acid therapeutics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] |