BR112021013173A2 - Sistemas e métodos para modular rna - Google Patents

Sistemas e métodos para modular rna Download PDF

Info

Publication number
BR112021013173A2
BR112021013173A2 BR112021013173-6A BR112021013173A BR112021013173A2 BR 112021013173 A2 BR112021013173 A2 BR 112021013173A2 BR 112021013173 A BR112021013173 A BR 112021013173A BR 112021013173 A2 BR112021013173 A2 BR 112021013173A2
Authority
BR
Brazil
Prior art keywords
rna
target
normalized
grna
protein
Prior art date
Application number
BR112021013173-6A
Other languages
English (en)
Inventor
Bryan C. Dickinson
Simone Rauch
Original Assignee
The University Of Chicago
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The University Of Chicago filed Critical The University Of Chicago
Publication of BR112021013173A2 publication Critical patent/BR112021013173A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Virology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Immunology (AREA)
  • Veterinary Medicine (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Medicinal Preparation (AREA)

Abstract

sistemas e métodos para modular rna. os aspectos da revelação se referem a um sistema regulador de rna compreendendo pelo menos um de cada: i) um domínio de ligação a grampo de rna; ii) uma molécula de alvejamento de rna compreendendo uma região de alvejamento de rna e pelo menos uma estrutura de grampo, em que a estrutura de grampo da molécula de alvejamento de rna especificamente se liga a i; e iii) um domínio regulador de rna.

Description

“SISTEMAS E MÉTODOS PARA MODULAR RNA” REFERÊNCIA CRUZADA AOS PEDIDOS RELACIONADOS
[001] Este pedido reivindica o benefício de prioridade do Pedido de Patente Provisório U.S. No 62/788.571 depositado em 4 de janeiro de 2019, Pedido de Patente Provisório U.S. No 62/831.342 depositado em 9 de abril de 2019, Pedido de Patente Provisório U.S. No 62/903.080 depositado em 20 de setembro de 2019 e Pedido de Patente Provisório U.S. No 62/929.339 depositado em 1 de novembro de 2019, todos os quais são, por meio deste, incorporados por referência em sua totalidade.
DECLARAÇÃO DE SUPORTE GOVERNAMENTAL
[002] Esta invenção foi feita com suporte governamental sob GM119840 e HG008935 concedido pelo The National Institutes of Health. O governo tem certos direitos sobre a invenção.
FUNDAMENTOS DA INVENÇÃO
1. Campo da Invenção
[003] A presente invenção geralmente se refere ao campo de química e medicina. Mais particularmente, ela diz respeito ao uso de um sistema para modular RNA.
2. Descrição da Técnica Relacionada
[004] Proteínas de ligação a ácido nucleico programáveis revolucionaram estudos do genoma e tecnologias de edição (Chandrasegaran e Carroll, 2016; Filipovska et al., 2011; Gootenberg et al., 2018; Hilton et al., 2015; Joung e Sander, 2012; Kearns et al., 2015; Strutt et al., 2018) e estão abrindo novas oportunidades terapêuticas para tratar doenças humanas (Liao et al., 2017; Monteys et al., 2017). Em particular, o sistema de CRISPR/Cas9, que evoluiu como um mecanismo de defesa imunológica bacteriana, transformou a capacidade de estudar e manipular o DNA celular especificamente no sítio (Cong et al., 2013; Jiang et al., 2013; O’Connell et al., 2014; Wiedenheft et al., 2012). Uma vantagem chave de sistemas de
CRISPR/Cas em comparação a métodos prévios (Desjarlais e Berg, 1993; Hockemeyer et al., 2011; Joung e Sander, 2012; Schierling et al., 2012) é que eles são facilmente programáveis para alvejar virtualmente qualquer loco de interesse. O sistema de CRISPR/Cas é um complexo de ribonucleoproteína que usa interações de pares de base de um RNA guia exibido (gRNA) para interagir com uma sequência de ácidos nucleicos alvo. A natureza simples de alvejamento guiado por pares de base abre a possibilidade de programar sistemas para interagir com uma sequência de ácidos nucleicos definida simplesmente mudando-se a sequência de ácidos nucleicos na fita de guia.
[005] Embora o alvejamento do DNA diretamente tenha profundas ramificações clínicas, doenças que envolvem alterações sutis a muitos genes serão desafiadoras de alvejar usando tecnologias de edição de DNA (Fuxman Bass et al., 2015). Adicionalmente, os efeitos colaterais potenciais ou riscos de alteração genética permanente podem não ser tolerados. Por exemplo, os genes que podem ser almejados para alvejar para ativar uma resposta realçada de cura do ferimento são provavelmente alvos que podem apresentar um risco para o desenvolvimento de câncer, tornando arriscada a estratégia com base em DNA permanente. O alvejamento do fluxo de informações ao nível de RNA apresenta várias oportunidades para intervenção terapêutica, incluindo mas não limitadas à capacidade de interromper o tratamento se surgirem efeitos colaterais, a capacidade de alvejar genes que seriam muito arriscados de alterar ao nível de DNA e a capacidade de manipular a expressão gênica sem alterações permanentes ao genoma do hospedeiro. Embora inibir ou realçar a transcrição ao nível do genoma forneça uma possibilidade de controlar a expressão gênica (Du et al., 2017; Fuxman Bass et al., 2015; Qi et al., 2013), mecanismos reguladores epitranscriptômicos de RNA recentemente descobertos oferecem uma ampla faixa de processos reguladores de RNA para alvejar, incluindo edição, degradação, transporte e tradução de transcritos de RNA
(Nishikura, 2010; Roundtree et al., 2017; Zhao et al., 2017). Embora os mecanismos e consequências desta camada reguladora epitranscriptômica estejam apenas começando a ser descobertos, é evidente que o fluxo de informações através do RNA é rigidamente regulado, oferecendo muitas novas oportunidades tanto para descobertas de pesquisa básicas bem como desenvolvimento terapêutico.
[006] Ferramentas de alvejamento de RNA programável análogas aos sistemas de alvejamento de DNA de dCas9 são uma grande promessa para estudar os mecanismos de regulação epitranscriptômica e para aplicações terapêuticas. As ferramentas atuais para o alvejamento de RNA envolvem a liberação de grandes complexos e apresentam problemas de imunogenicidade. A partir de uma perspectiva de ciência básica, o tamanho grande do veículo de liberação pode levar a perturbações potenciais ao RNA sob interrogatório, complicando o estudo de mecanismos reguladores de RNA. A partir de uma perspectiva traducional, o tamanho grande apresenta desafios para o empacotamento viral ou liberação direta de proteína. Adicionalmente, embora terapias de edição de DNA provavelmente consistissem de um tratamento único e irreversível, terapias de alvejamento de RNA precisarão ser continuamente administradas, tornando as questões de liberação especialmente importantes. Além disso, foi recentemente descoberto que 85 % das pessoas já têm anticorpos circulantes para proteínas CRISPR/Cas (Kim et al., 2018; Wagner et al., 2018), sugerindo que problemas de imunogenicidade podem ser problemáticos em aplicações clínicas. Portanto, existe uma necessidade na técnica de sistemas melhorados que podem alvejar o RNA e ser liberados eficientemente sem ativar uma resposta imune.
SUMÁRIO DA INVENÇÃO
[007] Para superar o tamanho grande e a natureza microbianamente derivada de sistemas de alvejamento de RNA atuais, os inventores apresentam um sistema de alvejamento de RNA inspirado em CRISPR/Cas (CIRTS), um método geral para a engenharia de proteínas efetoras de RNA programável. Similar a sistemas com base em CRISPR/Cas, CIRTS é um complexo de ribonucleoproteína que usa interações de pares de base de Watson-Crick-Franklin para liberar a carga de proteína seletivamente no sítio do transcriptoma. Os inventores mostram que podem facilmente engendrar CIRTS que liberam uma faixa ou proteínas reguladoras aos transcritos, incluindo nucleases para degradação, maquinaria reguladora de desadenilação para degradação ou maquinaria de ativação traducional para produção realçada de proteína. Entretanto, CIRTS são até 5 vezes menores do que os menores sistemas de CRISPR/Cas atuais e podem ser engendrados inteiramente a partir de partes humanas.
[008] Os aspectos da revelação se referem a um sistema ou método regulador de RNA compreendendo pelo menos um de cada: i) um domínio de ligação a grampo de RNA; ii) uma molécula de alvejamento de RNA compreendendo uma região de alvejamento de RNA e pelo menos uma estrutura de grampo, em que a estrutura de grampo da molécula de alvejamento de RNA especificamente se liga a i; e iii) um domínio regulador de RNA. Em algumas modalidades, os seguintes são incluídos: i) e ii), i) e iii), ii) e iii) ou i), ii) e iii). Qualquer modalidade revelada na presente invenção pode conter qualquer uma destas combinações.
[009] Outros aspectos se referem a um sistema de vetor compreendendo um ou mais vetores de ácido nucleico compreendendo um nucleotídeo que codifica: i) um domínio de ligação a grampo de RNA; ii) uma molécula de alvejamento de RNA compreendendo uma região de alvejamento de RNA e pelo menos uma estrutura de grampo, em que a estrutura de grampo da molécula de alvejamento de RNA especificamente se liga a i) e iii) um domínio regulador de RNA.
[010] Outros aspectos se referem a uma proteína de fusão compreendendo uma proteína de ligação a grampo de RNA e um domínio regulador de RNA e ácidos nucleicos que codificam tais proteínas de fusão.
[011] Outros aspectos se referem a um conjugado compreendendo um domínio regulador de RNA operavelmente ligado a uma molécula de alvejamento de RNA, em que a molécula de alvejamento de RNA compreende uma região de alvejamento de RNA e pelo menos uma estrutura de grampo. Em algumas modalidades, o domínio regulador de RNA e a molécula de alvejamento de RNA são operavelmente ligados através de uma ligação peptídica. Em algumas modalidades, o polipeptídeo compreende ainda um ou mais ligantes. Em algumas modalidades, o domínio regulador de RNA e a molécula de alvejamento de RNA são operavelmente ligados através de interações não covalentes. Em algumas modalidades, o domínio regulador de RNA é covalentemente ligado a um primeiro domínio de dimerização e a molécula de alvejamento de RNA é covalentemente ligada a um segundo domínio de dimerização e em que o primeiro e o segundo domínios de dimerização são capazes de dimerizar para formar uma ligação não covalente ou covalente. Em algumas modalidades, o conjugado compreende um ou mais sinais de localização nuclear (NLS).
[012] Ainda outros aspectos se referem a um veículo de liberação compreendendo um sistema da revelação. Em algumas modalidades, o veículo de liberação compreende lipossoma(s), partícula(s), exossoma(s), microvesícula(s), uma pistola gênica ou um ou mais vetores de ácido nucleico.
[013] Outros aspectos se referem a uma composição ou uma célula compreendendo um sistema, veículo de liberação ou proteína de fusão da revelação.
[014] Outros aspectos se referem a um método para modular pelo menos um RNA alvo compreendendo contatar o RNA alvo com um sistema, composição ou proteína de fusão da revelação. Em algumas modalidades, modulação de pelo menos um RNA alvo compreende clivagem, desmetilação, metilação, ativação da tradução, repressão da tradução, promoção da degradação ou ligação ao RNA. Em algumas modalidades, pelo menos dois RNAs alvos estão modulando. Em algumas modalidades, pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 ou 25 (ou qualquer faixa derivável) RNAs alvos são modulados. Em algumas modalidades, os RNAs múltiplos são modulados pelo mesmo domínio regulador de RNA ou por um domínio regulador com a mesma atividade. Em algumas modalidades, os diferentes RNAs alvos são modulados com uma diferente atividade, tal como por clivagem, desmetilação, metilação, ativação da tradução, repressão da tradução, promoção da degradação ou ligação ao RNA.
[015] Em algumas modalidades, o domínio regulador de RNA não se liga ao RNA. Em algumas modalidades, o domínio regulador de RNA compreende um polipeptídeo que não têm atividade de ligação a RNA. Em algumas modalidades, o domínio regulador de RNA não se liga ao RNA modificado. Em algumas modalidades, o domínio regulador de RNA não se liga ao RNA modificado por m6A.
[016] Outros aspectos se referem a uma célula ou progênie da mesma compreendendo RNA alvo modulado, em que o RNA alvo foi modulado de acordo com um método da revelação. Outros aspectos se referem a um organismo multicelular compreendendo uma ou mais células da revelação. Outros aspectos se referem a uma planta ou animal compreendendo uma ou mais células da revelação. Outros aspectos se referem a um kit compreendendo um sistema, vetor, veículo de liberação ou proteína de fusão da revelação.
[017] Outros aspectos se referem a um método para modular um RNA alvo em um indivíduo, o método compreendendo administrar um sistema ou composição da revelação ao indivíduo.
[018] O termo “grampo de RNA” se refere a uma molécula de RNA com pareamento de base intramolecular de haste-alça. Um grampo pode ocorrer quando duas regiões da mesma fita, usualmente complementares em sequência de nucleotídeos quando lidas em direções opostas, formam um par de base para formar uma dupla hélice que termina em uma alça não pareada. A revelação se refere a moléculas de alvejamento de RNA engendradas compreendendo uma região de alvejamento de RNA e um ou mais grampos. Consequentemente, as moléculas de RNA engendradas da revelação são moléculas quiméricas que não estão ocorrendo naturalmente.
[019] O termo “região de alvejamento de RNA” se refere a uma região do RNA que é capaz de hibridizar a um RNA alvo. O RNA alvo pode ser um RNA associado à doença ou um que é um alvo de modulação de acordo com os sistemas e métodos atuais.
[020] O “domínio regulador de RNA” se refere a um peptídeo ou polipeptídeo que tem atividade dirigida ao RNA. Exemplos de atividade incluem atividade de metilação, atividade de ligação a RNA, atividade de nuclease e atividade de ativação ou repressão traducional. Outros exemplos de atividades e proteínas compreendendo domínios reguladores de RNA são descritos por toda a revelação.
[021] Em algumas modalidades, o domínio de ligação a grampo de RNA e o domínio regulador de RNA são operavelmente ligados. O termo “operavelmente ligado” se refere à duas proteínas que são ligadas através de interações covalentes ou não covalentes. Por exemplo, as duas proteínas podem ser covalentemente ligadas através de uma ligação peptídica. Em algumas modalidades, as proteínas não são covalentemente ligadas. Uma ou mais proteínas da revelação podem ser operavelmente ligadas a uma outra proteína através de ligação a um par de proteínas acessórias que têm uma forte afinidade por uma outra. Tais proteínas acessórias são conhecidas na técnica. Por exemplo, o SunTag é um tal sistema que inclui um anticorpo com uma forte afinidade por um peptídeo. Uma proteína, polipeptídeo ou domínio da revelação podem ser ligados a um peptídeo de SunTag e uma outra proteína, polipeptídeo ou domínio da revelação podem ser ligados a um anticorpo para permitir a ligação operável das duas proteínas, polipeptídeos ou domínios através da interação do peptídeo de SunTag e anticorpo. Outros exemplos incluem biotina e avidina/estreptavidina e spytag e spycatcher.
[022] Em algumas modalidades, o sistema é induzível fornecendo-se o domínio regulador de RNA e o domínio de ligação a grampo como dois polipeptídeos não ligados que se tornam ligados após a presença de um estimulante. A indução pode ser, por exemplo, por indução de luz ou por indução química. Tal indutibilidade permite a ativação da regulação do RNA em um momento desejado no tempo. Em algumas modalidades, o domínio regulador de RNA é covalentemente ligado a um primeiro domínio de dimerização e o domínio de ligação a grampo de RNA é covalentemente ligado a um segundo domínio de dimerização e em que o primeiro e segundo domínios de dimerização são capazes de dimerizar para formar uma ligação não covalente ou covalente. Em algumas modalidades, a dimerização é induzível. Em alguns aspectos, a dimerização é induzida através da ligação dos domínios de dimerização a um ligante. O termo induzível se refere à dimerização que é formada em resposta a um estímulo, tal como um ligante, um produto químico, uma mudança de temperatura ou luz, por exemplo.
[023] A indutibilidade de luz é, por exemplo, obtida designando-se um complexo de fusão em que o primeiro e o segundo domínios de dimerização compreendem CRY2PHR e CIBN. Este sistema é particularmente útil para indução de luz de interações proteicas em células vivas e é ainda descrito em Konermann S, et al. Nature. 2013;500:472 - 476, que é incorporado aqui por referência.
[024] Domínios de dimerização adequados e ligantes correspondentes são conhecidos na técnica. Por exemplo, Liang, F.S., Ho, W.Q. e Crabtree, G.R. (2011). Engineering the ABA plant stress pathway for regulation of induced proximity. Sci. Signal. 4, rs2, que é incorporado por referência, descreve sistemas de dimerização/ligante adequados que são úteis nas modalidades da revelação. Em algumas modalidades, um do primeiro ou segundo domínio de dimerização compreende PYR/PYR1-like (PYL1), o outro do primeiro ou segundo domínio compreende ABA insensitive 1 (ABI1) e o ligante compreende ácido abscísico (ABA) ou derivados ou fragmentos do mesmo. O domínio de dimerização pode ser um fragmento ou porção da proteína integral e pode ser um substituído ou modificado. Em algumas modalidades, o primeiro e/ou o segundo domínios de dimerização compreendem FKBP12 e o ligante compreende FK1012 ou derivados ou fragmentos dos mesmos. Em algumas modalidades, um do primeiro ou segundo domínio de dimerização compreende proteína de ligação a FK506 (FKBP), o outro do primeiro ou segundo domínio compreende domínio de ligação a FKBP-Rap de alvo mamífero de Rap mTOR (Frb) e o ligante compreende rapamicina (Rap) ou derivados ou fragmentos dos mesmos.
[025] Os derivados se referem a ligantes e domínios modificados que mantêm a ligação ou têm ligação realçada ao seu domínio de dimerização ou ligante, respectivamente. Os fragmentos se referem a porções contíguas dos domínios de dimerização que mantêm a ligação ao ligante. Em algumas modalidades, o domínio de dimerização pode ser um fragmento modificado.
[026] Em algumas modalidades, i, ii, e/ou iii são humanos ou são derivados de humanos. Em algumas modalidades, o sistema, conjugado, e/ou proteína de fusão são não imunogênicos. Uma proteína, polipeptídeo, domínio ou ácido nucleico humanos se referem a uma proteína, polipeptídeo, domínio ou ácido nucleico que são do genoma humano, embora possam ser produzidos recombinantemente em sistemas não humanos. O termo “derivado de humanos” se refere a uma proteína, polipeptídeo, domínio ou ácido nucleico que é uma variante ou fragmento de uma proteína, polipeptídeo, domínio ou ácido nucleico do genoma humano, embora possam ser produzidos recombinantemente em sistemas não humanos. Em algumas modalidades, a proteína de fusão, conjugado, sistema ou partes dos mesmos, tais como partes i, ii, e/ou iii são não imunogênicos e/ou não tóxicos quando expressados ou administrados aos humanos.
[027] Em algumas modalidades, os ácidos nucleicos ou polipeptídeos da revelação são sintéticos, são não naturais, e/ou não ocorrem naturalmente na natureza.
[028] Em algumas modalidades, o sistema compreende ainda um polipeptídeo estabilizador; em que o polipeptídeo estabilizador compreende um polipeptídeo catiônico que se liga não especificamente a ácidos nucleicos. Em algumas modalidades, o polipeptídeo estabilizador é derivado de humano. Em algumas modalidades, o polipeptídeo estabilizador é operavelmente ligado ao domínio regulador de RNA e/ou domínio de ligação a grampo de RNA. Em algumas modalidades, o polipeptídeo estabilizador compreende ORF5 ou um fragmento do mesmo. Em algumas modalidades, o polipeptídeo estabilizador compreende a SEQ ID NO: 5, uma variante do mesmo ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 5. Em algumas modalidades, o polipeptídeo estabilizador compreende HEBGF ou um fragmento do mesmo. Em algumas modalidades, o polipeptídeo estabilizador compreende a SEQ ID NO: 19, uma variante do mesmo ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 19. Em algumas modalidades, o polipeptídeo estabilizador compreende β-defensina 3 ou um fragmento da mesma. Em algumas modalidades, o polipeptídeo estabilizador compreende a SEQ ID NO: 20, uma variante do mesmo ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 20.
[029] Em algumas modalidades, o polipeptídeo estabilizador, conjugado,
proteína de fusão, conjugado, domínio regulador de RNA, e/ou domínio de ligação a grampo de RNA são menores do que, maiores do que ou são no máximo ou pelo menos 175, 170, 165, 160, 155, 150, 145, 140, 135, 130, 125, 120, 115, 110, 105, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 kDa (ou qualquer faixa derivável). Em algumas modalidades, o complexo total compreendendo o domínio regulador de RNA e o domínio de ligação a grampo é menor do que, maior do que ou é no máximo ou pelo menos 175, 170, 165, 160, 155, 150, 145, 140, 135, 130, 125, 120, 115, 110, 105, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 kDa (ou qualquer faixa derivável). Em algumas modalidades, o complexo total compreendendo o polipeptídeo estabilizador, domínio regulador de RNA e domínio de ligação a grampo é menor do que, maior do que ou é no máximo ou pelo menos 175, 170, 165, 160, 155, 150, 145, 140, 135, 130, 125, 120, 115, 110, 105, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55, 50, 45, 40, 35, 30, 25, 20, 15, 10 ou 5 kDa (ou qualquer faixa derivável).
[030] Em algumas modalidades, o domínio de ligação a grampo de RNA compreende um domínio de ligação a grampo de RNA de U1A (TBP6.7), SLBP ou variantes dos mesmos. Em algumas modalidades, o domínio de ligação a grampo de RNA compreende um domínio de ligação a grampo de RNA de U1A (TBP6.7), SLBP, Ku70, nucleolina ou variantes dos mesmos. Em algumas modalidades, o domínio de ligação a grampo de RNA compreende a SEQ ID NO: 7 ou 18, uma variante do mesmo ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 7 ou 18.
[031] Em algumas modalidades, a molécula de alvejamento de RNA compreende um andaime de grampo TAR. Em algumas modalidades, a molécula de alvejamento de RNA compreende o andaime de grampo TAR da SEQ ID NO: 1 ou um nucleotídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78,
79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade à SEQ ID NO: 1. Em algumas modalidades, a molécula de alvejamento de RNA compreende um andaime de grampo SLBP. Em algumas modalidades, a molécula de alvejamento de RNA compreende o andaime de grampo SLBP da SEQ ID NO: 2 ou um nucleotídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade à SEQ ID NO: 2.
[032] Em algumas modalidades, a molécula de alvejamento de RNA compreende exatamente um grampo. Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos um grampo. Em algumas modalidades, a molécula de alvejamento de RNA compreende exatamente dois grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos dois grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende exatamente três grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos três grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende exatamente quatro grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos quatro grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende exatamente cinco grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos cinco grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende 1 a 4 grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende 1 a 3 grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende 1 a 2 grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende 2 a 4 grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende 2 a 3 grampos. Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos, no máximo ou exatamente
1, 2, 3, 4, 5 ou 6 grampos (ou qualquer faixa derivável). Em algumas modalidades, a molécula de alvejamento de RNA compreende pelo menos um grampo que não se liga à proteína de ligação a grampo de RNA e pelo menos um grampo que se liga à proteína de ligação a grampo de RNA. Em algumas modalidades, a molécula de alvejamento de RNA se liga a mais do que uma proteína de ligação a RNA. Em algumas modalidades, a molécula de alvejamento de RNA compreende duas, três ou quatro estruturas de grampo e se liga a pelo menos duas proteínas de ligação a RNA. Em algumas modalidades, o sistema regulador de RNA compreende pelo menos dois domínios reguladores, em que cada domínio regulador se liga a uma molécula de ligação a RNA diferente.
[033] Em algumas modalidades, a molécula de alvejamento de RNA compreende um ou mais nucleotídeos modificados. Em algumas modalidades, os nucleotídeos modificados compreendem uma modificação tal como um fosforotioato, nucleotídeos bloqueados, nucleotídeos ligados em ponte de etileno, ácidos nucleicos de peptídeo, 5’E-VP ou são modificados para um morfolino. Em algumas modalidades, a modificação inclui uma aqui descrita.
[034] Em algumas modalidades, o domínio de ligação a grampo de RNA compreende o domínio de ligação a grampo de RNA de U1A, uma variante do mesmo ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 7 e a molécula de alvejamento de RNA compreende um andaime de grampo TAR ou um nucleotídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade à SEQ ID NO: 1.
[035] Em algumas modalidades, o domínio de ligação a grampo de RNA compreende o domínio de ligação a grampo de RNA de SLBP, uma variante do mesmo ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 18 e a molécula de alvejamento de RNA compreende um andaime de grampo SLBP ou um nucleotídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade à SEQ ID NO: 2.
[036] Em algumas modalidades, o domínio de ligação a grampo de RNA compreende o domínio de ligação a grampo de RNA de ku70 ou uma variante do mesmo e a molécula de alvejamento de RNA compreende um grampo andaime ou um nucleotídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade à SEQ ID NO: 83.
[037] Em algumas modalidades, o domínio de ligação a grampo de RNA compreende o domínio de ligação a grampo de RNA de nucleolina ou uma variante do mesmo e a molécula de alvejamento de RNA compreende um grampo andaime ou um nucleotídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade a uma das SEQ ID NOs: 84 a 86.
[038] Em algumas modalidades, o domínio de ligação a grampo de RNA, polipeptídeo estabilizador ou domínio de ligação a grampo de RNA compreende um ligante. Em algumas modalidades, o ligante compreende um polipeptídeo compreendendo a SEQ ID NO: 6, 21, 22, 23 ou 25 ou um polipeptídeo com pelo menos 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 6, 21, 22, 23 ou 25. Em algumas modalidades, o ligante é um ligante rígido. Em algumas modalidades, o ligante é um ligante flexível. Em algumas modalidades, o ligante compreende resíduos de glicina e serina. Em algumas modalidades, o ligante é de pelo menos 4 aminoácidos. Em algumas modalidades, o ligante é de pelo menos ou no máximo ou exatamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43 44, 45, 46, 47, 48, 49 ou 50 aminoácidos (ou qualquer faixa derivável).
[039] Em algumas modalidades, o polipeptídeo estabilizador compreende um polipeptídeo, tal como um polipeptídeo de ligação a RNA, de cJun, HBEGF, HRX, NDEK, NHGF, beta-defensina3 ou scGFP. Em algumas modalidades, o domínio regulador de RNA é operavelmente ligado ao polipeptídeo estabilizador no término carbóxi do domínio regulador de RNA. Em algumas modalidades, o domínio regulador de RNA é operavelmente ligado ao polipeptídeo estabilizador no término amino do domínio regulador de RNA. Em algumas modalidades, o domínio regulador de RNA é operavelmente ligado ao polipeptídeo de domínio de ligação a grampo de RNA no término carbóxi do domínio regulador de RNA. Em algumas modalidades, o domínio regulador de RNA é operavelmente ligado ao polipeptídeo de domínio de ligação a grampo de RNA no término amino do domínio regulador de RNA. Em algumas modalidades, o polipeptídeo de domínio de ligação a grampo de RNA é operavelmente ligado ao polipeptídeo estabilizador no término carbóxi do polipeptídeo de domínio de ligação a grampo de RNA. Em algumas modalidades, o polipeptídeo de domínio de ligação a grampo de RNA é operavelmente ligado ao polipeptídeo estabilizador no término amino do polipeptídeo de domínio de ligação a grampo de RNA.
[040] Em algumas modalidades, a região de alvejamento de RNA compreende pelo menos 12 nucleotídeos. Em algumas modalidades, a região de alvejamento de RNA compreende pelo menos, no máximo ou exatamente 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61,
62, 63, 64, 65, 66, 67, 68, 69 ou 79 nucleotídeos (ou qualquer faixa derivável).
[041] Em algumas modalidades, o domínio regulador de RNA compreende uma nuclease, metilase, desmetilase, ativador traducional, repressor traducional, atividade de clivagem de RNA de fita simples, atividade de clivagem de RNA de fita dupla ou atividade de ligação a RNA. Em algumas modalidades, o domínio regulador de RNA compreende uma atividade aqui descrita.
[042] Em algumas modalidades, o domínio regulador de RNA compreende um domínio de nuclease Pin ou uma proteína leitora m6A ou porção dos mesmos. Em algumas modalidades, o domínio regulador de RNA compreende um domínio ou polipeptídeo de SMG6, YTHDF1 ou YTHDF2. Em algumas modalidades, o domínio regulador de RNA compreende um domínio ou polipeptídeo de uma proteína ADAR. Em algumas modalidades, o domínio regulador de RNA compreende um domínio ou polipeptídeo de uma proteína ADAR humana. Em algumas modalidades, o domínio regulador de RNA compreende um polipeptídeo que tem pelo menos, no máximo ou exatamente 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 9, 11, 15, 16, 17 ou 123 a 125. Em algumas modalidades, o domínio regulador de RNA compreende ainda uma região helicoidal. Em algumas modalidades, a região helicoidal compreende um polipeptídeo que tem pelo menos, no máximo ou exatamente 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 24.
[043] Em algumas modalidades, o domínio regulador de RNA aumenta a tradução de um RNA alvo. Em algumas modalidades, o domínio regulador de RNA aumenta a degradação de um RNA alvo. Em algumas modalidades, o domínio regulador de RNA modifica a localização de um RNA alvo. Em algumas modalidades, o domínio regulador de RNA modifica o processamento do RNA alvo.
[044] Em algumas modalidades, o domínio regulador de RNA compreende um polipeptídeo, tal como um polipeptídeo tendo atividade reguladora de RNA de IFIT2, eIF4a, eIF4e, PABP, PAIP, SLBP, BOLL, ICP27, YTHDF1, YTHDF2 ou YTHDF3. Em algumas modalidades, o domínio regulador de RNA compreende um polipeptídeo, tal como um polipeptídeo tendo atividade reguladora de RNA de YTHDF2, TOB2, ZFP36, CNOT7, RNaseA, RNaseL, RNaseP, RNase4, RNase1, RNaseU2 ou HRSP12. Em algumas modalidades, o domínio regulador de RNA aumenta a expressão de um polipeptídeo codificado pelo RNA alvo e em que o domínio regulador de RNA compreende IFIT2, eIF4a, eIF4e, PABP, PAIP, SLBP, BOLL, ICP27, YTHDF1 ou YTHDF3. Em algumas modalidades, o domínio regulador de RNA compreende um polipeptídeo, tal como um polipeptídeo tendo atividade reguladora de RNA de YTHDF2, TOB2, ZFP36, CNOT7, RNaseA, RNaseL, RNaseP, RNase4, RNase1, RNaseU2 ou HRSP12. Em algumas modalidades, o domínio regulador de RNA diminui a expressão de um polipeptídeo codificado pelo RNA alvo e em que o domínio regulador de RNA compreende YTHDF2, TOB2, ZFP36, CNOT7, RNaseA, RNaseL, RNaseP, RNase4, RNase1, RNaseU2 ou HRSP12.
[045] Em algumas modalidades, um ou mais sinais de exportação nuclear (NES) são fundidos ao domínio regulador de RNA, ao domínio de ligação a grampo de RNA, e/ou ao polipeptídeo de estabilização. Em algumas modalidades, o NES está no término carbóxi do domínio regulador de RNA, do domínio de ligação a grampo de RNA, e/ou do polipeptídeo de estabilização. Em algumas modalidades, o NES está no término amino do domínio regulador de RNA, do domínio de ligação a grampo de RNA, e/ou do polipeptídeo de estabilização. Em algumas modalidades, o NES compreende um polipeptídeo que tem pelo menos, no máximo ou exatamente 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 8.
[046] Em algumas modalidades, um ou mais sinais de localização nuclear (NLS) são fundidos ao domínio regulador de RNA, ao domínio de ligação a grampo de RNA, e/ou ao polipeptídeo de estabilização. Em algumas modalidades, o NLS está no término carbóxi do domínio regulador de RNA, do domínio de ligação a grampo de RNA, e/ou do polipeptídeo de estabilização. Em algumas modalidades, o NLS está no término amino do domínio regulador de RNA, do domínio de ligação a grampo de RNA, e/ou do polipeptídeo de estabilização. Em algumas modalidades, o NES compreende um polipeptídeo que tem pelo menos, no máximo ou exatamente 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 % (ou qualquer faixa derivável) de identidade ou homologia à SEQ ID NO: 13.
[047] Em algumas modalidades, a região de alvejamento de RNA de ii hibridiza a um RNA alvo em uma célula procariótica ou eucariótica. Em algumas modalidades, o RNA alvo é em uma célula humana. Em algumas modalidades, o RNA alvo é in vitro ou in vivo.
[048] Em algumas modalidades, o sistema compreende pelo menos dois de cada i, ii e iii. Em algumas modalidades, pelo menos dois de i, ii e iii são expressados na mesma célula. Em algumas modalidades, o método compreende modular pelo menos dois RNAs alvos. Em algumas modalidades, o sistema compreende pelo menos, no máximo ou exatamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40 ou 50 ou mais (ou qualquer faixa derivável) de i, ii e iii. Em algumas modalidades, pelo menos, no máximo ou exatamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40 ou 50 ou mais (ou qualquer faixa derivável) RNAs alvos são modulados em uma célula.
[049] Em algumas modalidades, o domínio regulador de RNA cliva o RNA, promove a tradução do RNA, inibe a tradução do RNA ou modifica a sequência de base do RNA.
[050] Em algumas modalidades, os vetores da revelação compreendem ainda um elemento regulador operavelmente ligado ao nucleotídeo que codifica i, ii, e/ou iii. Elementos reguladores, além de um NLS e NES, como previamente descrito, também incluem promotores, sinais de poliadenilação, realçadores, etc. Outros elementos reguladores são conhecidos na técnica e aqui descritos e podem ser usados nas modalidades da revelação. Em algumas modalidades, um ou mais vetores de ácido nucleico são otimizados para expressão em uma célula eucariótica. Em algumas modalidades, a expressão dos domínios, RNA ou polipeptídeos na célula ou a partir de um vetor é constitutiva. Em algumas modalidades, a expressão dos domínios, RNA ou polipeptídeos na célula ou a partir de um vetor é condicional. Em algumas modalidades, i, ii e iii estão em um único vetor. Em algumas modalidades, i, ii, iii e o polipeptídeo estabilizador são codificados em um único vetor. Em algumas modalidades, i, iii e o polipeptídeo estabilizador são codificados em um único vetor. Em algumas modalidades, um ou mais dos vetores são vetores virais. Em algumas modalidades, um ou mais vetores compreendem um ou mais vetores retrovirais, lentivirais, adenovirais, adeno-associados ou virais de herpes simplex. Em algumas modalidades, um ou mais dos vetores são vetores não virais. Em algumas modalidades, o sistema ou composição é não viral, o que denota que ele não contém nenhum componente viral.
[051] Em algumas modalidades, existe um sistema ou kit compreendendo um ou mais dos componentes seguintes: um polipeptídeo compreendendo um domínio regulador de RNA, um polipeptídeo compreendendo um domínio de ligação a RNA, um polipeptídeo compreendendo um estabilizador, um ácido nucleico que codifica um domínio regulador de RNA, um ácido nucleico que codifica um domínio de ligação a RNA, um ácido nucleico que codifica um estabilizador, um ácido nucleico que codifica uma molécula de alvejamento de RNA compreendendo uma região de alvejamento de RNA e pelo menos uma estrutura de grampo; um conjugado da revelação; um vetor da revelação, uma proteína de fusão da revelação, uma célula hospedeira recombinante, uma construção de expressão, um vetor viral engendrado ou um vírus atenuado engendrado. Em certas modalidades, um polipeptídeo da revelação está sob o controle de um promotor heterólogo. É especificamente considerado que qualquer função de proteína ou polipeptídeo que é usada nas modalidades, pode ser usada um ácido nucleico que codifica esta função de proteína ou polipeptídeo. Também, qualquer um e todos os polipeptídeos, proteínas, moléculas de ácido nucleico podem estar contidos dentro de uma célula ou outro organismo vivo, tal como um vírus (por exemplo, um fago).
[052] Um kit pode incluir um ou mais componentes que são separados ou juntos em um meio recipiente adequado, tal como um recipiente estéril, não reativo. Em algumas modalidades, células ou vírus são fornecidos que contêm uma ou mais construções de ácido nucleico que codificam os polipeptídeos da revelação. O termo “promotor” é usado de acordo com seu significado habitual àqueles no campo de biologia molecular; ele geralmente se refere a um sítio em um ácido nucleico em que uma polimerase pode se ligar para iniciar a transcrição. Em modalidades específicas, o promotor é reconhecido por uma T7 RNA polimerase.
[053] As composições, vetores, sistemas, métodos e proteínas da revelação são úteis para uma variedade de aplicações clínicas e relacionadas à pesquisa. As modalidades da revelação podem ser úteis para o tratamento de uma doença ou condição, tal como câncer ou autoimunidade. Em algumas modalidades, os métodos e composições são para o tratamento agudo de uma doença ou condição. Em algumas modalidades, os métodos e composições são úteis para a modulação temporária de RNA. Em algumas modalidades excluem a modificação permanente da atividade gênica. Em algumas modalidades, os métodos e as composições são mais seguros devido à modulação aguda do RNA e/ou devido à capacidade de controlar a expressão do sistema in vivo.
[054] Como usado na presente invenção a especificação, “um” ou “uma” pode significar um ou mais. Como usado na presente invenção na(s) reivindicação(ões), quando usadas em combinação com a palavra “compreendendo”, as palavras “um” ou “uma” podem significar um ou mais do que um.
[055] Como usado na presente invenção, os termos “ou” e “e/ou” são utilizados para descrever componentes múltiplos em combinação ou exclusivos um do outro. Por exemplo, “x, y, e/ou z” podem se referir a “x” sozinho, “y” sozinho, “z” sozinho, “x, y e z”, “(x e y) ou z”, “x ou (y e z)”, ou “x ou y ou z”. É especificamente considerado que x, y ou z pode ser especificamente excluído de uma modalidade.
[056] Por todo este pedido, o termo “cerca de” é usado de acordo com seu significado simples e habitual na área de biologia celular para indicar que um valor inclui o desvio padrão do erro para o dispositivo ou método sendo utilizado para determinar o valor.
[057] O termo “compreendendo”, que é sinônimo com “incluindo”, “contendo”, ou “caracterizado por”, é inclusivo ou ilimitado e não exclui os elementos ou etapas do método independentes, adicionais. A frase “consistindo em” exclui qualquer elemento, etapa ou ingrediente não especificados. A frase “consistindo essencialmente em” limita o escopo do assunto descrito aos materiais ou etapas específicos e aqueles que não afetam materialmente suas características básicas e novas. É considerado que as modalidades descritas no contexto do termo “compreendendo” também podem ser implementadas no contexto do termo “consistindo em” ou “consistindo essencialmente em”.
[058] É especificamente considerado que qualquer limitação discutida com respeito a uma modalidade da invenção pode se aplicar a qualquer outra modalidade da invenção. Além disso, qualquer composição da invenção pode ser usada em qualquer método da invenção e qualquer método da invenção pode ser usado para produzir ou para utilizar qualquer composição da invenção. Os aspectos de uma modalidade apresentada nos Exemplos também são modalidades que podem ser implementadas no contexto das modalidades discutidas em outra parte em um Exemplo diferente ou em outra parte no pedido, tal como no Sumário da Invenção, Descrição Detalhada das Modalidades, Reivindicações e Descrição das Legendas da Figura.
[059] Outro objetivos, características e vantagens da presente invenção tornar-se-ão evidentes a partir da descrição detalhada seguinte. Deve ser entendido, entretanto, que a descrição detalhada e os exemplos específicos, enquanto indicando as modalidades preferidas da invenção, são fornecidos por via de ilustração apenas, visto que várias mudanças e modificações dentro do espírito e escopo da invenção tornar-se-ão evidentes aos técnicos no assunto a partir desta descrição detalhada.
BREVE DESCRIÇÃO DOS DESENHOS
[060] Os desenhos seguintes formam parte do presente relatório descritivo e são incluídos para demonstrar ainda certos aspectos da presente invenção. A invenção pode ser mais bem entendida por referência a um ou mais destes desenhos em combinação com a descrição detalhada das modalidades específicas apresentadas na presente invenção.
[061] FIG. 1A-D. Projeto do sistema de alvejamento de RNA inspirado em CRISPR/Cas (CIRTS) (A) Visão geral esquemática da estratégia do projeto. CIRTS é composto de uma proteína de ligação a ssRNA, uma proteína de ligação a grampo de RNA, uma proteína efetora e um RNA guia. (B) Lista de construções de CIRTS modulares usadas neste trabalho. (C) Projeto do RNA guia para TBP6.7. O grampo HIV TAR foi fundido a um ligante de nucleotídeo (L) e uma sequência guia. (D) Projeto do RNA guia para o RRM de SLPF. O grampo de mRNA de histona humana foi fundido a um ligante flexível de cinco nucleotídeos e uma sequência guia.
[062] FIG. 2A-C. Ensaios de ligação a CIRTS-1 in vitro e clivagem de RNA (A) Ensaio de mobilidade eletroforética (EMSA) avaliando a afinidade de ligação do complexo de MBP-CIRTS-1:gRNA no alvo (R3) a um substrato de RNA rotulado (R1).
EDTA foi suplementado ao tampão de reação para evitar qualquer clivagem. (B) Cálculo da afinidade de ligação ajustando-se a fração de TBP6.7:gRNA ligada ao substrato a uma equação de ligação quadrática. (C) Ensaio de clivagem conduzido em um gel desnaturante depois de 2 h de incubação. Um substrato de RNA rotulado (R2) é a clivagem em uma maneira dependente de gRNA.
[063] FIG. 3A-G. Ensaios repórteres de célula mamífera de CIRTS (A) Visão geral do ensaio de luciferase dupla. Uma construção repórter que contém tanto a luciferase do vaga-lume quanto a luciferase da Renilla é usada em todos os ensaios. Os inventores alvejado seus CIRTS ao transcrito de luciferase do vaga-lume, enquanto mantendo a luciferase da Renilla constante para usar como um controle de transfecção. Para todos os ensaios subsequente, células HEK293T foram transfectadas com o vetor repórter, o vetor de CIRTS e um vetor de gRNA. (B) CIRTS- 0 cataliticamente inativo foi usado como um controle. Depois de 48 h de incubação, os inventores não observaram nenhuma diminuição na leitura da proteína. (C) Comparação de CIRTS-1 com Cas13b nuclease. Células transfectadas com CIRTS-1 ou Cas13 e o alvejamento de gRNA correspondente mostram níveis de proteína reduzidos depois da incubação. (D) Células HEK293T transfectadas com CIRTS-2 mostram um aumento no nível de proteína depois de 48 h, (E) células transfectadas com CIRTS-3, entretanto, mostram a diminuição prevista no nível de proteína. (F) A troca da proteína de ligação a grampo para SLBP ainda resulta na diminuição nos níveis de proteína depois de 48 h. (G) Células transfectadas com um sistema de CIRTS completamente humanizado (CIRTS-5 e CIRTS-6) e um gRNA no alvo para luciferase do vaga-lume resultam novamente em níveis de proteína diminuídos.
[064] FIG. 4A-C. Alvejamento de transcritos endógenos com CIRTS (A) Knockdown mediado por nuclease de cinco transcritos endógenos após a transfecção de células com CIRTS-1 como avaliado usando qPCR. CIRTS-1 pode ser usado para alvejar transcritos endógenos de interesse por co-transfecção de um gRNA à sequência guia no alvo correspondente. (B) Análise de qPCR de knockdown não mediado por nuclease de transcritos endógenos com CIRTS-3. Células transfectadas com CIRTS-3 mostram diminuições dependentes de gRNA no nível de RNA para todos os cinco transcritos testados. (C) Análise dos níveis de proteína depois da transfecção com CIRTS-2 ou CIRTS-3 usando Western blot. CIRTS-2 pode induzir um aumento nos níveis de proteína, ao passo que CIRTS-3 mostra a diminuição esperada em níveis de proteína como um controle.
[065] FIG. 5A-B. Alvejamento multidimensional com CIRTS. (A) Representação esquemática de vetores usados para o alvejamento multiplexado. CIRTS-6 foi co-transfectado com seu PPIB de alvejamento de construção de gRNA, enquanto CIRTS-7 foi co-transfectado com o SMARCA4 de alvejamento de construção de gRNA correspondente. (B) Mapa de calor mostrando o knockdown de alvejamento multiplexado. Quando tanto CIRTS-6 quanto CIRTS-7 estão presentes em células, a co-transfecção do gRNA de controle no alvo ou fora do alvo pode guiar o CIRTS para diminuir os transcritos endógenos. Quando ambos os CIRTS têm um gRNA no alvo para PPIB ou SMARCA4 presente, ambos os transcritos podem ser knocked down nas mesmas amostras.
[066] FIG. 6. Comparação de CIRTS a outros sistemas CRISPR/Cas de alvejamento de DNA e RNA. Comparação esquemática de tamanhos de sistemas de Cas9, Cas13 e proteína de fusão correntemente usados. Sistemas de liberação com base em Cas9 e Cas13 são substancialmente maiores do que sistemas de CIRTS engendrados.
[067] FIG. 7A-C. Controles de EMSA e Ensaio de clivagem. (A) EMSA avaliando trocas de ligação dependentes de MBP-CIRTS-1 na ausência de qualquer gRNA. (B) EMSA avaliando trocas de ligação na presença do único substrato rotulado (R1) e gRNA no alvo (R3). (C) Gel de clivagem total mostrado no texto principal da FIG. 2C.
[068] FIG. 8A-D. Ligante de CIRTS e otimização de gRNA. (A) Ensaio de luciferase com o sistema de nuclease CIRTS usando diferentes ligantes entre a proteína de ligação a grampo e a proteína efetora. (B) Ensaio de luciferase com decomposição mediada por CIRTS-YTHDF2 usando diferentes ligantes entre a proteína de ligação a grampo e a proteína efetora. (C) Diferente gRNA engendrado para TBP6.7 baseado no projeto mostrado na FIG. 1C. Dois comprimentos de alvejamento diferentes de 20 e 40 nucleotídeos foram usados em combinação com diferentes números de nucleotídeos de ligação (L) entre o grampo e a sequência guia. O ensaio de luciferase dupla foi usado para avaliar a decomposição mediada por nuclease. (D) Os mesmos gRNAs engendrados como na FIG. 8C foram usados com CIRTS-3 para induzir a decomposição de RNA induzida por epitranscriptoma. n = 3 réplicas biológicas
[069] FIG. 9A-H. Ensaios de luciferase de controle e RT-qPCRs. (A) Análise de RT-qPCR de níveis de RNA com o domínio de nuclease ‘morto’ Pin CIRTS (CIRTS- 0). (B) Ensaio de luciferase comparando a decomposição mediada por nuclease de domínio de nuclease de TBP6.7 Pin sem (CIRTS-8) e com (CIRTS-9) a proteína de ligação a ssRNA adicional ORF5. (C) A nuclease de CIRTS pode ser mediada por diminuição no RNA e portanto, do nível de proteína tanto no núcleo quanto no citoplasma (n=6). (D) Comparação de níveis de RNA quando células foram transfectadas com CIRTS-1 e nuclease Cas13b ativa. A clivagem de RNA mediada por CIRTS-1-Pin mostrou substancialmente menos degradação de RNA em comparação ao sistema de Cas13b. (E-H) Todos os sistema CIRTS engendrados que os inventores testaram no ensaio de luciferase dupla também foram submetidos à análise de RT-qPCR para avaliar as mudanças em níveis de RNA. CIRTS-2, que contêm o domínio efetor de YTHDF1 que induz a ativação da tradução não mostrou nenhuma mudança significativa no nível de RNA enquanto todos os CIRTS contendo YTHDF2 mostram a diminuição esperada nos níveis de RNA (S3F e S3H: n = 2 ou 3).
n = 3 réplicas biológicas a menos que de outro modo observado. Teste t de Student: *P < 0,05, **P <0,01, ***P <0,001.
[070] FIG. 10A-C. Imunoprecipitação, Western Blot de qPCR de Controle, truncamentos em Y2. (A) As células foram transfectadas com CIRTS-0 a 3xFLAG e um gRNA para PPIB, B4GALTN1 ou NT. Depois da reticulação e FLAG IP, o RNA precipitado foi quantificado usando RT-qPCR. Reações contendo gRNA no alvo para qualquer transcrito mostraram enriquecimento de 3,5 a 5 vezes para estes transcritos, indicando o alvejamento de RNA guiado (n = 2 ou 3). (B) análise de RT-qPCR do nível de RNA quando as células foram transfectadas com CIRTS-2. Como previsto, nenhuma mudança significativa no nível de RNA foi observada quando uma proteína contendo YTHDF1 foi usada. (C) Diferentes truncamentos de YTHDF2 foram avaliados para determinar qual seria mais eficiente. Os inventores compararam os dados de luciferase (esquerda) com os dados de qPCR (direita) e concluíram usar a construção de Y2 (100-200) para análise de luciferase e a construção de Y2 (1-200) para o alvejamento endógeno para permitir as melhores quantificações possíveis das ferramentas. n = 3 réplicas biológicas a menos que de outro modo observado. Teste t de Student: *P < 0,05, **P <0,01.
[071] FIG. 11A-C. Alvejamento endógeno com CIRTS. (A) Mudanças em níveis de RNA avaliadas depois da transfecção de CIRTS5-7 sozinho para PPIB. (B) Similar à FIG. 11A, níveis de SMARCA4 foram avaliados quando as células foram transfectadas com CIRTS5-7. (C) Triagem de gRNA ao longo de SMARCA4 usando CIRTS-3 para induzir a decomposição de RNA dependente de gRNA. Os inventores viram mudanças significativas na quantidade de decomposição induzida dependendo de onde o transcrito é alvejado (n = 2 ou 3). n = 3 réplicas biológicas a menos que de outro modo observado. Teste t de Student: *P < 0,05, **P <0,01, ***P <0,001.
[072] FIG. 12A-D. Projeto do sistema de alvejamento de RNA inspirado em CRISPR/Cas (CIRTS) (A) Visão geral esquemática da estratégia do projeto. CIRTS é composto de uma proteína de ligação a ssRNA, uma proteína de ligação a grampo de RNA, uma proteína efetora e um RNA guia. (B) Lista de CIRTS chaves usados neste trabalho. (C) Projeto do RNA guia para TBP6.7. O grampo HIV TAR foi fundido a um ligante de nucleotídeo (L) e uma sequência guia. O ligante de nucleotídeo foi alterado durante a otimização (como descrito na informação de suporte) mas L = UUAUU foi usado por todo o trabalho posteriormente. (D) Projeto do RNA guia para o motivo de reconhecimento de RNA (RRM) de SLPF. O grampo de mRNA de histona humana foi fundido a um ligante flexível de cinco nucleotídeos e uma sequência guia.
[073] FIG. 13A-B. Ensaios de ligação de CIRTS-1 in vitro e clivagem de RNA. (A) Ensaio de ligação de filtro avaliando a afinidade de ligação de MBP-CIRTS-1 com complexo de gRNA no alvo e RNA que não de alvejamento a um substrato de RNA rotulado. O ajuste dos dados a uma equação de ligação quadrática revelou uma KD evidente de 22  7 nM para o complexo no alvo:proteína e uma KD evidente em torno de 500 nM para a interação de não alvejamento:proteína. (B) Ensaio de clivagem conduzido em um gel de Ureia PAGE de desnaturação a 10 % na presença de 0,5 mM de MnCl2. Um substrato de RNA rotulado com IR800 é clivado em uma maneira dependente de gRNA.
[074] FIG. 14A-G. Ensaios repórteres de célula mamífera de CIRTS. (A) Visão geral do ensaio de luciferase dupla. Uma construção repórter que contém tanto luciferase do vaga-lume quanto luciferase da Renilla é usada em todos os ensaios. Os inventores alvejaram CIRTS ao transcrito de luciferase do vaga-lume, enquanto usando luciferase da Renilla como um controle interno. Para todos os ensaios subsequentes, células HEK293T foram transfectadas com o vetor repórter, um vetor de CIRTS e um vetor de gRNA. (B) CIRTS-0 cataliticamente inativo foi usado como um controle. Depois de 48 h de incubação, os inventores não observaram nenhuma diminuição na leitura da proteína. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. (C) Comparação de CIRTS-1 com Cas13b nuclease. Células transfectadas com CIRTS-1 ou Cas13 e o Fluc de alvejamento de gRNA correspondente mostram níveis de proteína reduzidos depois da incubação. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05, **P < 0,01. (D) células HEK293T transfectadas com CIRTS-2 mostram um aumento no nível de proteína depois de 48 h. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: **P < 0,01. (E) células HEK293T transfectadas com CIRTS-3 mostram a diminuição prevista em nível de proteína. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05. (F) Troca da proteína de ligação a grampo para SLBP ainda resulta na diminuição de níveis de proteína depois de 48 h. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05. (G) Células transfectadas com um sistema CIRTS completamente humanizado (CIRTS-5 e CIRTS-6) e um gRNA no alvo para luciferase do vaga-lume resultam novamente em níveis de proteína diminuídos. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05.
[075] FIG. 15A-B. CIRTS para edição de RNA. (A) Visão geral esquemática do ensaio repórter de edição de RNA usado. Uma única mutação de G-para-A foi introduzida na sequência de codificação de luciferase do vaga-lume resultado em uma troca de códon de W417X (X = STOP) e nenhum sinal mensurável de luciferase do vaga-lume (FIG. 22J). (B) Liberação de CIRTS-7 (hADAR2 wt) e CIRTS-8 (hADAR E488Q) com um gRNA no alvo mostra edição de RNA significativa que resulta em sinal mensurável de luciferase do vaga-lume. Tanto os fundamentos quanto a eficiência de edição de CIRTS-8, o mutante de hADAR2 hiperativo, são descobertos ser mais altos em comparação ao tipo selvagem. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: ***P < 0,001.
[076] FIG. 16A-C. Alvejamento de transcritos endógenos com CIRTS. (A) Knockdown mediado por nuclease de cinco transcritos endógenos após a transfecção de células com CIRTS-1 como avaliado usando qPCR. CIRTS-1 pode ser usado para alvejar transcritos endógenos de interesse por co-transfecção de um gRNA com a sequência guia no alvo correspondente. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05, **P <0,01, ***P <0,001. (B) Análise de qPCR de knockdown mediado por YTHDF2 de transcritos endógenos com CIRTS-3. Células transfectadas com CIRTS-3 mostram diminuições dependentes de gRNA em nível de RNA para todos os cinco transcritos testados. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05. (C) Análise de níveis de proteína depois da transfecção com CIRTS-2 ou CIRTS-3 por Western blot. CIRTS-2 induz um aumento em níveis de proteína, ao passo que CIRTS- 3 mostra a diminuição esperada em níveis de proteína, ambos em uma maneira dependente de gRNA.
[077] FIG. 17. Acessibilidade de alvejamento determina a eficiência de knockdown de CIRTS. Triagem de gRNA ao longo de SMARCA4 usando CIRTS-3 para induzir a decomposição de RNA dependente de gRNA. Os inventores observam mudanças significativas na quantidade de decomposição induzida dependendo de onde o transcrito é alvejado (n = 2 ou 3).
[078] FIG. 18A-D. Alvejamento multidimensional com CIRTS. (A) Representação esquemática de liberação de CIRTS-6 e três gRNAs. (B) CIRTS-6 pode ser liberado com três gRNAs distintos para PPIB, SMARCA4 e NRAS e simultaneamente causam knockdown de todos os três transcritos. n = 5 réplicas biológicas. Teste t de Student: **P <0,05, ***P <0,001. (C) Representação esquemática de liberação simultânea de CIRTS com diferentes proteínas efetoras. (D) Mudanças em níveis de proteína luciferase e níveis de transcrito de PPIB quando as células foram transfectadas tanto com CIRTS-9 (YTHDF1) quanto com CIRTS-10 (YTHDF2) e gRNAs para Fluc e PPIB respectivamente. Ambos os CIRTS ortogonais mantêm suas funções individuais e agem simultaneamente em células. n = 5 réplicas biológicas. Teste t de Student: *P < 0,1, **P <0,05.
[079] FIG. 19A-C. Liberação AAV de CIRTS. (A) Transferência de plasmídeo para liberação de AAV contendo tanto o CIRTS-6 (YTHDF2) bem como o componente de gRNA do sistema. O tamanho de inserção total entre as duas repetições de terminal invertido (ITR) foi 2,7 kb. (B) CIRTS-6 empacotado com AAV e um alvejamento de gRNA luciferase foram liberados a células HEK293T para knockdown da luciferase do vaga-lume no ensaio repórter de luciferase dupla. (C) CIRTS-6 empacotado com AAV e um alvejamento de gRNA SMARCA4 foram liberados a células HEK293T para knockdown do gene endógeno, que revelou eficiência comparável àquela obtida por transfecção transiente. Valores mostrados como média ± SEM com n = 3 réplicas biológicas. Teste t de Student: *P < 0,05.
[080] FIG. 20. Comparação de CIRTS a outros sistemas CRISPR/Cas de alvejamento de DNA e RNA. Comparação esquemática de tamanhos de sistemas comumente usados de Cas9, Cas12, Cas13 e proteína de fusão.
[081] FIG. 21. Lista de CIRTS continuada a partir da FIG. 12B. Lista de referência de todos os CIRTS remanescentes usados neste trabalho.
[082] FIG. 22A-J. Ensaios de luciferase de controle e RT-qPCRs. (A) Ensaio de luciferase comparando A decomposição mediada por nuclease DE domínio de nuclease de TBP6.7 Pin sem (CIRTS-11) e com (CIRTS-12) a proteína de ligação a ssRNA adicional ORF5. (B) Nuclease de CIRTS pode ser mediada por diminuição em RNA e portanto nível de proteína tanto no núcleo quanto no citoplasma (n=6). (C) Análise de RT-qPCR de níveis de RNA com o domínio de nuclease ‘morto’ Pin CIRTS (CIRTS-0). (D) Comparação de níveis de RNA quando as células foram transfectadas com CIRTS-1 e nuclease Cas13b ativa. A clivagem de RNA mediada por CIRTS-1- Pin mostrou substancialmente menos degradação de RNA em comparação ao sistema de Cas13b. (E-H) Todos os sistemas CIRTS engendrados testados no ensaio de luciferase dupla também foram submetidos à análise de RT-qPCR para avaliar mudanças em níveis de RNA. CIRTS-2, que contêm a ativação da tradução de indução de domínio efetor de YTHDF1 mostraram nenhum mudanças significativas em nível de RNA enquanto todos os CIRTS contendo YTHDF2 mostram a diminuição esperada em níveis de RNA. (I) CIRTS-18 engendrado contendo o dímero de PP7 como a proteína de ligação a grampo. Knockdown de PPIB depois da transfecção com CIRTS-18 como medido por qPCR. (J) Comparação de repórter apenas e repórter com CIRTS-7 (hADAR wt) com gRNA que não de alvejamento ou de alvejamento (S3F e S3H: n = 2 ou 3). n = 3 réplicas biológicas a menos que de outro modo observado. Teste t de Student: *P < 0,05, **P <0,01, ***P <0,001.
[083] FIG. 23A-D. Ligante de CIRTS e otimização de gRNA. (A) Ensaio de luciferase com o sistema de nuclease CIRTS usando diferentes ligantes entre a proteína de ligação a grampo e a proteína efetora. L8 previamente publicada = SGSETPGTSESATPES (SEQ ID NO: 133) (Guilinger et al., 2014), ligante helicoidal de 10 nm =
EEEEKKKQQEEEAERLRRIQEEMEKERKRREEDEKRRRKEEEERRMKLEMEAKRK QEEEERKKREDDEKRKKK (SEQ ID NO: 134). (B) Ensaio de luciferase com decomposição mediada por CIRTS-YTHDF2 usando diferentes ligantes entre a proteína de ligação a grampo e a proteína efetora. (C) Diferente gRNA engendrado para TBP6.7 baseado no projeto mostrado na Figura 1C. Dois comprimentos de alvejamento diferentes de 20 e 40 nucleotídeos foram usados em combinação com diferentes números de nucleotídeos de ligação (L) entre o grampo e a sequência guia. O ensaio de luciferase dupla foi usado para avaliar a decomposição mediada por nuclease. NT = gRNA de Fluc que não de alvejamento contendo diferente nuclease ligante (Figura 1), L2 = UU, L3 = UUU, L5 = UUAUU. (D) Os mesmos gRNAs engendrados como na Figura S3C foram usados com CIRTS-3 para induzir a decomposição de RNA induzida por epitranscriptoma. NT = gRNA de Fluc que não de alvejamento contendo diferente nuclease ligante (Figura 1), L2 = UU, L3 = UUU, L5 =
UUAUU. n = 3 réplicas biológicas.
[084] FIG. 24A-D. qPCR de Controle, Western Blot, truncamentos de YTHDF2. (A) CIRTS-1 pode ser liberado a espécies de RNA exceto mRNA. Como uma prova de princípio, os inventores transfectaram células com CIRTS-1 (Pin nuclease) e dois gRNAs diferentes para o lncRNA MALAT1 e avaliaram os níveis de RNA por RT-qPCR. (B) Análise de RT-qPCR de nível de RNA quando as células foram transfectadas com CIRTS-2. Como previsto, nenhuma mudança significativa em nível de RNA foi observada quando uma proteína contendo YTHDF1 foi usada. (C) Quantificação de níveis de proteína como medido por Western blot quando as células foram transfectadas com CIRTS-2 ou CIRTS-3 e alvejadas a PPIB (n=3). (D) Diferentes truncamentos de YTHDF2 foram avaliados para determinar qual seria mais eficiente. Os inventores compararam dados de luciferase (esquerda) com dados de qPCR (direita) e concluíram usar a construção de Y2 (100-200) para análise de luciferase e a construção de Y2 (1-200) para alvejamento endógeno para permitir as melhores quantificações possíveis das ferramentas. n = 3 réplicas biológicas a menos que de outro modo observado. Teste t de Student: *P < 0,05, **P <0,01.
[085] FIG. 25A-H. Especificidade de Alvejamento de CIRTS. (A) Representação esquemática do ensaio repórter de incompatibilidade de KRAS4b- luciferase. Os inventores escolheram quatro variantes de KRAS4b que têm um número crescente de incompatibilidades ao gRNA projetado de comprimento de 20 nt e o fundiram em N-terminal ao repórter de luciferase dupla. (B) Knockdown mediado por CIRTS de KRAS4b-Fluc com diferentes números de incompatibilidades entre o gRNA e RNA alvo como descrito na Figura S5A. CIRTS foi descoberto ser o mais sensível a incompatibilidades em no meio de sua sequência guia. (C) Knockdown mediado por Cas13b no mesmo ensaio repórter de KRAS4b-Fluc como descrito acima. Cas13b mostra uma eficiência de knockdown mais alta mas também é menos sensível às incompatibilidades introduzidas. Similar a CIRTS, Cas13b em knockdown é o mais afetado por incompatibilidades no centro da região de duplex alvo guia. (D) Eficiência de knockdown de CIRTS no repórter de incompatibilidade de KRAS4b- luciferase quando do uso de um comprimento de gRNA de 40 nt. Uma sequência guia mais longa no gRNA pode resgatar alguma da perda em eficiência de knockdown. (E- F) Níveis de expressão médios do transcriptoma em log2(transcrito por milhões (TPM) +1) quando CIRTS Pin nuclease (E) ou CIRTS YTHDF2 (F) são implantados a SMARCA4 em células (n=3). (G) Níveis de knockdown de SMARCA4 como determinado por sequenciamento de RNA. (H) As células foram transfectadas com CIRTS-0 a 3xFLAG e um gRNA para PPIB, B4GALNT1 ou NT. Depois da reticulação e FLAG IP, o RNA precipitado foi quantificado usando RT-qPCR. Reações contendo gRNA no alvo para qualquer transcrito mostraram enriquecimento de 3,5 a 5 vezes para estes transcritos, indicando alvejamento de RNA guiado (n = 2 ou 3).
[086] FIG. 26A-C. Alvejamento endógeno com CIRTS. (A) Mudanças em níveis de RNA como avaliado por RT-qPCR depois da transfecção de CIRTS5-7 sozinho para PPIB. (B) Similar a S6A d a Figura, níveis de SMARCA4 foram avaliados quando as células foram transfectadas com CIRTS5-7. (C) Comparação de níveis de knockdown de PPIB depois da liberação de nuclease Cas13b ativa ou uma construção de dCas13b-YTHDF2(1-200) engendrada a PPIB (n = 2 ou 3). n = 3 réplicas biológicas a menos que de outro modo observado. Teste t de Student: *P < 0,01, **P <0,05, ***P <0,01, ****P < 0,001.
[087] FIG. 27A-C. Alvejamento multiplexado com CIRTS. (A) Representação esquemática de vetores usados para alvejamento multiplexado. As células foram transfectadas com um vetor de expressão para CIRTS-6 e um vetor de expressão para CIRTS-10, um vetor de expressão para um PPIB de alvejamento de construção de gRNA de CIRTS-6 ou um controle sem alvejamento e um vetor de expressão para um SMARCA4 de alvejamento de gRNA de CIRTS-9 ou um controle sem alvejamento. (B) Mapa de calor mostrando o knockdown de alvejamento multiplexado descrito em
(A). Quando ambos os CIRTS têm um gRNA no alvo para PPIB ou SMARCA4 presente, ambos os transcritos podem ser knocked down nas mesmas amostras. Valores mostrados como nível de expressão médio de cada transcrito alvo em relação a GAPDH, com n = 8 réplicas biológicas. (C) Predição computacional de imunogenicidade. Os inventores primeiro previram peptídeos 9-mer que são ligantes de MHC I usando o banco de dados IEDB e submeteram o primeiro percentil de ligantes a previsões de imunogenicidade usando o preditor de imunogenicidade IEDB.
[088] FIG. 28. Triagem de gRNA com ADAR. Testar se projetos de RNA guia que caracterizam múltiplos grampos aumentam a potência de CIRTS. O painel esquerdo mostra que projetos de gRNA caracterizam o projeto de origem ou guias com um grampo TAR em qualquer extremidade do guia ou dois grampos em qualquer extremidade. Os guias de grampo adicionais aumentam a potência de CIRTS em um ensaio de atividade de ADAR em células. O painel direito está testando se o segundo grampo precisar ser um grampo TAR ou se apenas um “grampo estabilizante” pode funcionar - significando um grampo que não interage diretamente com a proteína de CIRTS mas retarda a degradação. Como observado nos dados, o segundo grampo aumenta a potência em comparação a um projeto de gRNA em grampo.
[089] FIG. 29A-B. (A) Editor de C-para-U: Os dados em A demonstram que um CIRTS baseado em um editor com base em C-para-U também é funcional usando um ensaio repórter de célula mamífera. (B) Proteínas de ligação a ssRNA. Os dados em B demonstram que outras proteínas de ligação a ssRNA podem funcionar como uma proteína de ligação a RNA nos sistemas e métodos da revelação.
[090] FIG. 30A-C. (A): Proteínas contendo domínio regulador de RNA que podem ativar a tradução, ordenar os gRNAs em vários locais em um RNA repórter e medir a ativação traducional de cada. (B-C). Proteínas contendo domínio regulador de RNA que potencialmente degradam ou desestabilizam um RNA, ordenando os gRNAs em vários locais em um RNA repórter e medindo a degradação de RNA de cada.
[091] FIG. 31A-B. (A) Modalidades demonstrando as diferentes orientações dos elementos dos sistemas da revelação. (B) Dados usando CNOT7 em diferentes orientações (como mostrado em A) e em dois RNAs alvos: um repórter de luciferase (esquerda) e um RNA endógeno (direita). Várias orientações diferentes das proteínas ainda funcionam, indicando que as proteínas podem ser engendradas em ordens diferentes dependendo das necessidades do efetor.
[092] FIG. 32A-D. Um biossensor de CIRTS para alvejamento de RNA induzível. (A) Visão geral esquemática do projeto de biossensor de CIRTS de ácido abscísico (ABA). O componente de alvejamento mediado por gRNA de CIRTS é fundido a um dos domínios de heterodimerização de ABA (ABI) enquanto o componente efetor de CIRTS é fundido ao seu parceiro de ligação (PIL). Após a adição do ABA de molécula pequena, os dois componentes de CIRTS dimerizam e levam o efetor em proximidade do transcrito alvejado. (B) A degradação de RNA induzível por ABA de um transcrito repórter de proteína fluorescente vermelha (RFP) 48 h depois da transfecção pode ser mediada pelo domínio de nuclease Pin ou YTHDF2. (C) Ativação da tradução de RFP por CIRTS-YTHDF1 induzido por ABA 48 h depois da transfecção. (D) A liberação de CIRTS-hADAR com gRNA no alvo na presença de ABA a células transfectadas com um repórter de luciferase desativado por mutação (FlucW417X para edição de A-para-I ou o GlucC82R para edição de C-para-U) induz a edição de RNA dependente de ABA.
DESCRIÇÃO DAS MODALIDADES ILUSTRATIVAS
[093] A regulação epitranscriptômica controla o fluxo de informações através do dogma central e fornece oportunidades únicas para manipular o estado da célula ao nível de RNA. Entretanto, tanto estudos mecanísticos fundamentais quanto aplicações traducionais potenciais são impedidos por uma falta de métodos eficazes para alvejar RNAs específicos com proteínas efetoras. Aqui, os inventores apresentam o projeto e a validação de um sistema de alvejamento de RNA inspirado em CRISPR/Cas (CIRTS), uma nova estratégia de engenharia de proteína para construir sistemas reguladores de RNA programável. Os inventores mostram que CIRTS é uma abordagem simples e generalizável para liberar uma faixa de proteínas efetoras, incluindo nucleases, mecanismo de degradação e ativadores traducionais, para alvejar transcritos. CIRTS não são apenas menores do que sistemas programáveis de ligação a RNA de CRISPR/Cas que ocorrem naturalmente, mas podem ser construídos inteiramente a partir de partes de proteína humana. O tamanho pequeno e a natureza derivada de humano de CIRTS fornece um método menos perturbativo para estudos reguladores de RNA fundamentais bem como uma estratégia potencial para evitar problemas imunológicos quando aplicada a terapias de modulação de epitranscriptoma. I. DOMÍNIO REGULADOR DE RNA
[094]É considerado que qualquer domínio regulador de RNA pode ser usado nos métodos e sistemas da revelação atual. Por exemplo, um domínio regulador de RNA com uma ou mais das atividades seguintes pode ser usado: metilação, 5ʹ-3ʹ guanililação, fosforribosilação, desaminação, carbamoilação, isopentenilação, agmatinilação, acetilação, lisilação, troca de O/S, galactosilação, glutamilação, manosilação, hidrogenação, formação de pseudouridina, carboximetilaminometilação, aminometilação, descarboximetilação, desidrogenação, carboximetilação, hidroxilação, metiltiolação, 3-amino-3-carboxipropilação, desmetilação, 5ʹ-5ʹ guanililação e desfosforilação.
[095]Domínios reguladores de RNA exemplares incluem domínios das proteínas seguintes da Tabela 1 (ou fragmentos funcionais dos mesmos): Tabela 1 Acrônimo Nome completo Organismo Atividade BCDIN3D contendo domínio de BCDIN3 Homo sapiens metilação Nop1 rRNA 2′-O-metiltransferase Saccharomyces metilação fibrillarina cerevisiae rRNA (adenosina-2’-O-)- Streptomyces Nsr metilação metiltransferase actuosus tRNA-2′-O-metiltransferase Saccharomyces Trm13 metilação TRM13 cerevisiae rRNA (adenosina-2’-O-)- Streptomyces Tsr metilação metiltransferase cyaneus rRNA adenina N-1- Streptomyces sp.
KamB metilação metiltransferase DSM 40477 rRNA adenina N-1- NpmA Escherichia coli metilação metiltransferase
Proteína 8 de processamento Saccharomyces Rrp8 metilação de RNA ribossômico cerevisiae tRNA metiltransferase 10 C, TRMT10C Homo sapiens metilação mitocondrial subunidade catalítica TRM61 Saccharomyces Trm61 de tRNA (adenina(58)-N(1))- metilação cerevisiae metiltransferase tRNA (adenina(57)- Pyrococcus TrmI N(1)/adenina(58)-N(1))- metilação abyssi metiltransferase TrmI tRNA (adenina(58)-N(1))- Thermus TrmI metilação metiltransferase TrmI thermophilus tRNA (adenina(58)-N(1))- Tuberculose por TrmI metilação metiltransferase TrmI micobactéria tRNA (adenina(22)-N(1))- TrmK Bacillus subtilis metilação metiltransferase subunidade catalítica TRMT61A Trmt61A de tRNA (adenina(58)-N(1))- Homo sapiens metilação metiltransferase tRNA (adenina(58)-N(1))- Trmt61B Homo sapiens metilação metiltransferase, mitocondrial
METTL14 Homo sapiens metilação subunidade de 70 kDa de N6- METTL3 Homo sapiens metilação adenosina-metiltransferase
Saccharomyces RsmA Dimetiladenosina transferase metilação cerevisiae rRNA adenina N-6- Streptococcus ErmAM metilação metiltransferase pneumoniae
Subunidade grande de RNA Staphylococcus Cfr ribossômico metiltransferase metilação sciuri Cfr rRNA 2′-O-metiltransferase Saccharomyces Nop1 metilação fibrillarina cerevisiae tRNA (citosina(38)-C(5))- Dnmt2 Homo sapiens metilação metiltransferase tRNA (citosina(34)-C(5))- Trm4 Homo sapiens metilação metiltransferase rRNA metiltransferase 1, MRM1 Homo sapiens metilação mitocondrial
Proteína 1 semelhante a RNA RNMTL1 Homo sapiens metilação metiltransferase tRNA (guanina(37)-N1)- TRM5 Homo sapiens metilação metiltransferase homólogo A de tRNA TRMT10A Homo sapiens metilação metiltransferase 10 homólogo B de tRNA TRMT10B Homo sapiens metilação metiltransferase 10 tRNA metiltransferase 10 C, TRMT10C Homo sapiens metilação mitocondrial tRNA (guanina-N(7)-)- TRMB Homo sapiens metilação metiltransferase
RNA cap guanina-N7 Hcm1 Homo sapiens metilação metiltransferase rRNA metiltransferase 2, MRM2 Homo sapiens metilação mitocondrial
Homólogo 8 de proteína alkB de ALKBH8 Homo sapiens metilação reparo de DNA alquilado
BCDIN3D contendo domínio de BCDIN3 Homo sapiens metilação
Tgs1 trimetilguanosinasintase 1 Homo sapiens metilação tRNA (guanina(26)-N(2))- Trm1 Homo sapiens metilação dimetiltransferase
Saccharomyces Thg1 tRNA(His) guanililtransferase 5ʹ-3ʹ guanililação cerevisiae tRNA A64-2′-O-ribosilfosfato Saccharomyces Rit1 fosforribosilação transferase cerevisiae adenosina desaminase 1 Saccharomyces Tad1 desaminação específica de tRNA cerevisiae adenosina desaminase 1 Tad1 Homo sapiens desaminação específica de tRNA
Tad2 subunidade TAD2 de adenosina Saccharomyces desaminação desaminase específica de tRNA cerevisiae subunidade TAD3 de adenosina Saccharomyces Tad3 desaminase específica de tRNA desaminação cerevisiae subunidade adenosina desaminase TadA Escherichia coli desaminação específica de tRNA adenosina desaminase Arabidopsis TadA específica de tRNA, desaminação thaliana cloroplástica citidina desaminase específica Methanopyrus CDAT8 desaminação de tRNA kandleri tRNA (adenosina(37)-N6)- MiaA Escherichia coli isopentenilação dimetilaliltransferase tRNA dimetilaliltransferase, Saccharomyces Mod5 isopentenilação mitocondrial cerevisiae tRNA dimetilaliltransferase, Mod5 Homo sapiens isopentenilação mitocondrial proteína SUA5 de biossíntese Saccharomyces Sua5 de tRNA carbamoilação cerevisiae treonilcarbamoiladenosina proteína de síntese de tRNA TsaD N6- Escherichia coli carbamoilação treonilcarbamoiladenosina(37)
tRNA(Ile2) 2-agmatinilcitidina Archaeoglobus TiaS agmatinilação sintase TiaS fulgidus
NAT10 N-acetiltransferase 10 Homo sapiens acetilação
TilS tRNA lisidina(34) sintetase Escherichia coli lisilação
TtcA tRNA 2-tiocitidina(32) sintetase Escherichia coli troca de O/S
2-tiouridilase 1 específica de TrmU Homo sapiens troca de O/S tRNA mitocondrial
Man/Gal-Q- tRNA-queuina vários galactosilação transferase glicosiltransferase eucariontes
GluQRS tRNA glutamil-Q(34) sintetase Escherichia coli glutamilação
Man/Gal-Q- tRNA-queuina vários manosilação transferase glicosiltransferase eucariontes
Saccharomyces Dus1 tRNA-di-hidrouridina sintase 1 hidrogenação cerevisiae
DusA tRNA di-hidrouridina sintase A Escherichia coli hidrogenação tRNA pseudouridina sintase 1, formação de Pus1 Homo sapiens mitocondrial pseudouridina
Saccharomyces formação de Pus1 tRNA pseudouridina sintase 1 cerevisiae pseudouridina tRNA pseudouridina(32) sintase/pseudouridina sintase A formação de RluA Escherichia coli de subunidade grande pseudouridina ribossômica
GTPase de síntese de tRNA carboximetilamino MnmE uridina(34) 5- Escherichia coli metilação carboximetilaminometila
GTPase de síntese de tRNA MnmE uridina(34) 5- Escherichia coli aminometilação carboximetilaminometila tRNA (5-metilaminometil-2- descarboximetilaç MnmCD Escherichia coli tiouridilato)-metiltransferase/ ão cmnm(5)s(2)U34 oxidorredutase dependente de
FAD dioxigenase FTO dependente FTO Homo sapiens desidrogenação de Alfa-cetoglutarato tRNA 5-metoxiuridina(34) CmoB Escherichia coli carboximetilação sintase tRNA 2-metiltio-N6-isopentenil Salmonella MiaE hidroxilação adenosina(37) hidroxilase typhimurium dioxigenase FTO dependente FTO Homo sapiens hidroxilação de alfa-cetoglutarato Homólogo 8 de proteína alkB de ALKBH8 Homo sapiens hidroxilação reparo de DNA alquilado tRNA (N6-isopentenil MiaB adenosina(37)-C2)- Escherichia coli metiltiolação metilthiotransferase Proteína 2 de síntese de tRNA Saccharomyces 3-amino-3- TYW2 wybutosina cerevisiae carboxipropilação ALKBH5 Homo sapiens desmetilação dioxigenase FTO dependente FTO Homo sapiens desmetilação de alfa-cetoglutarato HCAP1 Enzima de capeamento de RNA Homo sapiens 5ʹ-5ʹ guanililação HCAP1 Enzima de capeamento de RNA Homo sapiens desfosforilação
[096]Outros domínios reguladores de RNA incluem domínios funcionais das proteínas humanas seguintes da Tabela 2: Tabela 2 Símbolo do Sinônimos Descrição do gene gene proteína de motivo de ligação a RNA 5 [Fonte:HGNC RBM5 LUCA15; H37 Symbol;Acc:9902]
DEF-3; 3G2; NY- proteína de motivo de ligação a RNA 6 [Fonte:HGNC RBM6 LU-12; g16; DEF3 Symbol;Acc:9903]
RNA exonuclease putativa NEF-sp (EC 3.1.-.-) [Fonte:UniProtKB/Swiss-Prot;Acc:Q96IC2]
proteína de ligação à caixa Y 2 [Fonte:HGNC YBX2 MSY2; CSDA3 Symbol;Acc:17948]
domínio de choque frio contendo E1, ligação a RNA CSDE1 D1S155E; UNR [Fonte:HGNC Symbol;Acc:29905]
HNRPI; HNRNP-I; PTB2; PTB3; proteína de ligação ao trato de polipirimidina 1 PTBP1 PTB-1; PTB4; [Fonte:HGNC Symbol;Acc:9583] pPTB dedo de zinco tipo CCCH contendo 3 [Fonte:HGNC ZC3H3 KIAA0150 Symbol;Acc:28972]
KIAA0723; MATR3 matrin 3 [Fonte:HGNC Symbol;Acc:6912] MGC9105
KIAA1053; DKFZP434H0350; domínio do motivo alfa estéril contendo 4A SAMD4A Smaug; SMG; [Fonte:HGNC Symbol;Acc:23023] SMGA; hSmaug1
FLJ2194; domínio YTH contendo 2 [Fonte:HGNC YTHDC2 FLJ10053; Symbol;Acc:24721] DKFZp564A186
CUGBP2 repetição do tripleto CUG, proteína de ligação a
RNA 2 [Fonte:HGNC Symbol;Acc:2550] PUMH2; homólogo de pumilio 2 (Drosophila) [Fonte:HGNC PUM2 KIAA0235 Symbol;Acc:14958] FLJ20301; domínios de dedo anular e dedo de zinco tipo CCCH RC3H2 FLJ20713; 2 [Fonte:HGNC Symbol;Acc:21461] RNF164 dedo de zinco tipo CCCH contendo 11A ZC3H11A KIAA0663 [Fonte:HGNC Symbol;Acc:29093] FLJ22693; PARP- família de poli (ADP-ribose) polimerase, membro 12 PARP12 12; ZC3H1 [Fonte:HGNC Symbol;Acc:21919] dbpA; ZONAB; pseudogene 1 de proteína A de domínio de choque
CSDA CSDA1 frio [Fonte:HGNC Symbol;Acc:2429] fator de splicing, rico em arginina/serina 8 SFRS8 SWAP (suppressor-of-white-apricot homolog, Drosophila) [Fonte:HGNC Symbol;Acc:10790] fator de iniciação de tradução eucariótica 4B EIF4B [Fonte:HGNC Symbol;Acc:3285] Fator auxiliar de RNA nuclear pequeno de U2 2 U2AF2 U2AF65 [Fonte:HGNC Symbol;Acc:23156] fator de splicing, rico em arginina/serina 14 SFRS14 KIAA0365 [Fonte:HGNC Symbol;Acc:18641] KIAA0929; MINT; homólogo de spen, regulador transcricional
SPEN SHARP; RBM15C (Drosophila) [Fonte:HGNC Symbol;Acc:17575] dedo de zinco tipo CCCH contendo 15 [Fonte:HGNC ZC3H15 LEREPO4 Symbol;Acc:29528] YB-1; YB1; DBPB; proteína de ligação à caixa Y 1 [Fonte:HGNC YBX1 NSEP-1; MDR- Symbol;Acc:8014]
NF1; BP-8; CSDB; CSDA2
ELAV (embrionário letal, visão anormal, Drosophila)- ELAVL1 HuR; Hua; MelG like 1 (antígeno Hu R) [Fonte:HGNC Symbol;Acc:3312]
domínio THUMP contendo 1 [Fonte:HGNC THUMPD1 FLJ20274 Symbol;Acc:23807]
HRH1; PRP22; polipeptídeo 8 de caixa (Asp-Glu-Ala-His) DEAH DHX8 PRPF22 [Fonte:HGNC Symbol;Acc:2749]
domínio S1 de ligação a RNA 1 [Fonte:HGNC SRBD1 FLJ10379 Symbol;Acc:25521]
proteína de ligação a poli(A), citoplasmático 1 PABPC1 PABP1; PABPL1 [Fonte:HGNC Symbol;Acc:8554]
proteína 1 associada a DAZ [Fonte:HGNC DAZAP1 MGC19907 Symbol;Acc:2683]
proteína 2 de ligação a mRNA de fator de IGF2BP2 IMP-2 crescimento semelhante à insulina [Fonte:HGNC Symbol;Acc:28867]
NP220; proteína de dedo de zinco 638 [Fonte:HGNC ZNF638 MGC26130; Symbol;Acc:17894] Zfp638 antígeno do carcinoma de células escamosas KIAA0156; RP11 - SART3 reconhecido por células T 3 [Fonte:HGNC 13G14 Symbol;Acc:16860]
proteína de dedo anular makorin 2 [Fonte:HGNC MKRN2 RNF62; HSPC070 Symbol;Acc:7113]
RBM7 proteína de motivo de ligação a RNA 7 [Fonte:HGNC
Symbol;Acc:9904]
motivo de ligação a RNA, proteína de interação de RBMS2 SCR3 fita simples 2 [Fonte:HGNC Symbol;Acc:9909]
CHCR; FLJ11316; muscleblind-like 3 (Drosophila) [Fonte:HGNC MBNL3 MBLX39; MBXL Symbol;Acc:20564]
polipeptídeo A de ribonucleoproteína nuclear SNRPA U1A; U1-A; Mud1 pequeno [Fonte:HGNC Symbol;Acc:11151]
SYNJ2 INPP5H sinaptojanina 2 [Fonte:HGNC Symbol;Acc:11504]
homólogo A de Fox-1 (proteína de ligação 1 a Ataxin-2)(proteína de ligação 1 a A2BP1 Hexaribonucleotídeo) [Fonte:UniProtKB/Swiss- Prot;Acc:Q9NWB1]
Proteína de gene 6C contendo repetição de trinucleotídeo [Fonte:UniProtKB/Swiss- Prot;Acc:Q9HCJ0]
HAGE; polipeptídeo 43 de caixa DEAD (Asp-Glu-Ala-Asp) DDX43 DKFZp434H2114; [Fonte:HGNC Symbol;Acc:18677] CT13
KIAA0020 XTP5; PEN; PUF6 KIAA0020 [Fonte:HGNC Symbol;Acc:29676]
CLONE243; Complexo de transcrição de CCR4-NOT, CNOT4 NOT4H subunidade 4 [Fonte:HGNC Symbol;Acc:7880]
YT521; domínio YTH contendo 1 [Fonte:HGNC YTHDC1 KIAA1966; Symbol;Acc:30626] YT521-B
CyP-33; peptidilprolil isomerase E (ciclofilina E) PPIE MGC3736; [Fonte:HGNC Symbol;Acc:9258] MGC111222
ERPROT213 - 21; Proteína do retículo endoplasmático de homeostase
CHERP DAN16 de cálcio [Fonte:HGNC Symbol;Acc:16930] FLJ10290; proteína de motivo de ligação a RNA 22 RBM22 ZC3H16; fSAP47; [Fonte:HGNC Symbol;Acc:25503] Cwc2 KSRP; FBP2; Proteína reguladora de splicing do tipo KH
KHSRP FUBP2 [Fonte:HGNC Symbol;Acc:6316] TLS; FUS1; fundido em sarcoma [Fonte:HGNC
FUS hnRNP-P2 Symbol;Acc:4010] proteína de motivo de ligação a RNA 41 RBM41 FLJ11016 [Fonte:HGNC Symbol;Acc:25617] proteína de ligação a poli(rC) 4 [Fonte:HGNC PCBP4 MCG10; LIP4 Symbol;Acc:8652] proteína de ligação a poli(A), citoplasmático 4 (forma PABPC4 iPABP; APP-1 induzível) [Fonte:HGNC Symbol;Acc:8557] CAGH26; repetição de trinucleotídeo contendo 6A TNRC6A KIAA1460; [Fonte:HGNC Symbol;Acc:11969] GW182 KIAA1311; proteína de motivo de ligação a RNA 27 RBM27 ARRS1; Psc1 [Fonte:HGNC Symbol;Acc:29243] ribonucleoproteína nuclear heterogênea C (C1/C2) HNRNPC hnRNPC [Fonte:HGNC Symbol;Acc:5035] DAZH; SPGYLA; deletado em semelhante à azoospermia DAZL MGC26406; [Fonte:HGNC Symbol;Acc:2685] DAZL1 ribonucleoproteína nuclear heterogênea H3 (2H9) HNRNPH3 2H9 [Fonte:HGNC Symbol;Acc:5043]
KIAA0339; Set1; domínio SET contendo 1A [Fonte:HGNC SETD1A KMT2F Symbol;Acc:29010] proteína de ligação a RNA induzível a frio
CIRBP CIRP [Fonte:HGNC Symbol;Acc:1982] HTGR1; ribonucleoproteína nuclear heterogênea M HNRNPM HNRNPM4; [Fonte:HGNC Symbol;Acc:5046] HNRPM4 homólogo A de TRM2 tRNA metiltransferase 2 (S. TRMT2A HTF9C cerevisiae) [Fonte:HGNC Symbol;Acc:24974] SF3a120; fator de splicing 3a, subunidade 1, 120kDa SF3A1 SAP114; [Fonte:HGNC Symbol;Acc:10765] PRPF21; Prp21 polipeptídeo de ribonucleoproteína nuclear pequena SNRPD3 SMD3; Sm-D3 D3 18kDa [Fonte:HGNC Symbol;Acc:11160] PDIP46; polimerase (dirigida por DNA), proteína de interação POLDIP3 KIAA1649 delta 3 [Fonte:HGNC Symbol;Acc:23782] dedo de zinco, tipo matrin 5 [Fonte:HGNC ZMAT5 Symbol;Acc:28046] proteína de motivo de ligação a RNA 9 [Fonte:HGNC RBM9 HNRBP2; FOX-2 Symbol;Acc:9906] RoXaN; FLJ13787; dedo de zinco tipo CCCH contendo 7B ZC3H7B DKFZp434K0920; [Fonte:HGNC Symbol;Acc:30869] KIAA1031 proteína de motivo de ligação a RNA 23 RBM23 FLJ10482 [Fonte:HGNC Symbol;Acc:20155] SFRS5 SRP40; HRS fator de splicing, rico em arginina/serina 5
[Fonte:HGNC Symbol;Acc:10787]
FLJ11806; dedo de zinco tipo CCCH contendo 14 [Fonte:HGNC ZC3H14 UKp68; NY-REN- Symbol;Acc:20509] 37
KIAA0670; indutor de condensação de cromatina apoptótica 1 ACIN1 fSAP152 [Fonte:HGNC Symbol;Acc:17066]
proteína de ligação a poli(A), nuclear 1 PABPN1 PAB2 [Fonte:HGNC Symbol;Acc:8565]
dJ1069P2,3; proteína de ligação a poli(A), semelhante a 1 PABPC1L PABPC1L1; ePAB citoplasmática [Fonte:HGNC Symbol;Acc:15797]
bruno-like 4, proteína de ligação a RNA (Drosophila) BRUNOL4 [Fonte:HGNC Symbol;Acc:14015]
fator de estimulação de clivagem, 3’ pré-RNA, CSTF2 subunidade 2, 64kDa [Fonte:HGNC Symbol;Acc:2484]
dedo de zinco tipo CCCH contendo 12B ZC3H12B MCPIP2 [Fonte:HGNC Symbol;Acc:17407]
FMRP; FRAXA; retardo mental do X frágil 1 [Fonte:HGNC FMR1 MGC87458 Symbol;Acc:3775]
fator específico de HIV-1 Tat 1 [Fonte:HGNC HTATSF1 TAT-SF1 Symbol;Acc:5276]
proteína de motivo de ligação a RNA (RNP1, RRM) RBM3 IS1-RNPL 3 [Fonte:HGNC Symbol;Acc:9900]
proteína reguladora de splicing epitelial 2 ESRP2 FLJ21918 [Fonte:HGNC Symbol;Acc:26152]
contendo domínio de meteniltetraidrofolato sintetase MTHFSD FLJ12998 [Fonte:HGNC Symbol;Acc:25778]
Homólogo de DnaJ (Hsp40), subfamília C, membro DNAJC17 FLJ10634 17 [Fonte:HGNC Symbol;Acc:25556] MEF-2; FLJ11213; fator de expressão de mielina 2 [Fonte:HGNC MYEF2 KIAA1341; Symbol;Acc:17940] HsT18564 proteína reguladora de splicing epitelial 1 ESRP1 FLJ20171 [Fonte:HGNC Symbol;Acc:25966] ribonucleoproteína nuclear heterogênea L
HNRNPL [Fonte:HGNC Symbol;Acc:5045] ribonucleoproteína nuclear pequena 70kDa (U1) SNRNP70 U1 - 70K; Snp1 [Fonte:HGNC Symbol;Acc:11150] fator de splicing, rico em arginina/serina 16 SFRS16 SWAP2; CLASP [Fonte:HGNC Symbol;Acc:17731] homólogo de TRM1 tRNA metiltransferase 1 (S. TRMT1 FLJ20244 cerevisiae) [Fonte:HGNC Symbol;Acc:25980] antígeno ventral neuro-oncológico 2 [Fonte:HGNC NOVA2 ANOVA Symbol;Acc:7887] F23858; SF4 DKFZp434E2216; fator de splicing 4 [Fonte:HGNC Symbol;Acc:18643]
RBP ZAP; FLB6421; FLJ13288; dedo de zinco tipo CCCH, antiviral 1 [Fonte:HGNC ZC3HAV1 MGC48898; Symbol;Acc:23721] ZC3HDC2; ZC3H2; PARP13 EIF3B PRT1; eIF3b fator de iniciação de tradução eucariótica 3,
subunidade B [Fonte:HGNC Symbol;Acc:3280]
proteína de motivo de ligação a RNA 28 RBM28 FLJ10377 [Fonte:HGNC Symbol;Acc:21863]
homólogo de LSM5, associado a RNA nuclear LSM5 YER146W pequeno de U6 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:17162]
WSCR1; fator de iniciação de tradução eucariótica 4H EIF4H KIAA0038 [Fonte:HGNC Symbol;Acc:12741]
ELAV (embrionário letal, visão anormal, Drosophila)- ELAVL2 HuB; HEL-N1 like 2 (antígeno Hu B) [Fonte:HGNC Symbol;Acc:3313]
proteína de ligação a elemento a montante distante FUBP3 (FUSE) 3 [Fonte:HGNC Symbol;Acc:4005]
proteína de ligação a elemento de poliadenilação CPEB3 KIAA0940 citoplasmática 3 [Fonte:HGNC Symbol;Acc:21746]
família de domínio de ribonucleoproteína La, LARP4B membro 4B [Fonte:HGNC Symbol;Acc:28987]
KIAA0162; supressor de homólogo de Ty 6 (S. cerevisiae) SUPT6H SPT6H [Fonte:HGNC Symbol;Acc:11470]
receptor gama ativado por proliferador de PPARGC1A PGC1; PGC1A peroxissoma, coativador 1 alfa [Fonte:HGNC Symbol;Acc:9237]
CFIM; HPBRII-4; CPSF6 HPBRII-7; microRNA 1279 [Fonte:HGNC Symbol;Acc:35357] CFIM68
KRR1, componente de processoma de subunidade KRR1 RIP-1 pequena (SSU), homólogo (levedura) [Fonte:HGNC
Symbol;Acc:5176] fator de splicing, rico em arginina/serina 9 SFRS9 SRp30c [Fonte:HGNC Symbol;Acc:10791] fator de splicing, rico em arginina/serina 3 SFRS3 SRp20 [Fonte:HGNC Symbol;Acc:10785] FLJ30829; proteína de motivo de ligação a RNA 24 RBM24 dJ259A10,1 [Fonte:HGNC Symbol;Acc:21539] contendo domínio de KH, ligação de RNA, SLM1; SLM-1; KHDRBS2 associado à transdução de sinal 2 [Fonte:HGNC MGC26664 Symbol;Acc:18114] Homólogo de tremor, ligação de RNA ao domínio de QKI QK3 KH (camundongo) [Fonte:HGNC Symbol;Acc:21100] proteína de ligação a elemento de poliadenilação CPEB4 KIAA1673 citoplasmática 4 [Fonte:HGNC Symbol;Acc:21747] retardo mental do X frágil, homólogo autossômico 1 FXR1 [Fonte:HGNC Symbol;Acc:4023] NCL C23 nucleolina [Fonte:HGNC Symbol;Acc:7667] proteína de sítio de ramificação de pré-mRNA p14 (subunidade SF3B de 14 kDa) [Fonte:UniProtKB/Swiss-Prot;Acc:Q9Y3B4] proteína de ligação à lipoproteína de alta densidade
HDLBP HBP [Fonte:HGNC Symbol;Acc:4857] 9G8; ZCRB2; HSSG1; AAG3; fator de splicing, rico em arginina/serina 7, 35kDa SFRS7 RBM37; [Fonte:HGNC Symbol;Acc:10789] ZCCHC20 parceiro de homólogo de NOB1 (S. cerevisiae) PNO1 [Fonte:HGNC Symbol;Acc:32790]
proteína de ligação a RNA associada a grânulo TIA1 citotóxico de TIA1 [Fonte:HGNC Symbol;Acc:11802]
fator de splicing, rico em arginina/serina 4 SFRS4 SRP75 [Fonte:HGNC Symbol;Acc:10786]
fator de splicing rico em prolina/glutamina (proteína SFPQ PSF de ligação ao trato de polipirimidina associado) [Fonte:HGNC Symbol;Acc:10774]
fator de splicing, rico em arginina/serina 11 SFRS11 p54; NET2 [Fonte:HGNC Symbol;Acc:10782]
homólogo do fator de processamento pré-mRNA 3 PRPF3 Prp3; HPRP3 PRP3 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:17348]
brPTB; nPTB; proteína de ligação ao trato de polipirimidina 2 PTBP2 PTB; PTBLP [Fonte:HGNC Symbol;Acc:17662]
regulador de ROD1 de diferenciação 1 (S. pombe) ROD1 PTBP3 [Fonte:HGNC Symbol;Acc:10253]
proteína de motivo de ligação a RNA 18 RBM18 MGC2734 [Fonte:HGNC Symbol;Acc:28413]
proteína de ligação a RNA de interação haste-alça C14orf156 DC50 de SRA, Precursor mitocondrial [Fonte:UniProtKB/Swiss-Prot;Acc:Q9GZT3]
S164; fSAP94; proteína de motivo de ligação a RNA 25 RBM25 NET52; Snu71 [Fonte:HGNC Symbol;Acc:23244]
FLJ10094; PIG38; Trocador de ecto-NOX dissulfeto-tiol 1 [Fonte:HGNC ENOX1 CNOX; cCNOX Symbol;Acc:25474]
proteína de ligação a DNA de TAR [Fonte:HGNC TARDBP TDP-43; ALS10 Symbol;Acc:11571]
AKAP121; AKAP149; Uma proteína de ancoragem de cinase (PRKA) 1 AKAP1 SAKAP84; S- [Fonte:HGNC Symbol;Acc:367] AKAP84; AKAP84 componente de paraspeckle 1 [Fonte:HGNC PSPC1 PSP1; FLJ10955 Symbol;Acc:20320]
PS1D; HSPC251; dedo de zinco, domínio de CCHC contendo 17 ZCCHC17 pNO40 [Fonte:HGNC Symbol;Acc:30246]
contendo domínio de KH, ligação de RNA, Sam68; p62; KHDRBS1 associado à transdução de sinal 1 [Fonte:HGNC FLJ34027 Symbol;Acc:18116]
HSPC055; dedo de zinco tipo CCCH contendo 7A ZC3H7A FLJ20318 [Fonte:HGNC Symbol;Acc:30959]
ribonucleoproteína nuclear heterogênea A2/B1 HNRNPA2B1 [Fonte:HGNC Symbol;Acc:5033]
homólogo C bicaudal 1 (Drosophila) [Fonte:HGNC BICC1 Symbol;Acc:19351]
DKFZp586F1023; proteína de motivo de ligação a RNA 19 RBM19 KIAA0682 [Fonte:HGNC Symbol;Acc:29098]
dedo de zinco tipo CCCH contendo 13 [Fonte:HGNC ZC3H13 DKFZp434D1812 Symbol;Acc:20368]
fator de splicing, rico em arginina/serina 6 SFRS6 SRP55; B52 [Fonte:HGNC Symbol;Acc:10788]
proteína de dedo anular 113A [Fonte:HGNC RNF113A RNF113; Cwc24 Symbol;Acc:12974]
polipeptídeo de ribonucleoproteína nuclear pequena SNRPD2 Sm-D2 D2 16,5kDa [Fonte:HGNC Symbol;Acc:11159] COD; SmB/SmB’; polipeptídeos de ribonucleoproteína nuclear SNRPB Sm-B/B’; snRNP- pequena B e B1 [Fonte:HGNC Symbol;Acc:11153]
B polipeptídeo de ribonucleoproteína nuclear pequena SNRPB2 Msl1 B’’ [Fonte:HGNC Symbol;Acc:11155] R de ribonucleoproteína nuclear heterogênea HNRNPR hnRNP-R [Fonte:HGNC Symbol;Acc:5047] proteína de ligação a RNA, autoantigênico RALY P542; HNRPCL2 (associado a hnRNP com homólogo amarelo letal (camundongo)) [Fonte:HGNC Symbol;Acc:15921] proteína de motivo de ligação a RNA 42 RBM42 MGC10433 [Fonte:HGNC Symbol;Acc:28117] hnRNPH’; FTP3; ribonucleoproteína nuclear heterogênea H2 (H’) HNRNPH2 HNRPH’ [Fonte:HGNC Symbol;Acc:5042] RNF162A; TIS11; proteína de dedo de zinco 36, tipo C3H, homólogo ZFP36 G0S24; TTP; (camundongo) [Fonte:HGNC Symbol;Acc:12862] NUP475 N(alfa)-acetiltransferase 38, subunidade auxiliar de NAA38 YJR022W NatC [Fonte:HGNC Symbol;Acc:20471] SMN; SM-D; HCERN3; polipeptídeo de ribonucleoproteína nuclear pequena SNRPN SNRNP-N; N [Fonte:HGNC Symbol;Acc:11164] SNURF-SNRPN; RT-LI FXR2 retardo mental do X frágil, homólogo autossômico 2
[Fonte:HGNC Symbol;Acc:4024]
fator de fixação a andaime B2 [Fonte:HGNC SAFB2 KIAA0138 Symbol;Acc:21605]
homólogo de LSM7, associado a RNA nuclear LSM7 YNL147W pequeno de U6 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:20470]
homólogo de LSM4, associado a RNA nuclear LSM4 YER112W pequeno de U6 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:17259]
dedo de zinco tipo CCCH contendo 4 [Fonte:HGNC ZC3H4 KIAA1064 Symbol;Acc:17808]
eIF3-delta; eIF3- fator de iniciação de tradução eucariótica 3, EIF3G p44; eIF3g subunidade G [Fonte:HGNC Symbol;Acc:3274]
XAP101; dyskerin; RNA nucleolar pequeno, caixa H/ACA 56 DKC1 NAP57; NOLA4 [Fonte:HGNC Symbol;Acc:32650]
semelhante à peptidilprolil isomerase (ciclofilina) 4 PPIL4 [Fonte:HGNC Symbol;Acc:15702]
CC1,3; HCC1; proteína de motivo de ligação a RNA 39 RBM39 CAPER; fSAP59 [Fonte:HGNC Symbol;Acc:15923]
MASK; FLJ20288; FLJ11979; repetição de ancirina e contendo domínio de KH 1 ANKHD1 FLJ10042; [Fonte:HGNC Symbol;Acc:24714] FLJ14127; KIAA1085
T-STAR; Etle; contendo domínio de KH, ligação de RNA, KHDRBS3 etoile; SALP; associado à transdução de sinal 3 [Fonte:HGNC SLM2; SLM-2 Symbol;Acc:18117]
ZNRP; BOV-1A; proteína de motivo de ligação a RNA 8A RBM8A BOV-1B; BOV-1C; [Fonte:HGNC Symbol;Acc:9905] RBM8B; Y14 homólogo de lin-28 (C. elegans) [Fonte:HGNC LIN28 Symbol;Acc:15986]
fator de ligação à sequência de RNA rica em G 1 GRSF1 [Fonte:HGNC Symbol;Acc:4610]
GTAR; KIAA0697; Domínio de repetição de ancirina 17 [Fonte:HGNC ANKRD17 FLJ22206; NY- Symbol;Acc:23575] BR-16 homólogo desalinhado (Drosophila) [Fonte:HGNC UNK KIAA1753 Symbol;Acc:29369]
CGI-37; homólogo de importação nuclear 7 (S. cerevisiae) NIP7 FLJ10296; [Fonte:HGNC Symbol;Acc:24328] HSPC031; KD93 alvo de EGR1, membro 1 (nuclear) [Fonte:HGNC TOE1 Symbol;Acc:15954]
HSRNASEB; proteína de motivo de ligação a RNA 38 RBM38 SEB4D; seb4B; [Fonte:HGNC Symbol;Acc:15818] dJ800J21,2
SRM160; matriz repetitiva de serina/arginina 1 [Fonte:HGNC SRRM1 POP101; Symbol;Acc:16638] MGC39488 proteína de dedo anular makorin 1 [Fonte:HGNC MKRN1 RNF61 Symbol;Acc:7112]
fator de iniciação de tradução eucariótica 2, EIF2S1 EIF-2alfa; EIF2A subunidade 1 alfa, 35kDa [Fonte:HGNC
Symbol;Acc:3265]
domínio THUMP contendo 3 [Fonte:HGNC THUMPD3 DKFZP434F091 Symbol;Acc:24493]
proteína de motivo de ligação a RNA, X-ligado 2 RBMX2 CGI-79 [Fonte:HGNC Symbol;Acc:24282]
PUMH1; homólogo de pumilio 1 (Drosophila) [Fonte:HGNC PUM1 KIAA0099 Symbol;Acc:14957]
homólogo de musashi 1 (Drosophila) [Fonte:HGNC MSI1 Symbol;Acc:7330]
NSAP1; GRY- ligação à sinaptotagmina, proteína de interação a RBP; dJ3J17,2; SYNCRIP RNA citoplasmático [Fonte:HGNC HNRPQ1; Symbol;Acc:16918] hnRNP-Q dedo de zinco tipo CCCH contendo 10 [Fonte:HGNC ZC3H10 FLJ14451 Symbol;Acc:25893]
hnRNPA1; ribonucleoproteína nuclear heterogênea A1 HNRNPA1 hnRNP-A1 [Fonte:HGNC Symbol;Acc:5031]
KIAA2025; roquin; domínios de dedo anular e dedo de zinco tipo CCCH RC3H1 RP5 - 1198E17,5; 1 [Fonte:HGNC Symbol;Acc:29434] RNF198 proteína de ligação a mRNA 3 de fator de IGF2BP3 IMP-3; CT98 crescimento semelhante à insulina 2 [Fonte:HGNC Symbol;Acc:28868]
NLP_1; CG1; semelhante à nucleoporina 2 [Fonte:HGNC NUPL2 hCG1; Symbol;Acc:17010] H_RG271G13,9
SFRS1 ASF; SF2; fator de splicing, rico em arginina/serina 1
SRp30a; SF2p33; [Fonte:HGNC Symbol;Acc:10780] MGC5228 homólogo beta transformante 2 (Drosophila) TRA2B Htra2-beta [Fonte:HGNC Symbol;Acc:10781]
proteína de ligação a elemento de poliadenilação CPEB2 citoplasmática 2 [Fonte:HGNC Symbol;Acc:21745]
alkB, homólogo de reparo de alquilação 8 (E. coli) ALKBH8 MGC10235 [Fonte:HGNC Symbol;Acc:25189]
SAFB-like, modulador de transcrição [Fonte:HGNC SLTM Met; FLJ13213 Symbol;Acc:20709]
PNPase; OLD35; poliribonucleotídeo nucleotidiltransferase 1 PNPT1 old-35 [Fonte:HGNC Symbol;Acc:23166]
domínio THUMP contendo 2 [Fonte:HGNC THUMPD2 MGC2454 Symbol;Acc:14890]
CGI-18; subunidade 1 do complexo de cointegrador de sinal ASCC1 ASC1p50; de ativação 1 [Fonte:HGNC Symbol;Acc:24268] Em:AC022392,3 antígeno de síndrome de Sjogren B (autoantigen La) SSB LARP3; La [Fonte:HGNC Symbol;Acc:11316]
ribonucleoproteína nuclear heterogênea D HNRNPD (elemento proteína de ligação a RNA 1 rico em AU, 37kDa) [Fonte:HGNC Symbol;Acc:5036]
FLJ10378; família de domínio de ribonucleoproteína La, LARP1B DKFZp434K245; membro 1B [Fonte:HGNC Symbol;Acc:24704] DKFZp686E0316 proteína de ligação à proteína de ativação de G3BP2 KIAA0660 GTPase (domínio SH3) 2 [Fonte:HGNC
Symbol;Acc:30291]
MADP-1; MADP1; dedo de zinco tipo CCHC e motivo de ligação a RNA ZCRB1 RBM36; 1 [Fonte:HGNC Symbol;Acc:29620] ZCCHC19 polipeptídeo de ribonucleoproteína nuclear pequena SNRPF Sm-F F [Fonte:HGNC Symbol;Acc:11162]
proteína 2 semelhante à A1 de ribonucleoproteína nuclear pequena (proteína 2 semelhante à proteína de núcleo de hnRNP A1) [Fonte:UniProtKB/Swiss- Prot;Acc:Q32P51]
KIAA1076; Set1B; domínio SET contendo 1B [Fonte:HGNC SETD1B KMT2G Symbol;Acc:29187]
PRO1777; SE70 a proteína de motivo de ligação a RNA 26 RBM26 2; FLJ20957; [Fonte:HGNC Symbol;Acc:20327] ZC3H17; ARRS2
Semelhante a muscleblind 2 (Drosophila) MBNL2 MBLL; MBLL39 [Fonte:HGNC Symbol;Acc:16746]
proteína de dedo anular 113B [Fonte:HGNC RNF113B RNF161 Symbol;Acc:17267]
antígeno ventral neuro-oncológico 1 [Fonte:HGNC NOVA1 Symbol;Acc:7886]
bruno-like 6, proteína de ligação a RNA (Drosophila) BRUNOL6 [Fonte:HGNC Symbol;Acc:14059]
Semelhante à di-hidrouridina sintase 3 (S.
DUS3L DUS3; FLJ13896 cerevisiae) [Fonte:HGNC Symbol;Acc:26920]
SAP49; SF3b49; fator de splicing 3b, subunidade 4, 49kDa SF3B4 Hsh49 [Fonte:HGNC Symbol;Acc:10771]
LGTN ligatina [Fonte:HGNC Symbol;Acc:6583] ribonucleoproteína nuclear heterogênea L-like
HNRPLL [Fonte:HGNC Symbol;Acc:25127] polipeptídeo de ribonucleoproteína nuclear pequena SNRPG Sm-G G [Fonte:HGNC Symbol;Acc:11163] dedo de zinco tipo CCCH contendo 8 [Fonte:HGNC ZC3H8 Fliz1 Symbol;Acc:30941] motivo de ligação a RNA, proteína de interação de RBMS3 fita simples [Fonte:HGNC Symbol;Acc:13427] proteína de ligação à proteína de ativação de G3BP1 HDH-VIII; G3BP GTPase (domínio SH3) 1 [Fonte:HGNC Symbol;Acc:30292] NRB54; NMT55; contendo domínio que não POU, ligação a octâmero
NONO P54NRB; P54 [Fonte:HGNC Symbol;Acc:7871] proteína de motivo de ligação a RNA, X-ligado RBMX RNMX; hnRNP-G [Fonte:HGNC Symbol;Acc:9910] ACF; ASP; fator de complementação de APOBEC1 A1CF ACF64; ACF65; [Fonte:HGNC Symbol;Acc:24086] APOBEC1CF receptor gama ativado por proliferador de PRC; KIAA0595; PPRC1 peroxissoma, relacionado a coativador 1 MGC74642 [Fonte:HGNC Symbol;Acc:30025] morte celular programada 11 [Fonte:HGNC PDCD11 KIAA0185; ALG-4 Symbol;Acc:13408] FLJ22347; uridilil transferase terminal 1, específico de snRNA TUT1 FLJ22267; de U6 [Fonte:HGNC Symbol;Acc:26184] FLJ21850;
PAPD2; TUTase repetição do tripleto CUG, proteína de ligação a CUGBP1 RNA 1 [Fonte:HGNC Symbol;Acc:2549] FLJ26283; proteína ribossômica S3 [Fonte:HGNC RPS3 FLJ27450; Symbol;Acc:10420] MGC87870 KIAA1726; dedo de zinco tipo CCCH contendo 12C ZC3H12C MCPIP3 [Fonte:HGNC Symbol;Acc:29362] Fator específico de clivagem e poliadenilação 7, CPSF7 FLJ12529 59kDa [Fonte:HGNC Symbol;Acc:30098] Família de domínio YTH, membro 1 [Fonte:HGNC YTHDF1 FLJ20391 Symbol;Acc:15867] proteína de ligação a poli(A), citoplasmático 3 PABPC3 PABP3; tPABP [Fonte:HGNC Symbol;Acc:8556] semelhante à proteína de ligação a RNA associada TIAL1 TIAR a grânulo citotóxico de TIA1 1 [Fonte:HGNC Symbol;Acc:11804] proteína de motivo de ligação a RNA 46 RBM46 MGC27016; CT68 [Fonte:HGNC Symbol;Acc:28401] motivo de homologia de U2AF (UHM) cinase 1 UHMK1 KIS; Kist [Fonte:HGNC Symbol;Acc:19683] bol, semelhante a cristal (Drosophila) [Fonte:HGNC
BOLL BOULE Symbol;Acc:14273] ERF2; RNF162C; proteína de dedo de zinco 36, semelhante a tipo ZFP36L2 TIS11D C3H 2 [Fonte:HGNC Symbol;Acc:1108] homólogo de subunidade de ribonuclease PAN3 específico de PAN3 poli(A) (S. cerevisiae)
[Fonte:HGNC Symbol;Acc:29991]
KIAA0428; muscleblind-like (Drosophila) [Fonte:HGNC MBNL1 EXP42; EXP40; Symbol;Acc:6923] EXP35; EXP ribonucleoproteína nuclear heterogênea D-like HNRPDL JKTBP; laAUF1 [Fonte:HGNC Symbol;Acc:5037]
CRHSP-24; cálcio regulado calor estável proteína 1, 24kDa CARHSP1 CSDC1 [Fonte:HGNC Symbol;Acc:17150]
SCR2; MSSP-1; MSSP-2; MSSP- motivo de ligação a RNA, proteína de interação de RBMS1 3; YC1; HCC-4; fita simples 1 [Fonte:HGNC Symbol;Acc:9907] DKFZp564H0764
DKFZp564B176; fator de splicing, rico em arginina/serina 12 SFRS12 SRrp86; SRrp508 [Fonte:HGNC Symbol;Acc:17882]
homólogo de musashi 2 (Drosophila) [Fonte:HGNC MSI2 Symbol;Acc:18585]
fator de splicing, rico em arginina/serina 13B SFRS13B SRrp35; SFRS19 [Fonte:HGNC Symbol;Acc:21220]
tRNA (uracil-O(2)-)-metiltransferase provável (EC C4orf23 FLJ35725 2,1,1.n2) [Fonte:UniProtKB/Swiss-Prot;Acc:Q8IYL2]
Fosfoproteína nucleolar de interação a MKI67 MKI67IP Nopp34; NIFK (domínio FHA) [Fonte:HGNC Symbol;Acc:17838]
LARP; KIAA0731; família de domínio de ribonucleoproteína La, LARP1 MGC19556 membro 1 [Fonte:HGNC Symbol;Acc:29531]
proteína de motivo de ligação a RNA 45 RBM45 DRB1; FLJ44612 [Fonte:HGNC Symbol;Acc:24468]
PPARGC1B PERC; PGC1B receptor gama ativado por proliferador de peroxissoma, coativador 1 beta [Fonte:HGNC Symbol;Acc:30022] LSM11, associado a RNA nuclear pequeno de U7 LSM11 FLJ38273 [Fonte:HGNC Symbol;Acc:30860] KIAA1172; fator de splicing, rico em arginina/serina 15 SFRS15 DKFZp434E098; [Fonte:HGNC Symbol;Acc:19304] SRA4; SCAF4 proteína de ligação a RNA com múltiplo splicing
RBPMS HERMES [Fonte:HGNC Symbol;Acc:19097] dedo de zinco tipo CCCH contendo 18 [Fonte:HGNC ZC3H18 NHN1 Symbol;Acc:25091] SYNJ1 INPP5G sinaptojanina 1 [Fonte:HGNC Symbol;Acc:11503] proteína de ligação a mRNA 1 de fator de IGF2BP1 IMP-1; ZBP1 crescimento semelhante à insulina 2 [Fonte:HGNC Symbol;Acc:28866] repetição de trinucleotídeo contendo 4 [Fonte:HGNC TNRC4 Symbol;Acc:11967] U2AF35; Fator auxiliar de RNA nuclear pequeno de U2 1 U2AF1 RNU2AF1; RN [Fonte:HGNC Symbol;Acc:12453] fator de fixação a andaime B [Fonte:HGNC SAFB HET; SAFB1 Symbol;Acc:10520] Fator específico de clivagem e poliadenilação 4, CPSF4 NAR; CPSF30 30kDa [Fonte:HGNC Symbol;Acc:2327] bruno-like 5, proteína de ligação a RNA (Drosophila) BRUNOL5 [Fonte:HGNC Symbol;Acc:14058] MGC33901; Fator auxiliar de RNA nuclear pequeno de U2 1-like U2AF1L4 U2af26 4 [Fonte:HGNC Symbol;Acc:23020]
SC-35; SC35; fator de splicing, rico em arginina/serina 2 SFRS2 PR264; SFRS2A [Fonte:HGNC Symbol;Acc:10783]
família de domínio de ribonucleoproteína La, LARP4 PP13296 membro 4 [Fonte:HGNC Symbol;Acc:24320]
ribonucleoproteína, ligação a PTB 1 [Fonte:HGNC RAVER1 KIAA1978 Symbol;Acc:30296]
ELAV (embrionário letal, visão anormal, Drosophila)- ELAVL4 PNEM like 4 (antígeno Hu D) [Fonte:HGNC Symbol;Acc:3315]
KIAA1579; ribonucleoproteína, ligação a PTB 2 [Fonte:HGNC RAVER2 FLJ10770 Symbol;Acc:25577]
proteína de ligação a elemento a montante distante FUBP1 FBP (FUSE) 1 [Fonte:HGNC Symbol;Acc:4004]
proteína de motivo de ligação a RNA 15 RBM15 OTT; OTT1 [Fonte:HGNC Symbol;Acc:14959]
polipeptídeo de caixa DEAH (Asp-Glu-Ala-Asp/His) DHX57 DDX57 57 [Fonte:HGNC Symbol;Acc:20086]
domínio tudor contendo 10 [Fonte:HGNC TDRD10 DKFZp434M202 Symbol;Acc:25316]
DKFZP434J214; DKFZp686N0351; poli(ADP-ribose) polimerase induzível por TCDD TIPARP DDF1; PARP7; [Fonte:HGNC Symbol;Acc:23696] PARP-7; PARP-1; pART14; RM1 proteína de motivo de ligação a RNA 47 RBM47 FLJ20273; NET18 [Fonte:HGNC Symbol;Acc:30358]
SR140 proteína associada a U2SR140 (140 kDa Ser/Arg-
rich domínio proteína) [Fonte:UniProtKB/Swiss- Prot;Acc:O15042]
FLJ00166; Domínio de repetição de tetratricopeptídeo 14 TTC14 KIAA1980 [Fonte:HGNC Symbol;Acc:24697]
Homólogo de LSM6, associado a RNA nuclear LSM6 YDR378C pequeno de U6 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:17017]
Homólogo alfa 2 transformante (Drosophila) TRA2A htra-2-alfa; tra2a [Fonte:HGNC Symbol;Acc:16645]
HNRNPK CSBP; TUNP microRNA 7-1 [Fonte:HGNC Symbol;Acc:31638]
Trocador de ecto-NOX dissulfeto-tiol 2 [Fonte:HGNC ENOX2 APK1; tNOX Symbol;Acc:2259]
acheron; família de domínio de ribonucleoproteína La, LARP6 FLJ11196 membro 6 [Fonte:HGNC Symbol;Acc:24012]
KIAA0430 LKAP KIAA0430 [Fonte:HGNC Symbol;Acc:29562]
proteína de ligação a RNA com múltiplo splicing 2 RBPMS2 [Fonte:HGNC Symbol;Acc:19098]
polipeptídeo de ribonucleoproteína nuclear pequena SNRPD1 HsT2456; Sm-D1 D1 16kDa [Fonte:HGNC Symbol;Acc:11158]
domínio do motivo alfa estéril contendo 14 SAMD14 FLJ36890 [Fonte:HGNC Symbol;Acc:27312]
homólogo de Fox-1 C [Fonte:UniProtKB/Swiss- Prot;Acc:A6NFN3]
hRPB19; hsRPB7; polipeptídeo de polimerase (RNA) II (dirigida por POLR2G RPB7 DNA) G [Fonte:HGNC Symbol;Acc:9194]
SF1 ZFM1 fator de splicing 1 [Fonte:HGNC Symbol;Acc:12950]
HNRNPH1 hnRNPH ribonucleoproteína nuclear heterogênea H1 (H)
[Fonte:HGNC Symbol;Acc:5041] dedo de zinco (CCCH tipo), motivo de ligação a RNA ZRSR2 U2AF1-RS2; URP e rico em serina/arginina 2 [Fonte:HGNC Symbol;Acc:23019] HNRPE1; hnRNP- proteína de ligação a poli(rC) 1 [Fonte:HGNC PCBP1 E1; HNRPX; Symbol;Acc:8647] hnRNP-X proteína de motivo de ligação a RNA, Y-ligado, RBMY1F MGC33094 família 1, membro F [Fonte:HGNC Symbol;Acc:23974] ribonucleoproteína nuclear heterogênea F
HNRNPF [Fonte:HGNC Symbol;Acc:5039] ribonucleoproteína nuclear heterogênea A3 HNRNPA3 [Fonte:HGNC Symbol;Acc:24941] HNRNPG-T; proteína de motivo de ligação a RNA, semelhante a RBMXL2 HNRPGT X-ligado 2 [Fonte:HGNC Symbol;Acc:17886] homólogo de LSM3, associado a RNA nuclear YLR438C; SMX4; LSM3 pequeno de U6 (S. cerevisiae) [Fonte:HGNC USS2 Symbol;Acc:17874] subunidade de proteína de ligação de capeamento NCBP2L nuclear 2-like [Fonte:HGNC Symbol;Acc:31795] domínio de choque frio contendo C2, ligação de CSDC2 PIPPin RNA [Fonte:HGNC Symbol;Acc:30359] TAF15 RNA polimerase II, fator associado à hTAFII68; RBP56; TAF15 proteína de ligação à caixa TATA (TBP), 68kDa Npl3 [Fonte:HGNC Symbol;Acc:11547] RBM4B MGC10871; proteína de motivo de ligação a RNA 4B
ZCCHC15; [Fonte:HGNC Symbol;Acc:28842] RBM4L; ZCRB3B
LARK; RBM4A; proteína de motivo de ligação a RNA 4 [Fonte:HGNC RBM4 ZCRB3A; Symbol;Acc:9901] ZCCHC21
HDCMA18P; família de domínio de ribonucleoproteína La, LARP7 PIP7S; membro 7 [Fonte:HGNC Symbol;Acc:24912] DKFZP564K112 proteína de ligação a poli(A), citoplasmático 5 PABPC5 PABP5 [Fonte:HGNC Symbol;Acc:13629]
Homólogo de LSM1, associado a RNA nuclear LSM1 CASM; YJL124C pequeno de U6 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:20472]
proteína de motivo de ligação a RNA, semelhante a RBMXL3 FLJ40249 X-ligado 3 [Fonte:HGNC Symbol;Acc:26859]
FLJ38871; homólogo de mex-3 C (C. elegans) [Fonte:HGNC MEX3C RNF194 Symbol;Acc:28040]
proteína de motivo de ligação a RNA 44 RBM44 FLJ40411 [Fonte:HGNC Symbol;Acc:24756]
DKFZp434C1013; fator de estimulação de clivagem, 3’ pré-RNA, CSTF2T KIAA0689; CstF- subunidade 2, 64kDa, variante tau [Fonte:HGNC 64T Symbol;Acc:17086]
ribonucleoproteína nuclear heterogênea A0 HNRNPA0 hnRNPA0 [Fonte:HGNC Symbol;Acc:5030]
dJ281H8,1; dedo de zinco tipo CCCH contendo 12D ZC3H12D MCPIP4 [Fonte:HGNC Symbol;Acc:21175]
SAMD4B FLJ10211; domínio do motivo alfa estéril contendo 4B
MGC99832; [Fonte:HGNC Symbol;Acc:25492] SMGB; hSmaug2 ribonucleoproteína nuclear heterogênea C-like 1 HNRNPCL1 [Fonte:HGNC Symbol;Acc:29295]
RNF63; ZFP127; proteína de dedo anular makorin 3 [Fonte:HGNC MKRN3 MGC88288 Symbol;Acc:7114]
HUMAGCGB; proteína de motivo de ligação a RNA 15B RBM15B OTT3 [Fonte:HGNC Symbol;Acc:24303]
FIR; SIAHBP1; Fator de splicing de ligação a poli-U 60KDa PUF60 RoBPI [Fonte:HGNC Symbol;Acc:17042]
SECP43; Proteína 1 associada à tRNA selenocisteína 1 TRNAU1AP FLJ20503 [Fonte:HGNC Symbol;Acc:30813]
fator de splicing, rico em arginina/serina 2B SFRS2B SRP46 [Fonte:HGNC Symbol;Acc:16988]
Tino; KIAA2031; homólogo de mex-3 D (C. elegans) [Fonte:HGNC MEX3D OK/SW-cl,4; Symbol;Acc:16734] RNF193
LSM10, associado a RNA nuclear pequeno de U7 LSM10 MGC15749 [Fonte:HGNC Symbol;Acc:17562]
polipeptídeo de ribonucleoproteína nuclear pequena SNRPE Sm-E E [Fonte:HGNC Symbol;Acc:11161]
contendo domínio de tudor e KH [Fonte:HGNC TDRKH TDRD2 Symbol;Acc:11713]
DXS8237E; KIAA0122; proteína de motivo de ligação a RNA 10 RBM10 GPATC9; [Fonte:HGNC Symbol;Acc:9896] ZRANB5;
GPATCH9
Agrupamento de receptor de leucócito (LRC) LENG9 membro 9 [Fonte:HGNC Symbol;Acc:16306]
Região de ponto de interrupção de sarcoma de EWSR1 EWS Ewing 1 [Fonte:HGNC Symbol;Acc:3508]
MGC14151; domínio LSM contendo 1 [Fonte:HGNC LSMD1 PFAAP2 Symbol;Acc:28212]
MGC34750; homólogo de extremidade morta 1 (peixe-zebra) DND1 RBMS4 [Fonte:HGNC Symbol;Acc:23799]
DKFZp434J0617; homólogo de mex-3 B (C. elegans) [Fonte:HGNC MEX3B RNF195 Symbol;Acc:25297]
proteína de ligação a poli(rC) 3 [Fonte:HGNC PCBP3 Symbol;Acc:8651]
complexo de THO 4 [Fonte:HGNC THOC4 ALY; BEF Symbol;Acc:19071]
proteína de motivo de ligação a RNA 12B RBM12B [Fonte:HGNC Symbol;Acc:32310]
ribonucleoproteína nuclear pequena 35kDa SNRNP35 U1SNRNPBP (U11/U12) [Fonte:HGNC Symbol;Acc:30852]
proteína de ligação a poli(A), semelhante a 1 PABPC1L2B citoplasmática 2B [Fonte:HGNC Symbol;Acc:31852]
Semelhante à proteína de ligação a RNA de RALY RALYL HNRPCL3 [Fonte:HGNC Symbol;Acc:27036]
polipeptídeo de caixa DEAD (Asp-Glu-Ala-Asp) 53 DDX53 GAIOLA; CT26 [Fonte:HGNC Symbol;Acc:20083]
DKFZp686F102; proteína de motivo de ligação a RNA 33 RBM33 MGC20460; [Fonte:HGNC Symbol;Acc:27223]
DKFZp434D1319 proteína de motivo de ligação a RNA 43 RBM43 FLJ45645 [Fonte:HGNC Symbol;Acc:24790]
proteína de motivo de ligação a RNA 11 RBM11 [Fonte:HGNC Symbol;Acc:9897]
RNF162B; proteína de dedo de zinco 36, C3H tipo-like 1 ZFP36L1 Berg36; ERF1; [Fonte:HGNC Symbol;Acc:1107] TIS11B; cMG1 domínio YTH família, membro 3 [Fonte:HGNC YTHDF3 FLJ31657 Symbol;Acc:26465]
KIAA1839; ligação a RNA região (RNP1, RRM) contendo 3 RNPC3 FLJ20008; [Fonte:HGNC Symbol;Acc:18666] RBM40 proteína de ligação a poli(A), semelhante a 1 PABPC1L2A citoplasmática 2A [Fonte:HGNC Symbol;Acc:27989]
deletado em azoospermia 3 [Fonte:HGNC DAZ3 Symbol;Acc:15965]
RDM1 MGC33977 Motivo RAD52 1 [Fonte:HGNC Symbol;Acc:19950]
FLJ16517; homólogo de lin-28 B (C. elegans) [Fonte:HGNC LIN28B CSDD2 Symbol;Acc:32207]
Fator específico de clivagem e poliadenilação 4-like CPSF4L [Fonte:HGNC Symbol;Acc:33632]
deletado em azoospermia 1 [Fonte:HGNC DAZ1 SPGY Symbol;Acc:2682]
FLJ41410; dedo de zinco tipo CCCH contendo 6 [Fonte:HGNC ZC3H6 FLJ45877; Symbol;Acc:24762] KIAA2035
TASR1; TASR2; SRp38; SRrp40; fator de splicing, rico em arginina/serina 13A SFRS13A SFRS13; FUSIP1; [Fonte:HGNC Symbol;Acc:16713] FUSIP2 proteína de motivo de ligação a RNA 34 RBM34 KIAA0117 [Fonte:HGNC Symbol;Acc:28965] Homólogo A de processamento RNA ribossômico 7 RRP7A CGI-96 (S. cerevisiae) [Fonte:HGNC Symbol;Acc:24286] HUC; PLE21; ELAV (embrionário letal, visão anormal, Drosophila)- DKFZp547J036; ELAVL3 like 3 (antígeno Hu C) [Fonte:HGNC HUCL; Symbol;Acc:3314] MGC20653 proteína contendo domínio de Pumilio C14orf21 C14orf21 [Fonte:UniProtKB/Swiss-Prot;Acc:Q86U38] HNRPE2; hnRNP- proteína de ligação a poli(rC) 2 [Fonte:HGNC PCBP2 E2 Symbol;Acc:8648] dJ583P15,3; MGC44880; FLJ14972; dedo de zinco, tipo CCCH com domínio de adesivo
ZGPAT ZC3HDC9; G [Fonte:HGNC Symbol;Acc:15948] ZC3H9; GPATC6; GPATCH6; ZIP ribonucleoproteína nuclear heterogênea A/B HNRNPAB ABBP1; FLJ40338 [Fonte:HGNC Symbol;Acc:5034] FLJ20736; proteína nucleolar 8 [Fonte:HGNC NOL8 Nop132 Symbol;Acc:23387] HELZ KIAA0054; helicase com dedo de zinco [Fonte:HGNC
HUMORF5; Symbol;Acc:16878]
DHRC HGRG8; NY- Família de domínio YTH, membro 2 [Fonte:HGNC YTHDF2 REN-2 Symbol;Acc:31675] Scm-like com quatro domínios mbt 2 [Fonte:HGNC SFMBT2 KIAA1617 Symbol;Acc:20256] l(3)mbt-like 3 (Drosophila) [Fonte:HGNC L3MBTL3 KIAA1798 Symbol;Acc:23035] homólogo de mex-3 A (C. elegans) [Fonte:HGNC MEX3A Symbol;Acc:33482] proteína de motivo de ligação a RNA 20 RBM20 [Fonte:HGNC Symbol;Acc:27424] Associado à pluripotência de desenvolvimento 5 DPPA5 Esg1 [Fonte:HGNC Symbol;Acc:19201] MIR1236 microRNA 1236 [Fonte:HGNC Symbol;Acc:33925] proteína LSm2 semelhante a Sm associado a snRNA de U6 (proteína Sm-x5 semelhante a Sm nuclear de snRNP)(homólogo de proteína D ribonuclear pequena nuclear)(Proteína G7b) [Fonte:UniProtKB/Swiss-Prot;Acc:Q9Y333] Subunidade reguladora 10 de serina/treonina- proteína fosfatase 1 (subunidade3 de alvejamento nuclear de Fosfatase 1)(proteína CAT53rica em PPP1R10 prolina de região de classe I de MHC)(proteína FB19)(proteína de ligação a PP1de 114 kDa)(p99) [Fonte:UniProtKB/Swiss-Prot;Acc:Q96QC0] PRR3 Proteína rica em prolina 3 (proteína CAT56 rica em prolina de região de classe I de MHC) [Fonte:UniProtKB/Swiss-Prot;Acc:P79522]
proteína de ligação a poli(A), nuclear 1-like PABPN1L ePABP2 (citoplasmático) [Fonte:HGNC Symbol;Acc:37237]
proteína de ligação a RNA S1, domínio rico em RNPS1 serina [Fonte:HGNC Symbol;Acc:10080]
pDP1678; deletado em azoospermia 2 [Fonte:HGNC DAZ2 MGC126442 Symbol;Acc:15964]
Proteína 1 relacionada à subunidade de 35 kDa de fator auxiliar de ribonucleoproteína nuclear pequena de U2 (fator 1 auxiliar de RNA nuclear pequeno de ZRSR1 U2(RNU2)-like 1)(dedo de zinco tipo CCCH, motivo de ligação a RNA e proteína rica em serina/arginina 1) [Fonte:UniProtKB/Swiss-Prot;Acc:Q15695]
proteína de motivo de ligação a RNA 16 RBM16 KIAA1116 [Fonte:HGNC Symbol;Acc:20959]
Proteína putativa não caracterizada ENSP00000395989 [Fonte:UniProtKB/TrEMBL;Acc:C9JFH9]
proteína de motivo de ligação a RNA, semelhante a RBMXL1 KAT3 X-ligado 1 [Fonte:HGNC Symbol;Acc:25073]
proteína de ligação a elemento de poliadenilação CPEB1 FLJ13203; CPEB citoplasmática 1 [Fonte:HGNC Symbol;Acc:21744]
Fragmento de froteína putativa não caracterizada ENSP00000388079 [Fonte:UniProtKB/TrEMBL;Acc:C9JXI7]
Proteína putativa não caracterizada
ENSP00000383298 [Fonte:UniProtKB/TrEMBL;Acc:C9JCD7]
proteína de motivo de ligação a RNA, Y-ligado, RBMY1J família 1, membro J [Fonte:HGNC Symbol;Acc:23917]
polipeptídeo de ribonucleoproteína nuclear pequena SNRPEL1 bA390F4,4 E-like 1 [Fonte:HGNC Symbol;Acc:20733]
Fragmento de proteína putativa não caracterizada ENSP00000394145 [Fonte:UniProtKB/TrEMBL;Acc:C9JK19]
sequência amplificada de célula T maligna 1 MCTS1 MCT-1 [Fonte:HGNC Symbol;Acc:23357]
proteína de ligação a poli(A), citoplasmático 4-like PABPC4L [Fonte:HGNC Symbol;Acc:31955]
proteína de motivo de ligação a RNA, Y-ligado, RBMY1A1 YRRM1; YRRM2 família 1, membro A1 [Fonte:HGNC Symbol;Acc:9912]
pseudogene de proteína de dedo anular makorin 5 MKRNP5 [Fonte:HGNC Symbol;Acc:7115]
SIP; SYTIP1; proteína de motivo de ligação a RNA 14 RBM14 COAA; [Fonte:HGNC Symbol;Acc:14219] DKFZp779J0927
Família de domínio NOP2/Sun, membro 6 NSUN6 FLJ23743 [Fonte:HGNC Symbol;Acc:23529]
ZC3HDC5L; homólogo desalinhado (Drosophila)-like UNKL ZC3H5L; [Fonte:HGNC Symbol;Acc:14184] FLJ23360 proteína de motivo de ligação a RNA, Y-ligado, RBMY1E família 1, membro E [Fonte:HGNC Symbol;Acc:23916] ribonucleoproteína nuclear heterogênea A1-like 2 HNRNPA1L2 LOC144983 [Fonte:HGNC Symbol;Acc:27067] proteína de motivo de ligação a RNA, Y-ligado, RBMY1B família 1, membro B [Fonte:HGNC Symbol;Acc:23914] proteína de motivo de ligação a RNA, Y-ligado, RBMY1D família 1, membro D [Fonte:HGNC Symbol;Acc:23915] HRIHFB2091; proteína de motivo de ligação a RNA 12 RBM12 KIAA0765; SWAN [Fonte:HGNC Symbol;Acc:9898] deletado em azoospermia 4 [Fonte:HGNC DAZ4 Symbol;Acc:15966] diacilglicerol cinase, teta 110kDa [Fonte:HGNC DGKQ DAGK; DAGK7 Symbol;Acc:2856] SPF45; proteína de motivo de ligação a RNA 17 RBM17 MGC14439 [Fonte:HGNC Symbol;Acc:16944] Proteína associada a componente 3 do complexo de Map80; MCM3AP manutenção de minicromossomo [Fonte:HGNC KIAA0572; GANP Symbol;Acc:6946] ribonuclease específica de poli(A) (nuclease de
PARN DAN desadenilação) [Fonte:HGNC Symbol;Acc:8609] TLR2 TIL4; CD282 receptor toll-like 2 [Fonte:HGNC Symbol;Acc:11848] família de poli (ADP-ribose) polimerase, membro 10 PARP10 FLJ14464 [Fonte:HGNC Symbol;Acc:25895]
Mov10l1, vírus da leucemia de Moloney 10-like 1, DJ402G11,8; MOV10L1 homólogo (camundongo) [Fonte:HGNC DKFZp434B0717 Symbol;Acc:7201] FLJ10590; CARP- Ciclo de divisão celular e regulador de apoptose 1 CCAR1 1; CARP1 [Fonte:HGNC Symbol;Acc:24236] domínio LEM contendo 3 [Fonte:HGNC LEMD3 MAN1 Symbol;Acc:28887] regulador de UPF3 de homólogo B de transcritos RENT3B; UPF3X; UPF3B sem sentido (levedura) [Fonte:HGNC HUPF3B Symbol;Acc:20439] regulador de calcineurina 2 [Fonte:HGNC RCAN2 ZAKI-4 Symbol;Acc:3041] Asr2; serrate; Homólogo de molécula efetora de RNA dentado
SRRT ARS2 (Arabidopsis) [Fonte:HGNC Symbol;Acc:24101] FLJ23231; dedo de zinco tipo CCCH contendo 12A ZC3H12A MCPIP1 [Fonte:HGNC Symbol;Acc:26259] dedo de zinco tipo CCCH, antiviral 1-like ZC3HAV1L MGC14289 [Fonte:HGNC Symbol;Acc:22423] família de poli (ADP-ribose) polimerase, membro 14 PARP14 KIAA1268; pART8 [Fonte:HGNC Symbol;Acc:29232] proteína de transmembrana 63A [Fonte:HGNC TMEM63A Symbol;Acc:29118] proteína de ligação à haste-alça [Fonte:HGNC
SLBP HBP Symbol;Acc:10904] Fator de transcrição geral IIIA [Fonte:HGNC GTF3A Symbol;Acc:4662] NUFIP1 Proteína 1 de interação à proteína nuclear de retardo mental do X frágil [Fonte:HGNC Symbol;Acc:8057] matriz repetitiva de serina/arginina 2 [Fonte:HGNC SRRM2 Symbol;Acc:16639] APTX aprataxina [Fonte:HGNC Symbol;Acc:15984] proteína de dedo de zinco de ligação a RNA
ZFR [Fonte:HGNC Symbol;Acc:17277] regulador UPF1 de homólogo de transcritos sem UPF1 sentido (levedura) [Fonte:HGNC Symbol;Acc:9962] KIN, determinante antigênico de homólogo de KIN proteína recA (camundongo) [Fonte:HGNC Symbol;Acc:6327] proteína de dedo de zinco 239 [Fonte:HGNC ZNF239 Symbol;Acc:13031] proteína de dedo de zinco 74 [Fonte:HGNC ZNF74 Symbol;Acc:13144] polipeptídeo de ribonucleoproteína nuclear pequena
SNRPC C [Fonte:HGNC Symbol;Acc:11157] Proteína semelhante a TRM1 C1orf25 [Fonte:UniProtKB/Swiss-Prot;Acc:Q7Z2T5] proteína de dedo de zinco de ligação a RNA 2 ZFR2 [Fonte:HGNC Symbol;Acc:29189] ACO3; IRP2; proteína de ligação de elemento responsivo a ferro IREB2 IRP2AD; 2 [Fonte:HGNC Symbol;Acc:6115] FLJ23381; IREB2 IRP1; ACONS; ACO1 aconitase 1, solúvel [Fonte:HGNC Symbol;Acc:117] IREB1; IREBP;
IREBP1; ACO1 RO60; SSA2; Família do domínio TROVE, membro 2 TROVE2 RORNP; [Fonte:HGNC Symbol;Acc:11313] p240; TLP1; TP1; Proteína associada à telomerase 1 [Fonte:HGNC TEP1 TROVE1; Symbol;Acc:11726] VAULT2 gliceraldeído-3-fosfato desidrogenase [Fonte:HGNC
GAPDH GAPD Symbol;Acc:4141] dedo de zinco, domínio de ligação a RAN contendo ZRANB2 2 [Fonte:HGNC Symbol;Acc:13058]
[097]O domínio regulador de RNA pode ser uma proteína selecionada a partir da Tabela 1 ou Tabela 2 ou um domínio funcional de uma proteína selecionada a partir da lista de proteínas na Tabela 1 ou 2. Em algumas modalidades, o domínio regulador de RNA compreende um fragmento de uma proteína selecionada a partir da lista de proteínas na Tabela 1 ou 2. Em algumas modalidades, o domínio regulador de RNA compreende uma proteína tendo pelo menos, no máximo ou exatamente 100, 99, 98, 97, 96, 95, 94, 93, 92, 91, 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 79, 78, 77, 76, 75, 74, 73, 72, 71, 70, 69, 68, 67, 66, 65, 64, 63, 62, 61 ou 60 % (ou qualquer faixa derivável) de homologia ou identidade de sequência a uma proteína da Tabela 1 ou 2 ou um fragmento de uma proteína da Tabela 1 ou 2.
[098]Em algumas modalidades, o domínio regulador de RNA compreende pelo menos, no máximo ou exatamente 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950 ou 2000 aminoácidos contíguos (ou qualquer faixa derivável) de uma proteína da Tabela 1 ou Tabela 2.
[099]Em algumas modalidades, o domínio regulador de RNA compreende um fragmento de uma proteína da Tabela 1 ou 2, em que o fragmento tem uma ou mais das atividades seguintes: metilação, 5ʹ-3ʹ guanililação, fosforribosilação, desaminação, carbamoilação, isopentenilação, agmatinilação, acetilação, lisilação, troca de O/S, galactosilação, glutamilação, manosilação, hidrogenação, formação de pseudouridina, carboximetilaminometilação, aminometilação, descarboximetilação, desidrogenação, carboximetilação, hidroxilação, metiltiolação, 3-amino-3- carboxipropilação, desmetilação, 5ʹ-5ʹ guanililação, desfosforilação, nuclease, edição, transporte de RNA, ativação traducional, repressão traducional, atividade de clivagem de RNA de fita simples, atividade de clivagem de RNA de fita dupla e atividade de ligação a RNA.
[0100]Em algumas modalidades, o domínio regulador de RNA está no término carbóxi ou próximo do mesmo da proteína de ligação a grampo de RNA. Em algumas modalidades, o domínio regulador de RNA é está no término amino ou próximo do mesmo da proteína de ligação a grampo de RNA. Em algumas modalidades, o domínio regulador de RNA é fundido por via de uma ligação peptídica à proteína de ligação a grampo de RNA. Em algumas modalidades, o domínio regulador de RNA é ligado à proteína de ligação a grampo de RNA por uma porção ligante. II. DOMÍNIOS DE LIGAÇÃO A GRAMPO DE RNA E ESTRUTURAS DE
GRAMPO
[0101]Outros domínios de ligação a grampo de RNA e estruturas de grampo que eles se ligam são conhecidos na técnica e podem ser usados nos sistemas, composições, proteínas de fusão, kits, vetores e métodos da revelação. Por exemplo, as modalidades incluem um domínio de ligação a grampo de RNA e estrutura de grampo de acordo com a tabela seguinte (Tabela 3), que lista as proteínas compreendendo domínios de ligação a grampo de RNA e a estrutura de grampo que eles especificamente se ligam: Tabela 3: Domínio de ligação a grampo de RNA
Domínio de Estrutura de grampo ligação a grampo de RNA proteína de AAACAUGAGGAUUACCCAUGU (SEQ ID NO: 107) revestimento de AAACAUGAGGAUCACCCAUGU (SEQ ID NO: 108) MS2 (MCP) (bacteriófago)
λ N GCCCUGAAGAAGGGC (SEQ ID NO: 109); (bacteriófago) GCCCUGAAAAAGGGC (SEQ ID NO: 110)
PP7 UAAGGAGUUUAUAUGGAAACCCUUA (SEQ ID NO: 111) (Pseudomonas aeroginosa)
Proteína CAGWGH em que W é A ou U e H é A, C ou U; responsiva ao NNNNNUGCNNNNNCAGUGNNNNNNCNNNNN, em que n é qualquer ferro (IRP) nucleotídeo
Qβ AAACAUGAGGAUUACCCAUGU (SEQ ID NO: 107); AAACAUGAGGAUCACCCAUGU (SEQ ID NO: 108); AUGCAUGUCUAAGACAGCAU (SEQ ID NO: 114)
GA AAACAUGAGGAUUACCCAUGU (SEQ ID NO: 107); AAACAUGAGGAUCACCCAUGU (SEQ ID NO: 108); AAAACAUAAGGAAAACCUAUGUU (SEQ ID NO: 115)
Transativador de GGCUCGUGUAGCUCAUUAGCUCCGAGCC (SEQ ID NO: 112) transcrição (tat) do vírus da imunodeficiência bovina (BIV)
U1A (HUMANO) AUUGCAC;
GGAAUCCAUUGCACUCCGGAUUUCACTAG (SEQ ID NO: 113); GGCCAGAUCUGAGCCUGGGAGCUCUCUGGCC (SEQ ID NO: 1) SLBP CCAAAGGCUCUUCUCAGAGCCACCCA (SEQ ID NO: 2) (HUMANO) KU70 GGCGUCCCUCCCGAAGCUGCGCGCUCGGUCGAACAGGACGACC (HUMANO) (SEQ ID NO: 83) NUCLEOLINA UCCCGA (SEQ ID NO: 84); (HUMANA) GGCCGAAAUCCCGAAUGAGGCC (SEQ ID NO: 85); GGAUGCCUCCCGAGUGCAUCC (SEQ ID NO: 86).
[0102]É considerado que múltiplos domínios de ligação a grampo de RNA e/ou o domínio regulador de RNA podem ser usados em uma forma multiplexada usando-se domínios de ligação a grampo de RNA que se ligam a diferentes estruturas de grampo para alvejar múltiplos RNAs diferentes na mesma célula. Os RNAs diferentes podem ser modulados nos mesmos modos ou em modos diferentes. Por exemplo, um RNA pode ser modulado com ativação traducional, enquanto um segundo RNA pode ser modulado com repressão traducional na mesma célula. Portanto, os sistemas da revelação podem ser usados em uma forma multiplexada para a modulação de pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais RNAs em uma célula, tecido ou organismos. III. ÁCIDOS NUCLEICOS
[0103]Em certas modalidades, existem ácidos nucleicos recombinantes que codificam as proteínas, polipeptídeos, domínios reguladores ou moléculas de alvejamento de RNA aqui descritos.
[0104]Como usado neste pedido, o termo “polinucleotídeo” se refere a uma molécula de ácido nucleico que é recombinante ou foi isolada livre de ácido nucleico genômico total. Incluídos dentro do termo “polinucleotídeo” são oligonucleotídeos (ácidos nucleicos com 100 resíduos ou menos em comprimento), vetores recombinantes, incluindo, por exemplo, plasmídeos, cosmídeos, fagos, vírus e semelhantes. Polinucleotídeos incluem, em certos aspectos, sequências reguladoras, isoladas substancialmente longe de seus genes que ocorrem naturalmente ou sequências de codificação de proteína. Polinucleotídeos podem ser de fita simples (codificação ou anti-sentido) ou de fita dupla e podem ser RNA, DNA (genômico, cDNA ou sintético), análogos dos mesmos ou uma combinação dos mesmos. Sequências de codificação ou que não de codificação adicionais podem, mas não precisam, estar presentes dentro de um polinucleotídeo.
[0105]A este respeito, o termo “gene”, “polinucleotídeo”, ou “ácido nucleico” é usado para se referir a um ácido nucleico que codifica uma proteína, polipeptídeo ou peptídeo (incluindo quaisquer sequências necessárias para a transcrição, modificação pós-traducional ou localização apropriada). Como será entendido por aqueles na técnica, este termo abrange sequências genômicas, cassetes de expressão, sequências de cDNA e segmentos menores de ácido nucleico engendrado que expressam ou podem ser adaptados para expressar, proteínas, polipeptídeos, domínios, peptídeos, proteínas de fusão e mutantes. Um ácido nucleico que codifica todo ou parte de um polipeptídeo pode conter uma sequência contígua de ácidos nucleicos que codifica todo ou uma porção de um tal polipeptídeo. Também é considerado que um polipeptídeo particular pode ser codificado por ácidos nucleicos contendo variações tendo sequências de ácidos nucleicos levemente diferentes mas, no entanto, codificam a mesma proteína ou substancialmente similar (ver acima).
[0106]Em modalidades particulares, existem segmentos de ácido nucleico isolados e vetores recombinantes que incorporam sequências de ácidos nucleicos que codificam um polipeptídeo (por exemplo, uma polimerase, RNA polimerase, um ou mais domínios de polimerase truncados ou componentes de interação que são polipeptídeos) que conduzem a transcrição gênica dependente da atividade de polimerase a partir dos domínios de polimerase quando os componentes de interação interagem. O termo “recombinante” pode ser usado em combinação com um polipeptídeo ou o nome de um polipeptídeo específico e isto geralmente se refere a um polipeptídeo produzido a partir de uma molécula de ácido nucleico que foi manipulada in vitro ou que é um produto de replicação de uma tal molécula.
[0107]Os segmentos de ácido nucleico, não obstante do comprimento da sequência de codificação propriamente dita, podem ser combinados com outras sequências de ácidos nucleicos, tais como promotores, sinais de poliadenilação, sítios de enzima de restrição adicionais, sítios de clonagem múltiplos, outros segmentos de codificação e semelhantes, tal que seu comprimento total possa variar consideravelmente. Portanto, é considerado que um fragmento de ácido nucleico de quase qualquer comprimento pode ser utilizado, com o comprimento total preferivelmente sendo limitado pela facilidade de preparação e uso no protocolo de ácido nucleico recombinante intencionado. Em alguns casos, uma sequência de ácidos nucleicos pode codificar uma sequência de polipeptídeos com sequências de codificação heterólogas adicionais, por exemplo para levar em consideração a purificação do polipeptídeo, transporte, secreção, modificação pós-traducional ou para benefícios terapêuticos tal como alvejamento ou eficácia. Como discutido acima, uma etiqueta ou outro polipeptídeo heterólogo pode ser adicionado à sequência de codificação de polipeptídeo modificado, em que “heterólogo” se refere a um polipeptídeo que não é o mesmo como o polipeptídeo modificado.
[0108]Em certas modalidades, existem variantes de polinucleotídeo tendo identidade substancial às sequências reveladas na presente invenção; estas compreendendo pelo menos 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % ou 99 % ou identidade de sequência mais alta, incluindo todos os valores e faixas entre eles, em comparação a uma sequência de polinucleotídeos fornecida na presente invenção usando os métodos aqui descritos (por exemplo, análise BLAST usando parâmetros padrão). Em certos aspectos, o polinucleotídeo isolado compreenderá uma sequência de nucleotídeos que codifica um polipeptídeo que tem pelo menos 90 %, preferivelmente 95 % e acima, de identidade a uma sequência de aminoácidos aqui descrita, acima do comprimento inteiro da sequência; ou uma sequência de nucleotídeos complementar ao referido polinucleotídeo isolado. A. Vetores
[0109]Polipeptídeos podem ser codificados por uma molécula de ácido nucleico. A molécula de ácido nucleico pode estar na forma de um vetor de ácido nucleico. O termo “vetor” é usado para se referir a uma molécula de ácido nucleico carreadora em que uma sequência de ácidos nucleicos heteróloga pode ser inserida para introdução em uma célula onde ela pode ser replicada e expressada. Uma sequência de ácidos nucleicos pode ser “heteróloga”, o que significa que ela está em um contexto estranho à célula em que o vetor está sendo introduzido ou ao ácido nucleico em que é incorporada, que inclui uma sequência homóloga a uma sequência na célula ou ácido nucleico mas em uma posição dentro da célula hospedeira ou ácido nucleico onde ela comumente não é encontrada. Vetores incluem DNAs, RNAs, plasmídeos, cosmídeos, vírus (bacteriófago, vírus animais e vírus vegetais) e cromossomos artificiais (por exemplo, YACs). Um técnico no assunto estaria bem equipado para construir um vetor através de técnicas recombinantes padrão (por exemplo Sambrook et al., 2001; Ausubel et al., 1996, ambos incorporados aqui por referência). Vetores podem ser usados em uma célula hospedeira para produzir uma polimerase, RNA polimerase, um ou mais domínios de polimerase truncados ou componentes de interação que são fundidos, ligados ou ligados a um ou mais domínios de RNA polimerase truncados.
[0110]O termo “vetor de expressão” se refere a um vetor contendo uma sequência de ácidos nucleicos que codifica pelo menos parte de um produto genético capaz de ser transcrito. Em alguns casos, moléculas de RNA são então traduzidas em uma proteína, polipeptídeo ou peptídeo. Vetores de expressão podem conter uma variedade de “sequências de controle”, que se referem a sequências de ácidos nucleicos necessárias para a transcrição e possivelmente tradução de uma sequência de codificação operavelmente ligada em um organismo hospedeiro particular. Além de sequências de controle que governam a transcrição e a tradução, vetores e vetores de expressão podem conter sequências de ácidos nucleicos que também servem outras funções e são aqui descritas. B. Células
[0111]A revelação fornece métodos para modificar um RNA alvo de interesse, em particular em células procarióticas, células eucarióticas, tecidos, órgãos ou organismos, mais em particular em células mamíferas, tecidos, órgãos ou organismos. O RNA alvo pode estar compreendido em uma molécula de ácido nucleico dentro de uma célula. Em algumas modalidades, o RNA alvo está em uma célula eucariótica, tal como uma célula mamífera ou uma célula vegetal. A célula mamífera pode ser uma célula humana, de primata não humano, bovina, porcina, de roedor ou de camundongo. A célula pode ser uma célula eucariótica não mamífera tal como de aves domésticas, peixes ou camarões. A célula vegetal pode ser de uma planta de safra tal como mandioca, milho, sorgo, trigo ou arroz. A célula vegetal também pode ser de uma alga, árvore ou vegetal. A modulação do RNA induzido na célula pelos métodos, sistemas e composições da revelação pode ser tal que a célula e progênie da célula são alteradas para a produção melhorada de produtos biológicos tal como um anticorpo, amido, álcool ou outro produto celular desejado. A modulação do RNA induzido na célula pode ser tal que a célula e progênie da célula incluem uma alteração que muda o produto biológico produzido.
[0112]A célula mamífera pode ser um mamífero humano ou não humano, por exemplo, célula de primata, bovino, ovino, porcino, canino, roedor, Leporidae tal como macaco, vaca, ovelha, porco, cão, coelho, rato ou camundongo. A célula pode ser uma célula eucariótica não mamífera tal como célula de aves domésticas (por exemplo, galinha), peixes vertebrados (por exemplo, salmão) ou mariscos (por exemplo, ostra, mexilhão, lagosta, camarão). A célula também pode ser uma célula vegetal. A célula vegetal pode ser de uma monocotiledônea ou dicotiledônea ou de uma planta de safra ou grão tal como mandioca, milho, sorgo, soja, trigo, aveia ou arroz. A célula vegetal também pode ser de uma alga, árvore ou planta de produção, fruta ou vegetal (por exemplo, árvores tais como árvores cítricas, por exemplo, árvores de laranja, toranja ou limão; árvores de pêssego ou nectarina; árvores de maçã ou pera; árvores de nozes tais como árvores de amêndoa ou noz ou pistache; plantas de erva-moura; plantas do gênero Brassica; plantas do gênero Lactuca; plantas do gênero Spinacia; plantas do gênero Capsicum; algodão, tabaco, aspargo, cenoura, repolho, brócolis, couve-flor, tomate, berinjela, pimenta, alface, espinafre, morango, mirtilo, framboesa, amora, uva, café, cacau, etc.).
[0113]Como usado na presente invenção, os termos “célula”, “linhagem celular”, e “cultura celular” podem ser usados permutavelmente. Todos estes termos também incluem sua progênie, que é toda e qualquer geração subsequente. Entende- se que toda progênie pode não ser idêntica devido a mutações deliberadas ou inadvertidas. No contexto de expressão de uma sequência de ácidos nucleicos heteróloga, “célula hospedeira” se refere a uma célula procariótica ou eucariótica e inclui qualquer organismo transformável que é capaz de replicar um vetor ou que expressa um gene heterólogo codificado por um vetor. Uma célula hospedeira pode e foi, usada como um receptor para vetores ou vírus. Uma célula hospedeira pode ser “transfectada” ou “transformada”, o que se refere a um processo pelo qual ácido nucleico exógeno, tal como uma sequência de codificação de proteína recombinante, é transferido ou introduzido na célula hospedeira. Uma célula transformada inclui a célula principal e sua progênie.
[0114]Alguns vetores podem utilizar sequências de controle que permitem que sejam replicados e/ou expressos tanto em células procarióticas quanto eucarióticas.
Um técnico no assunto entenderá ainda as condições sob as quais incubar todas as célula hospedeiras descritas acima para mantê-las e permitir a replicação de um vetor. Também entendidas e conhecidas são técnicas e condições que permitem a produção em grande escala de vetores, bem como produção dos ácidos nucleicos codificados por vetores e seus polipeptídeos, proteínas ou peptídeos cognatos. C. Sistemas de expressão
[0115]Numerosos sistemas de expressão existem que compreendem pelo menos uma parte ou todas as composições discutidas acima. Sistemas com base em procariontes e/ou eucariontes podem ser utilizados para o uso com uma modalidade para produzir sequências de ácidos nucleicos ou seus polipeptídeos, proteínas e peptídeos cognatos. Por exemplo, os vetores, proteínas de fusão, proteínas de ligação a grampo de RNA, moléculas de alvejamento de RNA, domínio regulador de RNA e proteínas acessórias da revelação podem utilizar um sistema de expressão, tal como um sistema de expressão induzível ou constitutivo. Muitos tais sistemas estão comercialmente e amplamente disponíveis.
[0116]O sistema de célula de inseto/baculovírus pode produzir um alto nível de expressão de proteína de um segmento de ácido nucleico heterólogo, tal como descrito nas Patentes U.S. 5.871.986, 4.879.236, ambas incorporadas aqui por referência e que podem ser adquiridas, por exemplo, sob o nome MAXBAC® 2.0 da INVITROGEN® e BACPACK™ BACULOVIRUS EXPRESSION SYSTEM FROM CLONTECH®.
[0117]Além dos sistemas de expressão revelados, outros exemplos de sistemas de expressão incluem STRATAGENE®’s COMPLETE CONTROL Inducible Mammalian Expression System, que envolve um receptor induzível por ecdisona sintético ou seu Sistema de Expressão pET, um sistema de expressão de E. coli. Um outro exemplo de um sistema de expressão induzível está disponível da INVITROGEN®, que carrega o Sistema T-REX™ (expressão regulada por tetraciclina),
um sistema de expressão induzível de mamífero que usa o promotor de CMV de tamanho natural. INVITROGEN® também fornece um sistema de expressão de levedura chamado o Sistema de Expressão de Pichia metanolica, que é designado para a produção de alto nível de proteínas recombinantes na levedura metilotrófica Pichia metanolica. Um técnico no assunto conhecerá como expressar um vetor, tal como uma construção de expressão, para produzir uma sequência de ácidos nucleicos ou seu polipeptídeo, proteína ou peptídeo cognatos. D. Conjugação de Ácidos Nucleicos e Polipeptídeos
[0118]As modalidades da revelação se referem à conjugação de ácidos nucleicos a polipeptídeos. Métodos de conjugação de ácidos nucleicos a polipeptídeos são conhecidos na técnica e incluem aqueles descritos abaixo. As modalidades da revelação se referem a métodos para fabricar moléculas de ácido nucleico- polipeptídeo e as moléculas propriamente ditas em que o ácido nucleico foi conjugado ao polipeptídeo por via de um método aqui descrito. Um tal exemplo inclui química de clique. A “reação de clique”, também conhecida como “química de clique” é um nome frequentemente usado para descrever uma variante escalonada da cicloadição 1,3- dipolar de Huisgen de azidas e alcinos para produzir 1,2,3-triazol. Esta reação é realizada sob condições ambientes ou sob irradiação suave de micro-ondas, tipicamente na presença de um catalisador de Cu(I) e com regiosseletividade exclusiva para o produto de triazol 1,4-dissubstituído quando mediada por quantidades catalíticas de sais de Cu(I) [V. Rostovtsev, L. G. Green, V. V. Fokin, K. B. Sharpless, Angew. Chem. Int. Ed. 2002, 41, 2596; H. C. Kolb, M. Finn, K. B. Sharpless, Angew Chem., Int. Ed. 2001, 40, 2004].
[0119]Em outros métodos de conjugação, uma forma mutante da proteína de reparo de DNA humano O6-alquilguanina-DNA alquiltransferase reage rapidamente e especificamente com O6-benzilguanina (BG) e também com derivados que carregam uma grande porção ligada ao grupo benzila. Com guanina como o grupo de partida, a porção benzila se torna covalentemente ligada a uma cisteína no sítio ativo da enzima. A enzima também foi mutagenizada para se tornar específica para O6-benzilcitosina (BC) em uma maneira similar. Estes domínios enzimáticos (cerca de 20 kDa) estão comercialmente disponíveis como as etiquetas SNAP e CLIP, respectivamente.
[0120]Um outro método de conjugação utiliza a etiqueta Halo. A etiqueta Halo faz uso de uma reação química ortogonal aos eucariontes, isto é, a desalogenação de ligantes de haloalcano, assim, levando à rotulagem covalente altamente específica da etiqueta e, portanto, proteína, tanto em células vivas quanto em células fixas. E. Modificações de Ácido Nucleico
[0121]Os oligonucleotídeos da revelação, tais como as moléculas de alvejamento de RNA e outros ácidos nucleicos aqui descritos podem ter modificações que aumentam a estabilidade do ácido nucleico. Em algumas modalidades, a molécula de alvejamento de RNA é um análogo de oligonucleotídeo. O termo “análogo de oligonucleotídeo” se refere a compostos que funcionam como oligonucleotídeos mas que têm porções que não ocorrem naturalmente. Análogos de oligonucleotídeo podem ter porções de açúcar alteradas, porções de base alteradas ou ligações inter- açúcar alteradas. O termo “oligômeros” é intencionado a abranger oligonucleotídeos, análogos de oligonucleotídeo ou oligonucleosídeos. Assim, ao falar de “oligômeros”, referência será feita a uma série de nucleosídeos ou análogos de nucleosídeo que são unidos por intermédio de ligações fosfodiéster naturais ou outras ligações, incluindo os quatro átomos ligantes. Embora a ligação geralmente seja do carbono 3’ de um nucleosídeo ao carbono 5’ de um segundo nucleosídeo, o termo “oligômero” também pode incluir outras ligações tais como ligações 2’-5’.
[0122]Análogos de oligonucleotídeo também podem incluir outras modificações, particularmente modificações que aumentam a resistência da nuclease, melhoram a afinidade de ligação, e/ou melhoram a especificidade de ligação. Por exemplo, quando a porção açúcar de um nucleosídeo ou nucleotídeo é substituída por uma porção carbocíclica, ela não é mais um açúcar. Além disso, quando outras substituições, uma tal substituição para a ligação de fosfodiéster inter-açúcar é feita, o material resultante não é mais uma espécie ácido nucleico verdadeira. Todos os tais compostos são considerados como análogos. Por todo este relatório descritivo, referência à porção açúcar de uma espécie de ácido nucleico deve ser entendido como se referindo a um açúcar verdadeiro ou a uma espécie que toma o lugar estrutural do açúcar de ácidos nucleicos do tipo selvagem. Além disso, referência a ligações inter-açúcar devem ser tomadas para incluir porções que servem para unir as porções açúcar ou análogo de açúcar na forma de ácidos nucleicos do tipo selvagem.
[0123]A presente revelação diz respeito aos oligonucleotídeos modificados, isto é, análogos de oligonucleotídeo ou oligonucleosídeos e métodos para efetuar as modificações. Estes oligonucleotídeos modificados e análogos de oligonucleotídeo podem exibir estabilidade química e/ou enzimática aumentada em relação às suas contrapartes que ocorrem naturalmente. Nucleases extracelulares e intracelulares geralmente não reconhecem e, portanto, não se ligam aos compostos modificados na cadeia principal. Quando presente como a forma de ácido protonado, a falta de uma cadeia principal negativamente carregada pode facilitar a penetração celular.
[0124]As ligações internucleosídeo modificadas são intencionadas para substituir ligações fosfodiester-5’-metileno que ocorrem naturalmente com quatro grupos de ligação a átomo para conferir resistência de nuclease e captação celular realçada ao composto resultante. As ligações preferidas têm estrutura CH2 --RA -- NR1 CH2, CH2 --NR1 --RA --CH2, RA --NR1 --CH2 --CH2, CH2 --CH2 --NR1 --RA, CH2 --CH2 --RA --NR1 ou NR1 --RA --CH2 --CH2 onde RA é O ou NR2.
[0125]Modificações podem ser obtidas usando suportes sólidos que podem ser manualmente manipulados ou usados em combinação com um sintetizador de DNA usando a metodologia comumente conhecida àqueles habilitados na técnica de sintetizador de DNA. Geralmente, o procedimento envolve funcionalizar as porções açúcar de dois nucleosídeos que serão adjacentes entre si na sequência selecionada. Em um sentido 5’ a 3’, um synthon “a montante” é modificado em seu sítio terminal 3’, enquanto um synthon “a jusante” é modificado em seu sítio terminal 5’.
[0126]Oligonucleosídeos ligados por hidrazinas, hidroxilaminas e outros grupos de ligação podem ser protegidos por um grupo dimetoxitritila na 5’-hidroxila e ativado para acoplamento na 3’-hidroxila com porções cianoetildiisopropil-fosfito. Estes compostos podem ser inseridos em qualquer sequência desejada por técnicas de síntese de DNA automáticas, de fase sólida, padrão. Um dos processos mais populares é a técnica de fosforamidita. Oligonucleotídeos contendo uma ligação uniforme à cadeia principal podem ser sintetizados pelo uso de suporte sólido de CPG e mecanismos de sintetização de ácido nucleico padrão tais como Applied Biosystems Inc. 380B e 394 e Milligen/Biosearch 7500 e 8800s. O nucleotídeo inicial (número 1 no término 3’) é ligado a um suporte sólido tal como vidro de poro controlado. Na ordem específica de sequência, cada novo nucleotídeo é ligado por manipulação manual ou pelo sistema sintetizador automático.
[0127]Grupos amino livres podem ser alquilados com, por exemplo, acetona e cianoboroidreto de sódio em ácido acético. A etapa de alquilação pode ser usada para introduzir outras moléculas funcionais úteis na macromolécula. Tais moléculas funcionais úteis incluem, mas não são limitadas a moléculas repórteres, grupos de clivagem de RNA, grupos para melhorar as propriedades farmacocinéticas de um oligonucleotídeo e grupos para melhorar as propriedades farmacodinâmicas de um oligonucleotídeo. Tais moléculas podem ser ligadas ou conjugadas à macromolécula por intermédio de fixação ao átomo de nitrogênio na ligação à cadeia principal. Alternativamente, tais moléculas podem ser ligadas aos grupos pendentes que se estendem de um grupo hidroxila da porção açúcar de um ou mais dos nucleotídeos. Exemplos de tais grupos funcionais úteis adicionais são fornecidos pelo documento
WO1993007883, que é incorporado aqui por referência e em outros dos pedidos de patente referenciados acima.
[0128]Suportes sólidos podem incluir qualquer um daqueles conhecidos na técnica para síntese de polinucleotídeo, incluindo vidro de poro controlado (CPG), vidro de poro controlado de oxalila [53], Suporte TentaGel — um suporte derivado de aminopolietilenoglicol [54] ou Poros — um copolímero de poliestireno/divinilbenzeno. A fixação e a clivagem de nucleotídeos e oligonucleotídeos podem ser efetuadas por intermédio de procedimentos padrão [55]. Como usado na presente invenção, o termo suporte sólido inclui ainda quaisquer ligantes (por exemplo, alquil aminas de cadeia longa e resíduos de succinila) usados para ligar um oligonucleosídeo crescente a uma fase estacionária tal como CPG.
1. Nucleotídeos bloqueados
[0129]Em algumas modalidades, o ácido nucleico da revelação, tal como a molécula de alvejamento de RNA compreende um ácido nucleico fechado. Um ácido nucleico fechado (LNA ou Ln), também referido como RNA inacessível, é um nucleotídeo de RNA modificado. A porção ribose de um nucleotídeo de LNA é modificada com uma ponte extra que conecta o 2’ oxigênio e o 4’ carbono. A ponte “bloqueia” a ribose na conformação 3’-endo (North), que é frequentemente encontrada nos duplexes de forma A. Nucleotídeos de LNA podem ser misturados com resíduos de DNA ou RNA nos oligonucleotídeo sempre que desejado e hibridizam com DNA ou RNA de acordo com regras de pareamento de base de Watson-Crick. Tais oligômeros são sintetizados quimicamente e estão comercialmente disponíveis. A conformação de ribose bloqueada realça o empilhamento de base e pré-organização de cadeia principal. Isto significativamente aumenta as propriedades de hibridização (temperatura de fusão) dos oligonucleotídeos.
2. Nucleotídeos ligados em ponte de etileno
[0130]Em algumas modalidades, o ácido nucleico da revelação, tal como a molécula de alvejamento de RNA compreende um ou mais nucleotídeos ligados em ponte de etileno. Ácidos nucleicos ligados em ponte de etileno (ENA ou En) são nucleotídeos modificados com uma ligação etileno 2’-O, 4’C. Como nucleotídeos bloqueados, estes nucleotídeos também restringem a adstringência do açúcar à conformação N de RNA.
3. Ácidos nucleicos de peptídeo
[0131]Em algumas modalidades, o ácido nucleico da revelação, tal como a molécula de alvejamento de RNA compreende um ou mais ácidos nucleicos de peptídeo. Ácidos nucleicos de peptídeo (PNA ou Pn) imitam o comportamento de DNA e se ligam a fitas de ácido nucleico complementares. O termo, “peptídeo”, quando usado na presente invenção também pode se referir a um ácido nucleico de peptídeo. PNA é um polímero artificialmente sintetizado similar a DNA ou RNA. DNA e RNA têm uma cadeia principal de açúcar desoxirribose e ribose, respectivamente, ao passo que a cadeia principal de PNA é composta de unidades de repetição de N-(2-aminoetil)- glicina ligadas por ligações peptídicas. As várias bases de purina e pirimidina são ligadas à cadeia principal por uma ponte de metileno (-CH2-) e um grupo carbonila (- (C=O)-). PNAs são representados como peptídeos, com o término N na primeira posição (esquerda) e o término C na última posição (direita).
[0132]Visto que a cadeia principal de PNAs não contém nenhum grupo fosfato carregado, a ligação entre fitas de PNA/DNA é mais forte do que entre fitas de DNA/DNA devido à falta de repulsão eletrostática. PNAs não são facilmente reconhecidos por nucleases ou proteases, tornando-os resistentes à degradação por enzimas. PNAs também são estáveis em uma ampla faixa de pH. Em alguns aspectos, os PNAs aqui descritos têm liberação citosólica melhorada sobre outros PNAs.
4. Modificação de 5’(E)-vinil-fosfonato (VP)
[0133]Em algumas modalidades, o ácido nucleico da revelação, tal como a molécula de alvejamento de RNA compreende uma ou mais modificações de 5’(E)-
vinil-fosfonato (VP). Modificações de 5’-vinil-fosfonato (imitadores de fosfato metabolicamente estáveis) foram relatadas como realçando a estabilidade metabólica e a potência dos oligonucleotídeos.
5. Morfolinos
[0134]Em algumas modalidades, o ácido nucleico da revelação, tal como a molécula de alvejamento de RNA compreende um morfolino. Morfolinos são moléculas sintéticas que são o produto de uma reformulação da estrutura de ácido nucleico natural. Usualmente de 25 bases em comprimento, eles se ligam a sequências complementares de RNA ou DNA de fita simples por pareamento de base de ácido nucleico padrão. Em termos de estrutura, a diferença entre Morfolinos e DNA é que, enquanto os Morfolinos têm bases de ácido nucleico padrão, estas bases são ligadas a anéis de metilenomorfolina ligados através de grupos fosforodiamidato ao invés de fosfatos. A figura compara as estruturas das duas fitas representadas, uma de RNA e a outra de um Morfolino. A substituição de fosfatos aniônicos com os grupos fosforodiamidato não carregados elimina a ionização na faixa de pH fisiológico usual, de modo que os Morfolinos em organismos ou células sejam moléculas não carregadas. A cadeia principal inteira de um Morfolino é fabricada destas subunidades modificadas. IV. Veículos de liberação
[0135]A revelação atual considera vários sistemas de liberação compatíveis com ácidos nucleicos que levam em consideração a distribuição aproximadamente uniforme e têm taxas de liberação controláveis. Uma variedade de diferentes meios é descrita abaixo que é úteis em criar sistemas de liberação de ácido nucleico. Não é intencionado que qualquer um meio ou carreador seja limitante para a presente invenção. Note que qualquer meio ou carreador pode ser combinado com um outro meio ou carreador; por exemplo, em uma modalidade um carreador de micropartícula de polímero ligado a um composto pode ser combinado com um meio em gel.
[0136]Carreadores ou meios considerados por esta revelação compreendem um material selecionado a partir do grupo compreendendo gelatina, colágeno, ésteres de celulose, sulfato de dextrano, polissulfato de pentosano, quitina, sacarídeos, albumina, selantes de fibrina, polivinilpirrolidona sintética, óxido de polietileno, óxido de polipropileno, polímeros em bloco de óxido de polietileno e óxido de polipropileno, polietilenoglicol, acrilatos, acrilamidas, metacrilatos incluindo, mas não limitados a, metacrilato de 2-hidroxietila, poli(orto ésteres), cianoacrilatos, bioadesivos do tipo gelatina-resorcinol-aldeído, ácido poliacrílico e copolímeros e copolímeros em bloco dos mesmos. A. Micropartículas
[0137]Algumas modalidades da presente revelação consideram um sistema de liberação compreendendo uma micropartícula. Preferivelmente, micropartículas compreendem lipossomas, nanopartículas, microesferas, nanoesferas, microcápsulas e nanocápsulas. Preferivelmente, algumas micropartículas consideradas pela presente invenção compreendem poli(lactídeo-co-glicolídeo), poliésteres alifáticos incluindo, mas não limitados a, ácido poli-glicólico e ácido poli-láctico, ácido hialurônico, polissacarídeos modificados, quitosana, celulose, dextrano, poliuretanos, ácidos poliacrílicos, pseudo-poli(aminoácidos), copolímeros relacionados a poli- hidroxibutirato, polianidridos, polimetilmetacrilato, poli(óxido de etileno), lecitina e fosfolipídios. B. Lipossomas
[0138]Uma modalidade da revelação considera lipossomas capazes de fixar e liberar ácidos nucleicos conjugados, polipeptídeos e proteínas de fusão como aqui descrito. Lipossomas são bicamadas lipídicas esféricas microscópicas que circundam um núcleo aquoso que são fabricadas a partir de moléculas anfifílicas tais como fosfolipídios. Por exemplo, um lipossoma pode aprisionar um ácido nucleico entre as caudas hidrofóbicas da micela de fosfolipídio. Agentes solúveis em água podem ser capturados no núcleo e agentes solúveis em lipídio podem ser dissolvidos na bicamada semelhante à concha. Lipossomas têm uma característica especial em que eles permitem que produtos químicos solúveis em água e insolúveis em água sejam usados juntos em um meio sem o uso de surfactantes ou outros emulsionantes. Lipossomas podem se formar espontaneamente misturando-se vigorosamente fosfolipídios em meio aquoso. Compostos solúveis em água são dissolvidos em uma solução aquosa capaz de hidratar fosfolipídios. Após a formação dos lipossomas, portanto, estes compostos são aprisionados dentro do centro lipossômico aquoso. A parede do lipossoma, sendo uma membrana de fosfolipídio, contém materiais solúveis em gordura tais como óleos. Lipossomas fornecem liberação controlada de compostos incorporados. Além disso, lipossomas podem ser revestidos com polímeros solúveis em água, tal como polietilenoglicol para aumentar a meia-vida farmacocinética. Uma modalidade da presente invenção considera uma tecnologia de cisalhamento ultra alto para refinar a produção de lipossoma, resultando em lipossomas unilamelares (camada única) estáveis tendo características estruturais especificamente designadas. Estas propriedades únicas dos lipossomas permitem o armazenamento simultâneo de compostos normalmente imiscíveis e a capacidade de sua liberação controlada.
[0139]Em algumas modalidades, a revelação considera lipossomas catiônicos e aniônicos, bem como lipossomas tendo lipídeos neutros. Preferivelmente, lipossomas catiônicos compreendem materiais negativamente carregados misturando-se os materiais e componentes lipossômicos de ácido graxo e permitindo- se que eles se associem à carga. Claramente, a escolha de um lipossoma catiônico ou aniônico depende do pH desejado da mistura de lipossoma final. Exemplos de lipossomas catiônicos incluem lipofectina, lipofetamina e lipofectace.
[0140]Uma modalidade da presente revelação considera um sistema de liberação compreendendo lipossomas que fornecem liberação controlada de pelo menos uma molécula aqui descrita. Preferivelmente, lipossomas que são capazes de liberação controlada: i) são biodegradáveis e não tóxicos; ii) carregam compostos tanto solúveis em água quanto em óleo; iii) solubilizam compostos recalcitrantes; iv) previnem a oxidação do composto; v) promovem a estabilização de proteína; vi) controlam a hidratação; vii) controlam a liberação do composto por variações na composição de bicamada tal como, mas não limitado a, comprimento da cadeia de ácido graxo, composição lipídica de ácido graxo, quantidades relativas de ácidos graxos saturados e insaturados e configuração física; viii) têm dependência de solvente; iv) têm dependência de pH e v) têm dependência de temperatura.
[0141]As composições dos lipossomas são amplamente categorizadas em duas classificações. Lipossomas convencionais são geralmente misturas de lecitina natural estabilizada (PC) que pode compreender fosfolipídios sintéticos de cadeia idêntica que podem conter ou não glicolipídios. Lipossomas especiais podem compreender: i) ácidos graxos bipolares; ii) a capacidade de fixar anticorpos para terapias alvejadas a tecidos; iii) revestimento com materiais tais como, mas não limitados a lipoproteína e carboidrato; iv) encapsulamento múltiplo e v) compatibilidade de emulsão.
[0142]Lipossomas podem ser facilmente fabricados no laboratório por métodos tais como, mas não limitados a, sonicação e vibração. Alternativamente, lipossomas de libração de composto estão comercialmente disponíveis. Por exemplo, Collaborative Laboratories, Inc. são conhecidos por fabricar lipossomas personalizados para requisitos de liberação específicos. C. Microesferas, Micropartículas e Microcápsulas
[0143]Microesferas e microcápsulas são úteis devido à sua capacidade de manter uma distribuição geralmente uniforme, fornecer liberação controlada estável de composto e são econômicas para produzir e dispensar. Preferivelmente, um gel de liberação associado ou o gel impregnado com composto é claro ou, alternativamente,
o referido gel é colorido para a visualização fácil pelo pessoal médico.
[0144]Microesferas são obteníveis comercialmente (Prolease™, Alkerme’s: Cambridge, Mass.). Por exemplo, um meio seco por congelamento compreendendo pelo menos um agente terapêutico é homogeneizado em um solvente adequado e pulverizado para fabricar microesferas na faixa de 20 a 90 µm. Técnicas são então seguidas, que mantêm a integridade de liberação sustentada durante as fases de purificação, encapsulamento e armazenamento. Scott et al., Improving Protein Therapeutics With Sustained Release Formulations, Nature Biotechnology, Volume 16:153 - 157 (1998). A modificação da composição de microesfera pelo uso de polímeros biodegradáveis pode fornecer uma capacidade para controlar a taxa de liberação de ácido nucleico. Miller et al., Degradation Rates of Oral Resorbable Implants {Polylactates and Polyglycolates: Rate Modification and Changes in PLA/PGA Copolymer Ratios, J. Biomed. Mater. Res., Vol. 11:711 - 719 (1977).
[0145]Alternativamente, uma preparação de microesfera de liberação sustentada ou controlada é preparada usando um método de secagem em água, onde uma solução de solvente orgânico de um sal metálico de polímero biodegradável é primeiro preparado. Subsequentemente, um meio dissolvido ou disperso de um ácido nucleico é adicionado à solução de sal metálico de polímero biodegradável. A razão wt de um ácido nucleico para o sal metálico de polímero biodegradável pode ser, por exemplo, cerca de 1:100000 a cerca de 1:1, preferivelmente cerca de 1:20000 a cerca de 1:500 e mais preferivelmente cerca de 1:10000 a cerca de 1:500. Em seguida, a solução de solvente orgânico contendo o sal metálico de polímero biodegradável e ácido nucleico é vertida em uma fase aquosa para preparar uma emulsão óleo/água. O solvente na fase oleosa é então separado por evaporação para fornecer microesferas. Finalmente, estas microesferas são então recuperadas, lavadas e liofilizadas. Posteriormente, as microesferas podem ser aquecidas sob pressão reduzida para remover a água residual e o solvente orgânico.
[0146]Outros métodos úteis para produzir microesferas que são compatíveis com uma mistura de sal metálico de polímero biodegradável e ácido nucleico são: i) separação de fase durante uma adição gradual de um agente de coacervação; ii) um método de secagem em água ou método de separação de fase, onde um antifloculante é adicionado para prevenir a aglomeração de partículas e iii) por um método de secagem por pulverização.
[0147]Em uma modalidade, a presente invenção considera um meio compreendendo uma microesfera ou microcápsula capaz de liberar uma liberação controlada de um ácido nucleico por uma duração de aproximadamente entre 1 dia e 6 meses. Em uma modalidade, a microesfera ou micropartícula pode ser colorida para permitir ao médico a capacidade de ver o meio claramente conforme ele é dispensado. Em uma outra modalidade, a microesfera ou microcápsula pode ser clara. Em um outro modalidade, a microesfera ou micropartícula é impregnada com um corante fluoroscópico rádio-opaco.
[0148]Microcápsulas de liberação controlada podem ser produzidas usando- se técnicas de encapsulamento conhecidas tais como extrusão centrífuga, revestimento em recipiente rotativo e suspensão em ar. Tais microesferas e/ou microcápsulas podem ser engendradas para obter taxas de liberação desejadas. Por exemplo, Oliosphere™ (Macromed) é um sistema de microesfera de liberação controlada. Estas microesferas particulares estão disponíveis em tamanhos uniformes variando entre 5 e 500 µm e composto de polímeros biocompatíveis e biodegradáveis. Composições poliméricas específicas de uma microesfera podem controlar a taxa de liberação de ácido nucleico tal que microesferas personalizadas sejam possíveis, incluindo manejo eficaz do efeito de explosão. ProMaxx™ (Epic Therapeutics, Inc.) é uma sistema de liberação de matriz proteica. O sistema é aquoso em natureza e é adaptável a modelos de liberação farmacêutica padrão. Em particular, ProMaxx™ são microesferas de proteína bioerodíveis que liberam tanto fármacos pequenos quanto macromoleculares e podem ser customizados com respeito tanto ao tamanho da microesfera quanto às características de liberação desejadas.
[0149]Em uma modalidade, uma microesfera ou micropartícula compreende um material de encapsulamento sensível ao pH que é estável em um pH menor do que o pH do mesentério interno. A faixa típica no mesentério interno é do pH 7,6 ao pH 7,2. Consequentemente, as microcápsulas devem ser mantidas em um pH de menos do que 7. Entretanto, se a variabilidade do pH for esperada, o material sensível ao pH pode ser selecionado baseado nos diferentes critérios de pH necessários para a dissolução das microcápsulas. O ácido nucleico encapsulado, portanto, será selecionado para o ambiente de pH no qual a dissolução é desejada e armazenado em um pH pré-selecionado para manter a estabilidade. Exemplos de material sensível ao pH útil como encapsulantes são Eudragit™ L-100 ou S-100 (Rohm GMBH), ftalato de hidroxipropil metilcelulose, acetato succinato de hidroxipropil metilcelulose, acetato ftalato de polivinila, acetato ftalato de celulose e acetato trimelitato de celulose. Em uma modalidade, lipídeos compreendem o revestimento interno das microcápsulas. Nestas composições, estes lipídeos podem ser, mas não são limitados a, ésteres parciais de ácidos graxos e anidridos de hexitiol e gorduras comestíveis tais como triglicerídeos. Lew C. W., Controlled-Release pH Sensitive Capsule And Adhesive System And Method. Pat. U.S. No 5.364.634 (incorporada aqui por referência).
[0150]Em uma modalidade, a presente invenção considera uma micropartícula compreendendo uma gelatina ou outro cátion polimérico tendo uma densidade de carga similar à gelatina (isto é, poli-L-lisina) e é usada como um complexo para formar uma micropartícula primária. Uma micropartícula primária é produzida como uma mistura da composição seguinte: i) Gelatina (60 bloom, tipo A da pele porcina), ii) 4-sulfato de condroitina (0,005 % a 0,1 %), iii) glutaraldeído (25 %, grau 1) e iv) cloridrato de 1-etil-3-(3-dimetilaminopropil)-carbodiimida (cloridrato de EDC) e sacarose ultrapura (Sigma Chemical Co., St. Louis, Mo.). A fonte de gelatina não é considerada crítica; ela pode ser de bovino, porcino, humano ou outra fonte animal. Tipicamente, o cátion polimérico está entre 19.000 a 30.000 daltons. Sulfato de condroitina é então adicionado ao complexo com sulfato de sódio ou etanol como um agente de coacervação.
[0151]Após a formação de uma micropartícula, um ácido nucleico é diretamente ligado à superfície da micropartícula ou é indiretamente ligado usando uma “ponte” ou “espaçador”. Os grupos amino destes grupos lisina da gelatina são facilmente derivados para fornecer sítios para o acoplamento direto de um composto. Alternativamente, eapaçadores (isto é, moéculas de ligação e porções de derivação em ligantes de alvejamento) tal como avidina-biotina também são úteis para acoplar indiretamente os ligantes de alvejamento às micropartículas. A estabilidade da micropartícula é controlada pela quantidade de reticulação de glutaraldeído- espaçador induzida pelo cloridrato de EDC. Um meio de liberação controlada também é empiricamente determinado pela densidade final de reticulações de glutaraldeído- espaçador.
[0152]Em uma modalidade, a presente invenção considera micropartículas formadas por secagem por pulverização de uma composição compreendendo fibrinogênio ou trombina com um ácido nucleico. Preferivelmente, estas micropartículas são solúveis e a proteína selecionada (isto é, fibrinogênio ou trombina) cria as paredes das micropartículas. Consequentemente, os ácidos nucleicos são incorporados dentro das paredes de proteína e entre as mesmas da micropartícula. Heath et al., Microparticles And Their Use In Wound Therapy. Pat. U.S. No 6.113.948 (incorporada aqui por referência). Após a aplicação das micropartículas ao tecido vivo, a reação subsequente entre o fibrinogênio e a trombina cria um selante de tecido liberando desse modo o composto incorporado composto na área adjacente imediata.
[0153]Um técnico no assunto entenderá que a forma das microesferas não precisa ser exatamente esférica; apenas como partículas muito pequenas capazes de serem pulverizadas ou difundidas dentro ou sobre um sítio cirúrgico (isto é, aberto ou fechado). Em uma modalidade, micropartículas são compreendidas de um material biocompatível e/ou biodegradável selecionado a partir do grupo consistindo em polilactídeo, poliglicolídeo e copolímeros de lactídeo/glicolídeo (PLGA), ácido hialurônico, polissacarídeos modificados e qualquer outro material bem conhecido. V. COMPOSIÇÕES PROTEINÁCEAS
[0154]Os polipeptídeos ou polinucleotídeos da revelação, tais como as proteínas de fusão a CIRT, polipeptídeo estabilizador, ligante, domínio de ligação a grampo de RNA, NES, domínio regulador de RNA, etiqueta, NLS, molécula de alvejamento de RNA, região de grampo da molécula de alvejamento de RNA, região helicoidal ou região de alvejamento da molécula de alvejamento de RNA podem incluir 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 ou 50 ou mais aminoácidos variantes ou substituições de ácido nucleico ou ser pelo menos 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou 100 % similares, idênticos ou homólogos com pelo menos ou no máximo 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182,
183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 300, 400, 500, 550, 1000 ou mais aminoácidos ou ácidos nucleicos contíguos ou qualquer faixa derivável, das SEQ ID NOs: 1 a 132.
[0155]Os polipeptídeos ou polinucleotídeos da revelação, tais como as proteínas de fusão a CIRT, polipeptídeo estabilizador, ligante, domínio de ligação a grampo de RNA, NES, domínio regulador de RNA, etiqueta, NLS, molécula de alvejamento de RNA, região de grampo da molécula de alvejamento de RNA, região helicoidal ou região de alvejamento da molécula de alvejamento de RNA podem incluir 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 300, 400, 500, 550, 1000 ou mais aminoácidos contíguos ou qualquer faixa derivável, da SEQ ID NO: 1 a 132.
[0156]Em algumas modalidades, a proteína de fusão pode compreender os aminoácidos 1 a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484,
485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614 ou 615 (ou qualquer faixa derivável) das SEQ ID NOs: 87 a 106 ou 128 a 132.
[0157]Em algumas modalidades, a proteína de fusão pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318,
319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614 ou 615 (ou qualquer faixa derivável) aminoácidos contíguos das SEQ ID NOs: 87 a 106 ou 128 a 132.
[0158]Em algumas modalidades, a proteína de fusão pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148,
149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607,
608, 609, 610, 611, 612, 613, 614 ou 615 (ou qualquer faixa derivável) aminoácidos contíguos das SEQ ID NOs: 87 a 106 ou 128 a 132 que são pelo menos, no máximo ou exatamente 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou 100 % similares, idênticos ou homólogos com uma das SEQ ID NOs: 87 a 106 ou 128 a 132.
[0159]Em outras modalidades, o polipeptídeo estabilizador pode compreender os aminoácidos 1 a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 ou 90 ou qualquer faixa derivável da SEQ ID NO: 5, 19 ou 20.
[0160]Em algumas modalidades, o polipeptídeo estabilizador pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 ou 90 (ou qualquer faixa derivável) aminoácidos contíguos da SEQ ID NO: 5, 19 ou 20.
[0161]Em algumas modalidades, o polipeptídeo estabilizador pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 ou 90 (ou qualquer faixa derivável) aminoácidos contíguos da SEQ ID NO: 5, 19 ou 20 que são pelo menos, no máximo ou exatamente 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %,
80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou 100 % similares, idênticos ou homólogos com uma das SEQ ID NO: 5, 19 ou 20.
[0162]Em algumas modalidades, o domínio de ligação a grampo de RNA pode compreender os aminoácidos 1 a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101 ou 102, (ou qualquer faixa derivável) das SEQ ID NOs: 7 ou 18.
[0163]Em algumas modalidades, o domínio de ligação a grampo de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101 ou 102 (ou qualquer faixa derivável) aminoácidos contíguos das SEQ ID NOs: 7 ou 18.
[0164]Em algumas modalidades, o domínio de ligação a grampo de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101 ou 102 (ou qualquer faixa derivável) aminoácidos contíguos das SEQ ID NOs: 7 ou 18 que são pelo menos, no máximo ou exatamente 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98
%, 99 % ou 100 % similares, idênticos ou homólogos com um das SEQ ID NOs: 7 ou
18.
[0165]Em algumas modalidades, o domínio regulador de RNA pode compreender os aminoácidos 1 a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363 ou 364 (ou qualquer faixa derivável) das SEQ ID NOs: 9, 11, 15 a 17 ou 123 a 125.
[0166]Em algumas modalidades, o domínio regulador de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22,
23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363 ou 364 (ou qualquer faixa derivável) aminoácidos contíguos das SEQ ID NOs: 9, 11, 15 a 17 ou 123 a 125.
[0167]Em alguns aspectos, existe uma molécula de ácido nucleico ou polipeptídeo iniciando na posição 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106,
107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565,
566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614 ou 615 de qualquer um das SEQ ID NOS: 1 a 132 e compreendendo 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425,
426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614 ou 615 nucleotídeos ou polipeptídeos contíguos de qualquer uma das SEQ ID NOS: 1 a 132.
[0168]Em algumas modalidades, o domínio regulador de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246,
247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363 ou 364 (ou qualquer faixa derivável) aminoácidos contíguos das SEQ ID NOs: 9, 11, 15 a 17 ou 123 a 125 que são pelo menos, no máximo ou exatamente 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou 100 % similares, idênticos ou homólogos com uma das SEQ ID NOs: 9, 11, 15 a 17 ou 123 a 125.
[0169]Em algumas modalidades, a estrutura de grampo, tal como a haste, alça ou tanto a haste quanto a alça, da molécula de alvejamento de RNA pode compreender os ácidos nucleicos 1 a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 ou 43 (ou qualquer faixa derivável) das SEQ ID NOs: 1, 2, 26, 28 ou 83 a
86.
[0170]Em algumas modalidades, a estrutura de grampo, tal como a haste, alça ou tanto a haste quanto a alça, da molécula de alvejamento de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 ou 43 (ou qualquer faixa derivável) ácidos nucleicos contíguos das SEQ ID NOs: 1, 2, 26, 28 ou 83 a 86.
[0171]Em algumas modalidades, a estrutura de grampo, tal como a haste, alça ou tanto a haste quanto a alça, da molécula de alvejamento de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 ou 43 (ou qualquer faixa derivável) ácidos nucleicos contíguos das SEQ ID NOs: 1, 2, 26, 28 ou 83 a 86 que são pelo menos, no máximo ou exatamente 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou 100 % similares ou idênticos com uma das SEQ ID NOs: 1, 2, 26, 28 ou 83 a 86.
[0172]Em algumas modalidades, a região de alvejamento de RNA ou a molécula de alvejamento de RNA pode compreender os ácidos nucleicos 1 a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 ou 40 (ou qualquer faixa derivável) das SEQ ID NOs: 30 a 62.
[0173]Em algumas modalidades, a região de alvejamento de RNA ou a molécula de alvejamento de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 ou 40 (ou qualquer faixa derivável) ácidos nucleicos contíguos das SEQ ID NOs: 30 a 62.
[0174]Em algumas modalidades, a região de alvejamento de RNA ou a molécula de alvejamento de RNA pode compreender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 ou 40 (ou qualquer faixa derivável) ácidos nucleicos contíguos das SEQ ID NOs: 30 a 62 que são pelo menos, no máximo ou exatamente 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou 100 % similares ou idênticos com uma das SEQ ID NOs: 30 a 62.
[0175]Em alguns aspectos, o polipeptídeo estabilizador pode ter uma ou mais substituições que reduzem ou eliminam a ligação a proteínas endógenas. Em alguns aspectos, o polipeptídeo estabilizador pode ter uma ou mais substituições que reduzem ou eliminam uma atividade dirigida para uma proteína endógena.
[0176]Os polipeptídeos e ácidos nucleicos da revelação, tais como as proteínas de fusão a CIRT, polipeptídeo estabilizador, ligante, domínio de ligação a grampo de RNA, NES, domínio regulador de RNA, etiqueta, NLS, molécula de alvejamento de RNA, região de grampo da molécula de alvejamento de RNA, região helicoidal ou região de alvejamento da molécula de alvejamento de RNA podem incluir pelo menos, no máximo ou exatamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326,
327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614 ou 615 substituições.
[0177]A substituição pode estar na posição de aminoácido ou posição de ácido nucleico 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161,
162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614 ou 615 de uma das SEQ ID NO:
1 a 132.
[0178]Variantes substituintes tipicamente contêm a troca de um aminoácido por um outro em um ou mais sítios dentro da proteína e podem ser designadas para modular uma ou mais propriedades do polipeptídeo, com ou sem a perda de outras funções ou propriedades. Substituições podem ser conservativas, isto é, um aminoácido é substituído com um de forma e carga similares. Substituições conservativas são bem conhecidas na técnica e incluem, por exemplo, as mudanças de: alanina para serina; arginina para lisina; asparagina para glutamina ou histidina; aspartato para glutamato; cisteína para serina; glutamina para asparagina; glutamato para aspartato; glicina para prolina; histidina para asparagina ou glutamina; isoleucina para leucina ou valina; leucina para valina ou isoleucina; lisina para arginina; metionina para leucina ou isoleucina; fenilalanina para tirosina, leucina ou metionina; serina para treonina; treonina para serina; triptofano para tirosina; tirosina para triptofano ou fenilalanina; e valina para isoleucina ou leucina. Alternativamente, substituições podem ser não conservativas tal que uma função ou atividade do polipeptídeo seja afetada. Mudanças não conservativas tipicamente envolvem substituir um resíduo com um que seja quimicamente dissimilar, tal como um aminoácido polar ou carregado por um aminoácido não polar ou não carregado e vice versa.
[0179]Proteínas podem ser recombinantes ou sintetizadas in vitro. Alternativamente, uma proteína não recombinante ou recombinante pode ser isolada de bactérias. Também é considerado que bactérias contendo uma tal variante podem ser implementadas em composições e métodos. Consequentemente, uma proteína não precisa ser isolada.
[0180]O termo “códon funcionalmente equivalente” é usado na presente invenção para se referir a códons que codificam o mesmo aminoácido, tais como os seis códons para arginina ou serina e também se refere a códons que codificam aminoácidos biologicamente equivalentes.
[0181]Também será entendido que sequências de aminoácidos e ácidos nucleicos podem incluir resíduos adicionais, tais como aminoácidos N- ou C-terminais adicionais ou sequências 5’ ou 3’, respectivamente e ainda ser essencialmente como apresentado em uma das sequências reveladas na presente invenção, contanto que a sequência satisfaça os critérios apresentados acima, incluindo a manutenção da atividade biológica da proteína onde a expressão de proteína é afetada. A adição de sequências terminais particularmente se aplica a sequências de ácidos nucleicos que podem, por exemplo, incluir várias sequências que não de codificação que flanqueiam qualquer uma das porções 5’ ou 3’ da região de codificação.
[0182]O seguinte é uma discussão com base na mudança dos aminoácidos de uma proteína para criar uma molécula equivalente ou ainda uma molécula de segunda geração, melhorada. Por exemplo, certos aminoácidos podem ser substituídos no lugar de outros aminoácidos em uma estrutura de proteína sem perda apreciável da capacidade de ligação interativa. Estruturas tais como, por exemplo, um domínio catalítico enzimático ou componentes de interação podem ter aminoácido substituído para manter tal função. Visto que é a capacidade interativa e natureza de uma proteína que define qual atividade funcional biológica da proteína, certas substituições de aminoácido podem ser feitas em uma sequência de proteína e em sua sequência de codificação de DNA subjacente e, não obstante, produzem uma proteína com propriedades semelhantes. Assim, é considerado pelos inventores que várias mudanças podem ser feitas nas sequências de DNA de genes sem perda apreciável de sua utilidade ou atividade biológica.
[0183]Em outras modalidades, a alteração da função de um polipeptídeo é intencionada introduzindo-se uma ou mais substituições. Por exemplo, certos aminoácidos podem ser substituídos no lugar de outros aminoácidos em uma estrutura de proteína com a intenção de modificar a capacidade de ligação interativa de componentes de interação. Estruturas tais como, por exemplo, domínios de interação de proteína, domínios de interação de ácido nucleico e sítios catalíticos podem ter aminoácidos substituídos para alterar tal função. Visto que é a capacidade interativa e a natureza de uma proteína que definem qual atividade funcional biológica da proteína, certas substituições de aminoácido podem ser feitas em uma sequência de proteína e em sua sequência de codificação de DNA subjacente e, não obstante, produzem uma proteína com propriedades diferentes. Assim, é considerado pelos inventores que várias mudanças podem ser feitas nas sequências de DNA de genes com alteração apreciável de sua utilidade ou atividade biológica.
[0184]Ao fazer tais mudanças, o índice hidropático dos aminoácidos pode ser considerado. A importância do índice hidropático de aminoácido em conferir a função biológica interativa em uma proteína é geralmente entendida na técnica (Kyte e Doolittle, 1982). É aceito que o caráter hidropático relativo do aminoácido contribui para a estrutura secundária da proteína resultante, que por sua vez define a interação da proteína com outras moléculas, por exemplo, enzimas, substratos, receptores, DNA, anticorpos, antígenos e semelhantes.
[0185]Também é entendido na técnica que a substituição de aminoácidos semelhantes pode ser feita eficazmente com base em hidrofilicidade. A Patente U.S.
4.554.101, incorporada aqui por referência, afirma que a maior hidrofilicidade média local de uma proteína, como governado pela hidrofilicidade de seus aminoácidos adjacentes, se correlaciona com uma propriedade biológica da proteína. Entende-se que um aminoácido pode ser substituído no lugar de um outro tendo um valor de hidrofilicidade similar e ainda produz uma proteína biologicamente equivalente e imunologicamente equivalente.
[0186]Como esboçado acima, substituições de aminoácido geralmente são fundamentadas na similaridade relativa dos substituintes de cadeia lateral de aminoácido, por exemplo, sua hidrofobicidade, hidrofilicidade, carga, tamanho e semelhantes. Substituições exemplares que tomam em consideração as várias características precedentes são bem conhecidas e incluem: arginina e lisina; glutamato e aspartato; serina e treonina; glutamina e asparagina; e valina, leucina e isoleucina.
[0187]Em modalidades específicas, todas ou parte das proteínas aqui descritas também podem ser sintetizadas em solução ou em um suporte sólido de acordo com técnicas convencionais. Vários sintetizadores automáticos estão comercialmente disponíveis e podem ser usados de acordo com protocolos conhecidos. Ver, por exemplo, Stewart e Young, (1984); Tam et al., (1983); Merrifield, (1986); e Barany e Merrifield (1979), cada um incorporado aqui por referência. Alternativamente, tecnologia de DNA recombinante pode ser utilizada em que uma sequência de nucleotídeos que codifica um peptídeo ou polipeptídeo é inserida em um vetor de expressão, transformada ou transfectada em uma célula hospedeira apropriada e cultivada sob condições adequadas para expressão.
[0188]Uma modalidade inclui o uso de transferência de gene às células, incluindo microrganismos, para a produção e/ou apresentação de proteínas. O gene para a proteína de interesse pode ser transferido em células hospedeiras apropriadas seguido por cultura de células sob as condições apropriadas. Um ácido nucleico que codifica virtualmente qualquer polipeptídeo pode ser utilizado. A geração de vetores de expressão recombinantes e dos elementos incluídos nestes, são discutidas na presente invenção. Alternativamente, a proteína a ser produzida pode ser uma proteína endógena normalmente sintetizada pela célula usada para a produção de proteína. VI. SEQUÊNCIAS Andaime de grampo TAR: ggccagaucugagccugggagcucucuggcc (SEQ ID NO: 1) Andaime de grampo humano SLBP: ccaaaggcucuucucagagccaccca (SEQ ID NO: 2)
Nome: Descrição: Peptídeo MKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHP de DKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITP sinalização DKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLP de MBP NPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAAD
GGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHM NADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGV TVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENILLT DEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQK
GEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQT NS (SEQ ID NO: 3)
ITSLYKKAGSETVRFQSHHHHHHSSGVDLGTENLYFQSNA (SEQ ID NO: 4) MBP- ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS CIRTS-1 STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin morto LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP
VRDIPAFLTWAQVG (SEQ ID NO: 9)
SSG etiqueta 6H HHHHHH (SEQ ID NO: 10) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS CIRTS-0 HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin morto LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNADLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 11)
GS 3xFLAG DYKDHDGDYKDHDIDYKDDDDK (SEQ ID NO: 12) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) CIRTS-1 ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) Domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 9) NLS KRPAATKKAGQAKKKK (SEQ ID NO: 13)
GS Etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) CIRTS-2 ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF1 N MSATSVDTQRTKGQDNKVQNGSLHQKDTVHDNDFEPYLT terminal GQSNQSNSYPSMSDPYLSSYYPPSIGFPYSLNEAPWSTAG
DPPIPYLTTYGQLSNGDHHFMHDAVFGQPGGLGNNIYQHR FNFFPENPAFSAWGTSGSQGQQTQSSAYGSSYTYPPSSL GGTVVDGQPGFHSDTLSKAPGMNSLEQGMVGLKIGDVSS SAVKTVGSVVSSVALTGVLSGNGGTNVNMPVSKPTSWAAI ASKPAKPQPKMKTKSGPVMGGGLPPPPIKHNMDIGTWDN KGPVPKAPVPQQAPSPQAAPQPQQVAQPLPAQPPALAQP
QYQSPQQPPQTRWVAPRNRNAAFGQSGGAGSDSNSPGN VQPNSAPSVES (SEQ ID NO: 15)
GS Etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7) CIRTS-
GS 3t HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ (101-200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS Etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) CIRTS-3 TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS
HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 MSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS N-terminal PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTGG (1-200) DTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFLG
QHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAYAP SSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA (SEQ ID NO: 17)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) SLBP 124- ADFETDESVLMRRQKQINYGKNTIAYDRYIKEVPRHLRQPG 198 IHPKTPNKFKKYSRRSWDQQIKLWKVALHFWD (SEQ ID CIRTS- NO: 18) 4t HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ (101-200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS CIRTS-4 STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5)
ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) SLBP 124- ADFETDESVLMRRQKQINYGKNTIAYDRYIKEVPRHLRQPG 198 IHPKTPNKFKKYSRRSWDQQIKLWKVALHFWD (SEQ ID NO: 18) HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 MSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS (1-200) PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTGG
DTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFLG
QHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAYAP SSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA (SEQ ID NO: 17)
GS etiqueta DYKDDDDK (SEQ ID NO: 14)
HBEGF MRVTLSSKPQALATPNKEEHGKRKKKGKGLGKKRDPCLR
KYKDFCIHGECKYVKELRAPSCICHPGYHGERCHGLS (SEQ ID NO: 19) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI CIRTS- QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7) 5t
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ (101-200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS etiqueta DYKDDDDK (SEQ ID NO: 14)
HBEGF MRVTLSSKPQALATPNKEEHGKRKKKGKGLGKKRDPCLR
KYKDFCIHGECKYVKELRAPSCICHPGYHGERCHGLS (SEQ ID NO: 19) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) CIRTS-5 ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 MSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS (1-200) PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTGG
DTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFLG
QHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAYAP SSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA (SEQ ID NO: 17)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK defensina CCRRKK (SEQ ID NO: 20) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) CIRTS- TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL 6t
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS
HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ (101-200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK defensina CCRRKK (SEQ ID NO: 20) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) CIRTS-6 ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 MSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS (1-200) PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTGG
DTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFLG
QHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAYAP SSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA (SEQ ID NO: 17)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK CIRTS-7 defensina CCRRKK (SEQ ID NO: 20) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6)
SLBP 124- ADFETDESVLMRRQKQINYGKNTIAYDRYIKEVPRHLRQPG 198 IHPKTPNKFKKYSRRSWDQQIKLWKVALHFWD (SEQ ID NO: 18) HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2 MSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS (1-200) PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTGG
DTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFLG
QHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAYAP SSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA (SEQ ID NO: 17)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) CIRTS-8 Domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 9)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) CIRTS-9 ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) Domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 9)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL CIRTS-
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI 10 QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSGGSGGS (SEQ ID NO: 21) Domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE
Pin LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 9)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS CIRTS- HIV NES LQLPPLERLTL (SEQ ID NO: 8) 11 Ligante L8 SGSETPGTSESATPES (SEQ ID NO: 22) Domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 9)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS CIRTS- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH 12 INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6)
TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) ligante GGSG (SEQ ID NO: 23) ER/K 10 EEEEKKKQQEEEAERLRRIQEEMEKERKRREEDEQRRRK nm EEEERRMKLEMEAKRKQEEEERKKREDDEKRKKK (SEQ ID NO: 24) ligante GSGGS (SEQ ID NO: 25) Domínio MELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINE Pin LDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD
SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHYC
KDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVP VRDIPAFLTWAQVG (SEQ ID NO: 9)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) CIRTS- TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL 13 VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) Ligante L8 SGSETPGTSESATPES (SEQ ID NO: 22)
Y2 (101- DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ 200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) ligante GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GS HIV NES LQLPPLERLTL (SEQ ID NO: 8) CIRTS- ligante GGSG (SEQ ID NO: 23) 14 ER/K 10 EEEEKKKQQEEEAERLRRIQEEMEKERKRREEDEQRRRK nm EEEERRMKLEMEAKRKQEEEERKKREDDEKRKKK (SEQ ID NO: 24) ligante GSGGS (SEQ ID NO: 25) Y2 (101- DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ 200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS etiqueta DYKDDDDK (SEQ ID NO: 14) β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK CIRTS- defensina CCRRKK (SEQ ID NO: 20) 7X 3
GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7) GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) hADAR(29 LHLDQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLT 9-701) DNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCIN
GEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDD QKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHE PILEEPADRHPNRKARGQLRTKIESGEGTIPVRSNASIQTW DGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSS IILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNA EARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRL
CKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKE YQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP (SEQ ID NO: 123) NLS KRPAATKKAGQAKKKK (SEQ ID NO: 13)
GS Etiqueta de DYKDDDDK (SEQ ID NO: 14) marcação β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK defensina CCRRKK (SEQ ID NO: 20) 3 CIRTS- GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) 8X TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7)
GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) hADAR LHLDQTPSRQPIPSEGLQLHLPQVLADAVSRLVLGKFGDLT (299-701) DNFSSPHARRKVLAGVVMTTGTDVKDAKVISVSTGTKCIN E488Q GEYMSDRGLALNDCHAEIISRRSLLRFLYTQLELYLNNKDD
QKRSIFQKSERGGFRLKENVQFHLYISTSPCGDARIFSPHE PILEEPADRHPNRKARGQLRTKIESGQGTIPVRSNASIQTW DGVLQGERLLTMSCSDKIARWNVVGIQGSLLSIFVEPIYFSS IILGSLYHGDHLSRAMYQRISNIEDLPPLYTLNKPLLSGISNA EARQPGKAPNFSVNWTVGDSAIEVINATTGKDELGRASRL
CKHALYCRWMRVHGKVPSHLLRSKITKPNVYHESKLAAKE YQAAKARLFTAFIKAGLGAWVEKPTEQDQFSLTP (SEQ ID NO: 124) NLS KRPAATKKAGQAKKKK (SEQ ID NO: 13)
GS Etiqueta de DYKDDDDK (SEQ ID NO: 14) marcação β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK defensina CCRRKK (SEQ ID NO: 20) 3 GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) TBP6.7 MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDIL CIRTS-
VPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPMRI 9X QYAKTDKRIPAKMKGTFV (SEQ ID NO: 7) NES GSLQLPPLERLTL (SEQ ID NO: 124) GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) NYTHDF1 MSATSVDTQRTKGQDNKVQNGSLHQKDTVHDNDFEPYLT
GQSNQSNSYPSMSDPYLSSYYPPSIGFPYSLNEAPWSTAG DPPIPYLTTYGQLSNGDHHFMHDAVFGQPGGLGNNIYQHR FNFFPENPAFSAWGTSGSQGQQTQSSAYGSSYTYPPSSL GGTVVDGQPGFHSDTLSKAPGMNSLEQGMVGLKIGDVSS SAVKTVGSVVSSVALTGVLSGNGGTNVNMPVSKPTSWAAI ASKPAKPQPKMKTKSGPVMGGGLPPPPIKHNMDIGTWDN KGPVPKAPVPQQAPSPQAAPQPQQVAQPLPAQPPALAQP
QYQSPQQPPQTRWVAPRNRNAAFGQSGGAGSDSNSPGN VQPNSAPSVES (SEQ ID NO: 15)
GS Etiqueta de DYKDDDDK (SEQ ID NO: 14) marcação β- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK defensina CCRRKK (SEQ ID NO: 20) 3 GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6)
SLBP ADFETDESVLMRRQKQINYGKNTIAYDRYIKEVPRHLRQPG IHPKTPNKFKKYSRRSWDQQIKLWKVALHFWD (SEQ ID NO: 18) CIRTS- NES LQLPPLERLTL (SEQ ID NO: 8) 10X GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) YTHDF2(1 MSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS 01-200) PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTGG
DTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFLG
QHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAYAP SSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA (SEQ ID NO: 17)
GS
Etiqueta de DYKDDDDK (SEQ ID NO: 14) marcação ORF5 MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEYH INILETSDDEE (SEQ ID NO: 5) GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) PP7 MAKTIVLAVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLT
ASLRQNGAKTAYRVNLKLDQADVVDASTSVAGELPKVRYT QVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNL VPLGRSLEGGSGGMAKTIVLAVGEATRTLTEIQSTADRQIF EEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDA CIRTS-
STSVAGELPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKS 18X LVATSQVEDLVVNLVPLGRSLE (SEQ ID NO: 125) NES LQLPPLERLTL (SEQ ID NO: 8) GGS6 GGSGGSGGSGGSGGSGGS (SEQ ID NO: 6) Y2 (100- DAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ 200) GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAA (SEQ ID NO: 16)
GS Etiqueta de DYKDDDDK (SEQ ID NO: 14) marcação Sequências de gRNA usadas neste estudo (todos os gRNAs são expressos a partir de um promotor hU6) Nome: Descrição: Sequência de DNA TBP- 26- gRNA de GGCCAGATCTGAGCCTGGGAGCTCTCTGGCC
OT 51 TBP6.7 (TAR) (SEQ ID NO: 26)
TTATT fago λ fora do Tgacagcccacatggcattccacttatcactggcatcctt (SEQ alvo ID NO: 27) SLBP- 24- gRNA de SLBP CCAAAGGCTCTTCTCAGAGCCACCCA (SEQ ID OT 18 NO: 28)
TTATT λ alvo GTGATAAGTGGAATGCCATG (SEQ ID NO: 29) PP7- fago λ de gRNA TAAGGAGTTTATATGGAAACCCTTA (SEQ ID NT que não de NO: 121) alvejamento de PP7
TTATT fago λ GTGATAAGTGGAATGCCATG (SEQ ID NO: 122) Sequenciamento guia de gRNA; todos expressos pelo mesmo promotor hU6 como TBP-OT Nome do Sequência guia: Fig: alvo: Fluciferase- 18-20 caggtcgactctagactcgaggctagcgagctcgtttaaa (SEQ ID 3 40 NO: 30) PPIB 23-26 cttggtgctctccaccttccgcaccacctccatgccctct (SEQ ID NO: 4 31) SMARCA4 23-25 ccgatgcggtgggctcggtcctgcgcttgcaggtcctggt (SEQ ID 4 NO: 32) NFKB1 22-67 gcctccaccagctctctgactgtacccccagagacctcat (SEQ ID 4
NO: 33) NRAS 25-30 aagcatcttcaacaccctgtctggtcttggctgaggtttc (SEQ ID NO: 4 34) B4GALTN1 24-50 cttcgcaccgcagcgcagcgcggctcagctcccggctcgt (SEQ ID 4 NO: 35) Fluciferase- CTAGACTCGAGGCTAGCGAG (SEQ ID NO: 36) 8 20 Fluciferase- CGACTCTAGACTCGAGGCTAGCGAGCTCGT (SEQ 8 30 ID NO: 37) KRAS-2 22-45 cttgtggtagttggagctga (SEQ ID NO: 116) 25
B KRAS-3 22-53 agttggagctgatggcgtag (SEQ ID NO: 117) 25
B KRAS-4 22-54 gttggagctgatggcgtagg (SEQ ID NO: 118) 25
B KRAS-5 22-65 tggcgtaggcaagagtgcct (SEQ ID NO: 119) 25
B KRAS-6 22-66 ggcgtaggcaagagtgcctt (SEQ ID NO: 120) 25
B SMARCA4-1 27-67 ggccctggcccttcccctggagccatgctgggccctagcc (SEQ ID 11 NO: 38) C SMARCA4-2 27-71 gcccaaccccatttaaccagaaccagctgcaccagctcag (SEQ ID 11 NO: 39) C SMARCA4-3 27-74 cctcccaagccctggcctgaaggacccatggcgaatgctg (SEQ ID 11 NO: 40) C SMARCA4-4 27-75 cgtcccacccgccgcctcgcccgtgatgccaccgcagacc (SEQ ID 11
NO: 41) C
SMARCA4-5 27-78 ggaggtggtggtgtgcatgcggagggacacagcgctggag (SEQ ID 11 NO: 42) C
SMARCA4-6 27-80 Tcacaggcaaaatccagaagctgaccaaggcagtggccac (SEQ 11 ID NO: 43) C
SMARCA4-7 27-81 catggctgaagatgaggaggggtaccgcaagctcatcgac (SEQ ID 11 NO: 44) C
SMARCA4-8 28-02 ctctggacgagaccagccagatgagcgacctcccggtgaa (SEQ ID 11 NO: 45) C
SMARCA4-9 28-04 cccaccctgcccgtggaggagaagaagaagattccagatc (SEQ ID 11 NO: 46) C
SMARCA4- 28-05 aatatggcgtgtcccaggcccttgcacgtggcctgcagtc (SEQ ID 11 10 NO: 47) C
SMARCA4- 28-07 ctcatcacgtacctcatggagcacaaacgcatcaatgggc (SEQ ID 11 11 NO: 48) C
SMARCA4- 28-08 tggtgaaggtgtcttacaagggatccccagcagcaagacg (SEQ ID 11 12 NO: 49) C
SMARCA4- 28-10 accccgccgcctgctgctgacgggcacaccgctgcagaac (SEQ ID 11 13 NO: 50) C
SMARCA4- 28-11 cagtggtttaacgcaccctttgccatgaccggggaaaagg (SEQ ID 11 14 NO: 51) C
SMARCA4- 28-12 acgactcaagaaggaagtcgaggcccagttgcccgaaaag (SEQ ID 11 15 NO: 52) C
SMARCA4- 28-13 gtgctgctgactgatggctccgagaaggacaagaagggca (SEQ ID 11 16 NO: 53) C
SMARCA4- 28-16 ggaaccacgaaggcggaggaccggggcatgctgctgaaaa (SEQ 11 17 ID NO: 54) C
SMARCA4- 28-17 tccagtcggcagacactgtgatcatttttgacagcgactg (SEQ ID NO: 11 18 55) C SMARCA4- 28-20 cgccagcgggcgtcaaccccgacttggaggagccacctct (SEQ ID 11 19 NO: 56) C SMARCA4- 28-22 gcggaggtggagcggctgacctgtgaggaggaggaggaga (SEQ 11 20 ID NO: 57) C SMARCA4- 28-26 tgatcaagtacaaggacagcagcagtggacgtcagctcag (SEQ ID 11 21 NO: 58) C SMARCA4- 28-27 cttcaagaagataaaggagcgcattcgcaaccacaagtac (SEQ ID 11 22 NO: 59) C SMARCA4- 28-30 agggtcccgagccaagccggtcgtgagtgacgatgacagt (SEQ ID 11 23 NO: 60) C SMARCA4- 28-32 tatttatacagcagagaagctgtaggactgtttgtgactg (SEQ ID NO: 11 24 61) C SMARCA4- 28-33 ggggaacacacgatacctgtttttcttttccgttgctggc (SEQ ID NO: 11 25 62) C Oligonucleotídeos de RNA usados para caracterização in vitro: Nome Oligo Direto: Figura: do Nome: gene: R1 alvo de ATAGGCCAGTGAATTCGAGCTCGAATATGGATTACT 2A ssRNA TGGTAGAACAGCAATCTACGCCGGAAGCATAAAG para (SEQ ID NO: 63)
EMSA R2 alvo de GGCCAGTGAATTCGAGCTCGGTACCCGGGGATCCT 2C ssRNA CTAGAAATATGGATTACTTGGTAGAACAGCAATCTAC para TCGACCTGCAGGCATGCAAGCTTGGCGTAATCATG ensaio GTCATAGCTGTTTCCTGTGTTTATCCGCTCACAATTC de CACACAACATACGAGCCGGAAGCATAAAG (SEQ ID clivagem NO: 64) R3 gRNA GGCCAGATCTGAGCCTGGGAGCTCTCTGGCCCagcc 2A para accacccacagagccgccaccaga (SEQ ID NO: 65)
EMSA R4 gRNA GGCCAGATCTGAGCCTGGGAGCTCTCTGGCCCTAG 2C para ATTGCTGTTCTACCAAGTAATCCAT (SEQ ID NO: 66) ensaio de clivagem Iniciadores de qPCR: Nome do Direto: SEQ Reverso: SEQ gene: ID ID NO: NO: GAPDH GTCTCCTCTGACTTC 67 ACCACCCTGTTGCTGTAGC 68
AACAGCG CAA PPIB AACGCAGGCAAAGA 69 TCTGTCTTGGTGCTCTCCAC 70
CACCAACG CT Fluciferase AGGTTACAACCGCC 71 ATGAGAATCTCGCGGATCT 72
AAGAAGC TG PPIB AACGCAGGCAAAGA 73 TCTGTCTTGGTGCTCTCCAC 74
CACCAACG CT NFKB1 gcagcactacttcttgaccacc 75 tctgctcctgagcattgacgtc 76 NRAS gaaacctcagccaagacca 77 ggcaatcccatacaaccctgag 78 gac B4GALTN1 tgaggctgctttcactatccgc 79 gaggaaggtcttggtggcaatc 80 SMARCA4 caaagacaagcacatcctcg 81 gccacatagtgcgtgttgagca 82 cc MALAT1 gaagaaggaaggagcgcta 126 cctgctaccttcatcaccaa 127 a Estrutura de grampo de RNA: GGCGUCCCUCCCGAAGCUGCGCGCUCGGUCGAACAGGACGACC (SEQ ID NO: 83) Sequência de reconhecimento de nucleolina: UCCCGA (SEQ ID NO: 84). Estrutura de grampo de RNA: GGCCGAAAUCCCGAAUGAGGCC (SEQ ID NO: 85) e GGAUGCCUCCCGAGUGCAUCC (SEQ ID NO: 86).
Nome: Descrição: Sequência de polipeptídeos CIRTS-0 ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN domínio Pin HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR morto GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR
IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSG GSMELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIV INELDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFE SRDSCLRALTSRGNELESIAFRSEDITGQLGNNADLILSCC LHYCKDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALT
RNVPVRDIPAFLTWAQVGGSDYKDHDGDYKDHDIDYKDD DDK (SEQ ID NO: 87) CIRTS-1 ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS
TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN Domínio Pin- HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR
NLS GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGGSGGSGGSGGSGGSGGSMELEIRPLFLV PDTNGFIDHLASLARLLESRKYILVVPLIVINELDGLAKGQE TDHRAGGYARVVQEKARKSIEFLEQRFESRDSCLRALTSR GNELESIAFRSEDITGQLGNNDDLILSCCLHYCKDKAKDFM
PASKEEPIRLLREVVLLTDDRNLRVKALTRNVPVRDIPAFLT WAQVGKRPAATKKAGQAKKKKGSDYKDDDDK (SEQ ID NO: 88) CIRTS-2 ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN NYTHDF1 HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR
GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSG GSMSATSVDTQRTKGQDNKVQNGSLHQKDTVHDNDFEP YLTGQSNQSNSYPSMSDPYLSSYYPPSIGFPYSLNEAPW STAGDPPIPYLTTYGQLSNGDHHFMHDAVFGQPGGLGNN IYQHRFNFFPENPAFSAWGTSGSQGQQTQSSAYGSSYTY PPSSLGGTVVDGQPGFHSDTLSKAPGMNSLEQGMVGLKI GDVSSSAVKTVGSVVSSVALTGVLSGNGGTNVNMPVSKP TSWAAIASKPAKPQPKMKTKSGPVMGGGLPPPPIKHNMDI GTWDNKGPVPKAPVPQQAPSPQAAPQPQQVAQPLPAQP PALAQPQYQSPQQPPQTRWVAPRNRNAAFGQSGGAGS DSNSPGNVQPNSAPSVESGSDYKDDDDK (SEQ ID NO:
89) CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 3t TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN YTHDF2 HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR (100-200) GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR
IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSG GSDAMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNN
SSQGQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETL NKAPGMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 90) CIRTS-3 ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN YTHDF2 (1- HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR 200) GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR
IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSG GSMSASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEP YLSPQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWS TGGDTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTP FLGQHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNY
AYAPSSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAAG SDYKDDDDK (SEQ ID NO: 91) CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 4t SLBP-GGS6- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY YTHDF2 HINILETSDDEEGGSGGSGGSGGSGGSGGSADFETDESV (100-200) LMRRQKQINYGKNTIAYDRYIKEVPRHLRQPGIHPKTPNKF
KKYSRRSWDQQIKLWKVALHFWDLQLPPLERLTLGGSGG SGGSGGSGGSGGSDAMFGQPGALGSTPFLGQHGFNFFP SGIDFSAWGNNSSQGQSTQSSGYSSNYAYAPSSLGGAMI
DGQSAFANETLNKAPGMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 92) CIRTS-4 ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS SLBP-GGS6- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY YTHDF2 (1- HINILETSDDEEGGSGGSGGSGGSGGSGGSADFETDESV 200) LMRRQKQINYGKNTIAYDRYIKEVPRHLRQPGIHPKTPNKF
KKYSRRSWDQQIKLWKVALHFWDLQLPPLERLTLGGSGG SGGSGGSGGSGGSMSASSLLEQRPKGQGNKVQNGSVH QKDGLNDDDFEPYLSPQARPNNAYTAMSDSYLPSYYSPSI GFSYSLGEAAWSTGGDTAMPYLTSYGQLSNGEPHFLPDA MFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQG
QSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAP GMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 93) CIRTS- HBEGF- MRVTLSSKPQALATPNKEEHGKRKKKGKGLGKKRDPCLR 5t TBP6.7- KYKDFCIHGECKYVKELRAPSCICHPGYHGERCHGLSGG GGS6- SGGSGGSGGSGGSGGSMAVPETRPNHTIYINNLNSKIKK YTHDF2 DELKKSLYAIFSQFGQILDILVPRQRTPRGQAFVIFKEVSSA (100-200) TNALRSMQGFPFYDKPMRIQYAKTDKRIPAKMKGTFVGSL
QLPPLERLTLGGSGGSGGSGGSGGSGGSDAMFGQPGAL GSTPFLGQHGFNFFPSGIDFSAWGNNSSQGQSTQSSGY
SSNYAYAPSSLGGAMIDGQSAFANETLNKAPGMNTIDQG MAAGSDYKDDDDK (SEQ ID NO: 94) CIRTS-5 HBEGF- MRVTLSSKPQALATPNKEEHGKRKKKGKGLGKKRDPCLR TBP6.7- KYKDFCIHGECKYVKELRAPSCICHPGYHGERCHGLSGG GGS6- SGGSGGSGGSGGSGGSMAVPETRPNHTIYINNLNSKIKK
YTHDF2 (1- DELKKSLYAIFSQFGQILDILVPRQRTPRGQAFVIFKEVSSA 200) TNALRSMQGFPFYDKPMRIQYAKTDKRIPAKMKGTFVGSL
QLPPLERLTLGGSGGSGGSGGSGGSGGSMSASSLLEQR PKGQGNKVQNGSVHQKDGLNDDDFEPYLSPQARPNNAY TAMSDSYLPSYYSPSIGFSYSLGEAAWSTGGDTAMPYLTS YGQLSNGEPHFLPDAMFGQPGALGSTPFLGQHGFNFFPS
GIDFSAWGNNSSQGQSTQSSGYSSNYAYAPSSLGGAMID GQSAFANETLNKAPGMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 95) CIRTS- β-defensina- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK 6t TBP6.7- CCRRKKGGSGGSGGSGGSGGSGGSMAVPETRPNHTIYI GGS6- NNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPRGQAF YTHDF2 VIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKRIPAK (100-200) MKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSGGSD
AMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ
GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKA PGMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 96) CIRTS-6 β-defensina- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK TBP6.7- CCRRKKGGSGGSGGSGGSGGSGGSMAVPETRPNHTIYI GGS6- NNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPRGQAF YTHDF2 (1- VIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKRIPAK 200) MKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSGGSM
SASSLLEQRPKGQGNKVQNGSVHQKDGLNDDDFEPYLS PQARPNNAYTAMSDSYLPSYYSPSIGFSYSLGEAAWSTG GDTAMPYLTSYGQLSNGEPHFLPDAMFGQPGALGSTPFL GQHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSNYAY APSSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAAGSD
YKDDDDK (SEQ ID NO: 97) CIRTS-7 β-defensina- MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK SLBP-GGS6- CCRRKKGGSGGSGGSGGSGGSGGSADFETDESVLMRR YTHDF2 (1- QKQINYGKNTIAYDRYIKEVPRHLRQPGIHPKTPNKFKKYS 200) RRSWDQQIKLWKVALHFWDLQLPPLERLTLGGSGGSGG
SGGSGGSGGSMSASSLLEQRPKGQGNKVQNGSVHQKD GLNDDDFEPYLSPQARPNNAYTAMSDSYLPSYYSPSIGFS YSLGEAAWSTGGDTAMPYLTSYGQLSNGEPHFLPDAMF GQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQGQS
TQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAPGM NTIDQGMAAGSDYKDDDDK (SEQ ID NO: 98) CIRTS-8 TBP6.7- MAVPETRPNHTIYINNLNSKIKKDELKKSLYAIFSQFGQILDI GGS6- LVPRQRTPRGQAFVIFKEVSSATNALRSMQGFPFYDKPM Domínio Pin- RIQYAKTDKRIPAKMKGTFVGSLQLPPLERLTLGGSGGSG
NES GSGGSGGSGGSMELEIRPLFLVPDTNGFIDHLASLARLLE SRKYILVVPLIVINELDGLAKGQETDHRAGGYARVVQEKAR KSIEFLEQRFESRDSCLRALTSRGNELESIAFRSEDITGQL GNNDDLILSCCLHYCKDKAKDFMPASKEEPIRLLREVVLLT
DDRNLRVKALTRNVPVRDIPAFLTWAQVGGSDYKDDDDK (SEQ ID NO: 99) CIRTS-9 ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN Domínio Pin- HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR
NES GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSG GSMELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIV INELDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFE SRDSCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCC
LHYCKDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALT RNVPVRDIPAFLTWAQVGGSDYKDDDDK (SEQ ID NO: 100) CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 10 TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS3- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN Domínio Pin HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR
GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSMELEIRPL FLVPDTNGFIDHLASLARLLESRKYILVVPLIVINELDGLAKG QETDHRAGGYARVVQEKARKSIEFLEQRFESRDSCLRALT SRGNELESIAFRSEDITGQLGNNDDLILSCCLHYCKDKAKD
FMPASKEEPIRLLREVVLLTDDRNLRVKALTRNVPVRDIPA FLTWAQVGGSDYKDDDDK (SEQ ID NO: 101) CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 11 TBP6.7-L8- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY Domínio Pin HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN
HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLSGSETPGTSESATPESM ELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIVINEL DGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFESRD SCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCCLHY
CKDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALTRN VPVRDIPAFLTWAQVGGSDYKDDDDK (SEQ ID NO: 102)
CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 12 TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY helicoidal- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN Domínio Pin- HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR
NES GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLGGSGEEEEKKKQQEEEA ERLRRIQEEMEKERKRREEDEQRRRKEEEERRMKLEMEA KRKQEEEERKKREDDEKRKKKGSGGSMELEIRPLFLVPD TNGFIDHLASLARLLESRKYILVVPLIVINELDGLAKGQETD HRAGGYARVVQEKARKSIEFLEQRFESRDSCLRALTSRG NELESIAFRSEDITGQLGNNDDLILSCCLHYCKDKAKDFMP
ASKEEPIRLLREVVLLTDDRNLRVKALTRNVPVRDIPAFLT WAQVGGSDYKDDDDK (SEQ ID NO: 103) CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 13 TBP6.7-L8- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY Y2 (100-200) HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN
HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLSGSETPGTSESATPESD AMFGQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQ
GQSTQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKA PGMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 104) CIRTS- ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 14 TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY helicoidal-Y2 HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN (100-200) HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR
GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR IPAKMKGTFVGSLQLPPLERLTLGGSGEEEEKKKQQEEEA ERLRRIQEEMEKERKRREEDEQRRRKEEEERRMKLEMEA KRKQEEEERKKREDDEKRKKKGSGGSDAMFGQPGALGS TPFLGQHGFNFFPSGIDFSAWGNNSSQGQSTQSSGYSSN
YAYAPSSLGGAMIDGQSAFANETLNKAPGMNTIDQGMAA GSDYKDDDDK (SEQ ID NO: 105) MBP- MBP-ORF5- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS CIRTS-1 TBP6.7- STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY GGS6- HINILETSDDEEGGSGGSGGSGGSGGSGGSMAVPETRPN domínio Pin HTIYINNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPR morto GQAFVIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKR
IPAKMKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSG GSMELEIRPLFLVPDTNGFIDHLASLARLLESRKYILVVPLIV INELDGLAKGQETDHRAGGYARVVQEKARKSIEFLEQRFE SRDSCLRALTSRGNELESIAFRSEDITGQLGNNDDLILSCC
LHYCKDKAKDFMPASKEEPIRLLREVVLLTDDRNLRVKALT RNVPVRDIPAFLTWAQVGSSGHHHHHH (SEQ ID NO: 106) CIRTS- β-defensina MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK 7X 3-TBP6.7- CCRRKKGGSGGSGGSGGSGGSGGSMAVPETRPNHTIYI GGS6- NNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPRGQAF hADAR(299- VIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKRIPAK 701) MKGTFVGGSGGSGGSGGSGGSGGSLHLDQTPSRQPIPS
EGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVL AGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALND CHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGG FRLKENVQFHLYISTSPCGDARIFSPHEPILEEPADRHPNR KARGQLRTKIESGEGTIPVRSNASIQTWDGVLQGERLLTM SCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHL SRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPN FSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRW MRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLF
TAFIKAGLGAWVEKPTEQDQFSLTPKRPAATKKAGQAKKK KGSDYKDDDDK (SEQ ID NO: 128) CIRTS- β-defensina MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK 8X 3-TBP6.7- CCRRKKGGSGGSGGSGGSGGSGGSMAVPETRPNHTIYI GGS6- NNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPRGQAF hADAR VIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKRIPAK (299-701) MKGTFVGGSGGSGGSGGSGGSGGSLHLDQTPSRQPIPS E488Q EGLQLHLPQVLADAVSRLVLGKFGDLTDNFSSPHARRKVL
AGVVMTTGTDVKDAKVISVSTGTKCINGEYMSDRGLALND CHAEIISRRSLLRFLYTQLELYLNNKDDQKRSIFQKSERGG FRLKENVQFHLYISTSPCGDARIFSPHEPILEEPADRHPNR KARGQLRTKIESGQGTIPVRSNASIQTWDGVLQGERLLTM SCSDKIARWNVVGIQGSLLSIFVEPIYFSSIILGSLYHGDHL SRAMYQRISNIEDLPPLYTLNKPLLSGISNAEARQPGKAPN FSVNWTVGDSAIEVINATTGKDELGRASRLCKHALYCRW MRVHGKVPSHLLRSKITKPNVYHESKLAAKEYQAAKARLF
TAFIKAGLGAWVEKPTEQDQFSLTPKRPAATKKAGQAKKK KGSDYKDDDDK (SEQ ID NO: 129) CIRTS- β-defensina MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK 9X 3-SLBP- CCRRKKGGSGGSGGSGGSGGSGGSMAVPETRPNHTIYI GGS6- NNLNSKIKKDELKKSLYAIFSQFGQILDILVPRQRTPRGQAF NYTHDF1 VIFKEVSSATNALRSMQGFPFYDKPMRIQYAKTDKRIPAK
MKGTFVGSLQLPPLERLTLGGSGGSGGSGGSGGSGGSM SATSVDTQRTKGQDNKVQNGSLHQKDTVHDNDFEPYLTG QSNQSNSYPSMSDPYLSSYYPPSIGFPYSLNEAPWSTAG DPPIPYLTTYGQLSNGDHHFMHDAVFGQPGGLGNNIYQH RFNFFPENPAFSAWGTSGSQGQQTQSSAYGSSYTYPPS SLGGTVVDGQPGFHSDTLSKAPGMNSLEQGMVGLKIGDV SSSAVKTVGSVVSSVALTGVLSGNGGTNVNMPVSKPTSW AAIASKPAKPQPKMKTKSGPVMGGGLPPPPIKHNMDIGT WDNKGPVPKAPVPQQAPSPQAAPQPQQVAQPLPAQPPA
LAQPQYQSPQQPPQTRWVAPRNRNAAFGQSGGAGSDS NSPGNVQPNSAPSVESGSDYKDDDDK (SEQ ID NO: 130) CIRTS- β-defensina MGIINTLQKYYCRVRGGRCAVLSCLPKEEQIGKCSTRGRK 10X 3-SLBP- CCRRKKGGSGGSGGSGGSGGSGGSADFETDESVLMRR GGS6- QKQINYGKNTIAYDRYIKEVPRHLRQPGIHPKTPNKFKKYS YTHDF2 (1- RRSWDQQIKLWKVALHFWDLQLPPLERLTLGGSGGSGG 200) SGGSGGSGGSMSASSLLEQRPKGQGNKVQNGSVHQKD
GLNDDDFEPYLSPQARPNNAYTAMSDSYLPSYYSPSIGFS YSLGEAAWSTGGDTAMPYLTSYGQLSNGEPHFLPDAMF GQPGALGSTPFLGQHGFNFFPSGIDFSAWGNNSSQGQS
TQSSGYSSNYAYAPSSLGGAMIDGQSAFANETLNKAPGM NTIDQGMAAGSDYKDDDDK (SEQ ID NO: 131) CIRTS- ORF5-PP7- MDDPSFLTGRSTYAKRRRARRMNVCKCGAILHNNKDCRS 18X Y2 (100-200) STISGHKLDRLRFVKEGRVALEGETPVYRTWVKWVETEY
HINILETSDDEEGGSGGSGGSGGSGGSGGSMAKTIVLAV GEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGA KTAYRVNLKLDQADVVDASTSVAGELPKVRYTQVWSHDV TIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGRSL EGGSGGMAKTIVLAVGEATRTLTEIQSTADRQIFEEKVGPL VGRLRLTASLRQNGAKTAYRVNLKLDQADVVDASTSVAG ELPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATS QVEDLVVNLVPLGRSLELQLPPLERLTLGGSGGSGGSGG SGGSGGSDAMFGQPGALGSTPFLGQHGFNFFPSGIDFSA
WGNNSSQGQSTQSSGYSSNYAYAPSSLGGAMIDGQSAF ANETLNKAPGMNTIDQGMAAGSDYKDDDDK (SEQ ID NO: 132) VII. EXEMPLOS
[0189]Os exemplos seguintes são incluídos para demonstrar as modalidades preferidas da revelação. Deve ser avaliado pelos técnicos no assunto que as técnicas reveladas nos exemplos que seguem representam as técnicas descobertas pelos inventores para funcionar bem na prática da revelação e assim podem ser consideradas como constituindo os modos preferidos para sua prática. Entretanto, os técnicos no assunto devem, à luz da presente revelação, avaliar que muitas mudanças podem ser feitas nas modalidades específicas que são reveladas e ainda obter um resultado semelhante ou similar sem divergir do espírito e escopo da revelação. Exemplo 1 - Proteínas efetoras de RNA guiadas por RNA programável construídas a partir de partes humanas A. Introdução
[0190]Para superar o tamanho grande e a natureza microbianamente derivada de sistemas de alvejamento de RNA atuais, os inventores apresentam um sistema de alvejamento de RNA inspirado em CRISPR/Cas (CIRTS), um método geral para a engenharia de proteínas efetoras de RNA programável. Os inventores mostram que CIRTS permite extrair o proteoma humano para partes funcionais para construir proteínas reguladoras de RNA programável. CIRTS é um complexo de ribonucleoproteína que usa interações de pares de base de Watson-Crick-Franklin para liberar a carga de proteína seletivamente no sítio do transcriptoma. Os inventores mostram que podem facilmente engendrar CIRTS que liberam uma faixa ou proteínas reguladoras aos transcritos, incluindo nucleases para degradação, maquinaria reguladora de desadenilação para degradação ou maquinaria de ativação traducional para a produção realçada de proteína. Entretanto, CIRTS são até 5 vezes menores do que os menores sistemas de CRISPR/Cas atuais e podem ser engendrados inteiramente a partir de partes humanas.
[0191]Os inventores raciocinaram que um sistema de alvejamento de RNA programável mínimo precisará dos seguintes componentes: (1) uma proteína de grampo de ligação a RNA que serve como o núcleo do sistema e é um aglutinante seletivo, de alta afinidade para uma estrutura de RNA específica exibida em um gRNA engendrado, (2) um gRNA que caracteriza tanto a estrutura que interage com a proteína de ligação a grampo engendrada quanto uma sequência com complementaridade ao RNA alvo de interesse e (3) uma proteína efetora, tal como uma nuclease ou regulador epitranscriptômico, que atua no RNA alvejado em uma maneira dependente de proximidade. Em algumas modalidades, uma proteína carregada que se liga à sequência de gRNA exibida não é especificamente usada para estabilizar e proteger o RNA guia antes do acoplamento ao alvo. (FIG. 1A). CIRTS combina múltiplos domínios de proteína que realizam estes funções em um sistema engendrado.
[0192]Aqui, os inventores apresentam o projeto e a validação de CIRTS. Primeiro, os inventores engendraram uma ribonuclease de CIRTS programável, que eles usaram tanto para otimização quanto validação de ensaio repórter in vitro e de célula mamífera. Os inventores então demonstram a versatilidade de CIRTS mostrando-se que todas as quatro das partes constituintes, incluindo o gRNA, a proteína de ligação a grampo, a proteína de ligação a ssRNA e o domínio efetor de CIRTS-1 podem ser substituídas no lugar de outras partes e desenvolveram cinco
CIRTS adicionais (FIG. 1B). Os inventores são capazes de alvejar as vias reguladoras epitranscriptômicas endógenas, incluindo mecanismo de degradação e ativação traducional, usando CIRTS engendrado como proteínas leitoras programáveis m6A. Adicionalmente, os inventores mostram que eles podem alvejar transcritos endógenos para decomposição mediada por nuclease dependente de proximidade, decomposição não mediada por nuclease ou ativação da tradução, usando CIRTS. Finalmente, os inventores mostram que podem alvejar genes múltiplos simultaneamente usando CIRTS ortogonal. Tomado junto, este trabalho valida a estratégia de CIRTS como uma nova abordagem viável para engendrar proteínas efetoras de RNA que são pequenas e montadas a partir de partes humanas. B. Resultados
1. Desenvolvimento e validação in vitro de CIRTS-1
[0193]Para o sistema de primeira geração do inventor, CIRTS-1, os inventores usaram uma versão evoluída da proteína de ligação a grampo humano U1A (TBP6.7), que foi previamente engendrada para se ligar ao grampo HIV TAR e não tem nenhum alvo de grampo de RNA humano endógeno (Blakeley e McNaughton, 2014; Crawford et al., 2016) (FIG. 1B). Os inventores projetaram um gRNA que inclui a estrutura de grampo TAR, uma sequência de ligante de nucleotídeo (L) e então uma sequência guia (FIG. 1C). Para desenvolver e validar o sistema, os inventores primeiro engendraram uma nuclease programável fundindo-se TBP6.7 ao domínio de nuclease Pin de SMG6 humano, que foi previamente usado como uma RNA endonuclease dependente de proximidade não específica (Batra et al., 2017; Choudhury et al., 2012). Embora este projeto mais simples já exibisse degradação de transcrito mediada por gRNA em ensaios com base em célula (FIG. 9B, esquerda), o desempenho foi bastante deficiente, de modo que os inventores atribuíssem à degradação potencial da sequência de alvejamento exibida. A superfície da proteína e o canal de grampo de sistemas Cas13 tendem a ser altamente carregados,
provavelmente para não ligar e estabilizar especificamente a sequência de RNA guia (Liu et al., 2017). Para engendrar esta função de proteção de RNA no sistema do inventor, os inventores visaram adicionar em uma proteína de ligação a RNA com afinidade baixa, não específica por RNAs de fita simples. Entretanto, a caixa de ferramenta de proteína humana não continha prontamente uma proteína de ligação a RNA de fita simples não específica, pequena anotada. Portanto, os inventores desenvolveram CIRTS-1 usando uma pequena proteína de ligação a ssRNA viral, ORF5 (Zhou et al., 2006). Ao todo, CIRTS-1 é composto de um complexo de fusão de proteína de domínio de nuclease de ORF5-TBP6.7 Pin junto com um gRNA correspondente (FIG. 1A).
[0194]Os inventores primeiro caracterizaram a ligação a RNA programável e atividade de RNA nuclease de CIRTS-1 in vitro em substratos de RNA alvo de modelo. Usando proteína e gRNA de MBP-CIRTS-1 purificados em ensaios de troca de mobilidade eletroforética (EMSA) conduzidos na presença de EDTA para inativar a nuclease, os inventores descobriram que MBP-CIRTS-1 se liga a um RNA alvo em uma maneira dependente de gRNA com uma KD evidente de 105 nM (FIG. 2A e 2B). Se o gRNA (FIG. 7A) ou a proteína de CIRTS-1 (FIG. 7B) são omitidos do ensaio, nenhuma ligação mensurável é detectada, confirmando o modo de ligação dependente de gRNA como designado no sistema. Além disso, em um ensaio de clivagem, os inventores descobriram que CIRTS-1 degrada um substrato de RNA em uma maneira dependente de gRNA e Mn2+ (FIG. 2C). Coletivamente, estes resultados in vitro validam os princípios do projeto por trás de CIRTS-1 e motivaram os inventores a tentar otimizar o sistema para o uso em células vivas.
2. Otimização de CIRTS-1 em células vivas
[0195]Para testar a atividade de nuclease alvo de CIRTS-1 em células mamíferas vivas, os inventores estabeleceram um ensaio repórter de luciferase dupla que relata mudanças transcricionais dependentes de gRNA em um RNA alvo (FIG.
3A). Usando este sistema, os inventores otimizaram a distribuição de CIRTS-1 avaliando-se diferentes tipos de ligante de proteína (FIG. 8A), estruturas de gRNA (FIG. 8C) e localização celular de CIRTS-1 (FIG. 9C). Depois da otimização, os inventores compararam a capacidade do sistema CIRTS-1 otimizado de degradar o RNA repórter alvo ao sistema Cas13 do estado-da-técnica atual. Os inventores projetaram gRNAs que alvejam mRNAs de luciferase do vaga-lume no ensaio repórter de luciferase dupla tanto para CIRTS-1 quanto para Cas13b, bem como gRNAs fora do alvo, de controle para cada nuclease programável. Para testar se apenas a ligação ao transcrito altera os níveis de transcrito, os inventores engendraram CIRTS-0, que contém uma mutação ‘morta’ previamente relatada no domínio de nuclease de CIRTS- 1 (Eberle et al., 2009), servindo como um controle negativo. Os inventores descobriram que CIRTS-0 não tem nenhum efeito significativo sobre o transcrito alvo (FIG. 3B e FIG. 9A), indicando que o complexo de RNA alvo de ribonucleoproteína CIRTS é minimamente perturbador para o RNA de interesse. Em seguida, os inventores testaram se CIRTS-1, com uma nuclease ativa, pode mediar a degradação do alvo. De fato, os inventores descobriram a degradação dependente de gRNA do gene alvo, medida tanto ao nível de proteína como monitorado pela atividade de luciferase (FIG. 3C) quanto aos níveis de mRNA como monitorado por RT-qPCR (FIG 9D). De forma encorajadora, os inventores descobriram que CIRTS-1 é apenas levemente menos eficiente em alvejar o gene repórter de luciferase como em comparação à degradação de nuclease alvejada por Cas13b, indicando que a estratégia de CIRTS é um método viável em células vivas. Encorajados pelo desempenho de CIRTS-1, os inventores em seguida, procuraram avaliar a versatilidade do projeto testando-se se os componentes variados do sistema podem ser trocados por outras partes e manter a função de CIRTS.
3. Modularidade de CIRTS
[0196]Para explorar a versatilidade do projeto de CIRTS, os inventores testaram em seguida diferentes domínios de proteína para cada componente do sistema de liberação de proteína CIRTS. Primeiro, os inventores avaliaram se CIRTS pode liberar proteínas “leitoras” reguladoras epitranscriptômicas de RNA, que eles previamente liberaram usando o sistema dCas13b (Rauch et al., 2018). Os inventores trocaram a proteína efetora Pin nuclease de CIRTS-1 pelo Domínio N-terminal de YTHDF1, uma proteína leitora de N6-metiladenosina citoplasmática (m6A) que recruta a máquina de tradução, para gerar CIRTS-2. Quando CIRTS-2 é liberado à mesma sequência alvo como os experimentos de CIRTS-1, os níveis de RNA são relativamente inalterados (FIG. 9E), mas um aumento significativo em níveis de proteína do RNA é gerado (FIG. 3D). Os inventores então trocaram o fragmento YTHDF1 por um fragmento de YTHDF2, uma proteína leitora m6A que recruta a máquina de desadenilação de RNA e induz a degradação de RNA, para gerar CIRTS-
3. A liberação de CIRTS-3 ao mRNA repórter induz a degradação do transcrito alvo como medido tanto por RNA (FIG. 9F) quanto por níveis de proteína (FIG. 3E). CIRTS- 1 a 3 demonstram a versatilidade da estratégia do projeto para liberar uma faixa de cargas de proteína efetora ao RNA alvo em células vivas.
[0197]Depois de demonstrar a modularidade do domínio efetor, os inventores se propuseram a avaliar se outras partes humanas também podem ser usadas para o domínio de ligação a grampo de RNA e proteína de ligação a ssRNA não específica. Os inventores substituíram TBP6.7 em CIRTS-3 com o domínio de ligação a grampo de RNA da proteína de ligação à haste-alça de histona humana (SLBP) para gerar CIRTS-4. Adicionalmente, os inventores projetaram um gRNA baseado na estrutura de haste-alça de mRNA de histona (FIG. 1D). A avaliação de CIRTS-4 no ensaio repórter (FIG. 3F) e por RT-qPCR para avaliar níveis de RNA (FIG. 9G) revelou desempenho similar como CIRTS-3. Finalmente, os inventores procuraram engendrar versões inteiramente humanizadas do sistema CIRTS. Como estabelecido mais no início, os inventores projetaram os primeiros sistemas de prova de conceito baseados na proteína de ligação a RNA de fita simples, não específica, viral, ORF5. Embora não exista nenhuma proteína de ligação a RNA não específico, de fita simples, humana anotada, os inventores raciocinaram que proteínas humanas catiônicas altamente carregadas podem cumprir o papel de ORF5 no sistema CIRTS (Cronican et al., 2011). Os inventores, portanto, engendraram HBEGF e β-defensina 3, duas proteínas humanas catiônicas, no lugar de ORF5 em CIRTS-3 para gerar CIRTS-5 e CIRTS-6, respectivamente. Novamente, a implantação destes efetores programáveis no ensaio repórter luciferase revelou a degradação dependente de gRNA do gene alvo (FIG. 3G). Os inventores também avaliaram mudanças de níveis de RNA por qPCR e descobriram uma diminuição tanto para CRITS-5 quanto para CIRTS-6 (FIG. 9H). Coletivamente, o desempenho de CIRTS-1 a CIRTS-6 no ensaio repórter demonstra a modularidade do projeto de CIRTS em todas as dimensões, incluindo o domínio de ligação a grampo e gRNA correspondente, a proteína de ligação a RNA de fita simples e a proteína efetora. Em seguida, os inventores procuraram testar se o CIRTS também pode ser usado para alvejar transcritos endógenos.
4. Alvejamento de mRNAs endógenos com CIRTS
[0198]Como uma primeira etapa para alvejar seletivamente transcritos endógenos, os inventores viramificaram que CIRTS-0 pode se ligar a um transcrito endógeno alvo por análise por imunoprecipitação de RNA seguido por RT-qPCR. Os inventores projetaram gRNAs para alvejar dois transcritos endógenos que foram previamente alvejados por sistemas Cas13, PPIB e SMARCA4 (Cox et al., 2017; Konermann et al., 2018). Os inventores separadamente liberaram cada gRNA junto com CIRTS-0 fundido a uma etiqueta FLAG 3x. Os inventores então isolaram o RNA total, imunoprecipitado com um anticorpo anti-Flag e quantificaram as quantidades relativas de cada RNA alvo ligado à proteína. De fato, ambos os transcritos endógenos foram enriquecidos entre 2,5 e 5 vezes em uma maneira dependente de gRNA (FIG. 10A), CIRTS de validação pode funcionar como uma proteína de ligação a RNA guiada por RNA programável em transcritos endógenos.
[0199]Os inventores em seguida, procuraram avaliar se o sistema CIRTS pode liberar uma proteína efetora a um transcrito endógeno alvo, usando os sistemas de decomposição de CIRTS-1 nuclease programável e mediada por YTHDF2 programável de CIRTS-3 como exemplares. Os inventores selecionaram cinco transcritos de RNA que foram previamente validados como alvos de Cas13, raciocinando que estes são acessíveis para o alvejamento de RNA por sistemas de ligação a RNA programáveis. Os inventores então projetaram gRNAs para cada alvo, usando os mesmos sítios de ligação nos alvos que foram previamente usados em experimentos de Cas13, postulando que estes sítios também seriam acessíveis ao alvejamento de CIRTS (Konermann et al., 2018). Os inventores avaliaram os efeitos do sistema de CIRT sobre níveis de RNA de cada alvo por RT-qPCR. Quando células foram transfectadas com CIRTS-1 ou CIRTS-3, junto com um vetor de expressão de gRNA específico, os inventores observaram uma diminuição significativa no nível de RNA por RT-qPCR para cada um dos cinco transcritos endógenos: PPIB, NFKB1, NRAS, B4GALTN1 e SMARCA4 (FIG. 4A e 4B). A eficiência de knockdown relativo variou para cada gene, o que também é observado em outros sistemas de alvejamento de RNA e é potencialmente mediado por acessibilidade ou outras vias reguladoras específicas para cada gene. No entanto, estes resultados confirmam que CIRTS podem alvejar transcritos endógenos e mediar a decomposição através da atividade de nuclease ativa no alvo ou desencadeando-se as vias reguladoras epitranscriptômicas endógenas.
[0200]Em seguida, os inventores procuraram avaliar se CIRTS-2 pode desencadear a produção de proteína de transcritos endógenos através de uma via epitranscriptômica mediada por YTHDF1. Os inventores selecionaram um transcrito abundante (CypB, o produto proteico de PPIB) com um anticorpo confiável, relatado para análise de produção de proteína por Western blotting. De fato, as células transfectadas com CIRTS-2 e um gRNA no alvo mostraram um aumento no nível de proteína (FIG. 4C) sem uma mudança em níveis de RNA (FIG. 10B), confirmando o efeito de YTHDF1 sobre o transcrito. Como um controle, o mesmo experimento realizado com CIRTS-3, que libera YTHDF2, resulta em níveis de proteína diminuídos, o que se correlaciona com a diminuição em níveis de mRNA (FIG. 3B). Tomados juntos, estes experimentos mostram que a plataforma de CIRTS é funcional em transcritos endógenos em uma maneira dependente de gRNA e pode degradar ativamente um transcrito alvo, desencadear o mecanismo de degradação para agir sobre o transcrito alvo ou à tradução ativa e produção de proteína aumentada do transcrito alvo. A versatilidade do CIRTS inspirou os inventores a implantá-los simultaneamente para alvejar mais do que um transcrito.
5. Alvejamento multiplexado de múltiplos RNAs endógenos com CIRTs
[0201]Finalmente, os inventores visaram avaliar se CIRTS engendrado com diferentes domínios de ligação a grampo podem funcionar ortogonalmente em células vivas para alvejar seletivamente diferentes transcritos. Em princípio, o CIRTS construído a partir do domínio de ligação a grampo de TBP e o CIRTS construído a partir do domínio de ligação a grampo SLBP, em que cada um usa gRNA separadamente engendrados (FIG. 1C e 1D), devem ser ortogonais entre si. Para estes testes de ortogonalidade de CIRTS de multi-alvejamento, os inventores implantaram dois CIRTS completamente humanizados cada um liberando YTHDF2, CIRTS-6 e CIRTS-7, em que cada um se liga a diferentes estruturas de grampo e deve ter interferência mínima entre si. Os inventores visaram usar CIRTS-6 para alvejar PPIB e CIRTS-7 para alvejar SMARCA4 (FIG. 5A). Os inventores co-transfectaram células com vetores de expressão para ambas as proteínas de CIRTS, junto com vetores de expressão para gRNAs para cada exibição de CIRTS uma sequência de gRNA não alvejado, de controle ou uma sequência de gRNA que alveja o respectivo gene endógeno. Os inventores então avaliaram mudanças em níveis de RNA relativos dos dois genes alvos por RT-qPCR. De fato, cada sistema CIRTS degradou o transcrito alvo em uma maneira dependente de gRNA no alvo, sem nenhuma interferência entre os dois sistemas (FIG. 5B). Criticamente, os inventores foram capazes de degradar seletivamente um transcrito ou o outro na presença de ambas as proteínas de CIRTS e também foram capazes de degradar simultaneamente ambos os transcritos.
[0202]A degradação de RNA de CIRTS-6 mostrou níveis comparáveis a quando apenas CIRTS-6 é liberado às células (FIG. 11A), o alvejamento com CIRTS- 7, entretanto, resultou em degradação de RNA levemente reduzida em comparação à transfecção individual (FIG. 11B). Para o experimento de alvejamento multiplexado, os inventores transfectaram células sequencialmente em dois dias consecutivos com um CIRTS e um vetor de gRNA em cada dia. Os inventores atribuem esta atividade diminuída à eficiência de transfecção diminuída no segundo dia de transfecção com CIRTS-7. Adicionalmente, enquanto CIRTS com base em TBP6.7 tenham grampos de RNA ortogonais à máquina de célula mamífera endógena, as construções com base em SLBP podem ainda teoricamente se ligar ao mRNA de histona celular, o que pode levar a uma diminuição na atividade total. Curiosamente, quando ambos CIRTS foram liberados com gRNA no alvo, eles tiveram seu melhor desempenho neste ensaio. Neste ponto, os inventores concluíram que cada um dos dois sistemas de CIRTS ortogonais pode ser ortogonal entre si e pode alvejar simultaneamente transcritos endógenos em uma maneira dependente de gRNA. Os inventores estão correntemente trabalhando em engendrar CIRTS ortogonais que não tenham mais parceiros de ligação endógenos e possam agir sem perturbar potencialmente os eventos celulares. C. Discussão
[0203]Em resumo, aqui os inventores apresentaram CIRTS, uma nova estratégia para a engenharia de proteínas efetoras de RNA programável. CIRTS são pequenos, podem ser completamente humanizados, podem alvejar RNAs endógenos em células vivas e podem trabalhar ortogonalmente e sinergicamente juntos para controle multidimensional. Como ferramentas de pesquisa, CIRTS devem fornecer vantagens aos métodos prévios por causa de seu menor tamanho. Por exemplo, CIRTS-2 e CIRTS-3 são de 65 e 36 kDa respectivamente, enquanto os sistemas YTHDF1 e YTHDF2 programáveis com base em Cas13b comparáveis são de 155 e 126 kDa, respectivamente (FIG. 6). CIRTS-1 é ainda menor do que a menor proteína Cas de alvejamento de DNA encontrada até agora, Cas14a (Harrington et al., 2018). O menor tamanho do sistema de liberação deve ser menos perturbador ao transcrito endógeno sob estudo apresentando oportunidades para revelar os papéis das proteínas reguladoras de RNA em células vivas.
[0204]A partir de uma perspectiva traducional, o CIRTS deve oferecer várias vantagens e oportunidades chaves. A natureza humanizada do CIRTS fornecerá um caminho para evitar respostas imunes, abrindo o potencial para terapias continuamente liberadas. Com respeito ao uso de proteínas acessórias tal como β- defensina 3 humana, esta proteína foi extensivamente estudada e as bases estruturais para sua função foram elucidadas (Dhople et al., 2006; Kluver et al., 2005). Este conhecimento permitirá que um técnico no assunto engendre um peptídeo de β- defensina 3 que mantém sua natureza carregada mas abole suas funções endógenas. Correntemente, o pequeno tamanho do CIRTS ainda levará em consideração múltiplas proteínas reguladoras a serem simultaneamente liberadas em um sistema de liberação viral, por exemplo para alvejar um transcrito para degradação e um outro para ativação traducional. A capacidade multiplexável do par de CIRTS com o pequeno tamanho e a diversidade de proteínas efetoras que podem ser liberadas abrem possibilidades para a reprogramação celular alvejando-se múltiplos genes de uma vez em múltiplas dimensões.
[0205]A partir de uma perspectiva mais ampla, a plataforma de CIRTS demonstra o potencial de combinar partes contidas dentro da caixa de ferramenta de proteína humana para engendrar proteínas com novas propriedades. O sistema CIRTS fornece uma nova abordagem para estudar e explorar a regulação do RNA e abrirá muitas oportunidades futuras para interferir na regulação celular para o tratamento de doenças. Exemplo 2 - Proteínas efetoras de RNA guiadas por RNA programável construídas a partir de partes humanas A. RESULTADOS
1. Projeto de CIRTS
[0206]Embora sistemas com base em Cas9 de alvejamento de DNA utilizem mecanismos biofísicos complexos para desenrolar DNA e hibridar a uma sequência alvo (Rutkauskas et al., 2015; Sternberg et al., 2014; Szczelkun et al., 2014), estudos mecanísticos de Cas13 mostraram que o alvejamento de RNA é iniciado por uma região de semente central no gRNA (Liu et al., 2017). Além disso, os sistemas Cas13 exibem variabilidade substancial na segmentação do contexto de sequência em transcrições individuais (Abudayyeh et al., 2017; Cox et al., 2017; Konermann et al., 2018). Juntas, essas descobertas sugerem que a complementaridade da sequência entre o gRNA e o transcrito alvejado, bem como a acessibilidade de um determinado local, são requisitos essenciais para o alvejamento do RNA. Os inventores procuraram projetar um sistema inspirado em Cas13 que usa uma interação de proteína-RNA definida para exibir uma sequência de gRNA para liberar cargas de proteína a um RNA alvo, semelhante a ensaios anteriores de tethering de RNA com construções repórteres superexpressas (Coller e Wickens, 2007). De fato, proteínas de ligação a grampo e fusões de RNA covalentes foram usadas para liberar o maquinário de edição de RNA aos transcritos (Montiel-Gonzalez et al., 2016; Sinnamon et al., 2017; Vogel et al., 2018).
[0207]Com base na caracterização atual de Cas13 (Abudayyeh et al., 2017;
Cox et al., 2017; Gootenberg et al., 2018; Konermann et al., 2018; Liu et al., 2017), os inventores raciocinaram que um sistema de alvejamento de RNA programável mínimo pode ter quatro componentes: (1) uma proteína de grampo de ligação a RNA que serve como o núcleo do sistema e é um aglutinante seletivo, de alta afinidade para uma estrutura de RNA específica exibida em um gRNA engendrado, (2) um gRNA que caracteriza tanto a estrutura que interage com a proteína de ligação a grampo engendrada quanto uma sequência com complementaridade ao RNA alvo de interesse, (3) uma proteína carregada que pode se ligar à sequência de gRNA exibida não especificamente a estabilizar e proteger o RNA guia antes do acoplamento ao alvo e (4) uma proteína efetora, tal como uma ribonuclease ou regulador epitranscriptômico, que atua no RNA alvejado em uma maneira dependente de proximidade (FIG. 12A). Embora Cas13 abrigue todos estes componentes funcionais em um único domínio de proteína (Liu et al., 2017; Tambe et al., 2018), os inventores previram engendrar um sistema que combina múltiplos domínios de proteína em que cada um realiza uma destas funções, que os inventores denominaram sistema de alvejamento de RNA inspirado em CRISPR/Cas (CIRTS). CIRTS variam em sua composição de módulo e são unicamente numerados como listado na FIG. 12A e FIG.
21.
2. Desenvolvimento e validação in vitro de CIRTS-1
[0208]Para o sistema de primeira geração, CIRTS-1, os inventores usaram uma versão evoluída da proteína de ligação a grampo humano U1A (TBP6.7), que foi previamente engendrada para se ligar ao grampo de resposta de trans-ativação de HIV (TAR) e não tem nenhum alvo de grampo de RNA humano endógeno (Blakeley e McNaughton, 2014; Crawford et al., 2016) (FIG. 12B). Os inventores projetaram um gRNA que inclui o grampo TAR, uma sequência de ligante de nucleotídeo (L) e depois uma sequência guia (FIG. 12C). Para desenvolver e validar o sistema, os inventores primeiro engendraram uma ribonuclease programável fundindo-se TBP6.7 ao domínio de nuclease Pin de fator de decomposição de mRNA mediado sem sentido humano SMG6, que foi previamente usado como uma RNA endonuclease dependente de proximidade não específica (Batra et al., 2017; Choudhury et al., 2012). Embora este projeto mais simples já exibisse degradação de transcrito mediada por gRNA promissora em ensaios de luciferase com base em célula (FIG. 22A, esquerda), o desempenho foi bastante deficiente, o que os inventores atribuíram à degradação da sequência guia exibida. A superfície da proteína e o canal de grampo dos sistemas Cas13 tendem a ser altamente carregados, provavelmente para não ligar e estabilizar especificamente a sequência de RNA guia (Liu et al., 2017). Para engendrar esta função de proteção de RNA no sistema, os inventores visaram adicionar uma proteína de ligação a RNA de fita simples de baixa afinidade não específica (proteína de ligação a ssRNA). Entretanto, o proteoma humano não continha prontamente uma proteína de ligação a RNA de fita simples não específica, pequena anotada ao melhor do conhecimento dos inventores. Portanto, os inventores desenvolveram CIRTS-1 usando uma pequena proteína de ligação a ssRNA viral, ORF5 (Zhou et al., 2006). Ao todo, CIRTS-1 é composto de um complexo de fusão de proteína de domínio de nuclease de ORF5-TBP6.7 Pin junto com um gRNA correspondente.
[0209]Os inventores primeiro caracterizaram a ligação a RNA programável e a atividade de RNA nuclease de CIRTS-1 in vitro em substratos de RNA alvo de modelo. O domínio de nuclease Pin foi previamente mostrado como sendo ativo na presença de Mn2+ e a atividade pode ser extinta pela adição de EDTA (Choudhury et al., 2012). A superexpressão direta de CIRTS-1 levou à proteína insolúvel no pelota celular, que os inventores resolveram fundindo uma etiqueta MBP N-terminal a CIRTS-1 (MBP-CIRTS-1). Usando proteína MBP-CIRTS-1 purificada e gRNA em ensaios de ligação de filtro, os inventores descobriram que MBP-CIRTS-1 se liga a um RNA alvo de uma maneira dependente de gRNA com uma constante de dissociação de ligação aparente (KD) de 22 nM (FIG. 13A). Criticamente, se os inventores fornecem ao sistema um gRNA não alvejado, os inventores veem uma ligação ~ 50 vezes mais fraca. Além disso, em um ensaio de clivagem, os inventores descobriram que MBP-CIRTS-1 degrada um substrato de RNA de uma maneira dependente de gRNA e Mn2 +, confirmando a atividade do domínio de ribonuclease Pin no contexto de fusão (FIG. 13B). Coletivamente, esses resultados in vitro validam os princípios de projeto por trás do CIRTS-1 e motivaram os inventores a otimizar o sistema para uso em células vivas.
3. Otimização de CIRTS-1 em células vivas
[0210]Para testar a atividade de nuclease alvo de CIRTS-1 em células de mamíferos vivas, os inventores estabeleceram um ensaio repórter de luciferase dupla que relata mudanças transcricionais dependentes de gRNA em um RNA de luciferase de vaga-lume (Fluc) alvo (FIG. 14A). Usando este sistema, os inventores otimizaram a implantação da CIRT da nuclease Pin testando diferentes tipos de ligante de proteína (FIG. 23A), estruturas e comprimentos de gRNA (FIG. 23C) e localização celular da nuclease CIRT (FIG. 22B). Os inventores descobriram que um ligante flexível longo entre a proteína de ligação em grampo e gRNA de 40 nucleotídeos de comprimento resultou na melhor eficiência de knockdown. Após a otimização, os inventores compararam a capacidade do sistema CIRTS-1 otimizado (nuclease de Pin) de degradar o RNA repórter alvo para o sistema Cas13b (Cox et al., 2017). Os inventores projetaram gRNAs que têm como alvo o mRNA da luciferase do pirilampo no ensaio repórter de luciferase dupla para ambos CIRTS-1 e Cas13b, bem como gRNAs de controle não alvejados (alvejados a uma sequência de fago lambda) para cada nuclease programável. Para testar se a ligação ao transcrito altera os níveis de proteína, os inventores projetaram CIRTS-0, que contém uma mutação "morta" relatada anteriormente no domínio da nuclease Pin de CIRTS-1 (Eberle et al., 2009), servindo como um controle negativo. Os inventores descobriram que CIRT-0 não tem efeito significativo no nível de expressão do transcrito alvo (FIG. 14B e FIG. 22C),
indicando que a ligação pela ribonucleoproteína CIRS a um RNA alvo é minimamente perturbadora para o transcrito alvo. Em seguida, os inventores testaram se CIRTS-1, contendo uma nuclease ativa, poderia mediar a degradação do alvo. De fato, os inventores encontraram degradação dependente de gRNA do mRNA Fluc alvo, medido tanto no nível de proteína monitorado pela atividade de luciferase (FIG. 14C) quanto nos níveis de mRNA monitorados por RT-qPCR (FIG. 22D). Ambos os resultados sugerem que a estratégia CIRTS é um método viável em células vivas. Embora o CIRTS-1 seja menos eficiente no alvejamento do gene repórter em comparação com o Cas13b, o desempenho não foi dramaticamente diferente, especialmente considerando que os sistemas Cas13b evoluíram para realizar esta função de knockdown. Incentivados pelo desempenho de CIRTS-1 (nuclease de Pin), os inventores procuraram avaliar a versatilidade do projeto testando se cada componente do sistema, incluindo o gRNA, domínio de ligação em grampo, domínio de ligação de RNA não específico e efetor proteína, poderia ser trocada por outras partes para atingir CIRTS com funções diversas.
4. Modularidade de CIRTS em Transcritos Repórteres
[0211]Para explorar a versatilidade do projeto CIRT, os inventores testaram em seguida diferentes domínios de proteína para cada componente do sistema de entrega de proteína CIRT. Em primeiro lugar, os inventores avaliaram se a CIRTS poderia liberar proteínas de “leitura” regulatórias epitranscriptômicas de RNA, que os inventores liberaram anteriormente usando o sistema dCas13b (Rauch et al., 2018). Para o estudo, os inventores escolheram se concentrar nas proteínas regulatórias de N6-metiladenosina, a modificação de mRNA mais prevalente. Em média, cada transcrito contém três locais de modificação com alta abundância de m6A detectada no 3'UTR, e m6A demonstrou ter papéis regulatórios no splicing (Xiao et al., 2016), tradução (Meyer et al., 2015; Wang et al., 2015) e estabilidade (Du et al., 2016; Wang et al., 2013). Os inventores trocaram a proteína efetora de nuclease Pin de CIRTS-1 pelo domínio N-terminal da proteína 1 da família de domínio de homologia YT521-B (YTHDF1), uma proteína leitora citoplasmático m6A que recruta a maquinaria de tradução (Wang et al., 2015), para gerar CIRTS-2. Observe que o projeto atual dos inventores não inclui o domínio YTH C-terminal de YTHDF1 que reconhece m6A para simplificar estudos de proteínas de leitura de uma maneira independente de m6A e para evitar complicações de níveis variáveis de m6A em mRNAs celulares ao validar CIRTS. Quando CIRTS-2 (YTHDF1) é liberado à mesma sequência alvo que os experimentos CIRTS-1, os níveis de RNA são relativamente inalterados. 22E), mas um aumento significativo nos níveis de proteína do RNA é gerado (FIG. 14D), como esperado com base no conhecido papel de ativação da tradução de YTHDF1 (Wang et al., 2015). Os inventores, então, trocaram o fragmento YTHDF1 por um fragmento de YTHDF2, uma proteína leitora m6A diferente que recruta a maquinaria de deadenilação de RNA e induz a degradação de RNA (Du et al., 2016; Wang et al., 2013), para gerar CIRTS-3. A entrega de CIRTS-3 (YTHDF2) ao mRNA repórter induz a degradação do transcrito alvo conforme medido tanto pelo RNA (FIG. 22F) quanto pelos níveis de proteína (FIG. 14E). CIRTS-1 a -3 demonstram a versatilidade da estratégia de projeto para liberar uma variedade de cargas de proteínas efetoras para o RNA alvo em células vivas.
[0212]Depois de demonstrar a modularidade do domínio efetor, os inventores se propuseram a avaliar se outras partes humanas também poderiam ser usadas para o domínio de ligação em grampo de RNA e proteína de ligação de ssRNA não específica. Os inventores substituíram TBP6.7 em CIRTS-3 (YTHDF2) com o domínio de ligação de grampo de RNA da proteína de ligação de haste de histona humana (SLBP) para gerar CIRTS-4 (YTHDF2). Ao mesmo tempo, os inventores projetaram um gRNA com base na estrutura de haste-alça do mRNA da histona (FIG. 12D). O ensaio de CIRTS-4 (YTHDF2) no ensaio repórter (FIG. 14F) e por RT-qPCR para avaliar os níveis de RNA (FIG. 22G) revelou um desempenho semelhante ao CIRTS-
3, confirmando que outros domínios de ligação em grampo podem ser usados como o núcleo de os CIRTS.
[0213]Em seguida, os inventores buscaram criar versões inteiramente humanizadas do sistema CIRTS. Como afirmado anteriormente, os inventores projetaram os sistemas de prova de conceito iniciais com base na proteína de ligação de RNA de fita simples não específica viral, ORF5. Embora não existam proteínas de ligação de RNA não específicas de cadeia única humana anotadas, os inventores raciocinaram que proteínas humanas catiônicas altamente carregadas poderiam cumprir o papel de ORF5 no sistema CIRTS (Cronican et al., 2011). Os inventores, portanto, projetaram HBEGF e β-defensina 3, duas proteínas humanas catiônicas, no lugar de ORF5 em CIRTS-3 para gerar CIRTS-5 e CIRTS-6, respectivamente. Novamente, a implantação desses efetores programáveis no ensaio repórter de luciferase revelou degradação dependente de gRNA do gene alvo (FIG. 14G e S2H) mediada pela regulação epitranscriptômica de YTHDF2.
[0214]Finalmente, os inventores usaram CIRT para liberar o domínio catalítico de ADAR2 humano (hADAR2) para transcritos de RNA para confirmar a versatilidade do CIRT no escopo de funções com uma proteína efetora adicional. Os inventores projetaram um repórter de luciferase dupla que contém uma mutação G-para-A na região de codificação da luciferase do pirilampo, resultando em uma parada prematura da tradução e nenhuma atividade mensurável da luciferase do pirilampo (FIG. 15A e 22J). Os inventores então implantaram CIRTS para liberar wt ADAR2 (CIRTS-7) ou hADAR 2 E488Q (CIRTS-8), um conhecido mutante hiperativo de hADAR2 (Kuttan e Bass, 2012), para a posição mutada, o que resultou em resgate dependente de gRNA da atividade da luciferase em ambos os casos (FIG. 15B). O mutante hADAR2 hiperativo mostrou maior eficiência de edição e um fundo mais alto na ausência de um gRNA no alvo com base no ensaio de luciferase. No entanto, usar o mutante hiperativo pode ser benéfico para permitir o alvejamento de um escopo de substrato mais amplo,
uma vez que relaxou as restrições de sequência (Kuttan e Bass, 2012). Coletivamente, o desempenho desses vários CIRTS nos ensaios repórter demonstra a modularidade do projeto CIRTS, incluindo o domínio de ligação em grampo e o gRNA correspondente, a proteína de ligação a RNA de fita simples e a proteína efetora.
5. Alvejamento de mRNAs endógenos com CIRTS
[0215]Os inventores procuraram a seguir avaliar se o sistema CIRTS poderia liberar uma proteína efetora a um transcrito endógeno alvo, usando a nuclease programável CIRTS-1 e sistemas de decomposição mediados por YTHDF2 programáveis CIRTS-3 como exemplos. Os inventores selecionaram cinco transcritos de RNA que foram previamente validados como alvos Cas13, argumentando que estes são acessíveis para o alvejamento de RNA por sistemas de ligação de RNA programáveis. Os inventores então projetaram gRNAs para cada alvo, usando os mesmos locais de ligação nos alvos que foram usados anteriormente em experimentos Cas13 (Abudayyeh et al., 2017; Konermann et al., 2018). Os inventores analisaram os efeitos do sistema CIRT nos níveis de RNA de cada alvo por RT-qPCR. Quando as células foram transfectadas com CIRTS-1 ou CIRTS-3, juntamente com um vetor de expressão de gRNA específico, os inventores observaram uma diminuição significativa no nível de RNA por RT-qPCR para cada um dos cinco transcritos de mRNA endógenos: PPIB, NFKB1, NRAS, B4GALNT1 e SMARCA4 (FIG. 16A e 16B). Além de alvejar o mRNA, os inventores também verificaram que os inventores podem alvejar outras espécies de RNA, como lncRNA, alvejando CIRTS-1 (nuclease de Pin) para MALAT1 (FIG. 24A). A eficiência relativa de knockdown variou para cada gene, o que também é observado em outros sistemas de alvejamento de RNA e é potencialmente mediado pela acessibilidade ou outras vias regulatórias específicas para cada gene. No entanto, esses resultados confirmam que a CIRT pode ter como alvo os transcritos endógenos e mediar a decadência por meio da atividade de nuclease ativa no alvo ou pelo desencadeamento de vias regulatórias epitranscriptômicas endógenas.
[0216]Em seguida, os inventores se propuseram a avaliar se CIRT-2 poderia desencadear a produção de proteína de um transcrito endógeno através de vias epitranscriptômicas mediadas por YTHDF1. Os inventores selecionaram um PPIB transcrito abundante com um anticorpo confiável relatado para análise da produção de proteína CypB (o produto de proteína de PPIB) por Western blotting. De fato, as células transfectadas com CIRTS-2 e um gRNA no alvo mostraram um aumento no nível de proteína (FIG. 16C e FIG. 24C) sem uma mudança nos níveis de RNA (FIG. 24B), consistente com os efeitos de YTHDF1 relatados anteriormente no transcrito (Wang et al., 2015). Como um controle, o mesmo experimento realizado com CIRTS- 3, que distribui YTHDF2, resulta em uma ligeira diminuição nos níveis de proteína, que se correlaciona com a diminuição nos níveis de mRNA (FIG. 16B e 24C).
[0217]Finalmente, como um primeiro teste de efeitos específicos da posição do transcrito, os inventores agruparam gRNAs ao longo do mRNA SMARCA4 e testaram a decomposição mediada por YTHDF2 por CIRTS-3. Os inventores encontraram um desempenho dramaticamente diferente do sistema dependendo de onde o gRNA pousa no mRNA alvo (FIG. 17), o que é provavelmente o resultado tanto da acessibilidade de ligação de CIRTS quanto dos requisitos de sequência de proteína regulatória. Tomados em conjunto, esses experimentos mostram que a plataforma CIRTS é funcional em transcritos endógenos de uma maneira dependente de gRNA e pode degradar ativamente um transcrito alvo, desencadear maquinaria de degradação para agir no transcrito alvo ou ativar a tradução e aumentar a produção de proteína do transcrito alvo.
6. Especificidade de Alvejamento de CIRTS
[0218]Para obter insights sobre como o CIRT é específico no alvejamento de substratos de RNA, os inventores projetaram uma série de experimentos que abordam a sensibilidade do gRNA a incompatibilidades, alvos em todo o transcriptoma e segmentação de substrato endógeno. Para avaliar a tolerância de incompatibilidade, os inventores projetaram um experimento de incompatibilidade à base de luciferase que permite aos inventores avaliar os efeitos de alvejamento ao introduzir uma, duas ou três incompatibilidades no duplex formado entre gRNA e RNA alvo. Os inventores escolheram fundir o transcrito KRAS4b relevante para a doença ao repórter de luciferase e perguntaram se o sistema engendrado pode diferenciar entre o G12D associado ao câncer (alvo 1), o tipo selvagem (alvo 2), o G12C (alvo 3), e um G12W (alvo 4) variantes KRAS4b (FIG. 25A). Os inventores descobriram que CIRTS produz knockdown comparável de G12D e variantes de tipo selvagem, indicando que uma incompatibilidade não causa grandes mudanças na especificidade de alvejamento (FIG. 25B). No entanto, quando os inventores alvejaram o sistema para os repórteres G12C e G12W, que contêm duas e três incompatibilidades, respectivamente, a eficiência de desativação do CIRT diminuiu.
[0219]The inventors next assessed whether increasing the gRNA length could affect the mismatch tolerance of CIRTS, focusing on incompatibilidades in the center region of the duplex formed between gRNA and target RNA as they mostraram the largest effect on knockdown efficiency in the assay. As observed with the shorter 20 nt gRNA, the inventors see no difference in knockdown efficiency when the inventors target a repórter with no or one incompatibilidades. However, a longer 40 nt gRNA pode resgatar some of the effects when the two-mismatch variant was targeted, indicando that the gRNA length contributes to the specificity of the system (FIG. 25D). As a comparison to existing technology, the inventors subjected Cas13b to the same mismatch assay, which mostraram that Cas13b is less sensitive to incompatibilidades in general. Targeting Cas13b to repórters with one and two incompatibilidades yielded little change in knockdown efficiency, while three incompatibilidades led to a substantial decrease in knockdown efficiency (FIG. 25C). Both Cas13b and CIRTS are most sensitive to mismatched base-pairing in the center of the duplex formed between gRNA and target RNA, a finding that agrees well with previous studies of Cas13b (Abudayyeh et al., 2017).
[0220]Para avaliar os fora dos alvos do transcriptoma, os inventores submeteram o sistema a sequenciamento de RNA. Os inventores testaram os efeitos da nuclease CIRTS Pin e CIRTS YTHDF2 alvejados ao transcrito endógeno SMARCA4 (FIG. 25E e 25F). Em ambos os casos, os inventores não encontraram fora dos alvos estatisticamente significativos. No entanto, embora os inventores vejam o knockdown do transcrito alvo e até mesmo o knockdown estatisticamente significativo por CIRTS-3 (YTHDF2) quando os inventores olham apenas para o transcrito alvo (pval <0,1), os níveis de knockdown não caem em uma região estatisticamente significativa quando avaliado em todo o transcriptoma (qval <0,1). Neste ponto, os inventores concluem que a superexpressão do sistema não introduz grandes perturbações ao transcriptoma e, em conjunto com os estudos de incompatibilidade dos inventores, indica que a especificidade de alvejamento e, portanto, a eficiência de knockdown podem ser otimizadas por otimização adicional em estudos futuros.
[0221]Para verificar se os CIRTS se ligam ao transcrito de interesse, os inventores realizaram, além disso, imunoprecipitação de RNA seguida por RT-qPCR. Os inventores projetaram gRNAs para alvejar dois transcritos endógenos que foram previamente alvejados por sistemas Cas13, PPIB e B4GALNT1 (Cox et al., 2017; Konermann et al., 2018). Os inventores liberaram separadamente cada gRNA junto com CIRTS-0 (nuclease morta CIRTS) fundido a uma etiqueta FLAG 3x. Os inventores então submeteram os lisados a imunoprecipitação com um anticorpo anti-Flag e quantificaram as quantidades relativas de cada RNA alvo ligado à proteína. Na verdade, ambos os transcritos endógenos foram enriquecidos entre 2,5 e 5 vezes de uma maneira dependente de gRNA (FIG. 25H), confirmando a função CIRT como uma proteína de ligação de RNA guiada por RNA programável em transcritos endógenos.
7. Alvejamento multiplexado de múltiplos RNAs endógenos com CIRTS
[0222]Juntas, a especificidade da segmentação e a modularidade da CIRTS inspiraram os inventores a estender a aplicação da CIRTS de forma multiplexada. Em vez de liberar uma única proteína efetora e alvejar um único transcrito de cada vez, os inventores se propuseram a testar se a CIRT pode alvejar mais de um transcrito ou liberar mais de uma proteína efetora na mesma amostra. Em princípio, CIRTS construído a partir do domínio de ligação em grampo de TBP e CIRTS construído a partir do domínio de ligação em grampo de SLBP, que usam gRNAs projetados separadamente (FIG. 12C e 12D), devem ser ortogonais entre si, permitindo o alvejamento seletivo de vários transcritos o mesmo ou até mesmo diferentes CIRTS.
[0223]Em primeiro lugar, os inventores testaram se um único CIRTS pode ser usado para alvejar simultaneamente várias transcrições. Os inventores co- transfectaram células com CIRTS-6 juntamente com três gRNAs alvejados a PPIB, SMARCA4 e NRAS e avaliaram as alterações no nível de RNA por RT-qPCR. Como esperado, os inventores observaram uma diminuição nos níveis de RNA para todos os três transcritos alvejados (FIG. 18A e 18B). No entanto, os inventores observaram uma ligeira diminuição na eficiência quando os inventores implantam vários gRNAs ou CIRTS nas mesmas células. Os inventores atribuem esta diminuição à transfecção simultânea de células com quatro plasmídeos. Otimização adicional dos níveis de proteína e gRNA e vetores são provavelmente necessários para recuperar o desempenho dos experimentos de CIRTS/gRNA individuais.
[0224]Para testar se dois tipos diferentes de efetores podem ser usados simultaneamente, os inventores em seguida implantaram ambos CIRTS-9, uma versão totalmente humanizada do construto YTHDF1, para alvejar a luciferase do pirilampo e CIRTS-10 (YTHDF2) para alvejar SMARCA4 (FIG. 18C e 18D). Os inventores descobriram que ambas as proteínas são ativas e induzem o aumento previsto na proteína luciferase e diminuição nos níveis de RNA, respectivamente. Além disso, para corroborar ainda mais a ortogonalidade de CIRTS de alvejamento múltiplo, os inventores implantaram dois CIRTS, CIRTS-6 (TBP6.7) e CIRTS-10 (SLBP) (FIG. 26A e 26B), mas usam diferentes módulos de ligação em grampo, para liberar YTHDF2 a dois diferentes mRNAs alvo endógenos (FIG. 27A). Cada sistema CIRT degradou o transcrito alvo de uma maneira dependente de gRNA no alvo, com interferência mínima entre os dois sistemas (FIG. 27B).
[0225]Neste ponto, os inventores concluem que o TBP6.7 e o CIRT baseado em SLBP podem, cada um, visar simultaneamente transcritos endógenos de uma maneira dependente de gRNA. Os inventores estão atualmente trabalhando na engenharia de CIRTs ortogonais que não têm parceiros de ligação endógenos por meio da evolução de proteínas humanas em direção a novas especificidades, como foi feito com TBP6.7. Embora não seja de origem humana, os inventores descobriram que outros sistemas de ligação em grampo, como PP7, também podem ser usados para gerar CIRT, sugerindo que é possível gerar uma variedade de sistemas seletivos e ortogonais (FIG. 22I). O CIRTS permite que várias proteínas regulatórias sejam liberados simultaneamente, por exemplo, para alvejar um transcrito para degradação e outro para ativação traducional, abrindo possibilidades para a reprogramação celular ao alvejar vários genes ao mesmo tempo em múltiplas dimensões (Bao et al., 2017; Gao et al., 2016).
8. Liberação Viral de CIRTS por AAV
[0226]Além da natureza de origem humana de CIRTS, outra vantagem principal é o tamanho pequeno de CIRTS, que deve permitir um empacotamento e distribuição viral mais eficientes. O vírus associado a adenovírus (AAV) é um veículo de entrega versátil para liberar transgenes e terapias gênicas para diferentes tipos de células devido à ampla gama de sorotipos disponíveis (Gao et al., 2005), estimulação de baixa resposta imunológica (Vasileva e Jessberger, 2005), e baixo risco de inserção do genoma (Gao et al., 2005; Naso et al., 2017). No entanto, tem sido um desafio empacotar e liberar muitas proteínas Cas13 devido a uma capacidade de empacotamento limitada de cerca de 4,7 kb (Wu et al., 2010). Para mostrar a possibilidade de CIRTS serem liberados pelo AAV, os inventores projetaram um plasmídeo de transferência duplo CIRTS-6/gRNA e o embalaram no veículo de entrega AAV. A inserção total, incluindo a proteína CIRTS e gRNA, é de apenas 2,7 kb (FIG. 19A). Os inventores descobriram que a transdução de células HEK293T com o vírus gerado recapitula a eficiência de knockdown de CIRT-6 tanto no repórter de luciferase quanto em um alvo endógeno (FIG. 19B e 19C), confirmando que os CIRTS liberados por vírus ainda são funcionais e proporcionando caminho para implantação clínica. Em aplicações futuras, pode-se imaginar empacotar mais de um sistema CIRT no veículo de entrega AAV para alvejar simultaneamente um transcrito para regulação positiva e um transcrito para degradação, como mostrado anteriormente por transfecção transitória. B. DISCUSSÃO
[0227]Em resumo, aqui os inventores apresentaram a CIRTS, uma estratégia versátil para a engenharia de proteínas efetoras de RNA programáveis. Os CIRTS são pequenos, podem ser totalmente humanizados, podem ter como alvo RNAs endógenos em células vivas e podem funcionar para o controle do transcriptoma multidimensional. Como ferramentas de pesquisa, os CIRTS devem oferecer vantagens aos métodos anteriores devido ao seu tamanho menor. Por exemplo, CIRTS-2 e CIRTS-3 têm 65 e 36 kDa respectivamente, enquanto os sistemas YTHDF1 e YTHDF2 programáveis baseados em Cas13b comparáveis são 155 e 126 kDa, respectivamente (FIG. 20). CIRTS-1 é ainda menor do que a menor proteína Cas de alvejamento de DNA encontrada até o momento, Cas14a e a menor proteína de alvejamento de RNA de Cas12g (Harrington et al., 2018; Yan et al., 2019)
[0228]A partir de uma perspectiva traducional, a CIRTS deve oferecer várias vantagens e oportunidades importantes. A natureza humanizada do CIRTS fornecerá um caminho para evitar respostas imunológicas, abrindo o potencial para terapias administradas continuamente. Embora as fusões entre as proteínas humanas no CIRTS apresentem limitações potenciais no projeto em que o sistema imunológico poderia responder (Glaesner et al., 2010), este é um problema que pode, em princípio, ser planejado. Quando os inventores previram computacionalmente a imunogenicidade dos peptídeos de ligação de MHC I de maior probabilidade nos construtos projetados pelos inventores, os inventores descobriram que o CIRT totalmente humanizado mostra menor propensão para causar reações imunes (FIG. 27C), mas testes experimentais adicionais são necessários descobrir onde surgem as limitações do projeto.
[0229]Vários desafios conhecidos permanecem com o sistema CIRT atual. Em primeiro lugar, a proteína de ligação em grampo de cabelo alternativa SLBP em sua forma atual tem um parceiro de ligação em grampo de RNA endógeno, que poderia influenciar o tráfego de RNA de alça de haste. Para minimizar os efeitos endógenos dos construtos de fusão dos inventores, os inventores incluíram apenas o motivo de reconhecimento de RNA mínimo (RRM) necessário para o reconhecimento em grampo no sistema e omitiu regiões de potenciais interações com outras proteínas ou ácidos nucleicos. Da mesma forma, os inventores tentaram manter o grampo de RNA necessário o menor possível para evitar potenciais interações endógenas. O grampo de cabelo com alça de haste já era muito curto e não poderia ser truncado, mas os inventores escolheram usar apenas a região minimamente necessária para a ligação de TBP6.7 ao grampo de cabelo TAR, resultando em um gRNA com menos da metade do comprimento do grampo original. Em segundo lugar, o peptídeo catiônico, β-defensina 3, em sua forma atual pode, teoricamente, ainda interagir com seus parceiros de ligação intracelular e eliciar respostas biológicas indesejadas. No entanto, a β-defensina 3 humana foi amplamente estudada e as bases estruturais para sua função foram elucidadas (Dhople et al., 2006; Kluver et al., 2005). Os inventores podem alavancar esse conhecimento como base para criar mutantes de β-defensina 3 que retêm a natureza altamente carregada necessária para CIRT, mas abolem funções endógenas, a fim de criar um sistema de alvejamento de RNA ortogonal baseado em partes humanas.
[0230]A partir de uma perspectiva mais ampla, a plataforma CIRTS demonstra o potencial de combinar partes contidas na caixa de ferramentas de proteínas humanas para desenvolver proteínas com novas propriedades. Os CIRTS apresentados foram criados por meio de esforços mínimos de engenharia e otimização de proteínas, mas funcionam quase tão bem quanto os sistemas CRISPR/Cas de evolução natural. Em particular, quando os inventores compararam o knockdown baseado em Cas13b por sua nuclease endógena e pela distribuição de YTHDF2 (FIG. 26C) ao knockdown mediado por CIRTS, os inventores descobriram que, embora a nuclease Cas13b tenha um desempenho substancialmente melhor do que a nuclease CIRTS, os inventores não veem diferença no knockdown mediado por YTHDF2, sugerindo que CIRTS-3 (YTHDF2) em seu estado atual já pode ser usado para estudar o epitranscriptoma de forma eficaz. Trabalhos adicionais para otimizar o CIRT usando evolução alvejada provavelmente produzirão variantes que melhoraram o desempenho em sistemas de mamíferos (Hu et al., 2018). Compreender o projeto do local alvo e os requisitos contextuais da proteína efetora também melhorará o desempenho do sistema CIRTS, e uma melhor compreensão das vias epitranscriptômicas que estão sendo exploradas permitirá que os inventores projetem sistemas melhores. Além disso, há uma gama de outras proteínas regulatórias contidas no proteoma humano que provavelmente abrigam propriedades de controle de RNA únicas (Dominguez et al., 2018), que podem ser acopladas com CIRTS para criar versões programáveis de cada proteína para caracterização funcional e potencial aplicações translacionais. O sistema CIRTS fornece uma nova abordagem para estudar e explorar a regulação do RNA e abrirá oportunidades futuras para intervir na regulação das células para o tratamento de doenças. ***
[0231]Todos os métodos divulgados e reivindicados aqui podem ser feitos e executados sem experimentação indevida à luz da presente divulgação. Embora as composições e métodos desta invenção tenham sido descritos em termos de modalidades preferidas, será evidente para os técnicos no assunto que variações podem ser aplicadas aos métodos e nas etapas ou na sequência das etapas do método descrito aqui, sem se afastar do conceito, espírito e escopo da invenção. Mais especificamente, será evidente que certos agentes que são química e fisiologicamente relacionados podem ser substituídos pelos agentes descritos aqui enquanto os mesmos resultados ou resultados semelhantes seriam alcançados. Todos esses substitutos e modificações semelhantes evidentes aos técnicos no assunto são considerados como estando dentro do espírito, escopo e conceito da invenção conforme definido pelas reivindicações anexas.
REFERÊNCIAS
[0232]As seguintes referências, na medida em que fornecem procedimentos exemplares ou outros detalhes complementares aos aqui estabelecidos, são especificamente incorporadas aqui por referência. Abudayyeh, O.O., Gootenberg, J.S., Essletzbichler, P., Han, S., Joung, J., Belanto, J.J., Verdine, V., Cox, D.B.T., Kellner, M.J., Regev, A., et al. (2017). RNA targeting with CRISPR–Cas13. Nature 550, 280. Abudayyeh, O.O., Gootenberg, J.S., Konermann, S., Joung, J., Slaymaker, I.M., Cox, D.B.T., Shmakov, S., Makarova, K.S., Semenova, E., Minakhin, L., et al. (2016). C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573. Adamala, K.P., Martin-Alarcon, D.A., and Boyden, E.S. (2016). Programmable
RNA-binding protein composed of repeats of a single modular unit.
Proc Natl Acad Sci U S A 113, E2579-2588. Batra, R., Nelles, D.A., Pirie, E., Blue, S.M., Marina, R.J., Wang, H., Chaim, I.A., Thomas, J.D., Zhang, N., Nguyen, V., et al. (2017). Elimination of Toxic Microsatellite Repeat Expansion RNA by RNA-Targeting Cas9. Cell 170, 899-912 e810. Blakeley, B.D., and McNaughton, B.R. (2014). Synthetic RNA recognition motifs that selectively recognize HIV-1 trans-activation response element hairpin RNA.
ACS Chem Biol 9, 1320-1329. Chandrasegaran, S., and Carroll, D. (2016). Origins of Programmable Nucleases for Genome Engineering.
J Mol Biol 428, 963-989. Chavez, A., Scheiman, J., Vora, S., Pruitt, B.W., Tuttle, M., P R Iyer, E., Lin, S., Kiani, S., Guzman, C.D., Wiegand, D.J., et al. (2015). Highly eficiente Cas9- mediated transcriptional programming.
Nat Methods 12, 326. Choudhury, R., Tsai, Y.S., Dominguez, D., Wang, Y., and Wang, Z. (2012). Engineering RNA endonucleases with customized sequence specificities.
Nat Commun 3, 1147. Chu, V.T., Weber, T., Wefers, B., Wurst, W., Sander, S., Rajewsky, K., and Kuhn, R. (2015). Increasing the efficiency of homology-directed repair for CRISPR- Cas9-induced precise gene editing in mammalian cells.
Nat Biotechnol 33, 543-548. Coller, J., and Wickens, M. (2007). Tethered function assays: an adaptable approach to study RNA regulatory proteins.
Methods Enzymol 429, 299-321. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., et al. (2013). Multiplex genome engineering using CRISPR/Cas systems.
Science 339, 819-823. Cox, D.B.T., Gootenberg, J.S., Abudayyeh, O.O., Franklin, B., Kellner, M.J., Joung, J., and Zhang, F. (2017). RNA editing with CRISPR-Cas13. Science 358, 1019-
1027. Crawford, D.W., Blakeley, B.D., Chen, P.H., Sherpa, C., Le Grice, S.F., Laird- Offringa, I.A., and McNaughton, B.R. (2016). An Evolved RNA Recognition Motif That Suppresses HIV-1 Tat/TAR-Dependent Transcription. ACS Chem Biol 11, 2206-2215. Cronican, J.J., Beier, K.T., Davis, T.N., Tseng, J.C., Li, W., Thompson, D.B., Shih, A.F., May, E.M., Cepko, C.L., Kung, A.L., et al. (2011). A class of human proteins that deliver functional proteins into mammalian cells in vitro and in vivo. Chem Biol 18, 833-838. Desjarlais, J.R., and Berg, J.M. (1993). Use of a zinc-finger consensus sequence framework and specificity rules to projeto specific DNA binding proteins. Proceedings of the National Academy of Sciences 90, 2256. Dhople, V., Krukemeyer, A., and Ramamoorthy, A. (2006). The human beta- defensin-3, an antibacterial peptide with multiple biological functions. Biochim Biophys Acta 1758, 1499-1512. Dominguez, D., Freese, P., Alexis, M.S., Su, A., Hochman, M., Palden, T., Bazile, C., Lambert, N.J., Van Nostrand, E.L., Pratt, G.A., et al. (2018). Sequence, Structure, and Context Preferences of Human RNA Binding Proteins. Mol Cell 70, 854-
867.e859. Du, D., Roguev, A., Gordon, D.E., Chen, M., Chen, S.-H., Shales, M., Shen, J.P., Ideker, T., Mali, P., Qi, L.S., et al. (2017). Genetic interaction mapping in mammalian cells using CRISPR interference. Nat Methods 14, 577. Eberle, A.B., Lykke-Andersen, S., Muhlemann, O., and Jensen, T.H. (2009). SMG6 promotes endonucleolytic cleavage of nonsense mRNA in human cells. Nat Struct Mol Biol 16, 49-55. Filipovska, A., Razif, M.F., Nygard, K.K., and Rackham, O. (2011). A universal code for RNA recognition by PUF proteins. Nat Chem Biol 7, 425-427. Fuxman Bass, J.I., Sahni, N., Shrestha, S., Garcia-Gonzalez, A., Mori, A.,
Bhat, N., Yi, S., Hill, D.E., Vidal, M., and Walhout, A.J.M. (2015). Human gene-centered transcription factor networks for enhancers and disease variants. Cell 161, 661-673. Gaudelli, N.M., Komor, A.C., Rees, H.A., Packer, M.S., Badran, A.H., Bryson, D.I., and Liu, D.R. (2017). Programmable base editing of A•T to G•C in genomic DNA without DNA cleavage. Nature 551, 464. Gilbert, L.A., Larson, M.H., Morsut, L., Liu, Z., Brar, G.A., Torres, S.E., Stern- Ginossar, N., Brandman, O., Whitehead, E.H., Doudna, J.A., et al. (2013). CRISPR- mediated modular RNA-guided regulation of transcription in eukaryotes. Cell 154, 442-
451. Glaesner, W., Vick, A.M., Millican, R., Ellis, B., Tschang, S.H., Tian, Y., Bokvist, K., Brenner, M., Koester, A., Porksen, N., et al. (2010). Engineering and characterization of the long-acting glucagon-like peptide-1 analogue LY2189265, an Fc fusion protein. Diabetes Metab Res Rev 26, 287-296. Gootenberg, J.S., Abudayyeh, O.O., Kellner, M.J., Joung, J., Collins, J.J., and Zhang, F. (2018). Multiplexed and portable nucleic acid detection platform with Cas13, Cas12a, and Csm6. Science 360, 439. Harrington, L.B., Burstein, D., Chen, J.S., Paez-Espino, D., Ma, E., Witte, I.P., Cofsky, J.C., Kyrpides, N.C., Banfield, J.F., and Doudna, J.A. (2018). Programmed DNA destruction by miniature CRISPR-Cas14 enzymes. Science 362, 839. Hilton, I.B., D'Ippolito, A.M., Vockley, C.M., Thakore, P.I., Crawford, G.E., Reddy, T.E., and Gersbach, C.A. (2015). Epigenome editing by a CRISPR-Cas9- based acetyltransferase activates genes from promoters and enhancers. Nat Biotechnol 33, 510. Hockemeyer, D., Wang, H., Kiani, S., Lai, C.S., Gao, Q., Cassady, J.P., Cost, G.J., Zhang, L., Santiago, Y., Miller, J.C., et al. (2011). Genetic engineering of human pluripotent cells using TALE nucleases. Nat Biotechnol 29, 731-734. Hu, J.H., Miller, S.M., Geurts, M.H., Tang, W., Chen, L., Sun, N., Zeina, C.M.,
Gao, X., Rees, H.A., Lin, Z., et al. (2018). Evolved Cas9 variants with broad PAM compatibility and high DNA specificity. Nature 556, 57. Jiang, W., Bikard, D., Cox, D., Zhang, F., and Marraffini, L.A. (2013). RNA- guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31,
233. Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J.A., and Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821. Joung, J.K., and Sander, J.D. (2012). TALENs: a widely applicable technology for targeted genome editing. Nature Reviews Molecular Cell Biology 14, 49. Kearns, N.A., Pham, H., Tabak, B., Genga, R.M., Silverstein, N.J., Garber, M., and Maehr, R. (2015). Functional annotation of native enhancers with a Cas9–histone demethylase fusion. Nat Methods 12, 401. Kim, S., Koo, T., Jee, H.G., Cho, H.Y., Lee, G., Lim, D.G., Shin, H.S., and Kim, J.S. (2018). CRISPR RNAs trigger innate immune responses in human cells. Genome Res. Kluver, E., Schulz-Maronde, S., Scheid, S., Meyer, B., Forssmann, W.G., and Adermann, K. (2005). Structure-activity relation of human beta-defensin 3: influence of disulfide bonds and cysteine substitution on antimicrobial activity and cytotoxicity. Biochemistry 44, 9804-9816. Knott, G.J., and Doudna, J.A. (2018). CRISPR-Cas guides the future of genetic engineering. Science 361, 866-869. Koblan, L.W., Doman, J.L., Wilson, C., Levy, J.M., Tay, T., Newby, G.A., Maianti, J.P., Raguram, A., and Liu, D.R. (2018). Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction. Nat Biotechnol 36, 843-846. Komor, A.C., Kim, Y.B., Packer, M.S., Zuris, J.A., and Liu, D.R. (2016).
Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420. Konermann, S., Lotfy, P., Brideau, N.J., Oki, J., Shokhirev, M.N., and Hsu, P.D. (2018). Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors. Cell 173, 665-676.e614. Liao, H.-K., Hatanaka, F., Araoka, T., Reddy, P., Wu, M.-Z., Sui, Y., Yamauchi, T., Sakurai, M., O’Keefe, D.D., Núñez-Delicado, E., et al. (2017). In Vivo Target Gene Activation via CRISPR/Cas9-Mediated Trans-epigenetic Modulation. Cell 171, 1495-
1507.e1415. Lin, S., Staahl, B.T., Alla, R.K., and Doudna, J.A. (2014). Enhanced homology- directed human genome engineering by controlled timing of CRISPR/Cas9 delivery. Elife 3, e04766. Liu, L., Li, X., Ma, J., Li, Z., You, L., Wang, J., Wang, M., Zhang, X., and Wang, Y. (2017). The Molecular Architecture for RNA-Guided RNA Cleavage by Cas13a. Cell 170, 714-726 e710. Maeder, M.L., Linder, S.J., Cascio, V.M., Fu, Y., Ho, Q.H., and Joung, J.K. (2013). CRISPR RNA-guided activation of endogenous human genes. Nat Methods 10, 977-979. Mali, P., Aach, J., Stranges, P.B., Esvelt, K.M., Moosburner, M., Kosuri, S., Yang, L., and Church, G.M. (2013a). CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol 31, 833-838. Mali, P., Yang, L., Esvelt, K.M., Aach, J., Guell, M., DiCarlo, J.E., Norville, J.E., and Church, G.M. (2013b). RNA-guided human genome engineering via Cas9. Science 339, 823-826. Monteys, A.M., Ebanks, S.A., Keiser, M.S., and Davidson, B.L. (2017). CRISPR/Cas9 Editing of the Mutant Huntingtin Allele In Vitro and In Vivo. Mol Ther 25,
12-23. Montiel-Gonzalez, M.F., Vallecillo-Viejo, I.C., and Rosenthal, J.J. (2016). An eficiente system for selectively altering genetic information within mRNAs.
Nucleic Acids Res 44, e157. Nelles, D.A., Fang, M.Y., O'Connell, M.R., Xu, J.L., Markmiller, S.J., Doudna, J.A., and Yeo, G.W. (2016). Programmable RNA Tracking in Live Cells with CRISPR/Cas9. Cell 165, 488-496. Nishikura, K. (2010). Functions and regulation of RNA editing by ADAR deaminases.
Annu Rev Biochem 79, 321-349. O'Connell, M.R., Oakes, B.L., Sternberg, S.H., East-Seletsky, A., Kaplan, M., and Doudna, J.A. (2014). Programmable RNA recognition and cleavage by CRISPR/Cas9. Nature 516, 263-266. O’Connell, M.R., Oakes, B.L., Sternberg, S.H., East-Seletsky, A., Kaplan, M., and Doudna, J.A. (2014). Programmable RNA recognition and cleavage by CRISPR/Cas9. Nature 516, 263. Perez-Pinera, P., Kocak, D.D., Vockley, C.M., Adler, A.F., Kabadi, A.M., Polstein, L.R., Thakore, P.I., Glass, K.A., Ousterout, D.G., Leong, K.W., et al. (2013). RNA-guided gene activation by CRISPR-Cas9-based transcription factors.
Nat Methods 10, 973-976. Qi, L.S., Larson, M.H., Gilbert, L.A., Doudna, J.A., Weissman, J.S., Arkin, A.P., and Lim, W.A. (2013). Repurposing CRISPR as an RNA-guided platform for sequence- specific control of gene expression.
Cell 152, 1173-1183. Rauch, S., He, C., and Dickinson, B.C. (2018). Targeted m(6)A Reader Proteins To Study Epitranscriptomic Regulation of Single RNAs.
J Am Chem Soc 140, 11974-11981. Roundtree, I.A., Evans, M.E., Pan, T., and He, C. (2017). Dynamic RNA Modifications in Gene Expression Regulation.
Cell 169, 1187-1200.
Rutkauskas, M., Sinkunas, T., Songailiene, I., Tikhomirova, Maria S., Siksnys, V., and Seidel, R. (2015). Directional R-Loop Formation by the CRISPR-Cas Surveillance Complex Cascade Provides Eficiente Off-Target Site Rejection.
Cell Reports 10, 1534-1543. Savić, N., and Schwank, G. (2016). Advances in therapeutic CRISPR/Cas9 genome editing.
Translational Research 168, 15-21. Schierling, B., Dannemann, N., Gabsalilow, L., Wende, W., Cathomen, T., and Pingoud, A. (2012). A novel zinc-finger nuclease platform with a sequence-specific cleavage module.
Nucleic Acids Res 40, 2623-2638. Sinnamon, J.R., Kim, S.Y., Corson, G.M., Song, Z., Nakai, H., Adelman, J.P., and Mandel, G. (2017). Site-directed RNA repair of endogenous Mecp2 RNA in neurons.
Proc Natl Acad Sci U S A 114, E9395-E9402. Sternberg, S.H., Redding, S., Jinek, M., Greene, E.C., and Doudna, J.A. (2014). DNA interrogation by the CRISPR RNA-guided endonuclease Cas9. Nature 507, 62. Strutt, S.C., Torrez, R.M., Kaya, E., Negrete, O.A., and Doudna, J.A. (2018). RNA-dependent RNA targeting by CRISPR-Cas9. eLife 7, e32724. Sundaram, G.M., Ismail, H.M., Bashir, M., Muhuri, M., Vaz, C., Nama, S., Ow, G.S., Vladimirovna, I.A., Ramalingam, R., Burke, B., et al. (2017). EGF hijacks miR- 198/FSTL1 wound-healing switch and steers a two-pronged pathway toward metastasis.
J Exp Med 214, 2889-2900. Szczelkun, M.D., Tikhomirova, M.S., Sinkunas, T., Gasiunas, G., Karvelis, T., Pschera, P., Siksnys, V., and Seidel, R. (2014). Direct observation of R-loop formation by single RNA-guided Cas9 and Cascade effector complexes.
Proceedings of the National Academy of Sciences 111, 9798. Tambe, A., East-Seletsky, A., Knott, G.J., Doudna, J.A., and O'Connell, M.R. (2018). RNA Binding and HEPN-Nuclease Activation Are Decoupled in CRISPR-
Cas13a.
Cell Rep 24, 1025-1036. Vogel, P., Moschref, M., Li, Q., Merkle, T., Selvasaravanan, K.D., Li, J.B., and Stafforst, T. (2018). Eficiente and precise editing of endogenous transcripts with SNAP-tagged ADARs.
Nat Methods 15, 535-538. Wagner, D.L., Amini, L., Wendering, D.J., Burkhardt, L.-M., Akyüz, L., Reinke, P., Volk, H.-D., and Schmueck-Henneresse, M. (2018). High prevalence of Streptococcus pyogenes Cas9-reactive T cells within the adult human population.
Nat Med.
Wiedenheft, B., Sternberg, S.H., and Doudna, J.A. (2012). RNA-guided genetic silencing systems in bacteria and archaea.
Nature 482, 331. Yan, W.X., Chong, S., Zhang, H., Makarova, K.S., Koonin, E.V., Cheng, D.R., and Scott, D.A. (2018). Cas13d Is a Compact RNA-Targeting Type VI CRISPR Effector Positively Modulated by a WYL-Domain-Containing Accessory Protein.
Mol Cell 70, 327-339 e325. Yi, L., and Li, J. (2016). CRISPR-Cas9 therapeutics in cancer: promising strategies and present challenges.
Biochim Biophys Acta 1866, 197-207. Zhao, B.S., Roundtree, I.A., and He, C. (2017). Post-transcriptional gene regulation by mRNA modifications.
Nat Rev Mol Cell Biol 18, 31-42. Zhou, Z., Dell'Orco, M., Saldarelli, P., Turturo, C., Minafra, A., and Martelli, G.P. (2006). Identification of an RNA-silencing suppressor in the genome of Grapevine virus A.
J Gen Virol 87, 2387-2395. Guilinger, J.P., Thompson, D.B., and Liu, D.R. (2014). Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification.
Nat Biotechnol 32, 577-582. Abil, Z., Denard, C.A., and Zhao, H. (2014). Modular assembly of designer PUF proteins for specific post-transcriptional regulation of endogenous RNA.
J Biol Eng 8, 7.
Andreatta, M., and Nielsen, M. (2016). Gapped sequence alignment using artificial neural networks: application to the MHC class I system.
Bioinformatics 32, 511-517. Bao, Z., Jain, S., Jaroenpuntaruk, V., and Zhao, H. (2017). Orthogonal Genetic Regulation in Human Cells Using Chemically Induced CRISPR/Cas9 Activators.
ACS Synth Biol 6, 686-693. Boyle, E.A., Andreasson, J.O.L., Chircus, L.M., Sternberg, S.H., Wu, M.J., Guegler, C.K., Doudna, J.A., and Greenleaf, W.J. (2017). High-throughput biochemical profiling reveals sequence determinants of dCas9 off-target binding and unbinding.
Proc Natl Acad Sci U S A 114, 5461-5466. Bray, N.L., Pimentel, H., Melsted, P., and Pachter, L. (2016). Near-optimal probabilistic RNA-seq quantification.
Nat Biotechnol 34, 525. Calis, J.J., Maybeno, M., Greenbaum, J.A., Weiskopf, D., De Silva, A.D., Sette, A., Kesmir, C., and Peters, B. (2013). Properties of MHC class I presented peptides that enhance immunogenicity.
PLoS Comput Biol 9, e1003266. Charlesworth, C., Deshpande, P., Dever, D., Dejene, B., Gomez-Ospina, N., Mantri, S., Pavel-Dinu, M., Camarena, J., Weinberg, K., and Porteus, M.
Identification of Pre-Existing Adaptive Immunity to Cas9 Proteins in Humans. bioRxiv.
Du, H., Zhao, Y., He, J., Zhang, Y., Xi, H., Liu, M., Ma, J., and Wu, L. (2016). YTHDF2 destabilizes m6A-containing RNA through direct recruitment of the CCR4– NOT deadenylase complex.
Nat Commun 7, 12626. Gao, G., Vandenberghe, L.H., and Wilson, J.M. (2005). New recombinant serotypes of AAV vectors.
Curr Gene Ther 5, 285-297. Gao, Y., Xiong, X., Wong, S., Charles, E.J., Lim, W.A., and Qi, L.S. (2016). Complex transcriptional modulation with orthogonal and inducible dCas9 regulators.
Nat Methods 13, 1043-1049. Jurtz, V., Paul, S., Andreatta, M., Marcatili, P., Peters, B., and Nielsen, M.
(2017). NetMHCpan-4.0: Improved Peptide-MHC Class I Interaction Predictions Integrating Eluted Ligand and Peptide Binding Affinity Data. J Immunol 199, 3360-
3368. Kearns, N.A., Pham, H., Tabak, B., Genga, R.M., Silverstein, N.J., Garber, M., and Maehr, R. (2015). Functional annotation of native enhancers with a Cas9–histone demethylase fusion. Nat Methods 12, 401. Kuttan, A., and Bass, B.L. (2012). Mechanistic insights into editing-site specificity of ADARs. Proc Natl Acad Sci U S A 109, E3295-3304. Meyer, Kate D., Patil, Deepak P., Zhou, J., Zinoviev, A., Skabkin, Maxim A., Elemento, O., Pestova, Tatyana V., Qian, S.-B., and Jaffrey, Samie R. (2015). 5′ UTR m6A Promotes Cap-Independent Translation. Cell 163, 999-1010. Moutaftsi, M., Peters, B., Pasquetto, V., Tscharke, D.C., Sidney, J., Bui, H.H., Grey, H., and Sette, A. (2006). A consensus epitope prediction approach identifies the breadth of murine T(CD8+)-cell responses to vaccinia virus. Nat Biotechnol 24, 817-
819. Naso, M.F., Tomkowicz, B., Perry, W.L., 3rd, and Strohl, W.R. (2017). Adeno- Associated Virus (AAV) as a Vector for Gene Therapy. BioDrugs 31, 317-334. Peters, B., and Sette, A. (2005). Generating quantitative models describing the sequence specificity of biological processes with the stabilized matrix method. BMC Bioinformatics 6, 132. Pimentel, H., Bray, N.L., Puente, S., Melsted, P., and Pachter, L. (2017). Differential analysis of RNA-seq incorporating quantification uncertainty. Nat Methods 14, 687. Sidney, J., Assarsson, E., Moore, C., Ngo, S., Pinilla, C., Sette, A., and Peters, B. (2008). Quantitative peptide binding motifs for 19 human and mouse MHC class I molecules derived using positional scanning combinatorial peptide libraries. Immunome Res 4, 2.
Simhadri, V.L., McGill, J., McMahon, S., Wang, J., Jiang, H., and Sauna, Z.E. (2018). Prevalence of Pre-existing Antibodies to CRISPR-Associated Nuclease Cas9 in the USA Population.
Mol Ther Methods Clin Dev 10, 105-112. Vasileva, A., and Jessberger, R. (2005). Precise hit: adeno-associated virus in gene targeting.
Nat Rev Microbiol 3, 837-847. Wang, X., Lu, Z., Gomez, A., Hon, G.C., Yue, Y., Han, D., Fu, Y., Parisien, M., Dai, Q., Jia, G., et al. (2013). N6-methyladenosine-dependent regulation of messenger RNA stability.
Nature 505, 117. Wang, X., Zhao, Boxuan S., Roundtree, Ian A., Lu, Z., Han, D., Ma, H., Weng, X., Chen, K., Shi, H., and He, C. (2015). N6-methyladenosine Modulates Messenger RNA Translation Efficiency.
Cell 161, 1388-1399. Wu, Z., Yang, H., and Colosi, P. (2010). Effect of genome size on AAV vector packaging.
Mol Ther 18, 80-86. Xiao, W., Adhikari, S., Dahal, U., Chen, Y.-S., Hao, Y.-J., Sun, B.-F., Sun, H.- Y., Li, A., Ping, X.-L., Lai, W.-Y., et al. (2016). Nuclear m6A Reader YTHDC1 Regulates mRNA Splicing.
Mol Cell 61, 507-519. Yan, W.X., Hunnewell, P., Alfonse, L.E., Carte, J.M., Keston-Smith, E., Sothiselvam, S., Garrity, A.J., Chong, S., Makarova, K.S., Koonin, E.V., et al. (2019). Functionally diverse type V CRISPR-Cas systems.
Science 363, 88-91.

Claims (94)

REIVINDICAÇÕES
1. Sistema regulador de RNA, CARACTERIZADO pelo fato de que compreende pelo menos um de cada: i) um domínio de ligação a grampo de RNA; ii) uma molécula de alvejamento de RNA compreendendo uma região de alvejamento de RNA e pelo menos uma estrutura de grampo, em que a estrutura de grampo da molécula de alvejamento de RNA especificamente se liga a i; e iii) um domínio regulador de RNA.
2. Sistema, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o domínio de ligação a grampo de RNA e o domínio regulador de RNA são operavelmente ligados.
3. Sistema, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que as partes i), ii), e/ou iii) são humanas ou são derivadas de humanos.
4. Sistema, de acordo com a reivindicação 2 ou 3, CARACTERIZADO pelo fato de que i) e iii) são operavelmente ligados através de uma ligação peptídica.
5. Sistema, de acordo com a reivindicação 2 ou 3, CARACTERIZADO pelo fato de que i) e iii) são operavelmente ligados através de interações não covalentes.
6. Sistema, de acordo com qualquer uma das reivindicações 1 a 5, CARACTERIZADO pelo fato de que o domínio regulador de RNA é covalentemente ligado a um primeiro domínio de dimerização e o domínio de ligação a grampo de RNA é covalentemente ligado a um segundo domínio de dimerização e em que o primeiro e o segundo domínio de dimerização são capazes de dimerizar para formar uma ligação não covalente ou covalente.
7. Sistema, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que a dimerização é induzível.
8. Sistema, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que a dimerização compreende dimerização induzida por ligante.
9. Sistema, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que um do primeiro ou segundo domínio de dimerização compreende PYR/PYR1-like (PYL1), o outro do primeiro ou segundo domínio compreende ABA insensitive 1 (ABI1), e o ligante compreende ácido abscísico (ABA) ou derivados ou fragmentos do mesmo.
10. Sistema, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que o primeiro e/ou segundo domínios de dimerização compreendem FKBP12 e o ligante compreende FK1012 ou derivados ou fragmentos dos mesmos.
11. Sistema, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que um do primeiro ou segundo domínios de dimerização compreende proteína de ligação a FK506 (FKBP), o outro do primeiro ou segundo domínio compreende domínio de ligação a FKBP-Rap de alvo mamífero de Rap mTOR (Frb), e o ligante compreende rapamicina (Rap) ou derivados ou fragmentos dos mesmos.
12. Sistema, de acordo com qualquer uma das reivindicações 1 a 11, CARACTERIZADO pelo fato de que ii) compreende pelo menos duas estruturas de grampo.
13. Sistema, de acordo com qualquer uma das reivindicações 1 a 12, CARACTERIZADO pelo fato de que ii) compreende um ou mais nucleotídeos modificados.
14. Sistema, de acordo com qualquer uma das reivindicações 1 a 13, CARACTERIZADO pelo fato de que o sistema compreende ainda um polipeptídio estabilizador; em que o polipeptídio estabilizador compreende um polipeptídio catiônico que se liga não especificamente a ácidos nucleicos.
15. Sistema, de acordo com a reivindicação 14, CARACTERIZADO pelo fato de que o polipeptídio estabilizador é derivado de humano.
16. Sistema, de acordo com qualquer uma das reivindicações 1 a 15, CARACTERIZADO pelo fato de que o tamanho total do sistema é menor do que 150 kDa.
17. Sistema, de acordo com qualquer uma das reivindicações 1 a 16, CARACTERIZADO pelo fato de que i) compreende U1A, SLBP ou variantes do mesmo.
18. Sistema, de acordo com qualquer uma das reivindicações 1 a 17, CARACTERIZADO pelo fato de que ii) compreende um andaime de grampo TAR da SEQ ID NO: 1.
19. Sistema, de acordo com qualquer uma das reivindicações 1 a 18, CARACTERIZADO pelo fato de que ii) compreende um andaime de grampo SLBP da SEQ ID NO: 2.
20. Sistema, de acordo com qualquer uma das reivindicações 1 a 19, CARACTERIZADO pelo fato de que ii) compreende um ligante.
21. Sistema, de acordo com a reivindicação 20, CARACTERIZADO pelo fato de que o ligante é de pelo menos 5 aminoácidos.
22. Sistema, de acordo com qualquer uma das reivindicações 1 a 21, CARACTERIZADO pelo fato de que a região de alvejamento de RNA compreende pelo menos 12 nucleotídeos.
23. Sistema, de acordo com qualquer uma das reivindicações 1 a 22, CARACTERIZADO pelo fato de que iii) compreende uma nuclease, metilase, desmetilase, ativador traducional, repressor traducional, atividade de clivagem de RNA de fita simples, atividade de clivagem de RNA de fita dupla ou atividade de ligação a RNA.
24. Sistema, de acordo com qualquer uma das reivindicações 1 a 23, CARACTERIZADO pelo fato de que iii) compreende um domínio de nuclease Pin ou uma proteína leitora m6A ou porção dos mesmos.
25. Sistema, de acordo com a reivindicação 24, CARACTERIZADO pelo fato de que iii) compreende YTHDF1, YTHDF2 ou ADAR.
26. Sistema, de acordo com qualquer uma das reivindicações 14 a 25, CARACTERIZADO pelo fato de que a proteína estabilizadora compreende HBEGF, beta-defensina ou variantes ou porções dos mesmos.
27. Sistema, de acordo com qualquer uma das reivindicações 1 a 26, CARACTERIZADO pelo fato de que a região de alvejamento de RNA de ii) hibridiza a um RNA alvo em uma célula procariótica ou eucariótica.
28. Sistema, de acordo com qualquer uma das reivindicações 1 a 27, CARACTERIZADO pelo fato de que i) e/ou iii) compreendem um ou mais sinais de localização nuclear (NLS)s.
29. Sistema, de acordo com qualquer uma das reivindicações 1 a 28, CARACTERIZADO pelo fato de que o sistema compreende pelo menos dois de cada i, ii, e iii.
30. Sistema, de acordo com qualquer uma das reivindicações 1 a 29, CARACTERIZADO pelo fato de que o domínio regulador de RNA cliva o RNA, promove a tradução do RNA, inibe a tradução do RNA ou modifica a sequência de base do RNA.
31. Sistema de vetor, CARACTERIZADO pelo fato de que compreende um ou mais vetores de ácido nucleico compreendendo um nucleotídeo que codifica: i) um domínio de ligação a grampo de RNA; ii) uma molécula de alvejamento de RNA compreendendo uma região de alvejamento de RNA e pelo menos uma estrutura de grampo, em que a estrutura de grampo da molécula de alvejamento de RNA especificamente se liga a i), e iii) um domínio regulador de RNA.
32. Sistema de vetor, de acordo com a reivindicação 31, CARACTERIZADO pelo fato de que o domínio de ligação a grampo de RNA e o domínio regulador de RNA são operavelmente ligados.
33. Sistema de vetor, de acordo com a reivindicação 31, CARACTERIZADO pelo fato de que compreende ainda um elemento regulador operavelmente ligado ao nucleotídeo que codifica i, ii, e/ou iii.
34. Sistema de vetor, de acordo com a reivindicação 31 ou 33, CARACTERIZADO pelo fato de que um ou mais vetores de ácido nucleico são otimizados para expressão em uma célula eucariótica.
35. Sistema de vetor, de acordo com qualquer uma das reivindicações 31 a 34, CARACTERIZADO pelo fato de que a expressão é constitutiva ou condicional.
36. Sistema de vetor, de acordo com qualquer uma das reivindicações 31 a 35, CARACTERIZADO pelo fato de que i, ii, e iii estão em um único vetor.
37. Sistema de vetor, de acordo com qualquer uma das reivindicações 31 a 36, CARACTERIZADO pelo fato de que um ou mais dos vetores são vetores virais.
38. Sistema de vetor, de acordo com as reivindicações 31 a 37, CARACTERIZADO pelo fato de que um ou mais vetores compreendem um ou mais vetores retrovirais, lentivirais, adenovirais, adenoassociados ou virais de herpes simplex.
39. Sistema de vetor, de acordo com qualquer uma das reivindicações 31 a 36, CARACTERIZADO pelo fato de que um ou mais dos vetores são vetores não virais.
40. Conjugado, CARACTERIZADO pelo fato de que compreende um domínio regulador de RNA operavelmente ligado a uma molécula de alvejamento de RNA, em que a molécula de alvejamento de RNA compreende uma região de alvejamento de RNA e pelo menos uma estrutura de grampo.
41. Conjugado, de acordo com a reivindicação 40, CARACTERIZADO pelo fato de que o domínio regulador de RNA é derivado de humano.
42. Conjugado, de acordo com a reivindicação 40 ou 41, CARACTERIZADO pelo fato de que o domínio regulador de RNA e a molécula de alvejamento de RNA são operavelmente ligados através de uma ligação peptídica.
43. Conjugado, de acordo com qualquer uma das reivindicações 40 a 42,
CARACTERIZADO pelo fato de que o polipeptídio compreende ainda um ou mais ligantes.
44. Conjugado, de acordo com a reivindicação 40 ou 41, CARACTERIZADO pelo fato de que o domínio regulador de RNA e a molécula de alvejamento de RNA são operavelmente ligados através de interações não covalentes.
45. Conjugado, de acordo com qualquer uma das reivindicações 40 a 44, CARACTERIZADO pelo fato de que o domínio regulador de RNA é covalentemente ligado a um primeiro domínio de dimerização e a molécula de alvejamento de RNA é covalentemente ligada a um segundo domínio de dimerização e em que o primeiro e segundo domínios de dimerização são capazes de dimerizar para formar uma ligação não covalente ou covalente.
46. Conjugado, de acordo com a reivindicação 45, CARACTERIZADO pelo fato de que a dimerização é induzível.
47. Conjugado, de acordo com a reivindicação 46, CARACTERIZADO pelo fato de que a dimerização compreende dimerização induzida por ligante.
48. Conjugado, de acordo com a reivindicação 47, CARACTERIZADO pelo fato de que um do primeiro ou segundo domínios de dimerização compreende PYR/PYR1-like (PYL1), o outro do primeiro ou segundo domínio compreende ABA insensitive 1 (ABI1), e o ligante compreende ácido abscísico (ABA) ou derivados ou fragmentos do mesmo.
49. Conjugado, de acordo com a reivindicação 47, CARACTERIZADO pelo fato de que o primeiro e/ou segundo domínios de dimerização compreendem FKBP12 e o ligante compreende FK1012 ou derivados ou fragmentos dos mesmos.
50. Conjugado, de acordo com a reivindicação 47, CARACTERIZADO pelo fato de que um do primeiro ou segundo domínios de dimerização compreende proteína de ligação a FK506 (FKBP), o outro do primeiro ou segundo domínio compreende domínio de ligação a FKBP-Rap de alvo mamífero de Rap mTOR (Frb),
e o ligante compreende rapamicina (Rap) ou derivados ou fragmentos dos mesmos.
51. Conjugado, de acordo com qualquer uma das reivindicações 40 a 50, CARACTERIZADO pelo fato de que a molécula de alvejamento de RNA compreende pelo menos duas estruturas de grampo.
52. Conjugado, de acordo com qualquer uma das reivindicações 40 a 51, CARACTERIZADO pelo fato de que a molécula de alvejamento de RNA compreende um ou mais nucleotídeos modificados.
53. Conjugado, de acordo com qualquer uma das reivindicações 40 a 52, CARACTERIZADO pelo fato de que a molécula de alvejamento de RNA compreende um andaime de grampo TAR da SEQ ID NO: 1.
54. Conjugado, de acordo com qualquer uma das reivindicações 40 a 53, CARACTERIZADO pelo fato de que a molécula de alvejamento de RNA compreende um andaime de grampo SLBP da SEQ ID NO: 2.
55. Conjugado, de acordo com qualquer uma das reivindicações 40 a 54, CARACTERIZADO pelo fato de que a molécula de alvejamento de RNA compreende um ligante.
56. Conjugado, de acordo com a reivindicação 55, CARACTERIZADO pelo fato de que o ligante compreende pelo menos 5 aminoácidos.
57. Conjugado, de acordo com qualquer uma das reivindicações 40 a 56, CARACTERIZADO pelo fato de que a região de alvejamento de RNA compreende pelo menos 12 nucleotídeos.
58. Conjugado, de acordo com qualquer uma das reivindicações 40 a 57, CARACTERIZADO pelo fato de que o domínio regulador de RNA compreende uma nuclease, metilase, desmetilase, ativador traducional, repressor traducional, atividade de clivagem de RNA de fita simples, atividade de clivagem de RNA de fita dupla ou atividade de ligação a RNA.
59. Conjugado, de acordo com qualquer uma das reivindicações 40 a 57,
CARACTERIZADO pelo fato de que o domínio regulador de RNA compreende um domínio de nuclease Pin ou uma proteína leitora m6A ou porção dos mesmos.
60. Conjugado, de acordo com qualquer uma das reivindicações 40 a 59, CARACTERIZADO pelo fato de que o domínio regulador de RNA compreende YTHDF1, YTHDF2 ou ADAR.
61. Conjugado, de acordo com qualquer uma das reivindicações 40 a 60, CARACTERIZADO pelo fato de que a região de alvejamento de RNA da molécula de alvejamento de RNA hibridiza a um RNA alvo em uma célula procariótica ou eucariótica.
62. Conjugado, de acordo com qualquer uma das reivindicações 40 a 61, CARACTERIZADO pelo fato de que o conjugado compreendem um ou mais sinais de localização nuclear (NLS)s.
63. Conjugado, de acordo com qualquer uma das reivindicações 40 a 62, CARACTERIZADO pelo fato de que o domínio regulador de RNA cliva o RNA, promove a tradução do RNA, inibe a tradução do RNA ou modifica a sequência de base do RNA.
64. Proteína de fusão, CARACTERIZADA pelo fato de que compreende um domínio de ligação a grampo de RNA e um domínio regulador de RNA.
65. Proteína de fusão, CARACTERIZADA pelo fato de que compreende um domínio regulador de RNA e um primeiro domínio de dimerização.
66. Proteína de fusão, CARACTERIZADA pelo fato de que compreende um domínio de ligação a grampo de RNA e um segundo domínio de dimerização.
67. Proteína de fusão, de acordo com a reivindicação 65 ou 66, CARACTERIZADA pelo fato de que a dimerização do primeiro e/ou segundo domínios de dimerização é induzível.
68. Proteína de fusão, de acordo com a reivindicação 67, CARACTERIZADA pelo fato de que a dimerização compreende dimerização induzida por ligante.
69. Proteína de fusão, de acordo com a reivindicação 68, CARACTERIZADA pelo fato de que o primeiro e segundo domínios de dimerização são selecionados a partir de PYL1 e ABI1 e o ligante compreende ABA ou derivados ou fragmentos do mesmo.
70. Proteína de fusão, de acordo com a reivindicação 68, CARACTERIZADA pelo fato de que o primeiro e/ou segundo domínios de dimerização compreendem FKBP12 e o ligante compreende FK1012 ou derivados ou fragmentos dos mesmos.
71. Proteína de fusão, de acordo com a reivindicação 68, CARACTERIZADA pelo fato de que o primeiro e segundo domínios de dimerização são selecionados a partir de FKBP e Frb, e o ligante compreende rapamicina ou derivados ou fragmentos dos mesmos.
72. Proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 71, CARACTERIZADA pelo fato de que o domínio de ligação a grampo de RNA e/ou domínio regulador de RNA são derivadas de humanos.
73. Proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 72, CARACTERIZADA pelo fato de que a proteína de fusão é menor do que 150 kDa.
74. Proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 73, CARACTERIZADA pelo fato de que o domínio de ligação a grampo de RNA compreende U1A, SLBP ou variantes ou fragmentos dos mesmos.
75. Proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 74, CARACTERIZADA pelo fato de que o domínio regulador de RNA compreende uma nuclease, metilase, desmetilase, ativador traducional, repressor traducional, atividade de clivagem de RNA de fita simples, atividade de clivagem de RNA de fita dupla ou atividade de ligação a RNA.
76. Proteína de fusão, de acordo com a reivindicação 75, CARACTERIZADA pelo fato de que o domínio regulador de RNA compreende um domínio de nuclease Pin ou uma proteína leitora m6A ou porção dos mesmos.
77. Proteína de fusão, de acordo com a reivindicação 76, CARACTERIZADA pelo fato de que o domínio regulador de RNA compreende YTHDF1 ou YTHDF2.
78. Proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 77, CARACTERIZADA pelo fato de que compreende ainda um ou mais sinais de localização nuclear (NLS)s.
79. Proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 77, CARACTERIZADA pelo fato de que o domínio regulador de RNA cliva o RNA, promove a tradução do RNA, inibe a tradução do RNA ou modifica a sequência de base do RNA.
80. Ácido nucleico, CARACTERIZADO pelo fato de que codifica a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79.
81. Veículo de liberação, CARACTERIZADO pelo fato de que compreende o sistema, de acordo com qualquer uma das reivindicações 1 a 39, o conjugado, de acordo com qualquer uma das reivindicações 40 a 63 ou a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79.
82. Veículo de liberação, de acordo com a reivindicação 81, CARACTERIZADO pelo fato de que o veículo de liberação compreende lipossoma(s), partícula(s), exossoma(s), microvesícula(s), uma pistola gênica ou um ou mais vetores de ácido nucleico.
83. Composição, CARACTERIZADA pelo fato de que compreende o sistema, de acordo com qualquer uma das reivindicações 1 a 39, o conjugado, de acordo com qualquer uma das reivindicações 40 a 63, a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79 ou o veículo de liberação, de acordo com qualquer uma das reivindicações 81 a 82.
84. Célula, CARACTERIZADA pelo fato de que compreende o sistema, de acordo com qualquer uma das reivindicações 1 a 39, o conjugado, de acordo com qualquer uma das reivindicações 40 a 63, a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79, o veículo de liberação, de acordo com qualquer uma das reivindicações 81 a 82 ou a composição, de acordo com a reivindicação 83.
85. Método para modular pelo menos um RNA alvo, CARACTERIZADO pelo fato de que compreende contatar o RNA alvo com o sistema, de acordo com qualquer uma das reivindicações 1 a 39, o conjugado, de acordo com qualquer uma das reivindicações 40 a 63, a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79, o veículo de liberação, de acordo com qualquer uma das reivindicações 81 a 82 ou a composição, de acordo com a reivindicação 83.
86. Método, de acordo com a reivindicação 85, CARACTERIZADO pelo fato de que modular o pelo menos um RNA alvo compreende clivar, desmetilar, metilar, ativar a tradução, reprimir a tradução, promover a degradação, e/ou ligar ao RNA.
87. Método, de acordo com a reivindicação 85 ou 86, CARACTERIZADO pelo fato de que o RNA alvo é em uma célula procariótica ou eucariótica.
88. Método, de acordo com a reivindicação 87, CARACTERIZADO pelo fato de que o RNA alvo está em uma célula humana.
89. Método, de acordo com a reivindicação 87 ou 88, CARACTERIZADO pelo fato de que o RNA alvo é in vitro ou in vivo.
90. Célula ou progênie da mesma, CARACTERIZADA pelo fato de que compreende RNA alvo modulado, em que o RNA alvo foi modulado de acordo com qualquer uma das reivindicações 85 a 89.
91. Organismo multicelular, CARACTERIZADO pelo fato de que compreende uma ou mais células, de acordo com a reivindicação 90.
92. Planta ou animal, CARACTERIZADOS pelo fato de que compreendem uma ou mais células, de acordo com a reivindicação 91.
93. Kit, CARACTERIZADO pelo fato de que compreende o Sistema, de acordo com qualquer uma das reivindicações 1 a 39, o conjugado, de acordo com qualquer uma das reivindicações 40 a 63, a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79, o veículo de liberação, de acordo com qualquer uma das reivindicações 81 a 82 ou a composição, de acordo com a reivindicação 83.
94. Método para modular um RNA alvo em um indivíduo, o método CARACTERIZADO pelo fato de que compreende administrar o conjugado, de acordo com qualquer uma das reivindicações 40 a 63, a proteína de fusão, de acordo com qualquer uma das reivindicações 64 a 79, o veículo de liberação, de acordo com qualquer uma das reivindicações 81 a 82 ou a composição, de acordo com a reivindicação 83.
Petição 870210079066, de 27/08/2021, pág. 204/239 Proteína Proteína de ligação Proteína de ligação efetora a grampo de RNA a ssRNA Proteína de ligação Proteína de ligação a ssRNA Nuclease de a grampo de RNA Pin morto Nuclease de Pin Proteína efetora
RNA 1/36 alvo β-defensina 3 Sistema de alvejamento de RNA inspirado em CRISPR/Cas β-defensina 3 (CIRTS)
Petição 870210079066, de 27/08/2021, pág. 205/239 andaime hp de
TAR andaime hp de
SLBP humano 2/36 sequência guia sequência guia ligante nt ligante nt
Fração ligada não ligado proteína de gRNA ligado
Petição 870210079066, de 27/08/2021, pág. 207/239 gRNA fora do alvo Fluc de alvejamento de gRNA vetor de gRNA mRNA de Fluc Proteína de ligação (alvo) a grampo de RNA Proteína de ligação a ssRNA vetor de
CIRTS 4/36 Proteína efetora Repórter de mRNA de Rluc (normalização) luciferase Luciferase normalizada Luciferase normalizada dupla
Petição 870210079066, de 27/08/2021, pág. 208/239 Luciferase normalizada Luciferase normalizada Luciferase normalizada Luciferase normalizada 5/36
Petição 870210079066, de 27/08/2021, pág. 209/239 gRNA no alvo gRNA fora do alvo gRNA no alvo gRNA fora do alvo 6/36
Luciferase normalizada Luciferase normalizada vetor de gRNA vetor de gRNA epitranscriptoma de Reguladores de
RNA
Petição 870210079066, de 27/08/2021, pág. 212/239 proteína apenas gRNA apenas ligado ligado não ligado não ligado 9/36
Petição 870210079066, de 27/08/2021, pág. 213/239 gRNA fora do alvo Fluc de alvejamento de gRNA gRNA fora do alvo Fluc de alvejamento de gRNA 10/36
Luciferase normalizada
Luciferase normalizada ligante helicoidal ligante helicoidal
Petição 870210079066, de 27/08/2021, pág. 214/239 Comprimento do alvejamento = Comprimento do alvejamento = Comprimento do alvejamento = Comprimento do alvejamento =
Luciferase normalizada 11/36
Luciferase normalizada
Luciferase normalizada Luciferase normalizada
Petição 870210079066, de 27/08/2021, pág. 215/239 Expressão normalizada Expressão normalizada gRNA fora do alvo
Expressão normalizada Luciferase normalizada Fluc de alvejamento de gRNA
Luciferase normalizada Expressão normalizada Luciferase normalizada citoplasmático
Expressão normalizada Expressão normalizada Expressão normalizada 12/36
Petição 870210079066, de 27/08/2021, pág. 216/239 Luciferase normalizada Modulação para Ctrl IP gRNA fora do alvo
Modulação para Ctrl IP gRNA no alvo
Expressão normalizada Expressão normalizada 13/36
Petição 870210079066, de 27/08/2021, pág. 217/239 Expressão normalizada Expressão normalizada gRNA fora do alvo gRNA no alvo
Mapa de transcrito Expressão normalizada 14/36
Petição 870210079066, de 27/08/2021, pág. 218/239 andaime hp Proteína Proteína de ligação Proteína de ligação de TAR efetora a grampo de RNA a ssRNA Nuclease de Proteína de ligação Proteína de ligação Pin morto a grampo de RNA a ssRNA Nuclease de Pin Proteína efetora sequência guia ligante
RNA alvo 15/36 β-defensina 3 andaime hp de SLBP β-defensina 3 humano β-defensina 3 Sistema de alvejamento de RNA β-defensina 3 sequência guia inspirado em CRISPR/Cas (CIRTS) β-defensina 3 ligante de alvejamento gRNA que não gRNA no alvo
Fração ligada
Vetor de gRNA mRNA de Fluc Proteína de (alvo) ligação a Petição 870210079066, de 27/08/2021, pág. 220/239 grampo de RNA Proteína de ligação a ssRNA Vetor de
CIRTS Proteína efetora mRNA de Rluc Repórter de (normalização) Luciferase normalizada Luciferase normalizada luciferase dupla gRNA que não de alvejamento Fluc de alvejamento de gRNA (Pin morto) (nuclease de Pin) 17/36 Luciferase normalizada Luciferase normalizada Luciferase normalizada Luciferase normalizada
Repórter de gRNA que luciferase Fluc morta não de
Petição 870210079066, de 27/08/2021, pág. 221/239 dupla alvejamento
Fluc de alvejamento de gRNA Edição de A-para-I alvejada 18/36
Repórter de Luciferase normalizada luciferase dupla
Petição 870210079066, de 27/08/2021, pág. 222/239 (nuclease de Pin) gRNA que não de gRNA no alvo gRNA que não de gRNA no alvo alvejamento alvejamento
Expressão normalizada 19/36
Expressão normalizada
Mapa de transcrito (nt)
normalizada Expressão de SMARCA4 gRNAs que degradação não de
Petição 870210079066, de 27/08/2021, pág. 224/239 alvejamento gRNAs degradação no alvo
Expressão normalizada degradação 21/36
Ativação da tradução gRNAs que não de alvejamento gRNAs no alvo Luciferase normalizada Expressão normalizada degradação
Petição 870210079066, de 27/08/2021, pág. 225/239 gRNA que não de gRNA no alvo alvejamento Repórter de luciferase SMARCA4 endógeno 22/36
Expressão normalizada
Luciferase normalizada
Petição 870210079066, de 27/08/2021, pág. 226/239 23/36
Reguladores de epitranscriptoma
Núcleo Nuclease Truncamento Truncamento de CIRTS de PIN de YTHDF1 de YTHDF2
Proteína Ligante Proteína de ligação Proteína de efetora a grampo de RNA ligação a ssRNA
Petição 870210079066, de 27/08/2021, pág. 227/239 Nuclease de Pin citoplasmática
Nuclease de Pin citoplasmática
Nuclease de Pin
Nuclease de Pin 24/36
Nuclease de Pin helicoidal helicoidal
Petição 870210079066, de 27/08/2021, pág. 228/239 Expressão normalizada Luciferase normalizada alvejamento gRNA que não de
Luciferase normalizada Expressão normalizada Luciferase normalizada Fluc de alvejamento de gRNA
Expressão normalizada citoplasmático
Expressão normalizada Expressão normalizada Expressão normalizada Expressão normalizada Luciferase normalizada Expressão normalizada 25/36 gRNA que não de Fluc de alvejamento de gRNA alvejamento
Petição 870210079066, de 27/08/2021, pág. 229/239 Luciferase normalizada Luciferase normalizada 26/36
Comprimento de alvejamento = Comprimento de alvejamento = Comprimento de alvejamento = Comprimento de alvejamento =
Luciferase normalizada Luciferase normalizada Luciferase normalizada
Luciferase normalizada
Petição 870210079066, de 27/08/2021, pág. 230/239 Expressão normalizada Luciferase normalizada alvejamento gRNA que não de
Expressão normalizada gRNA no alvo gRNA no alvo alvejamento gRNA que não de Expressão normalizada Nível de proteína normalizado alvejamento gRNA que não de
Nível de proteína normalizado gRNA no alvo 27/36
Variante de KRAS4b alvo (0 incompatibilidade): GAT alvo (1 incompatibilidade): GGT alvo (2 incompatibilidades): TGT alvo (3 incompatibilidades): TGG alvo alvo alvo alvo Luciferase normalizada alvo alvo alvo alvo Luciferase normalizada alvo alvo alvo alvo
Luciferase normalizada log2(tpm+1) de gRNA no alvo log2(tpm+1) de gRNA no alvo log2(tpm+1) de gRNA NT log2(tpm+1) de gRNA NT gRNA que não de gRNA no alvo alvejamento Expressão normalizada
Modulação para Ctrl IP Modulação para Ctrl IP
(nuclease de Pin)
Petição 870210079066, de 27/08/2021, pág. 233/239 Expressão normalizada alvejamento gRNA que não de gRNA no alvo
Expressão normalizada Expressão normalizada 30/36
Petição 870210079066, de 27/08/2021, pág. 234/239 β-defensina Expressão de Expressão de PPIB: SMARCA4: degradação β-defensina 31/36 degradação Escore de reconhecimento de célula T
Petição 870210079066, de 27/08/2021, pág. 235/239 Eficiência de edição relativa Eficiência de edição relativa estável 32/36
Sinal de Gluc Fluc/Rluc Normalizada
Luciferase Normalizada
Petição 870210079066, de 27/08/2021, pág. 237/239 Fluc/Rluc Normalizada Fluc/Rluc Normalizada 34/36
Domínio efetor
Proteína de ligação a ssRNA Proteína de ligação a grampo de RNA
Efeito sobre o mRNA repórter de luciferase Efeito sobre o mRNA de PPIB endógeno Fluc/Rluc Normalizada/%
Fluc/Rluc Normalizada/%
Petição 870210079066, de 27/08/2021, pág. 239/239 Fluorescência (a.u.) Ativação da tradução
Fluorescência (a.u.) Eficiência de edição relativa Não induzido
Edição de A-para-I Fluorescência (a.u.) Eficiência de edição relativa Degradação de RNA
(hADAR2 evoluiu) Edição de C-para-U 36/36
BR112021013173-6A 2019-01-04 2020-01-03 Sistemas e métodos para modular rna BR112021013173A2 (pt)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962788571P 2019-01-04 2019-01-04
US62/788,571 2019-01-04
US201962831342P 2019-04-09 2019-04-09
US62/831,342 2019-04-09
US201962903080P 2019-09-20 2019-09-20
US62/903,080 2019-09-20
US201962929339P 2019-11-01 2019-11-01
US62/929,339 2019-11-01
PCT/US2020/012169 WO2020142676A1 (en) 2019-01-04 2020-01-03 Systems and methods for modulating rna

Publications (1)

Publication Number Publication Date
BR112021013173A2 true BR112021013173A2 (pt) 2021-09-28

Family

ID=71407144

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021013173-6A BR112021013173A2 (pt) 2019-01-04 2020-01-03 Sistemas e métodos para modular rna

Country Status (12)

Country Link
US (1) US20220048962A1 (pt)
EP (1) EP3906042A4 (pt)
JP (1) JP2022516919A (pt)
KR (1) KR20210124238A (pt)
CN (1) CN113543797A (pt)
AU (1) AU2020204917A1 (pt)
BR (1) BR112021013173A2 (pt)
CA (1) CA3125299A1 (pt)
IL (1) IL284516A (pt)
MX (1) MX2021008153A (pt)
SG (1) SG11202107209WA (pt)
WO (1) WO2020142676A1 (pt)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230090706A1 (en) * 2020-02-28 2023-03-23 The University Of Chicago Methods and compositions comprising trans-acting translational activators
CN113583136A (zh) * 2021-04-25 2021-11-02 南方科技大学 一种植物激素脱落酸荧光分子探针及其用途
CA3234338A1 (en) * 2021-10-08 2023-04-13 Pencil Biosciences Limited Synthetic genome editing system
CN114085837B (zh) * 2021-11-19 2024-04-12 中山大学 一种敲除基因ythdf1的细胞系及其构建方法
WO2023150131A1 (en) * 2022-02-01 2023-08-10 The Regents Of The University Of California Method of regulating alternative polyadenylation in rna
WO2023164628A1 (en) * 2022-02-25 2023-08-31 The University Of Chicago Methods and compositions for activating translation
CN114685685B (zh) * 2022-04-20 2023-11-07 上海科技大学 编辑rna的融合蛋白及其应用
WO2023215712A2 (en) * 2022-05-02 2023-11-09 The University Of Chicago Systems and methods for modulating rna

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101844123B1 (ko) * 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
WO2014165825A2 (en) * 2013-04-04 2014-10-09 President And Fellows Of Harvard College Therapeutic uses of genome editing with crispr/cas systems
US20200291369A1 (en) * 2016-03-11 2020-09-17 Erasmus University Medical Center Rotterdam Improved CRISPR-Cas9 Genome Editing Tool
US11932856B2 (en) * 2017-03-03 2024-03-19 The Regents Of The University Of California RNA targeting of mutations via suppressor tRNAs and deaminases
KR20200006054A (ko) * 2017-04-12 2020-01-17 더 브로드 인스티튜트, 인코퍼레이티드 신규 타입 vi crispr 오르소로그 및 시스템
CN108559738A (zh) * 2018-02-12 2018-09-21 南昌大学 一种植物rna修饰和编辑的系统及方法

Also Published As

Publication number Publication date
EP3906042A4 (en) 2023-03-15
IL284516A (en) 2021-08-31
KR20210124238A (ko) 2021-10-14
AU2020204917A1 (en) 2021-08-19
MX2021008153A (es) 2021-08-11
CA3125299A1 (en) 2020-07-09
CN113543797A (zh) 2021-10-22
EP3906042A1 (en) 2021-11-10
JP2022516919A (ja) 2022-03-03
SG11202107209WA (en) 2021-07-29
US20220048962A1 (en) 2022-02-17
WO2020142676A1 (en) 2020-07-09

Similar Documents

Publication Publication Date Title
US20220048962A1 (en) Systems and methods for modulating rna
Rauch et al. Programmable RNA-guided RNA effector proteins built from human parts
JP7094323B2 (ja) 最適化機能CRISPR-Cas系による配列操作のための系、方法および組成物
US11149259B2 (en) CRISPR-Cas systems and methods for altering expression of gene products, structural information and inducible modular Cas enzymes
CN116590257B (zh) VI-E型和VI-F型CRISPR-Cas系统及其用途
JP6914274B2 (ja) Crisprcpf1の結晶構造
US11434484B2 (en) Three-component CRISPR/Cas complex system and uses thereof
JP6878468B2 (ja) 標的ゲノム修飾を増強するためのプログラム可能なdna結合タンパク質の使用
JP2023027277A (ja) Rna誘導型核酸修飾酵素及びその使用方法
US20180057810A1 (en) Functional screening with optimized functional crispr-cas systems
JP2021503278A (ja) CasZ組成物及び使用方法
CA3026110A1 (en) Novel crispr enzymes and systems
CN111902536A (zh) 用于真核基因组修饰的改造的cas9系统
BR112019028146A2 (pt) rna guia sintético para sistemas ativadores de crispr/cas
JP2023538964A (ja) 真核生物ゲノム工学のための合成小型crispr-cas(casmini)システム
CN116249776A (zh) CRISPR/Cas系统及其用途
AU2022245243A1 (en) Novel crispr enzymes, methods, systems and uses thereof
Mistry et al. Nucleic Acid Editing
WO2023215712A2 (en) Systems and methods for modulating rna
Vermaak et al. A surrogate approach to study the evolution of noncoding DNA elements that organize eukaryotic genomes
CN117916372A (zh) 无切割活性的cas12f1、基于无切割活性的cas12f1的融合蛋白、包括其的crispr基因编辑系统及其制备方法和用途
TW202346588A (zh) 基因組編輯的組成物和方法
Mistry et al. Nucleic Acid Editing 11