BR112021010186A2 - Agente de corte de dna, métodos associados e seus usos - Google Patents

Agente de corte de dna, métodos associados e seus usos Download PDF

Info

Publication number
BR112021010186A2
BR112021010186A2 BR112021010186-1A BR112021010186A BR112021010186A2 BR 112021010186 A2 BR112021010186 A2 BR 112021010186A2 BR 112021010186 A BR112021010186 A BR 112021010186A BR 112021010186 A2 BR112021010186 A2 BR 112021010186A2
Authority
BR
Brazil
Prior art keywords
sequence
dna
protein
amino acid
dfcas9
Prior art date
Application number
BR112021010186-1A
Other languages
English (en)
Inventor
Konstantin Viktorovich SEVERINOV
Georgii Evgenevich POBEGALOV
Anatolii Nikolaevich ARSENIEV
Polina Anatolevna SELKOVA
Aleksandra Andreevna VASILEVA
Tatiana Olegovna ARTAMONOVA
Marina Viktorovna ABRAMOVA
Sergey Anatolevich SHMAKOV
Daria Nikolaevna ARTAMONOVA
Ignatiy Igorevich GORYANIN
Olga Sergeevna MUSHAROVA
Iuliia Valerevna PISKUNOVA
Iana Vitalevna FEDOROVA
Tatyana Igorevna ZYUBKO
Mikhail Alekseevich KHODORKOVSKIY
Original Assignee
Joint Stock Company Biocad
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Joint Stock Company Biocad filed Critical Joint Stock Company Biocad
Publication of BR112021010186A2 publication Critical patent/BR112021010186A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

agente de corte de dna, métodos associados e seus usos. a presente invenção descreve uma nova nuclease bacteriana do sistema crispr-cas9 da bactéria defluviimonas sp. 20v17, bem como a sua utilização para formar quebras de cadeia dupla estritamente específicas numa molécula de dna. esta nuclease tem propriedades incomuns e pode ser usada como uma ferramenta para introduzir modificações em locais estritamente definidos na sequência de dna genômico de organismos unicelulares ou multicelulares. assim, a versatilidade dos sistemas crispr-cas9 disponíveis é aumentada, o que permitirá o uso de nucleases cas9 de vários organismos para o corte de dna genômico ou plasmídeo em um maior número de locais e condições específicas.

Description

AGENTE DE CORTE DE DNA, MÉTODOS ASSOCIADOS E SEUS USOS CAMPO DA INVENÇÃO
[001] A invenção se refere à biotecnologia, especificamente a novas enzimas de nuclease Cas do sistema CRISPR-Cas, usadas para cortar DNA e editar o genoma de vários organismos. Esta técnica pode ser usada no futuro para terapia gênica de doenças humanas hereditárias, bem como para editar o genoma de outros organismos.
ESTADO DA TÉCNICA
[002] A modificação de uma sequência de DNA é um dos atuais problemas no campo da biotecnologia. A edição e modificação do genoma de organismos eucarióticos e procarióticos, bem como a manipulação de DNA in vitro, requerem a introdução direcionada de quebras de fita dupla em uma sequência de DNA.
[003] Para resolver este problema, as seguintes técnicas são atualmente usadas: sistemas de nuclease artificial contendo domínios do tipo zinc finger, sistemas TALEN e sistemas bacterianos CRISPR-Cas. As duas primeiras técnicas requerem otimização laboriosa de uma sequência de aminoácidos de nuclease para o reconhecimento de uma sequência de DNA específica. Em contraste, se tratando de sistemas CRISPR-Cas, as estruturas que reconhecem um DNA alvo não são proteínas, mas RNAs guia curtos. O corte de um DNA alvo particular não requer a síntese de novo de nuclease ou seu gene, mas é feito por meio do uso de RNAs guia complementares à sequência alvo. Isso torna os sistemas CRISPR-Cas um meio conveniente e eficiente para o corte de várias sequências de DNA. A técnica permite o corte simultâneo de DNA em várias regiões usando RNAs guia de diferentes sequências. Essa abordagem também é usada para modificar simultaneamente vários genes em organismos eucarióticos.
[004] Por sua natureza, os sistemas CRISPR-Cas são sistemas imunológicos procarióticos capazes de introduzir rupturas altamente específica em um material genético viral (Mojica FJM et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements // Journal of molecular evolution. - 2005. -
Vol. 60. - Edição 2. - pp. 174-182). A abreviatura CRISPR-Cas vem de "Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated Genes" (Jansen R. et al. Identification of genes that are associated with DNA repeats in prokaryotes //Molecular microbiology. - 2002. - Vol. 43. - Edição 6. - pp. 1565-1575). Todos os sistemas CRISPR- Cas consistem em cassetes CRISPR e genes que codificam várias proteínas Cas (Jansen R. et al., Molecular microbiology. - 2002. - Vol. 43. - Issue 6. - pp. 1565-1575). Os cassetes CRISPR consistem em espaçadores, cada um com uma sequência única de nucleotídeos e repetições palindrômicas (Jansen R. et al., Molecular microbiology. - 2002. - Vol. 43. - Edição 6. - pp. 1565-1575). A transcrição de cassetes CRISPR seguida do processamento dos mesmos resulta na formação de crRNAs guia, que juntamente com as proteínas Cas formam um complexo efetor (Brouns SJJ et al. Small CRISPR RNAs guide antiviral defense in prokaryotes / / Science. - 2008. - Vol. 321. - Edição 5891. - pp. 960-964). Devido ao emparelhamento complementar entre o crRNA e um sítio do DNA alvo, que é chamado de protoespaçador, a nuclease de Cas reconhece um DNA alvo e introduz nele uma quebra de forma altamente específica.
[005] Os sistemas CRISPR-Cas com uma única proteína efetora são agrupados em seis tipos diferentes (tipos I-VI), dependendo das proteínas Cas que estão incluídas nos sistemas. O sistema CRISPR-Cas9 tipo II é caracterizado por sua composição e mecanismo de atividade simples, ou seja, seu funcionamento requer a formação de um complexo efetor que consiste em apenas uma proteína Cas9 e dois RNAs curtos como segue: crRNA e RNA rastreador (tracrRNA). O RNA rastreador emparelha-se complementarmente com uma região de crRNA, originada da repetição CRISPR, para formar uma estrutura secundária necessária para a ligação de RNAs guia ao efetor Cas. A proteína efetora Cas9 é uma endonuclease de DNA RNA-dependente com dois domínios de nuclease (HNH e RuvC) que introduzem quebras nas fitas complementares do DNA alvo, formando assim uma quebra de DNA de fita dupla (Deltcheva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III // Nature. - 2011. - Vol. 471. - Edição 7340. - p. 602).
[006] Até o momento, várias nucleases CRISPR-Cas são conhecidas por serem capazes de introduzir quebras de fita dupla no DNA de forma direcionada e específica. Uma das principais características que limitam o uso de sistemas CRISPR-Cas é uma sequência
PAM que flanqueia um DNA alvo na extremidade 3' e cuja presença é necessária para o correto reconhecimento do DNA pela nuclease Cas9. Várias proteínas CRISPR-Cas têm diferentes sequências PAM que limitam o potencial de uso das nucleases em quaisquer regiões desejada do DNA. A utilização de proteínas CRISPR-Cas com diversas novas sequências PAM é necessária para permitir a modificação de qualquer região desejada do DNA, tanto in vitro como no genoma de organismos vivos. A modificação de genomas eucarióticos também requer o uso de nucleases de pequeno tamanho para fornecer a entrega AAV-mediada de sistemas CRISPR-Cas nas células.
[007] Embora sejam conhecidas uma série de técnicas para cortar DNA e modificar uma sequência de DNA genômica, ainda há uma necessidade por novos meios eficazes para modificar o DNA em vários organismos e em locais estritamente específicos de uma sequência de DNA. Esta invenção fornece uma série de propriedades necessárias para resolver este problema.
RESUMO DA INVENÇÃO
[008] O objetivo da presente invenção é fornecer novos meios para modificar uma sequência de DNA genômico de organismos unicelulares ou multicelulares usando sistemas CRISPR-Cas9. Os sistemas atuais são de uso limitado devido a uma sequência PAM específica que deve estar presente na extremidade 3' de uma região de DNA a ser modificada. A pesquisa de novas enzimas Cas9 com outras sequências PAM irá expandir a gama de meios disponíveis para a formação de uma quebra de fita dupla em locais desejados e altamente específicos em moléculas de DNA de vários organismos. Para resolver este problema, os autores caracterizaram a nuclease DfCas9 do CRISPR tipo II previamente predita para Defluviimonas sp. 20V17, que pode ser usado para introduzir modificações dirigidas no genoma dos organismos acima e de outros organismos. A presente invenção é caracterizada por ter as seguintes características essenciais: (a) sequência PAM curta diferente de outras sequências PAM conhecidas; (b) tamanho relativamente pequeno da proteína caracterizada DfCas9, correspondendo a 1079 resíduos de aminoácidos (a.a.r.).
[009] O referido problema é resolvido usando uma proteína compreendendo a sequência de aminoácidos de SEQ ID NO: 1, ou compreendendo uma sequência de aminoácidos que é pelo menos 95% idêntica à sequência de aminoácidos de SEQ ID NO: 1 e difere de SEQ ID NO: 1 apenas em resíduos de aminoácidos não conservados, para formar uma quebra de fita dupla em uma molécula de DNA, localizada imediatamente antes da sequência de nucleotídeos 5'-NN(G/A)NA(C/T)N-3' na referida molécula de DNA. Em algumas configurações da invenção, esta utilização é caracterizada pela quebra de fita dupla ser formada em uma molécula de DNA a uma temperatura de 35°C a 37°C e na presença de íons Mn2 +. Em configurações preferidas da invenção, este uso é caracterizado pelo fato de que a concentração de íons Mn2 + é maior do que 5 mM.
[010] O referido problema é ainda resolvido fornecendo um método para gerar uma quebra de fita dupla em uma sequência de DNA genômico de um organismo unicelular ou multicelular diretamente adjacente à sequência 5'-NN(G/A)NA(C/T)N-3', compreendendo a introdução em pelo menos uma célula do referido organismo de uma quantidade eficaz de: a) proteína compreendendo a sequência de aminoácidos de SEQ ID NO: 1, ou um ácido nucleico que codifica a proteína compreendendo a sequência de aminoácidos de SEQ ID NO: 1, e b) RNA guia compreendendo uma sequência que forma um duplex com a sequência de nucleotídeos da região de DNA genômico de um organismo, que é diretamente adjacente à sequência de nucleotídeos 5'- NN(G/A)NA(C/T)N-3' e interage com a referida proteína após a formação do duplex, ou uma sequência de DNA que codifica o referido RNA guia, em que a interação entre a referida proteína com o RNA guia e a sequência de nucleotídeos 5'-NN(G/A)NA(C/T)N- 3' resulta na formação de uma quebra de fita dupla na sequência de DNA genômico diretamente adjacente à sequência 5'-NN(G/A)NA(C/T)N-3'. Em algumas configurações da invenção, o método é caracterizado por compreender ainda a introdução de uma sequência de DNA exógena simultaneamente com o RNA guia.
[011] Uma mistura de crRNA e RNA rastreador (tracrRNA), que pode formar um complexo com uma região de DNA alvo e proteína DfCas9, pode ser usada como um RNA guia. Em configurações preferidas da invenção, um RNA híbrido construído com base em crRNA e RNA rastreador pode ser usado como um RNA guia. Os métodos para a construção de um RNA guia híbrido são conhecidos pelos versados na arte (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Set; 31 (9): 827-32). Uma das abordagens para a construção de um RNA híbrido foi descrita nos Exemplos abaixo.
[012] A invenção pode ser usada para corte in vitro de DNA alvo e para modificar o genoma de algum organismo vivo. O genoma pode ser modificado de forma direta, isto é, cortando o genoma em um local correspondente, bem como inserindo uma sequência de DNA exógena por meio de reparo homólogo.
[013] Qualquer região de DNA de fita dupla ou de fita simples do genoma de um organismo diferente daquele usado para administração (ou uma composição de tais regiões entre si e com outros fragmentos de DNA) pode ser usada como uma sequência de DNA exógena, em que a referida região (ou composição de regiões) se destina a ser integrada no local de uma quebra de fita dupla no DNA alvo, induzida pela nuclease DfCas9. Em algumas configurações da invenção, uma região de DNA de fita dupla do genoma de um organismo usado para a introdução da proteína DfCas9, mas posteriormente modificada por mutações (substituição de nucleotídeos), bem como por inserções ou deleções de um ou mais nucleotídeos, podem ser usados como uma sequência de DNA exógena.
[014] O resultado técnico da presente invenção é o aumento da versatilidade dos sistemas CRISPR-Cas9 disponíveis para permitir o uso de nuclease Cas9 para cortar DNA genômico ou plasmídeo em um maior número de locais específicos e condições específicas.
BREVE DESCRIÇÇÃO DOS DESENHOS
[015] Fig. 1. Esquema de loci CRISPR em Defluviimonas sp.
[016] Fig. 2. Desenvolvimento de um sistema de corte de DNA limitado à sequência NN(G/A)NA(C/T)N.
[017] Fig. 3. Esquema de interação entre o RNA guia e uma região do DNA alvo.
[018] Fig. 4. Dependência da eficiência da reação de corte de DNA na presença de íons.
[019] Fig. 5. Verificação da atividade da proteína no corte de vários alvos de DNA.
[020] Fig. 6. Reações de corte in vitro de um fragmento de DNA do gene humano grin2b.
[021] Fig. 7. Efeito da concentração de íons na eficiência da reação de corte de DNA.
[022] Fig. 8. Seleção da sequência de sgRNA.
[023] Fig. 9. Alinhamento das porções iniciais das sequências da proteína Cas9 de organismos Staphylococcus aureus (SaCas9), Campylobacter jejuni (CjCas9) e DfCas9. Regiões não conservadas de sequências estão sublinhadas.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[024] Conforme usado na descrição da presente invenção, os termos "inclui" e "incluindo" devem ser interpretados como significando "inclui, entre outras coisas". Os referidos termos não devem ser interpretados como "consiste apenas em". A menos que definidos separadamente, os termos técnicos e científicos neste pedido têm significados típicos geralmente aceitos na literatura científica e técnica.
[025] Tal como aqui utilizado, o termo "percentagem de homologia de duas sequências" é equivalente ao termo "percentagem de identidade de duas sequências". A identidade das sequências é determinada com base em uma sequência de referência. Algoritmos para análise de sequência são conhecidos na técnica, tais como BLAST descrito em Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990). Para os fins da presente invenção, para determinar o nível de identidade e semelhança entre sequências de nucleotídeos e sequências de aminoácidos, a comparação de sequências de nucleotídeos e de aminoácidos pode ser usada, sendo realizada pelo pacote de software BLAST fornecido pelo National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/blast) usando alinhamento de espaçamentos com parâmetros padrão. A identidade percentual de duas sequências é determinada pelo número de posições de aminoácidos idênticos nessas duas sequências, levando em consideração o número de espaçamentos e o comprimento de cada espaçamento a ser inserida para comparação ideal por alinhamento das duas sequências. A identidade percentual é igual para o número de aminoácidos idênticos em determinadas posições, levando em consideração o alinhamento da sequência dividido pelo número total de posições e multiplicado por 100.
[026] O termo "hibridiza especificamente" refere-se à associação entre duas moléculas de ácido nucleico de fita simples ou sequências suficientemente complementares, o que permite tal hibridização sob condições pré-determinadas tipicamente usadas na técnica.
[027] A frase "uma quebra de fita dupla localizada imediatamente antes da sequência de nucleotídeo PAM" significa que uma quebra de fita dupla em uma sequência de DNA alvo será feita a uma distância de 0 a 25 nucleotídeos antes da sequência de nucleotídeo PAM.
[028] Uma sequência de DNA exógena introduzida simultaneamente com um RNA guia pretende se referir a uma sequência de DNA preparada especificamente para a modificação específica de um DNA alvo de fita dupla no local de quebra determinado pela especificidade do RNA guia. Tal modificação pode ser, por exemplo, uma inserção ou deleção de certos nucleotídeos no local de uma quebra no DNA alvo. O DNA exógeno pode ser uma região de DNA de um organismo diferente ou uma região de DNA do mesmo organismo do DNA alvo.
[029] Uma proteína compreendendo uma sequência de aminoácidos específica pretende se referir a uma proteína possuindo uma sequência de aminoácidos composta pela referida sequência de aminoácidos e possivelmente outras sequências ligadas por ligações peptídicas à referida sequência de aminoácidos. Um exemplo de outras sequências pode ser um sinal de localização nuclear (NLS), ou outras sequências que fornecem funcionalidade aumentada para a referida sequência de aminoácidos.
[030] Uma sequência de DNA exógena introduzida simultaneamente com um RNA guia pretende se referir a uma sequência de DNA preparada especificamente para a modificação específica de um DNA alvo de fita dupla no local de quebra determinado pela especificidade do RNA guia. Tal modificação pode ser, por exemplo, uma inserção ou deleção de certos nucleotídeos no local de uma quebra no DNA alvo. O DNA exógeno pode ser uma região de DNA de um organismo diferente ou uma região de DNA do mesmo organismo do DNA alvo.
[031] Uma quantidade eficaz de proteína e RNA introduzida em uma célula pretende se referir a tal quantidade de proteína e RNA que, quando introduzida na referida célula, será capaz de formar um complexo funcional, ou seja, um complexo que se ligará especificamente ao DNA alvo e produzirá nele uma quebra de fita dupla no local determinado pelo RNA guia e a sequência PAM no DNA. A eficiência deste processo pode ser avaliada através da análise do DNA alvo isolado da referida célula usando técnicas convencionais conhecidas pelos versados na arte.
[032] Uma proteína e RNA podem ser entregues a uma célula por várias técnicas. Por exemplo, uma proteína pode ser entregue como um plasmídeo de DNA que codifica um gene desta proteína, como um mRNA para tradução desta proteína no citoplasma celular ou como um complexo de ribonucleoproteína que inclui esta proteína e um RNA guia. A entrega pode ser realizada por várias técnicas conhecidas pelos versados na arte.
[033] Os componentes do sistema de codificação de ácido nucleico podem ser introduzidos em uma célula direta ou indiretamente da seguinte forma: por meio de transfecção ou transformação de células por métodos conhecidos pelos versados na arte, por meio do uso de um vírus recombinante, por meio de manipulações na célula, como microinjeção de DNA etc.
[034] Um complexo ribonucleico que consiste em uma nuclease e RNAs guia e DNA exógeno (se necessário) pode ser entregue por meio de transfecção dos complexos em uma célula ou por meio de introdução mecânica do complexo em uma célula, por exemplo, por meio de microinjeção.
[035] Uma molécula de ácido nucleico que codifica a proteína a ser introduzida em uma célula pode ser integrada no cromossomo ou pode ser DNA extracromossômica replicante. Em algumas configurações, para garantir a expressão eficaz do gene da proteína com o DNA introduzido em uma célula, é necessário modificar a sequência do referido DNA de acordo com o tipo de célula, a fim de otimizar os códons para a expressão, o que ocorre devido às frequências desiguais de ocorrência de códons sinônimos nas regiões codificantes do genoma de vários organismos. A otimização do códon é necessária para aumentar a expressão em células de animais, plantas, fungos ou microrganismos.
[036] Para que uma proteína que tem uma sequência que é pelo menos 95% idêntica à sequência de aminoácidos de SEQ ID NO: 1 funcione em uma célula eucariótica, é necessário que essa proteína chegue no núcleo desta célula. Portanto, em algumas configurações da invenção, uma proteína tendo uma sequência que é pelo menos 95%
idêntica à sequência de aminoácidos de SEQ ID NO: 1 e que é ainda modificada em uma ou ambas as extremidades pela adição de um ou mais núcleos sinais de localização são usados para formar quebras de fita dupla no DNA alvo. Por exemplo, um sinal de localização nuclear do vírus SV40 pode ser usado. Para fornecer entrega eficiente ao núcleo, o sinal de localização nuclear pode ser separado da sequência principal da proteína por uma sequência espaçadora, por exemplo, descrita em Shen B, et al. "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", Cell Res. maio de 2013; 23 (5): 720-3. Além disso, em outras configurações, um sinal de localização nuclear diferente ou um método alternativo para entregar a referida proteína no núcleo da célula pode ser usado.
[037] A presente invenção envolve o uso de uma proteína de Defluviimonas sp. organismo 20V17, que é homóloga às proteínas Cas9 previamente caracterizadas, para introduzir quebras de fita dupla em moléculas de DNA em posições altamente especificadas. O uso de nucleases CRISPR para introduzir modificações direcionadas ao genoma tem uma série de vantagens. Em primeiro lugar, a especificidade da atividade do sistema é determinada por uma sequência de crRNA, que permite o uso de um tipo de nuclease para todos os loci alvo. Em segundo lugar, a técnica permite a entrega de vários RNAs guia complementares a diferentes genes alvo em uma célula ao mesmo tempo, assim, tornando possível modificar simultaneamente vários genes de uma só vez.
[038] Para a caracterização bioquímica da proteína Cas9 da bactéria Defluviimonas sp. 20V17, o locus CRISPR que codifica os principais componentes do sistema (genes das proteínas DfCas9, cas1, cas2, bem como cassete CRISPR e RNAs guia) foi clonada no vetor bacteriano de cópia única pACYC184. O complexo ribonucleico efetor que consiste em Cas9 e um duplex crRNA / tracrRNA requer a presença de PAM (motivo ajustado por protoespaçador) em um DNA alvo para reconhecimento e hidrólise subsequente de DNA, além da complementaridade espaçador-protoespaçador de crRNA. (Mojica F. J. M. et al. Short motif sequences determine the targets of the prokaryotic CRISPR defence system //Microbiology. - 2009. - Vol. 155. - Edição 3. - pp. 733-740). PAM é uma sequência altamente definida de vários nucleotídeos localizada em sistemas do tipo II adjacentes ou vários nucleotídeos longe da extremidade 3' do protoespaçador em uma cadeia off-target. Na ausência de PAM, não ocorre a hidrólise das ligações de DNA com a formação de uma quebra de fita dupla. A necessidade da presença de uma sequência PAM em um alvo aumenta a especificidade de reconhecimento, mas ao mesmo tempo impõe restrições na seleção de regiões de DNA alvo para a introdução de uma quebra.
[039] Para determinar as sequências do RNA guia do sistema CRISPR-Cas9, o sequenciamento de RNA da bactéria E.coli DH5-alpha portando o construto DfCas9_pacyc184 gerado foi realizado. O sequenciamento mostrou que o cassete CRISPR do sistema foi transcrito ativamente, assim como o RNA rastreador (Fig. 1). A análise da sequência de crRNA e tracrRNA permitiu contemplar que possivelmente podem formar estruturas secundárias reconhecidas pela nuclease DfCas9.
[040] Além disso, os autores determinaram a sequência PAM da proteína DfCas9 usando triagem de PAM bacteriana. A fim de determinar a sequência PAM da proteína DfCas9, células de E.coli DH5alpha portando o plasmídeo DfCas9_pacyc184 foram transformadas por uma biblioteca de plasmídeos contendo a sequência espaçadora 5'- TAGACCTTCGGGATCATGTCGATCATGATC-3' do cassete CRISPR do sistema DfCas9 flanqueado por uma sequência aleatória de sete letras nas extremidades 5' ou 3'. Plasmídeos portadores de uma sequência correspondente à sequência PAM do sistema DfCas9 foram submetidos à degradação sob a ação do sistema CRISPR-Cas funcional, enquanto os plasmídeos restantes da biblioteca foram efetivamente transformados em células, conferindo-lhes resistência ao antibiótico ampicilina. Após transformação e incubação das células em placas contendo o antibiótico, as colônias foram lavadas da superfície do ágar e o DNA foi extraído usando o kit Qiagen Plasmid Purification Midi. As regiões contendo a sequência PAM randomizada foram amplificadas por PCR a partir do conjunto isolado de plasmídeos e, em seguida, submetidas a sequenciamento de high- throughput na plataforma Illumina. As leituras resultantes foram analisadas comparando a eficiência da transformação de plasmídeos com PAMs únicos incluídos na biblioteca em células com DfCas9_pacyc184 ou em células de controle com o vetor vazio pacyc184. Os resultados foram analisados por meio de métodos de bioinformática. Como resultado, foi possível identificar o sistema PAM do DfCas9, que era uma sequência de três letras 5'-NN(G/A)NA(C/T)N-3' (Fig. 2).
[041] Para desenvolver um sistema de corte de DNA in vivo e in vitro, é necessário obter todos os componentes que fazem parte do complexo efetor DfCas9, conforme indicado: RNAs guia e nuclease DfCas9. A determinação da sequência de RNA guia por sequenciamento de RNA possibilitou a síntese de moléculas de crRNA e tracrRNA in vitro. A síntese foi realizada usando o kit de síntese de RNA NEB HiScribe T7.
[042] Para cortar os alvos de DNA limitados a partir da extremidade 3' até a sequência NN(G/A)NA(C/T)N, os RNAs guia com a seguinte sequência foram usados: tracrRNA 5'UCCUAGCAGAAGAAGCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCACACCAUUGG GGCAGGCUGCGGCCUGCCCCAUCUGUUU3' e crRNA 5'uaucuccuuucauugagcacGUCCGGGCUUGGCCACGCCGCUUC-3'.
[043] Os primeiros 20 nucleotídeos que estão incluídos na sequência de crRNA são emparelhados complementarmente com a sequência correspondente no DNA alvo e fornecem reconhecimento específico dos mesmos pela nuclease DfCas9. Se for desejado cortar um DNA alvo diferente, esta sequência espaçadora de 20 letras é modificada (Fig. 3).
[044] Para obter uma proteína DfCas9 recombinante, um gene desta foi clonado no plasmídeo pET21a. As células de E. coli Rosetta foram transformadas pelo plasmídeo resultante DfCas9_pET21a. As células contendo o plasmídeo foram cultivadas até uma densidade óptica de OD600 = 0,6, então a expressão do gene DfCas9 foi induzida pela adição de IPTG a uma concentração de 1 mM. As células foram incubadas durante 4 horas a 25°C, sendo em seguida lisadas. A proteína recombinante foi purificada em duas etapas da seguinte forma: por cromatografia de afinidade (Ni-NTA) e por exclusão por tamanho de proteína em uma coluna Superdex 200. A proteína resultante foi concentrada usando filtros Amicon de 30 kDa. Depois disso, a proteína foi congelada a menos 80°C e usada para reações in vitro.
[045] Como um DNA alvo, um fragmento de DNA de fita dupla com um comprimento de 378 pares de bases (pb) foi usado, carregando a sequência do protoespaçador a uma distância de cerca de 30pb da extremidade 3', limitada à sequência PAM correspondente conforme determinado em experimentos com bactérias: NN(G/A)NA(C/T)N.
[046] Sequência DNA alvo: 5’cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaagtgcccacg aggatgacagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggccaacac caaccagaacttgggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgcaaacacaaagaaagagc atgttaaaataggatctacatcacgtaacctgtcttagaagaggctagatactgcaattcaaggaccttatctcctttcattga gcacAAAAACGaactccatctaccagcctactctcttatctctggtatt -3’.
[047] A presença de íons divalentes é necessária para a atividade dos domínios de nuclease das proteínas Cas9. Nesse sentido, as reações in vitro de corte do DNA alvo foram realizadas na presença de sais de magnésio, manganês, cálcio e zinco. A reação in vitro de corte do DNA alvo foi realizada nas seguintes condições: 1x Tampão Tris-HCl, pH = 7.9 (a 25°C) 400 nM DfCas9 20 nM DNA alvo 2 µM crRNA 2 µM tracrRNA mM sal do íon correspondente
[048] O volume total da reação foi de 20 µl, a duração da reação foi de 30 minutos e a temperatura de incubação foi 37°C.
[049] Os produtos da reação foram aplicados em gel de agarose a 1,5% e submetidos à eletroforese. Se o corte do DNA alvo foi bem-sucedido, o fragmento se dividiu em duas porções, uma das quais (cerca de 325bp de comprimento) formou uma banda distinguível no gel (Fig. 4). Os resultados dos experimentos mostraram que a proteína DfCas9 requer, para sua atividade, íons de manganês em vez de íons de magnésio, o que é uma propriedade incomum para nucleases Cas9 caracterizadas até o momento.
[050] Para confirmar a importância de diferentes sequências PAM de DfCas9, os experimentos foram conduzidos no corte in vitro de alvos de DNA, semelhantes aos usados anteriormente, mas compreendendo mutações pontuais (nucleotídeo único) na sequência PAM 5'-AAAAACG-3' (Fig. 5).
[051] Os resultados do experimento confirmaram que a enzima DfCas9 é capaz de introduzir quebras de fita dupla em sequências de DNA limitadas à sequência PAM NN(G/A)NA(C/T)N na extremidade 3'. As substituições nas posições 3, 5 e 6 do PAM são críticas para o complexo efetor DfCas9 e evitam o corte eficaz do DNA alvo.
[052] Além disso, os experimentos foram conduzidos para encontrar a temperatura ideal para a atividade DfCas9: se verificou como sendo 35-37°C, o que abre perspectivas para o uso de DfCas9 nas células humanas.
[053] As seguintes configurações exemplificativas do método são fornecidas com o propósito de revelar as características da presente invenção e não devem ser interpretadas de forma alguma como limitando o escopo da invenção.
[054] Exemplo 1. Testando a atividade da proteína DfCas9 no corte de vários alvos de DNA.
[055] A fim de testar a capacidade do DfCas9 de reconhecer diferentes sequências de DNA flanqueadas pelo motivo 5’-NN(G/A)NA(C/T)N-3’, experimentos foram conduzidos em corte in vitro de alvos de DNA de uma sequência do gene grin2b humano (ver Tabela 1).
[056] Tabela 1. Alvos de DNA isolados do gene humano grin2b.
DNA alvo PAM attttctctcattctgcaga gcaaata tctaagacaggttacgtgat gtagatc aatgaaaggagataaggtcc ttgaatt caccttttattgccttgttc aaggatt ggcattgctgtcatcctcgt gggcact ttgcagtatctagcctcttc taagaca
[057] As reações de corte de DNA in vitro foram realizadas em condições semelhantes aos experimentos anteriores. Um crRNA guia foi sintetizado para cada uma das sequências alvo. Um fragmento do gene humano grin2b de cerca de 760pb de tamanho foi usado como um DNA alvo: 5’ttgtctctgcctgtagctgccaatgactatagcaatagcaccttttattgccttgttcaaggatttctgaggcttttgaaagtt tcattttctctcattctgcagagcaaataccagagataagagagtaggctggtagatggagttgggtttggtgctcaatgaaa ggagataaggtccttgaattgcagtatctagcctcttctaagacaggttacgtgatgtagatcctattttaacatgctctttctt tgtgtttgcagggagtcgacgagttgaagatgaagcccagagcggagtgctgttctcccaagttctggttggtgttggccgtc ctggccgtgtcaggcagcagagctcgttctcagaagagcccccccagcattggcattgctgtcatcctcgtgggcacttccga cgaggtggccatcaaggatgcccacgagaaagatgatttccaccatctctccgtggtaccccggg - 3’.
[058] Sequências flanqueadas na extremidade 3' por regiões de DNA correspondentes à sequência PAM 5’-NN(G/A)NA(C/T)N-3’ foram selecionados como alvos de DNA. Apenas duas das seis sequências selecionadas foram efetivamente cortadas pela proteína DfCas9: fragmentos de DNA do tamanho apropriado cortado pelo complexo efetor são visíveis no gel (Fig. 6). A seletividade no corte de diferentes alvos pode ser explicada pela diferente eficiência no reconhecimento da DfCas9 de diferentes estruturas secundárias de DNA, ou por outras razões. A seletividade DfCas9 no corte de diferentes alvos pode aumentar a especificidade da proteína ao cortar os genomas de células eucarióticas.
[059] Assim, DfCas9 em combinação com RNAs guia é um novo meio para cortar um DNA de fita dupla limitado à sequência 5’-NN(G/A)NA(C/T)N-3’ com uma faixa característica de temperatura de atividade de 35°C a 37°C.
[060] Exemplo 2. Efeito da concentração de íons Mn2+ na funcionalidade de nuclease.
[061] Para testar o efeito dos íons Mn2+ na atividade da nuclease DfCas9, os experimentos foram realizados in vitro no corte de um fragmento de DNA de fita dupla contendo uma sequência de DNA alvo limitada à sequência PAM AAAAAC que tem a sequência de consenso 3’- NN(G/A)NA(C/T) -5’. A reação foi realizada usando um tampão CutSmart 1x (NEB), DNA alvo a uma concentração de 20 nM e trRNA/crRNA a uma concentração de 2 μM.
[062] Como DNA alvo, usamos 5’aataccagagataagagagtaggctggtagatggagttCGTTTTTgtgctcaatgaaaggagataaggtccttgaatt gcagtatctagcctcttctaagacaggttacgtgatgtagatcctattttaacatgctctttctttgtgtttgcagggagtcgac gagttgaagatgaagcccagagcggagtgctgttctcccaagttctggttggtgttggccgtcctggccgtgtcaggcagca gagctcgttctcagaagagcccccccagcattggcattgctgtcatcctcgtgggcacttccgacgaggtggccatcaagga tgcccacgagaaagatgatttccaccatctctccgtggtaccccggg -3’.
[063] A reação usou tracrRNA: 5’UCCUAGCAGAAGAAGCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCACACCAUUGG GGCAGGCUGCGGCCUGCCCCAUCUGUUU-3' e crRNA: 5’-uaucuccuuucauugagcacGUCCGGGCUUGGCCACGCCGCUUC-3'.
[064] A Fig. 7 mostra que um aumento na concentração de MnCl2 de 5 mM para 10 mM resulta em um corte mais eficiente do DNA alvo, enquanto um aumento adicional na concentração de íons divalentes não influencia a eficiência da reação. Assim, a atividade DfCas9 eficaz requer a presença de íons manganês a uma concentração de 10 mM ou mais.
[065] Exemplo 3. Uso de RNA guia híbrido para cortar um DNA alvo.
[066] sgRNA é uma forma de RNAs guia, que é tracrRNA (RNA traçador) e crRNA fundidos. Para selecionar o sgRNA ideal, construímos três variantes desta sequência, que diferiam no comprimento do duplex tracrRNA-crRNA. Os RNAs foram sintetizados in vitro e os experimentos foram realizados neles no corte do DNA alvo (a Figura 8 mostra as reações de corte de DNA por DfCas9 usando várias variantes de sgRNA).
[067] O sgRNA3 selecionado foi tão eficaz quanto as sequências de tracrRNA e crRNA nativas, com o corte de mais de 50% do DNA alvo.
[068] Esta variante de sgRNA pode ser usada para cortar qualquer outro DNA alvo ao modificar uma sequência que emparelha diretamente com o DNA alvo.
[069] As seguintes sequências de RNA foram usadas como RNAs híbridos:
1 - sgRNA1 24DR:
UAUCUCCUUUCAUUGAGCACGUCCGGGCUUGGCCACGCCGCUUCGAAAGAA GCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCACACCAUUGGGGCAGGC
UGCGGCCUGCCCCAUCUGUUU 2 - sgRNA2 18DR
UAUCUCCUUUCAUUGAGCACGUCCGGGCUUGGCCACGCGAAAGCGUG GUCUUUCCCGCGAUAAGGUUAAAACCACACCAUUGGGGCAGGCUGCGGCCUG
CCCCAUCUGUUU 3 - sgRNA3 30DR
UAUCUCCUUUCAUUGAGCACGUCCGGGCUUGGCCACGCCGCUUCUUC UGCGAAAGCAGAAGAAGCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCAC
ACCAUUGGGGCAGGCUGCGGCCUGCCCCAUCUGUUU 4 - control (without RNA) 5 - positive control (cutting the target using crRNA+trRNA)
[070] O negrito indica uma sequência de 20 nucleotídeos que fornece emparelhamento com o DNA alvo (porção variável de sgRNA). O experimento utilizou uma amostra controle sem RNA e um controle positivo, que é o corte do alvo utilizando crRNA + trRNA.
[071] A reação foi realizada nas seguintes condições: a concentração da sequência de DNA contendo PAM (AAAACG) foi de 20 nM, a concentração de proteína foi de 400 nM, a concentração de RNA foi de 2 μM; o tempo de incubação foi de 30 minutos, a temperatura de incubação foi 37°C.
[072] Esta variante de RNA híbrido pode ser usada para cortar qualquer outro DNA alvo após modificar a sequência que emparelha diretamente com o DNA alvo.
[073] Exemplo 4. Proteínas Cas9 de organismos intimamente relacionados pertencentes à Defluviimonas sp.
[074] Até o momento, nenhuma enzima CRISPR-Cas9 foi caracterizada em
Defluviimonas. Proteínas Cas9 de Staphylococcus aureus, que são comparáveis em tamanho, são idênticas a DfCas9 em 21%, Cas9 de Campylobacter jejuni são idênticas a DfCas9 em 28% (o grau de identidade foi calculado usando o software BLASTp, parâmetros padrão).
[075] Assim, a proteína DfCas9 difere significativamente em sua sequência de aminoácidos de outras proteínas Cas9 estudadas até o momento.
[076] Os versados na técnica de engenharia genética apreciarão que a variante da sequência da proteína DfCas9 obtida e caracterizada pelo Requerente pode ser modificada sem alterar a função da própria proteína (por exemplo, por mutagênese dirigida de resíduos de aminoácidos que não diretamente influenciam a atividade funcional (Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)). Em particular, os versados reconhecerão que resíduos de aminoácidos não conservados podem ser modificados, sem afetar os resíduos que são responsáveis pela funcionalidade da proteína (determinação da função ou estrutura da proteína). Exemplos de tais modificações incluem as substituições de resíduos de aminoácidos não conservados por outros homólogos. Algumas das regiões contendo resíduos de aminoácidos não conservados são mostradas na Figura 9. Em algumas configurações da invenção, é possível usar uma proteína compreendendo uma sequência de aminoácidos que é pelo menos 95% idêntica à sequência de aminoácidos de SEQ ID NO: 1 e difere da SEQ ID NO: 1 apenas em resíduos de aminoácidos não conservados, para formar, na molécula de DNA, uma quebra de fita dupla localizada imediatamente antes da sequência de nucleotídeos 5'-NN(G/A)NA(C/T)N-3' na referida molécula de DNA. As proteínas homólogas podem ser obtidas por mutagênese (por exemplo, mutagênese dirigida ao local ou mediada por PCR) de moléculas de ácido nucleico correspondentes, seguido pelo teste da proteína Cas9 modificada codificada para a preservação de suas funções de acordo com as análises funcionais aqui descritas.
[077] Exemplo 5. O sistema DfCas9 descrito na presente invenção, em combinação com RNAs guia, pode ser usado para modificar a sequência de DNA genômico de um organismo multicelular, incluindo um organismo eucariótico. Para introduzir o sistema DfCas9 no complexo com RNAs guia nas células deste organismo (em todas as células ou em uma porção das células), várias abordagens conhecidas pelos versados na arte podem ser aplicadas. Por exemplo, métodos para entregar sistemas CRISPR-Cas9 às células de organismos foram divulgados nas fontes (Liu C et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28; 266: 17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov; 25 (1): 1234-1257), e nas fontes divulgadas posteriormente nessas fontes.
[078] Para a expressão eficaz da nuclease DfCas9 em células eucarióticas, será desejável otimizar códons para a sequência de aminoácidos da proteína DfCas9 por métodos conhecidos pelos versados na técnica (por exemplo, ferramenta de otimização de códons IDT).
[079] Para a atividade eficaz da nuclease DfCas9 em células eucarióticas, é necessário importar a proteína para o núcleo de uma célula eucariótica. Isso pode ser feito por meio do uso de um sinal de localização nuclear do antígeno T SV40 (Lanford et al., Cell, 1986, 46: 575-582) ligado à sequência DfCas9 por meio de uma sequência espaçadora descrita em Shen B, et al "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", Cell Res. 2013 May; 23 (5): 720-3, ou sem a sequência espaçadora. Assim, a sequência de aminoácidos completa da nuclease a ser transportada dentro do núcleo de uma célula eucariótica será a seguinte sequência: MAPKKKRKVGIHGVPAA-DfCas9- KRPAATKKAGQAKKKK (doravante referido como DfCas9 NLS). Uma proteína com a sequência de aminoácidos acima pode ser entregue usando pelo menos duas abordagens.
[080] A entrega do gene é realizada através da criação de um plasmídeo contendo o gene DfCas9 NLS sob o controle de um promotor (por exemplo, promotor CMV) e uma sequência que codifica RNAs guia sob controle do promotor U6. Como DNAs alvo, sequências de DNA flanqueadas por 3’- NN(G/A)NA(C/T)-5’ são usados, por exemplo, sequências do gene humano grin2b: 5’-ttgcagtatctagcctcttc-3’
[081] Assim, o cassete de expressão de crRNA se apresenta como o seguinte:
Gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactg taaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttt taaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaac accgttgcagtatctagcctcttcGTCCGGGCTTGGCCACGCCGCTTCTT CTGCTAGGATttttt
[082] O negrito indica a sequência do promotor U6, seguida pela sequência necessária para o reconhecimento do DNA alvo, enquanto a sequência de repetição direta é destacada em letras maiúsculas.
[083] O cassete de expressão de RNA rastreador se apresenta como o seguinte: Gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactg taaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttt taaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaac accgTCCTAGCAGAAGAAGCGGCGTGGTCTTTCCCGCGATAAGGTTAAAACCACACCATTGGG GCAGGCTGCGGCCTGCCCCATCTGTTTtttt
[084] O negrito indica a sequência do promotor U6, seguida pela sequência que codifica o RNA rastreador.
[085] O DNA de plasmídeo é purificado e transfectado em células HEK293 humanas usando o reagente Lipofectamine 2000 (Thermo Fisher Scientific). As células são incubadas durante 72 horas, após o que o DNA genômico é extraído usando colunas de purificação de DNA genômico (Thermo Fisher Scientific). O sítio de DNA alvo é analisado por sequenciamento na plataforma Illumina, a fim de determinar o número de inserções/deleções no DNA que ocorrem no sítio alvo devido a uma quebra de fita dupla dirigida seguida por seu reparo.
[086] A amplificação dos fragmentos alvo é realizada usando iniciadores que flanqueiam o local presuntivo de introdução de quebra, por exemplo, para os locais do gene grin2b mencionados acima.: 5’-GACTATAGCAATAGCAC-3’ 5’TCAACTCGTCGACTCCCTG-3’
[087] Após a amplificação, as amostras são preparadas de acordo com o protocolo de preparação de amostra do reagente Ultra II DNA Library Prep para Illumina (NEB) para sequenciamento de highthroughput. O sequenciamento é então realizado na plataforma Illumina, 300 ciclos, leitura direta. Os resultados do sequenciamento são analisados por métodos de bioinformática. Uma inserção ou deleção de vários nucleotídeos na sequência de DNA alvo é considerada como uma detecção de corte.
[088] A entrega como um complexo ribonucleico é realizada incubando NLS DfCas9 recombinante com RNAs guia no tampão CutSmart (NEB). A proteína recombinante é produzida a partir de células produtoras de bactérias purificando as primeiras por cromatografia de afinidade (NiNTA, Qiagen) com exclusão de tamanho (Superdex 200).
[089] A proteína é misturada com RNAs em uma proporção de 1:2:2 (DfCas9 NLS:crRNA:tracrRNA), a mistura é incubada por 10 minutos em temperatura ambiente e então transfectada em células.
[090] Em seguida, o DNA extraído do mesmo é analisado quanto a inserções/deleções no sítio de DNA alvo (como descrito acima).
[091] A nuclease DfCas9 caracterizada na presente invenção a partir da bactéria de águas profundas Defluviimonas sp. 20V17 tem uma série de vantagens em relação às proteínas Cas9 anteriormente caracterizadas. Por exemplo, DfCas9 tem um PAM de três letras relativamente simples, distinto de outras nucleases Cas conhecidas, que é necessário para o sistema funcionar. A maioria das nucleases Cas atualmente conhecidas, capazes de introduzir quebras de fita dupla no DNA, têm PAMs complexos de múltiplas letras que limitam a escolha de sequências adequadas para corte. Entre as Cas nucleases estudadas até o momento, que reconhecem PAMs curtos, apenas DfCas9 pode reconhecer sequências limitadas a nucleotídeos 5'-NN(G/A)NA(C/T)N-3'.
[092] A segunda vantagem do DfCas9 é um tamanho de proteína relativamente pequeno (1079 a.a.r.). Até o momento, é uma das poucas proteínas de pequeno porte estudadas que têm uma sequência PAM simples e são ativas a 37°C. Uma propriedade incomum do DfCas9 é a necessidade da presença de íons de manganês para cortar alvos de DNA com sucesso. Esta propriedade pode ser usada para regular a atividade do complexo Cas9.
[093] Embora a invenção tenha sido descrita com referência às configurações divulgadas, aqueles versados na técnica apreciarão que as configurações particulares descritas em detalhes foram fornecidas com o propósito de ilustrar a presente invenção e não devem ser interpretadas como de qualquer forma limitar o âmbito da invenção.
Será entendido que várias modificações podem ser feitas sem se afastar do espírito da presente invenção.

Claims (5)

REIVINDICAÇÕES
1. Uso de uma proteína caracterizada pelo fato de que compreende a sequência de aminoácidos da SEQ ID NO: 1, ou compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à sequência de aminoácidos da SEQ ID NO: 1 e difere da SEQ ID NO: 1 apenas em resíduos de aminoácidos não conservados, para formar uma quebra de fita dupla em uma molécula de DNA, localizada imediatamente antes da sequência de nucleotídeos 5'-NN(G/A)NA(C/T)N-3' na referida molécula de DNA.
2. Uso, de acordo com a reivindicação 1, caracterizada pelo fato de que a quebra de fita dupla é formada em uma molécula de DNA a uma temperatura de 35°C a 37°C e na presença de íons Mn2 +.
3. Uso da proteína, de acordo com a reivindicação 1, caracterizado pelo fato de que a proteína compreende a sequência de aminoácidos de SEQ ID NO: 1.
4. Método para gerar uma quebra de fita dupla em uma sequência de DNA genômico de um organismo unicelular ou multicelular diretamente adjacente à sequência 5'-NN(G/A)NA(C/T)N-3', caracterizado pelo fato de que compreende a introdução em pelo menos uma célula do referido organismo de uma quantidade eficaz de: a) uma proteína compreendendo a sequência de aminoácidos de SEQ ID NO: 1, ou um ácido nucleico que codifica a proteína compreendendo a sequência de aminoácidos de SEQ ID NO: 1, e b) RNA guia compreendendo uma sequência que forma um duplex com a sequência de nucleotídeos da região do DNA genômico de um organismo, que é diretamente adjacente à sequência de nucleotídeos 5'-NN(G/A)NA(C/T)N-3' e interage com a referida proteína após a formação do duplex, ou uma sequência de DNA que codifica o referido RNA guia, em que a interação entre a referida proteína com o RNA guia e a sequência de nucleotídeos 5'-NN(G/A)NA(C/T)N-3' resulta na formação de uma quebra de fita dupla na sequência do DNA genômico diretamente adjacente à sequência 5'- NN(G/A)NA(C/T)N-3'.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que compreende ainda a introdução de uma sequência de DNA exógena simultaneamente com o RNA guia.
BR112021010186-1A 2018-11-26 2019-11-26 Agente de corte de dna, métodos associados e seus usos BR112021010186A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
RU2018141534 2018-11-26
RU2018141534A RU2712492C1 (ru) 2018-11-26 2018-11-26 Средство разрезания днк на основе cas9 белка из defluviimonas sp.
PCT/RU2019/050230 WO2020111984A2 (ru) 2018-11-26 2019-11-26 Средство разрезания днк на основе cas9 белка из defluviimonas sр.

Publications (1)

Publication Number Publication Date
BR112021010186A2 true BR112021010186A2 (pt) 2021-09-28

Family

ID=69625403

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021010186-1A BR112021010186A2 (pt) 2018-11-26 2019-11-26 Agente de corte de dna, métodos associados e seus usos

Country Status (18)

Country Link
US (1) US20220017896A1 (pt)
EP (1) EP3889270A4 (pt)
JP (1) JP2022509826A (pt)
KR (1) KR20210118817A (pt)
CN (1) CN113614247A (pt)
AU (1) AU2019388217A1 (pt)
BR (1) BR112021010186A2 (pt)
CA (1) CA3121089A1 (pt)
CL (1) CL2021001381A1 (pt)
CO (1) CO2021006937A2 (pt)
EA (1) EA202191505A1 (pt)
MA (1) MA53578B1 (pt)
MX (1) MX2021006118A (pt)
PE (1) PE20212083A1 (pt)
PH (1) PH12021551202A1 (pt)
RU (1) RU2712492C1 (pt)
WO (1) WO2020111984A2 (pt)
ZA (1) ZA202103582B (pt)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013088446A1 (en) * 2011-12-16 2013-06-20 Targetgene Biotechnologies Ltd Compositions and methods for modifying a predetermined target nucleic acid sequence
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
AU2014281028B2 (en) * 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
WO2016186946A1 (en) * 2015-05-15 2016-11-24 Pioneer Hi-Bred International, Inc. Rapid characterization of cas endonuclease systems, pam sequences and guide rna elements
CN110114461A (zh) * 2016-08-17 2019-08-09 博德研究所 新型crispr酶和系统
US20220010293A1 (en) * 2018-02-23 2022-01-13 Pioneer Hi-Bred International, Inc. Novel cas9 orthologs

Also Published As

Publication number Publication date
WO2020111984A3 (ru) 2020-07-23
EP3889270A4 (en) 2022-08-24
KR20210118817A (ko) 2021-10-01
PH12021551202A1 (en) 2021-10-25
CO2021006937A2 (es) 2021-09-20
JP2022509826A (ja) 2022-01-24
US20220017896A1 (en) 2022-01-20
CA3121089A1 (en) 2020-06-04
WO2020111984A2 (ru) 2020-06-04
MA53578B1 (fr) 2022-10-31
CL2021001381A1 (es) 2022-01-07
MA53578A1 (fr) 2022-02-28
AU2019388217A1 (en) 2021-07-08
EP3889270A2 (en) 2021-10-06
RU2712492C1 (ru) 2020-01-29
CN113614247A (zh) 2021-11-05
ZA202103582B (en) 2022-07-27
MX2021006118A (es) 2021-07-07
EA202191505A1 (ru) 2021-09-14
PE20212083A1 (es) 2021-11-04

Similar Documents

Publication Publication Date Title
WO2023138082A1 (zh) 一种真核生物来源的Argonaute蛋白及其应用
Dong et al. A single digestion, single-stranded oligonucleotide mediated PCR-independent site-directed mutagenesis method
Prykhozhij et al. Genome editing in zebrafish using high-fidelity Cas9 nucleases: Choosing the right nuclease for the task
BR112021010186A2 (pt) Agente de corte de dna, métodos associados e seus usos
RU2791447C1 (ru) Средство разрезания ДНК на основе ScCas12a белка из бактерии Sedimentisphaera cyanobacteriorum
RU2788197C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Streptococcus uberis NCTC3858
US20220228134A1 (en) Dna-cutting agent based on cas9 protein from the bacterium pasteurella pneumotropica
RU2778156C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Capnocytophaga ochracea
RU2722933C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии demequina sediminicola
US20220403369A1 (en) Use of cas9 protein from the bacterium pasteurella pneumotropica
Esquerra‐Ruvira et al. Identification of the EH CRISPR‐Cas9 system on a metagenome and its application to genome engineering
RU2712497C1 (ru) Средство разрезания ДНК на основе Cas9 белка из биотехнологически значимой бактерии Clostridium cellulolyticum
Esquerra et al. Identification of the EH CRISPR-Cas9 system on a metagenome and its application to genome engineering
OA20197A (en) DNA-cutting agent.
EA041933B1 (ru) Средство разрезания днк
EA041935B1 (ru) СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ Cas9 БЕЛКА ИЗ БАКТЕРИИ Pasteurella Pneumotropica
OA20443A (en) DNA-cutting agent based on CAS9 protein from the bacterium pasteurella pneumotropica
OA20812A (en) Use of CAS9 protein from the bacterium pasteurella pneumotropica.
EA042517B1 (ru) Средство разрезания днк
WO2023196476A1 (en) Compositions and methods of prime editor guide rna/sequencing tag complexes
WO2022144437A1 (en) Crispna for genome editing
OA20196A (en) DNA-cutting agent.