BR112020010479A2 - sistemas cas9 geneticamente modificados para modificação de genoma eucariótico - Google Patents

sistemas cas9 geneticamente modificados para modificação de genoma eucariótico Download PDF

Info

Publication number
BR112020010479A2
BR112020010479A2 BR112020010479-5A BR112020010479A BR112020010479A2 BR 112020010479 A2 BR112020010479 A2 BR 112020010479A2 BR 112020010479 A BR112020010479 A BR 112020010479A BR 112020010479 A2 BR112020010479 A2 BR 112020010479A2
Authority
BR
Brazil
Prior art keywords
genetically modified
sequence
protein
fact
cell
Prior art date
Application number
BR112020010479-5A
Other languages
English (en)
Inventor
Timothy Seebeck
Fuqiang Chen
Gregory D. Davis
Original Assignee
Sigma-Aldrich Co. Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sigma-Aldrich Co. Llc filed Critical Sigma-Aldrich Co. Llc
Publication of BR112020010479A2 publication Critical patent/BR112020010479A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/10Fusion polypeptide containing a localisation/targetting motif containing a tag for extracellular membrane crossing, e.g. TAT or VP22
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/21Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
    • C12Y301/21001Deoxyribonuclease I (3.1.21.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)

Abstract

A presente invenção refere-se a sistemas Cas9 geneticamente modificados que usam motivos adjacentes aos protoespaçadores alternativos para ligação ao DNA-alvo, ácidos nucleicos que codificam os referidos sistemas Cas9 geneticamente modificados e métodos de uso dos sistemas Cas9 geneticamente modificados para modificar sequências cromossômicas alvo em células eucarióticas.

Description

Relatório Descritivo da Patente de Invenção para "SISTE- MAS CAS9 GENETICAMENTE MODIFICADOS PARA MODIFICA- ÇÃO DE GENOMA EUCARIÓTICO",
REFERÊNCIA CRUZADA COM PEDIDOS CORRELATOS
[001] Este pedido reivindica o benefício do Pedido Provisório dos EUA, Nº de Série 62/631.304, depositado em 15 de fevereiro de 2018, e do Pedido Provisório dos EUA, Nº de Série 62/720.525, depositado em 21 de agosto de 2018, cuja descrição de cada um dos quais é no presente documento incorporada na íntegra como referência.
LISTAGEM DE SEQUÊNCIAS
[002] O presente pedido contém uma Listagem de Sequências que foi submetida eletronicamente no formato ASCII e é no presente documento incorporada na íntegra como referência. A cópia ASCII, criada em 12 de fevereiro de 2019, é nomeada P18 023PCT SL.ixt e tem 370.305 bytes de tamanho.
CAMPO DA INVENÇÃO
[003] A presente invenção refere-se a sistemas Cas9 genetica- mente modificados, ácidos nucleicos que codificam os referidos siste- mas e métodos de uso desses sistemas para modificação de genoma.
ANTECEDENTES DA INVENÇÃO
[004] O desenvolvimento recente da classe bacteriana 2 Repeti- ções Palindrômicas Curtas Agrupadas Regularmente Interespaçadas (CRISPR) e sistemas (Cas) CRISPR/Cas associados a CRISPR como ferramentas de edição de genoma tem proporcionado facilidade e sim- plicidade sem precedentes para modificar geneticamente endonuclea- ses específicas para sítios para modificação de genoma eucariótico. No entanto, como cada sistema CRISPR/Cas exige um motivo adja- cente ao protoespaçador específico (PAM) para ligação ao DNA-alvo, cada sistema é limitado a certos sítios genômicos. Embora o Strepto- coccus pyogenes adotado atualmente mais difundido Cas9 (SpyCas9)
use um PAM (5'-NGG-3 ') de ocorrência frequente para direcionamen- to, ele ainda está excluído de muitos sítios genômicos sem esse moti- vo, uma vez que genomas eucarióticos, especialmente aqueles de mamíferos e plantas, são altamente complexos e heterogêneos na se- quência de DNA. Além disso, a edição precisa de genes usando repa- ro dirigido por homologia (HDR) ou editores de bases como dCas9/citidina desaminase e dCas9/adenosina desaminase frequen- temente exige uma posição precisa de ligação ao DNA, mesmo na re- solução de pares de bases simples, para obter um resultado ideal de edição. Portanto, é necessário desenvolver novos sistemas CRISPR/Cas que usem novos PAMs para direcionamento para au- mentar a densidade de cobertura do genoma.
SUMÁRIO
[005] Entre os vários aspectos da presente invenção incluem-se sistemas Cas9 geneticamente modificados que compreendem proteí- nas Cas9 geneticamente modificadas e RNAs-guia geneticamente modificados, em que cada RNA-guia geneticamente modificado é pro- jetado para complexar-se com uma proteína Cas9 geneticamente mo- dificada e o RNA-guia geneticamente modificado compreende uma sequência-guia 5' projetada para hibridar-se com uma sequência-alvo em uma sequência de fita dupla, em que a sequência-alvo é 5' em re- lação a um motivo adjacente ao protoespaçador (PAM) e o PAM tem uma sequência como listada na Tabela A.
[006] Outro aspecto da presente invenção abrange uma plurali- dade de ácidos nucleicos que codificam os referidos sistemas Cas9 geneticamente modificados e pelo menos um vetor que compreende a pluralidade dos referidos ácidos nucleicos.
[007] Outro aspecto inclui células eucarióticas que compreendem pelo menos um sistema Cas9 geneticamente modificado e/ou pelo menos um ácido nucleico que codifica o sistema Cas9 geneticamente modificado.
[008] Ainda outro aspecto da presente invenção abrange méto- dos para modificar sequências cromossômicas em células eucarióti- cas. Os métodos compreendem a introdução na célula eucariótica de pelo menos um sistema Cas9 geneticamente modificado que compre- ende uma proteína Cas9 geneticamente modificada e um RNA-guia geneticamente modificado e/ou pelo menos um ácido nucleico que co- difica o sistema Cas9 geneticamente modificado e, opcionalmente, pe- lo menos um polinucleotídeo doador, em que o referido pelo menos um RNA-guia geneticamente modificado orienta o referido pelo menos uma proteína Cas9 geneticamente modificada para o sítio-alvo na se- quência cromossômica, de modo que ocorra a modificação da se- quência cromossômica.
[009] Outros aspectos e características da invenção são detalha- dos abaixo.
BREVE DESCRIÇÃO DOS DESENHOS
[0010] A FIG. 1 mostra a análise WebLogo de motivos adjacentes aos protoespaçadores (PAM) necessários para a clivagem de DNA- alvo in vitro por ortólogos de Cas9. Os números no eixo horizontal in- dicam a posição do nucleotídeo na sequência do PAM.
[0011] A FIG. 2A apresenta a eficiência da clivagem (como por- centagem de indels) da fusão McaCas9, McaCas9-HN1HB1 (ou seja, HMGN1 no término amino e HMGB1 caixa A no término carboxila) e da fusão McaCas9-HN1H1G (ou seja, HMGN1 no término amino e mo- tivo globular central da histona H1 no término carboxila). O sítio-alvo de cada locus é apresentado na Tabela 6. As barras de erro mostram a média + DP (n = 3 réplicas biológicas).
[0012] A FIG. 2B apresenta a eficiência de clivagem (como por- centagem de indels) da fusão PexCas9, PexCas9-HN1HB1 (ou seja, HMGN1 no término amino e HMGB1 caixa A no término carboxila) e da fusão PexCas9-HN1H1G (ou seja, HMGN1 no término amino e mo- tivo globular central da histona H1 no término carboxila). O sítio-alvo de cada locus é apresentado na Tabela 6. As barras de erro mostram a média + DP (n = 3 réplicas biológicas).
[0013] A FIG. 2C apresenta a eficiência de clivagem (como por- centagem de indels) da fusão BsmCas9, BsmCas9-HN1HB1 (ou seja, HMGN1 no término amino e HMGB1 caixa A no término carboxila) e da fusão BsmCas9-HN1H1G (ou seja, HMGN1 no término amino e motivo globular central da histona H1 no término carboxila). O sítio de destino de cada /ocus é apresentado na Tabela 6. As barras de erro mostram a média + DP (n = 3 réplicas biológicas).
[0014] A FIG. 2D apresenta a eficiência de clivagem (como por- centagem de indels) da fusão LrhCas9, LrhCas9-HN1HB1 (ou seja, HMGN1 no término amino e HMGB1 caixa A no término carboxila) e da fusão LrhCas9-HN1H1G (ou seja, HMGN1 no término amino e mo- tivo globular central da histona H1 no término carboxila). O sítio de destino de cada locus é apresentado na Tabela 6. As barras de erro mostram a média + DP (n = 3 réplicas biológicas).
[0015] A FIG. 3 mostra atividades fora do alvo previsto (como por- centagem de indels) das nucleases de fusão Cas9 e Cas9-CMM de controle. As barras de erro mostram média + DP (n = 3 réplicas bioló- gicas).
DESCRIÇÃO DETALHADA
[0016] A presente invenção proporciona sistemas Cas9 ortólogos que usam PAMs alternativos para ligação ao DNA-alvo, aumentando assim a densidade de cobertura do genoma. Por exemplo, alguns des- ses PAMs alternativos compreendem resíduos A e/ou T, e outros PAMS alternativos são ricos em GC. Como tal, os sistemas Cas9 ge- neticamente modificados que usam esses PAM;s alternativos permitem a edição direcionada do genoma ou a modificação de /oci genômicos precedentemente inacessíveis do genoma.
(1) Sistemas Cas9 Geneticamente Modificados
[0017] Um aspecto da presente invenção proporciona sistemas Cas9 geneticamente modificados que compreendem proteínas Cas9 geneticamente modificadas e RNAs-guia geneticamente modificados, em que cada RNA-guia geneticamente modificado é projetado para complexar-se com uma proteína Cas9 específica geneticamente modi- ficada. Cada RNA-guia geneticamente modificado compreende uma sequência guia 5' projetada para hibridar-se com uma sequência-alvo em uma sequência de fita dupla, em que a sequência-alvo é 5' em re- lação a um motivo adjacente ao protoespaçador (PAM) e o PAM tem uma sequência como listada na Tabela A. Esses sistemas Cas9 gene- ticamente modificados não ocorrem naturalmente.
(a) Proteínas Cas9 Geneticamente Modificadas
[0018] A proteína Cas9 geneticamente modificada compreende pelo menos uma substituição, inserção ou exclusão de aminoácidos em relação à sua contraparte do tipo selvagem. A proteína Cas9 é a única proteína efetora em sistemas CRISPR tipo Il, que estão presen- tes em várias bactérias. A proteína Cas9 geneticamente modificada no presente documento descrita pode ser de Acaryochloris sp., Acetoha- lobium sp., Acidaminococceus sp., Acidithiobacillus sp., Acidothermus sp., Akkermansia sp., Alicyclobacillus sp., Allochromatium sp., Ammo- nifex sp., Anabaena sp., Arthrospira sp., Bacillus sp., Bifidobacterium sp., Burkholderiales sp., Caldicelulosiruptor sp., Campylobacter sp., Candidatus sp., Clostridium sp., Corynebacterium sp., Crocosphaera sp., Synechococcus sp., Exiguobacterium sp., Finegoldia sp., Franci- sella sp., Ktedonobacter sp., Lachnospiraceae sp., Lactobacillus sp., Lyngbya sp., Marinomonas sp., Methanohalobium sp., Microscilla sp., Microcoleus sp., Microcystis sp., Mycoplasma sp., Natranaerobius sp., Neisseria sp., Nitratifractor sp., Nitrosococcus sp., Nocardiopsis sSp.,
Nodularia sp., Nostoc sp., Oenococcus Sp., Oscillatoria sp., Parasutte- rella sp., Pelotomaculum sp., Petrotoga sp., Polaromonas sp., Prevo- tella sp., Pseudoalteromonas sp., Ralstonia sp., Staphylococcus sSp., Streptococcus sp., Streptomyces sp., Streptosporangium sp., Syne- chococcus sp., Thermosipho sp., Verrucomicrobia sp. e Wolinella sp.
[0019] Em certas modalidades da presente invenção, a proteína Cas9 geneticamente modificada no presente documento descrita é proveniente de Acidothermus sp., Akkermansia sp., Alicyclobacillus sp., Bacillus sp., Bifidobacterium sp., Burkholderiales sp., Corynebac- terium sp., Lactobacillus sp., Mycoplasma sp., Nitratifractor sp., Oe- nococcus sp., Parasutterella sp., Ralstonia sp. ou Wolinella sp.
[0020] Em modalidades específicas da presente invenção, a prote- ína Cas9 geneticamente modificada no presente documento descrita é proveniente de Acidothermus cellulolyticus (Ace), Akkermansia glyca- niphila (Agl), Akkermansia muciniphila (Amu), Alicyclobacillus hesperi- dum (Ahe), Bacillus smithii (Bsm), Bifidobacterium bombi (Bm), Corynebacterium diphtheria (Cdi), Lactobacillus rhamnosus (Lrh), Mycoplasma canis (Mca), Mycoplasma gallisepticum (Mga), Nitratifrac- tor salsuginis (Nsa), Acinetobacter kitaharae (Oki), Parasutterella ex- crementihominis (Pex), Ralstonia syzygii (Rsy) ou Wolinella succino- genes (Wsu).
[0021] Proteínas Cas9 do tipo selvagem compreendem dois domí- nios nucleasse, ou seja, domínios RuvC e HNH, cada um dos quais Cliva uma cadeia de uma sequência de cadeias duplas. As proteínas Cas9 também compreendem domínios REC que interagem com o RNA-guia (por exemplo, REC1, REC2) ou com o heterodúplex RNA/DNA (por exemplo, REC3), e um domínio que interage com o motivo adjacente ao protoespaçador (PAM) (ou seja, domínio de inte- ração com PAM).
[0022] A proteína Cas9 pode ser geneticamente modificada para compreender uma ou mais modificações (ou seja, uma substituição de pelo menos um aminoácido, uma exclusão de pelo menos um aminoá- cido, uma inserção de pelo menos um aminoácido) de modo que essa proteína Cas9 possua atividade, especificidade e/ou estabilidade alte- radas.
[0023] Por exemplo, a proteína Cas9 pode ser geneticamente mo- dificada por uma ou mais mutações e/ou exclusões para desativar um ou ambos os domínios nuclease. A inativação de um domínio nuclease gera uma proteína Cas9 que quebra uma cadeia de uma sequência de cadeia dupla (isto é, uma Cas9 nickase). O domínio RuvC pode ser inativado por mutações tais como D10A, D8A, E762A e/ou D986A, e o domínio HNH pode ser inativado por mutações tais como H840A, H559A, N854A, N856A e/ou N863A (com referência ao sistema de numeração de Cas9, SpyCas9 de Streptococcus pyogenes). A inativa- ção de ambos os domínios nuclease gera uma proteína Cas9 sem ati- vidade de clivagem (isto é, uma Cas9 cataliticamente inativa ou mor- ta).
[0024] A proteína Cas9 pode também ser geneticamente modifica- da por uma ou mais substituições, exclusões e/ou inserções de ami- noácidos para melhorar a especificidade do direcionamento, melhorar a fidelidade, a especificidade do PAM alterado, diminuir os efeitos fora do alvo previsto e/ou aumentar a estabilidade. Exemplos não limitati- vos de uma ou mais mutações que melhoram a especificidade de dire- cionamento, melhoram a fidelidade e/ou diminuem os efeitos fora do alvo previsto incluem N497A, R661 A, Q695A, K810A, K848A, K855A, Q926A, K1003A, R1060A e/ou D1135E (com referência ao sistema de numeração de SpyCas9). (i) Domínios heterólogos
[0025] A proteína Cas9 pode ser geneticamente modificada para compreender pelo menos um domínio heterólogo, isto é, Cas9 é fundi-
da com um ou mais domínios heterólogos. Em situações em que dois ou mais domínios heterólogos são fundidos com Cas9, os dois ou mais domínios heterólogos podem ser os mesmos ou podem ser diferentes. Os referidos um ou mais domínios heterólogos podem ser fundidos com a extremidade do término N, a extremidade do término C, uma localização interna ou uma combinação das mesmas. A fusão pode ser direta por meio de uma ligação química, ou a ligação pode ser indi- reta por meio de um ou mais ligantes. Em várias modalidades da pre- sente invenção, o domínio heterólogo pode ser um sinal de localização nuclear, um domínio penetrante de células, um domínio marcador, um domínio de interrupção da cromatina, um domínio de modificação epi- genética (por exemplo, um domínio citidina desaminase, um domínio histona acetiltransferase e similares), um domínio de regulação de transcrição, um domínio de ligação ao aptâmero de RNA ou um domí- nio nucleasse não Cas9.
[0026] Em algumas modalidades da presente invenção, os referidos um ou mais domínios heterólogos podem ser um sinal de localização nuclear (NLS). Exemplos não limitativos de sinais de localização nuclear incluem PKKKRKV (SEQ ID NO: 78), PKKKRRV (SEQ ID NO: 79), KRPAATKKAGQAKKKK (SEQ ID NO: 80), YGRKKRRORRR (SEQ ID NO: 81), RKKRRORRR (SEQ ID NO: 82), PAAKRVKLD (SEQ ID NO: 83), RORRNELKRSP (SEQ ID NO: 84), VSRKRPRP (SEQ ID NO: 85), PPKKARED (SEQ ID NO: 86), PQPKKKPL (SEQ ID NO : 87), SALIKKKKKMAP (SEQ ID NO: 88), PKQKKRK (SEQ ID NO: 89), RKLKKKIKKL (SEQ |D NO: 90), REKKKFLKRR (SEQ ID NO: 91), KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 92) RKCLOAGMNLEARKTKK (SEQ ID NO: 93) NOSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 94) e RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV — (SEQ
ID NO: 95).
[0027] Em outras modalidades da presente invenção, os referidos um ou mais domínios heterólogos podem ser um domínio penetrante de células. Exemplos de domínios penetrantes de células adequados incluem, sem limite, GRRKKRRQORRRPPQPKKKRKV (SEQ ID NO: 96), PLSSIFSRIGDPPKKKRKV (SEQ ID NO: 97), GALFLGWLGAAGSTMGAPKKKRKV (SEQ ID NO: 98), GALFLGFLGAAGSTMGAWSQPKKKRKV (SEQ |D NO: 929), KETWWETWWTEWSQPKKKRKV (SEQ ID NO: 100), YARAAARQARA (SEQ ID NO: 101), THRLPRRRRRR (SEQ ID NO: 102), GGRRARRRRRR (SEQ ID NO: 103), RRORRTSKLMKR (SEQ ID NO: 104), GWTLNSAGYLLGKINLKALAALAKKIL (SEQ ID NO: 105), KALAWEAKLAKALAKALAKHLAKALAKALKCEA (SEQ ID NO: 106) e RQIKIWFQONRRMKWKK (SEQ ID NO: 107).
[0028] Em modalidades alternativas da presente invenção, os refe- ridos um ou mais domínios heterólogos podem ser um domínio marca- dor. Domínios marcadores incluem proteínas fluorescentes e tags de purificação ou de epítopos. Proteínas fluorescentes adequadas inclu- em, sem limite, proteínas verdes fluorescentes (por exemplo, GFP, eGFP, GFP-2, tagGFP, turboGFP, Emerald, Azami Green, Azami Green monomérica, CopGFP, AceGFP, ZsGreenl), proteínas fluores- centes amarelas (por exemplo, YFP, EYFP, Citrino, Vênus, YPet, PhNiYFP, ZsYellow1), proteínas fluorescentes azuis (por exemplo, BFP, EBFP, EBFP2, Azurita, mKalamal, GFPuv, Safira, T-safira), proteínas fluorescentes cianas (por exemplo, ECFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), proteínas fluorescentes vermelhas (por exemplo, mKate, mKate2, mPlum, monômero DsRed, mCherry, mMRFP1, DsRed- Express, DsRed2, DsRed-Monômero, HcRed-Tandem, HcRed1, As- Red2, eqgFP611, mRasberry, mStrawberry, Jred), proteínas fluorescen- tes laranjas (por exemplo, mOrange, mKO, Kusabira-Orange, Kusabi-
ra-Orange Monomérica, mTangerine, tdTomato) ou combinações das mesmas. O domínio marcador pode compreender repetições em tan- dem de uma ou mais proteínas fluorescentes (por exemplo, Suntag). Exemplos não limitativos de tags de purificação ou de epítopos ade- quadas incluem 6xHis (SEQ ID NO: 134), FLAGº, HA, GST, Myc, SAM e similares. Exemplos não limitativos de fusões heterólogas que facili- tam a detecção ou enriquecimento de complexos CRISPR incluem es- treptavidina (Kipriyanov et al., Human Antibodies, 1995, 6(3):93-101.), avidin (Airenne et al., Biomolecular Engineering, 1999), 16(1-4):87-92), formas monoméricas de avidina (Laitinen et al., Journal of Biological Chemistry, 2003, 278(6):4010-4014), tags peptídicos que facilitam bio- tinilação durante produção recombinante (Cull et al, Methods in Enzymology, 2000, 326:430-440).
[0029] Ainda em outras modalidades da presente invenção, os re- feridos um ou mais domínios heterólogos podem ser um motivo modu- lador da cromatina (CMM). Exemplos não limitativos de CMMs incluem peptídeos que interagem com nucleossomos derivados de proteínas do grupo de proteínas de alta mobilidade (HMG) (por exemplo, proteí- nas HMGB1, HMGB2, HMGB3, HMGN1, HMGN2, HMGN3a, HMGN3b, HMGN4 e HMGNB5), o domínio globular central das varian- tes de histona H1 (por exemplo, histona H1.0, H1.1, H1.2, H1.3, H1.4, H1.5, H1.6, H1.7, H1.8, H1.9 e H.1.10), ou domínios de ligação ao DNA de complexos de remodelação da cromatina (por exemplo, SWI/SNF (SWiItch/Sacarose Não Fermentável), ISWI (Imitation SWitch). CHD (ligação Cromodomínio-Helicase-DNA), Mi-2/NuRD (Nucleosome Remodeling and Deacetylase (Remodelação de Nu- cleossomos e Desacetilase)), INOSO0, SWR1 e complexos RSC. Em outras modalidades da presente invenção, os CMMs também podem ser derivados de topoisomerases, helicases ou proteínas virais. A fon- te do CMM pode e variará. Os CMMs podem ser provenientes de se-
res humanos, animais (por exemplo, vertebrados e invertebrados), plantas, algas ou leveduras. Exemplos não limitativos de CMMs espe- cíficos estão listados na tabela abaixo. Pessoas versadas no estado da técnica podem identificar prontamente homólogos em outras espé- cies e/ou o motivo de fusão relevante. HMGN1 humana PO5114 HMGNA4 humana 000479 cleossomos Histona H1.0 humana | Po7305 CHD1 de levedura P32657 TOP1 humana P11387 pesvirus 8 cleossomos tina prae
[0030] Em ainda outras modalidades da presente invenção, os re- feridos um ou mais domínios heterólogos podem ser um domínio de modificação epigenética. Exemplos não limitativos de domínios de modificação epigenética adequados incluem aqueles com desamina- ção de DNA (por exemplo, citidina desaminase, adenosina desami- nase, guanina desaminase), atividade de DNA metiltransferase (por exemplo, citosina metiltransferase), atividade de DNA desmetilase,
aminação de DNA, atividade de oxidação de DNA, atividade de DNA helicase, atividade de histona acetiltransferase (HAT) (por exemplo, domínio HAT derivado da proteína de ligação com E1A p300), ativida- de de histona desacetilase, atividade de histona metiltransferase, ativi- dade de histona desmetilase, atividade de histona cinase, atividade de histona fosfatase, atividade de histona ubiquitina ligase, atividade de desubiquitinação de histonas, atividade de adenilação de histonas, ati- vidade de desadenilação de histonas, atividade de SUMOilação de his- tonas, atividade de desSUMOilação de histonas, atividade de ribosila- ção de histonas, atividade de desribosilação de histonas, atividade de miristoilação de histonas, atividade de desmiristoilação de histonas, atividade de citrulinação de histonas, atividade de alquilação de histo- nas, atividade de desalquilação de histonas ou atividade de oxidação de histonas. Em modalidades específicas da presente invenção, o do- mínio de modificação epigenética pode compreender atividade de citi- dina desaminase, atividade de adenosina desaminase, atividade de histona acetiltransferase ou atividade de DNA metiltransferase.
[0031] Em outras modalidades da presente invenção, os referidos um ou mais domínios heterólogos podem ser um domínio de regulação de transcrição (isto é, um domínio de ativação de transcrição ou domí- nio repressor da transcrição). Os domínios de ativação de transcrição adequados incluem, sem limite, domínio VP16 do vírus da herpes sim- ples, VP64 (ou seja, quatro cópias em tandem do VP16), VP160 (ou seja, dez cópias em tandem do VP16), domínio de ativação do NFKB p65 (p65), domínio transativador R do vírus Epstein-Barr (Rta), VPR (isto é, VP64+p65+Rta), domínios de ativação de transcrição depen- dentes de p300, domínios de ativação 1 e 2 de p53, domínios de ati- vação do fator de choque térmico 1 (HSF1), domínios de ativação de Smad4 (SAD), domínios de ativação da proteína de ligação ao ele- mento de resposta a CAMP (CREB), domínios de ativação de E2A, fa-
tor nuclear de domínios de ativação de células T ativadas (NFAT) ou combinações dos mesmos. Exemplos não limitativos de domínios re- pressores da transcrição adequados incluem domínios repressores da caixa associada a Kruppel (KRAB), domínios repressores Mxi, domí- nios repressores precoces de cAMP induzíveis (ICER), domínios re- pressores ricos em glicina YY1, repressores semelhantes a Sp1, re- pressores E(spl), repressores IkB, repressores Sin3, repressores da proteína de ligação 2 a metil-CpG (MeCP2) ou combinações dos mesmos. Os domínios de ativação de transcrição ou de repressão de transcrição podem ser geneticamente fundidos com a proteína Cas9 ou ligados via interações não covalentes proteína-proteína, proteína- RNA ou proteína-DNA.
[0032] Em outras modalidades da presente invenção, os referidos um ou mais domínios heterólogos podem ser um domínio de ligação com aptâmero de RNA (Konermann et al, Nature, 2015, 517(7536):583-588; Zalatan et al, Celli/ 2015, 160(1-2):339-50). Exemplos de domínios de proteína de aptâmero de RNA adequados incluem proteína de revestimento MS2 (MCP), proteína de revestimen- to de bacteriófago PP7 (PCP), proteína Com de bacteriófago Mu, pro- teína N22 do bacteriófago lâmbda, proteína de ligação ao motivo stem- loop (SLBP), proteína 1 relacionada com a síndrome do retardo mental do X frágil (FXR1), proteínas derivadas de bacteriófagos tais como AP205, BZ13, f1, f2, fd, fr, I1D2, JP34/GA, JP501, JP34, JP500, KU1, M1 1, M12, MX1, NL95, PP7, 6Cb5, 6&Cb8r, 9Cb12r, 9Cb23r, Qb, R17, SP-B, TW18, TW19 e VK, seus fragmentos ou derivados.
[0033] Em ainda outras modalidades da presente invenção, os re- feridos um ou mais domínios heterólogos podem ser um domínio nu- clease não Cas9. Domínios nuclease adequados podem ser obtidos de qualquer endonuclease ou exonuclease. Exemplos não limitativos de endonucleases a partir das quais um domínio nuclease pode ser derivado incluem, mas sem limite, endonucleases de restrição e endo- nucleases de homing. Em algumas modalidades da presente inven- ção, o domínio nuclease pode ser derivado de uma endonuclease de restrição do tipo II-S. Endonucleases do tipo II-S clivam DNA em sítios que estão tipicamente a vários pares de bases do sítio de reconheci- mento/ligação e, como tal, têm domínios de ligação e clivagem sepa- ráveis. Essas enzimas geralmente são monômeros que se associam transitoriamente para formar dímeros para clivar cada cadeia de DNA em locais escalonados. Exemplos não limitativos de endonucleases do tipo I1I-S adequadas incluem Bfil, Boml, Bsal, Bsal, BsmBI, Bsml, BspMl, Fokl, Mboll e Sapl. Em algumas modalidades da presente in- venção, o domínio nuclease pode ser um domínio nuclease Fokl ou um derivado seu. O domínio nuclease do tipo II-S pode ser modificado para facilitar dimerização de dois domínios nuclease diferentes. Por exemplo, o domínio de clivagem de Fokl pode ser modificado por mu- tação de certos resíduos de aminoácidos. A título de exemplo não limi- tativo, resíduos de aminoácidos nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 e 538 dos do- mínios nuclease de Fokl são alvos para modificação. Em modalidades específicas da presente invenção, o domínio nuclease de Fokl pode compreender um primeiro meio domínio Fokl que compreende muta- ções Q486E, 1499L e/ou N496D e um segundo meio domínio Fokl que compreende mutações E490K, I538K e/ou H537R.
[0034] Os referidos um ou mais domínios heterólogos podem ser ligados diretamente à proteína Cas9 por meio de uma ou mais liga- ções químicas (por exemplo, ligações covalentes), ou os referidos um ou mais domínios heterólogos podem ser ligados indiretamente à pro- teína Cas9 por meio de um ou mais ligantes.
[0035] Um ligante é um grupo químico que conecta um ou mais outros grupos químicos via pelo menos uma ligação covalente. Ligan-
tes adequados incluem aminoácidos, peptídeos, nucleotídeos, ácidos nucleicos, moléculas de ligantes orgânicos (por exemplo, derivados de maleimida, N-etoxibenzilimidazol, ácido bifenil-3,4',5-tricarboxílico, p- aminobenziloxicarbonila e similares), ligantes de dissulfeto e ligantes de polímero (por exemplo, PEG). O ligante pode incluir um ou mais grupos de espaçamento, incluindo, mas sem limitação, alquileno, alce- nileno, alcinileno, alquila, alcenila, alcinila, alcóxi, arila, heteroarila, aralquila, aralquenila, aralquinila e similares. O ligante pode ser neutro ou ter uma carga positivo ou negativa. Além disso, o ligante pode ser clivável de modo que a ligação covalente do ligante que conecta o li- gante a outro grupo químico possa ser quebrada ou clivada sob certas condições, incluindo pH, temperatura, concentração de sal, luz, um catalisador ou uma enzima. Em algumas modalidades da presente in- venção, o ligante pode ser um ligante peptídico. O ligante peptídico pode ser um ligante de aminoácido flexível (por exemplo, compreen- dendo aminoácidos pequenos, não polares ou polares). Exemplos não limitativos de ligantes flexíveis incluem LEGGGS (SEQ ID NO: 108), TGSG (SEQ ID NO: 109) GGSGGGSG (SEQ ID NO: 110), (GGGGS);-4 (SEQ ID NO: 111) e (Gly)a-8 (SEQ ID NO: 112). Alternati- vamente, o ligante peptídico pode ser um ligante de aminoácidos rígi- dos. Esses ligantes incluem (EAAAK):x (SEQ ID NO: 1 13), A(EAAAK)2-5A (SEQ ID NO: 114), PAPAP (SEQ ID NO: 115) e (AP)Js-8 (SEQ ID NO: 116). Exemplos adicionais de ligantes adequados são bem conhecidos no estado da técnica e programas para projetar ligan- tes são prontamente disponíveis (Crasto et al., Protein Eng., 2000, 13(5):309-312).
[0036] Em algumas modalidades da presente invenção, as proteí- nas Cas9 geneticamente modificadas podem ser produzidas de forma recombinante em sistemas sem células, células bacterianas ou células eucarióticas, e purificadas usando meios de purificação padrão. Em outras modalidades da presente invenção, as proteínas Cas9 geneti- camente modificadas são produzidas in vivo em células eucarióticas de interesse a partir de ácidos nucleicos que codificam as proteínas Cas9 geneticamente modificadas (consulte a seção (II) abaixo).
[0037] Em modalidades nas quais a proteína Cas9 geneticamente modificada compreende atividade nuclease ou nickase, a proteína Cas9 geneticamente modificada pode compreender ainda pelo menos um sinal de localização nuclear, domínio penetrante de células e/ou domínio marcador, bem como pelo menos um domínio de interrupção da cromatina. Em modalidades nas quais a proteína Cas9 genetica- mente modificada está ligada a um domínio de modificação epigenéti- ca, a proteína Cas9 geneticamente modificada pode ainda compreen- der pelo menos um sinal de localização nuclear, domínio penetrante de células e/ou domínio marcador, bem como pelo menos um domínio de interrupção da cromatina. Além disso, nas modalidades da presente invenção em que a proteína Cas9 geneticamente modificada está liga- da a um domínio de regulação de transcrição, a proteína Cas9 geneti- camente modificada pode ainda compreender pelo menos um sinal de localização nuclear, domínio penetrante de células e/ou domínio mar- cador, bem como pelo menos um domínio de interrupção da cromatina e/ou pelo menos um domínio de ligação ao aptâmero do RNA. (ii) Proteínas Cas9 específicas geneticamente modificadas
[0038] Em modalidades específicas da presente invenção, a prote- ína Cas9 geneticamente modificada é proveniente de Bacillus smithii, Lactobacillus rhamnosus, Parasutterella excrementihominis, Myco- plasma canis, Mycoplasma gallisepticum, Akkermansia glycaniphila, Akkermansia muciniphila, Oenococcus Kkitaharae, Bifidobacterium bombi, Acidothermus cellulolyticus, Alicyclobacillus hesperidum, Weoli- nella succinogenes, Nitratifractor salsuginis, Ralstonia syzygii ou Corynebacterium diphtheria, e é ligada a pelo menos um NLS. Em al-
gumas iterações, a proteína Cas9 geneticamente modificada pode ter pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95% ou pelo menos cerca de 99% de identidade de sequência com SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28 ou 30. Em certas modalidades da presente invenção, a proteína Cas9 geneticamente modificada pode ter pelo menos cerca de 95% de identidade de se- quência com SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28 ou 30. Em outras iterações, a proteína Cas9 geneticamente modifi- cada tem a sequência de aminoácidos da SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28 ou 30.
[0039] Em outras modalidades da presente invenção, a proteína Cas9 geneticamente modificada pode ser uma proteína Cas9 de Baci- llus smithii, Lactobadilus rhamnosus, Parasutterella excrementihomi- nis, Mycoplasma canis, Mycoplasma gallisepticum, Akkermansia glycaniphila, Akkermansia mudniphila, Oenococcus kitaharae, Bifido- baderium bombi, Acidothermus cellulolyticus, Alicyclobadilus hesperi- dum, Wolinella succinogenes, Nitratifractor salsuginis, Ralstonia sy- zygii ou Corynebacterium diphtheria ligada a pelo menos um motivo de modulação da cromatina (CMM). A ligação entre a proteína Cas9 e o CMM pode ser direta ou por meio de um ligante. A proteína de fusão Cas9-CMM pode compreender ainda pelo menos um NLS. Em moda- lidades particulares da presente invenção, a proteína de fusão Cas9- CMM pode ter pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cer- ca de 95% ou pelo menos cerca de 99% de identidade de sequência com a SEQ ID NO: 117, 118, 119, 1200, 121, 122, 123 ou 124. Em de- terminadas modalidades da presente invenção, a proteína de fusão Cas9-CMM pode ter pelo menos cerca de 95% de identidade de se- quência com a SEQ ID NO: 117, 118, 119, 120, 121, 122, 123 ou 124.
Em iterações específicas, a proteína de fusão Cas9-CMM possui a se- quência de aminoácidos da SEQ ID NO: 117, 118, 119, 120, 121, 122, 123 ou 124. (b) RNAs-guia geneticamente modificados
[0040] Os RNAs-guia geneticamente modificados são projetados para complexar-se com uma proteína Cas9 geneticamente modificada específica. Un RNA-guia compreende (i) um RNA CRISPR (crRNA) que contém uma sequência-guia na extremidade 5' que hibridizar-se com uma sequência-alvo e (ii) uma sequência de transação de cr»RNA (tracr»RNA) que recruta a proteína Cas9. A sequência-guia cr»RNA de cada RNA-guia é diferente (isto é, é específica da sequência). A se- quência tracrRNA é geralmente a mesma em RNAs-guia projetados para complexar-se com uma proteína Cas9 de uma espécie bacteriana específica.
[0041] A sequência-guia de crRNA é projetada para hibridar-se com uma sequência-alvo (isto é, protoespaçador) em uma sequência de fita dupla. Em geral, a complementaridade entre o crRNA e a se- quência-alvo é de pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95% ou pelo menos 99%. Em modalidades especiífi- cas da presente invenção, a complementaridade é completa (ou seja, 100%). Em várias modalidades da presente invenção, o comprimento da sequência-guia do crRNA pode variar de cerca de 15 nucleotídeos a cerca de 25 nucleotídeos. Por exemplo, a sequência-guia do cº»RNA pode ser de cerca de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 nu- cleotídeos de comprimento. Em modalidades específicas da presente invenção, o crRNA tem cerca de 19, 20 ou 21 nucleotídeos de com- primento. Em uma modalidade da presente invenção, a sequência- guia do crRNA tem um comprimento de 20 nucleotídeos.
[0042] O RNA-guia compreende sequência de repetição que forma pelo menos uma estrutura de stem-loop, que interage com a proteína
Cas9, e sequência 3' que permanece com fita simples. O comprimento de cada laço e haste pode variar. Por exemplo, o laço pode variar de cerca de 3 a cerca de 10 nucleotídeos de comprimento, e a haste pode variar de cerca de 6 a cerca de 20 pares de bases de comprimento. À haste pode compreender uma ou mais protuberâncias de 1 a cerca de nucleotídeos. O comprimento da região 3' de fita simples pode vari- ar. A sequência de tracrRNA no RNA-guia geneticamente modificado em geral é baseada na sequência codificadora de tracr>RNA do tipo selvagem nas espécies bacterianas de interesse. A sequência do tipo selvagem pode ser modificada para facilitar a formação da estrutura secundária, aumentar a estabilidade da estrutura secundária, facilitar a expressão em células eucarióticas e assim por diante. Por exemplo, uma ou mais alterações nucleotídicas podem ser introduzidas na se- quência codificadora de RNA-guia (ver Exemplo 3, abaixo). A sequên- cia tracr»RNA pode variar em comprimento de cerca de 50 nucleotídeos a cerca de 300 nucleotídeos. Em várias modalidades da presente in- venção, o tracr>RNA pode variar em comprimento de cerca de 50 a cerca de 90 nucleotídeos, de cerca de 90 a cerca de 10 nucleotídeos, de cerca de 110 a cerca de 130 nucleotídeos, de cerca de 130 a cerca de 150 nucleotídeos, de cerca de 150 a cerca de 170 nucleotídeos, de cerca de 170 a cerca de 200 nucleotídeos, de cerca de 200 a cerca de 250 nucleotídeos ou de cerca de 250 a cerca de 300 nucleotídeos.
[0043] Em geral, o RNA-guia geneticamente modificado é uma molécula única (isto é, um único RNA-guia ou saRNA), em que a se- quência de crRNA está ligada à sequência de tracrRNA. Em algumas modalidades da presente invenção, no entanto, o RNA-guia genetica- mente modificado pode ser duas moléculas separadas. Uma primeira molécula que compreende o crRNA que contém sequência 3' (com- preendendo de cerca de 6 a cerca de 20 nucleotídeos) que é capaz de emparelhar bases com a extremidade 5' de uma segunda molécula,
em que a segunda molécula compreende o tracrRNA que contém se- quência 5' (compreendendo de cerca de 6 a cerca de 20 nucleotídeos) que é capaz de emparelhar bases com a extremidade 3' da primeira molécula.
[0044] Em algumas modalidades da presente invenção, a sequên- cia tracr»RNA do RNA-guia geneticamente modificado pode ser modifi- cada para compreender uma ou mais sequências de aptâmeros (Ko- nermann et al., Nature, 2015, 517 (7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50). Sequências de aptâmeros adequadas incluem aquelas que se ligam a proteínas adaptadoras escolhidas de MCP, PCP, Com, SLBP, FXR1, AP205, BzZ13, f1, f2, fd, fr, 1D2, JP34/GA, JP501, JP34, JP500, KU1, M11, M12, MX1, NL95, PP7, 6Cb5, 6Cb8r, $Cb12r, 9Cb23r, QB, R17, SP-B, TW18, TW19, VK, seus fragmentos ou seus derivados. Aqueles versados no estado da técnica entendem que o comprimento da sequência de aptâmero pode variar.
[0045] Em outras modalidades da presente invenção, o RNA-guia pode ainda compreender pelo menos um marcador detectável. O mar- cador detectável pode ser um fluoróforo (por exemplo, FAM, TMR, Cy3, Cy5, Texas Red, Oregon Green, Alexa Fluors, tags Halo ou co- rante fluorescente adequado), um tag de detecção (por exemplo, bioti- na, digoxigenina e similares), pontos quânticos ou partículas de ouro.
[0046] O RNA-guia pode compreender ribonucleotídeos padrões e/ou ribonucleotídeos modificados. Em algumas modalidades da pre- sente invenção, o RNA-guia pode compreender desoxirribonucleotí- deos padrões ou modificados. Em modalidades nas quais o RNA-guia é sintetizado enzimaticamente (isto é, in vivo ou in vitro), o RNA-guia geralmente compreende ribonucleotídeos padrões. Nas modalidades da presente invenção em que o RNA-guia é quimicamente sintetizado, o RNA-guia pode compreender ribonucleotídeos padrões ou modifica- dos e/ou desoxirribonucleotídeos. Os ribonucleotídeos modificados e/ou desoxirribonucleotídeos incluem modificações de bases (por exemplo, pseudouridina, 2-tiouridina, N6-metiladenosina e similares) e/ou modificações de açúcares (por exemplo, 2'-O-metila, 2'-flúor, 2'- amino, ácido nucleico bloqueado (LNA) e assim por diante). A espinha dorsal do RNA-guia também pode ser modificada para compreender ligações fosforotioato, ligações boranofosfato ou ácidos nucleicos de peptídeos.
[0047] Em modalidades específicas da presente invenção, o RNA- guia geneticamente modificado tem pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95% ou pelo menos cerca de 99% de iden- tidade de sequência com a SEQ ID NO: 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44 ou 45. Em algumas modalidades da presente invenção, o RNA-guia de Cas9 geneticamente modificado tem a se- quência de SEQ ID NO: 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44 ou 45. (c) Sequência PAM
[0048] Os sistemas Cas9 geneticamente modificados detalhados acima têm como alvo sequências específicas no DNA de fita dupla que estão localizadas a montante das novas sequências de PAM. As se- quências de PAM preferidas pelos sistemas Cas9 geneticamente mo- dificados foram identificadas in vitro usando uma biblioteca de PAMS degenerados (ver Exemplo 1 e FIG. 1) e confirmadas por sequencia- mento após experimentos de edição de genoma (ver Exemplo 2). O PAM para cada um dos sistemas Cas9 geneticamente modificados no presente documento descritos é apresentado na Tabela A, abaixo.
Sistema Cas9 geneticamente modificado Bacillus smithil Cas9 (BsmCas9)
Mycoplasma gallisepticum Cas9 (MgaCas9) Oenococcus kitaharae Cas9 (OkKiCas9) Acidothermus cellulolyticus Cas9 (AceCas9) Alicyclobacillus hesperidum Cas9 (AheCas9) Nitratifractor salsuginis Cas9 (NsaCas9) *KéGouT; MéAouC;RéAouG; Yé CouTeNéA,C,GouT. (II) Ácidos Nucleicos
[0049] Outro aspecto da presente invenção proporciona ácidos nucleicos que codificam os sistemas Cas9 geneticamente modificados descritos acima na seção (Il). Os sistemas podem ser codificados por ácidos nucleicos únicos ou múltiplos ácidos nucleicos. Os ácidos nu- cleicos podem ser DNA ou RNA, lineares ou circulares, fita simples ou fita dupla. O RNA ou DNA pode ser otimizado por códons para tradu- ção eficiente em proteína na célula eucariótica de interesse. Os pro- gramas de otimização por códons estão disponíveis como freeware ou a partir de fontes comerciais.
[0050] Em algumas modalidades da presente invenção, ácido nu- cleico codifica uma proteína que possui pelo menos cerca de 75%, pe- lo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95% ou pelo menos cerca de 99% de identidade de sequência com a sequência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28 ou 30. Em certas modalidades da presente invenção, o ácido nucleico que codifica a proteína Cas9 geneticamente modificada pode ter pelo menos cerca de 75%, a pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95% ou pelo menos cerca de 99% de identidade de sequência com a sequência de DNA da SEQ ID NO: 1,3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27 ou 29. Em certas modalidades da presente invenção, o DNA que codifica a proteína Cas9 geneticamente modificada possui a sequência de DNA da SEQ ID NO: 1,3, 5,7, 9, 11,13, 15, 17, 19, 21, 23, 25, 27 ou 29. Em moda- lidades adicionais, o ácido nucleico codifica uma proteína que possui pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95% ou pelo menos cerca de 99% de identidade de sequência com a sequên- cia de aminoácidos da SEQ ID NO: 117, 118, 119, 120, 121, 122, 123 ou 124.
[0051] Em algumas modalidades da presente invenção, o ácido nucleico que codifica a proteína Cas9 geneticamente modificada pode ser RNA. O RNA pode ser sintetizado enzimaticamente in vitro. Para isso, o DNA que codifica a proteína Cas9 geneticamente modificada pode ser operacionalmente ligado a uma sequência promotora que é reconhecida por uma RNA polimerase de fago para síntese de RNA in vitro. Por exemplo, a sequência promotora pode ser uma sequência promotora T7, T3 ou SP6 ou uma variação de uma sequência promo- tora T7, T3 ou SP6. O DNA que codifica a proteína geneticamente modificada pode fazer parte de um vetor, como detalhado abaixo. Em tais modalidades da presente invenção, o RNA transcrito in vitro pode ser purificado, rematado e/ou poliadenilado. Em outras modalidades da presente invenção, o RNA que codifica a proteína Cas9 genetica- mente modificada pode ser parte de um RNA autorreplicante (Yos- hioka et al., Cell Stem Cell, 2013, 13:246-254). O RNA autorreplicante pode ser derivado de um replicon de RNA do vírus da encefalite equi- na venezuelana não-infecciosa autorreplicante (VEE), que é um RNA de fita única e sentido positivo que é capaz de se autorreplicar para um número limitado de divisões celulares e que pode ser modificado para codificar proteínas de interesse (Yoshioka et a/l., Cell Stem Cell, 2013, 13:246-254).
[0052] Em outras modalidades da presente invenção, o ácido nu- cleico que codifica a proteína Cas9 geneticamente modificada pode ser DNA. A sequência de codificação do DNA pode ser operacional- mente ligada a pelo menos uma sequência de controle promotora para expressão na célula de interesse. Em certas modalidades da presente invenção, a sequência codificadora de DNA pode ser operacionalmen- te ligada a uma sequência promotora para expressão da proteína Cas9 geneticamente modificada em células bacterianas (por exemplo, E. coli) ou células eucarióticas (por exemplo, levedura, inseto ou ma- mífero). Promotores bacterianos adequados incluem, sem limite, pro- motores T7, promotores operon /lac, promotores trp, promotores tac (que são híbridos dos promotores trp e lac), variações de qualquer um dos precedentes e combinações de qualquer um dos itens preceden- tes. Exemplos não limitativos de promotores eucarióticos adequados incluem promotores constitutivos, regulados ou específicos para célu- las ou tecidos. Sequências de controle promotoras constitutivas euca- rióticas adequadas incluem, mas sem limitação, promotor precoce imediato de citomegalovírus (CMV), promotor do vírus símio (SV40), promotor tardio principal de adenovírus, promotor do vírus do sarcoma de Rous (RSV), promotor do vírus de tumor mamário em camundongo (MMTV), promotor da fosfoglicerato cinase (PGK), promotor do fator de alongamento (EDIl)-alfa, promotores da ubiquitina, promotores da acti- na, promotores da tubulina, promotores da imunoglobulina, seus frag- mentos ou combinações de qualquer um dos precedentes. Exemplos de sequências de controle promotoras reguladas por eucariotos ade- quadas incluem, sem limite, aquelas reguladas por choque térmico,
metais, esteroides, antibióticos ou álcool. Exemplos não limitativos de promotores específicos para tecidos incluem promotor B29, promotor CD14, promotor CD43, promotor CD45, promotor CD68, promotor da desmina, promotor da elastase-1, promotor da endoglina, promotor da fibronectina, promotor FIt-1, promotor GFAP, promotor GPIIb, Promotor ICAM-2, promotor INF-B, promotor Mb, promotor Nphsl, promotor OG- 2, promotor SP-B, promotor SYN1 e promotor WASP. A sequência promotora pode ser do tipo selvagem ou pode ser modificada para ex- pressão mais eficiente ou eficaz. Em algumas modalidades da presen- te invenção, a sequência codificadora de DNA pode também ser ligada a um sinal de poliadenilação (por exemplo, sinal SV40 poliA, sinal po- liA do hormônio de crescimento bovino (BGF) etc.) e/ou pelo menos uma sequência de terminação de transcrição. Em algumas situações, a proteína Cas9 geneticamente modificada pode ser purificada a partir de células bacterianas ou eucarióticas.
[0053] Ainda em outras modalidades da presente invenção, o RNA-guia geneticamente modificado pode ser codificado por DNA. Em alguns casos, o DNA que codifica o RNA-guia geneticamente modifi- cado pode ser operacionalmente ligado a uma sequência promotora que é reconhecida por uma RNA polimerase de fago para síntese de RNA in vitro. Por exemplo, a sequência promotora pode ser uma se- quência promotora T7, T3 ou SP6 ou uma variação de uma sequência promotora T7, T3 ou SP6. Em outros casos, o DNA que codifica o RNA-guia geneticamente modificado pode ser operacionalmente liga- do a uma sequência promotora que é reconhecida por RNA polimera- se Ill (Pol Ill) para expressão em células eucarióticas de interesse. Exemplos de promotores Pol Ill adequados incluem, mas sem limita- ção, promotores de RNA de U6, U3, H1 e 7SL de mamíferos.
[0054] Em várias modalidades da presente invenção, o ácido nu- cleico que codifica a proteína Cas9 geneticamente modificada pode estar presente em um vetor. Em algumas modalidades da presente invenção, o vetor pode ainda compreender ácido nucleico que codifica o RNA-guia geneticamente modificado. Vetores adequados incluem vetores plasmídicos, vetores virais e RNA autorreplicante (Yoshioka et al., Cell Stem Cell, 2013, 13:246-254). Em algumas modalidades da presente invenção, o ácido nucleico que codifica a proteína complexa ou de fusão pode estar presente em um vetor plasmídico. Exemplos não limitativos de vetores plasmídicos adequados incluem pUC, pBR322, pET, pBluescript e suas variantes. Em outras modalidades da presente invenção, o ácido nucleico que codifica a proteína complexa ou de fusão pode ser parte de um vetor viral (por exemplo, vetores len- tivirais, vetores virais adenoassociados, vetores adenovirais e assim por diante). O plasmídeo ou vetor viral pode compreender sequências de controle de expressão adicionais (por exemplo, sequências poten- ciadoras, sequências de Kozak, sequências de poliadenilação, se- quências de terminação de transcrição etc.), sequências marcadoras selecionáveis (por exemplo, genes de resistência a antibióticos), ori- gens de replicação e similares. Informações adicionais sobre vetores e seu uso podem ser encontradas em “Current Protocols in Molecular Biology", Ausubel et al., John Wiley & Sons, Nova lorque, 2003, ou “Molecular Cloning: A Laboratory Manual, Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, Nova lorque, 3º edição,
20071. (II) Células Eucarióticas
[0055] Outro aspecto da presente invenção compreende células eucarióticas que compreendem pelo menos um sistema Cas9 geneti- camente modificado como detalhado acima na seção (I), e/ou pelo menos um ácido nucleico codificador e proteína Cas9 geneticamente modificada, e/ou RNA-guia geneticamente modificado como detalhado acima na seção (1).
[0056] A célula eucariótica pode ser uma célula humana, uma cé- lula de mamífero não humano, uma célula de vertebrado não mamiífe- ro, uma célula de invertebrado, uma célula vegetal ou um organismo eucariótico de célula única. Exemplos de células eucarióticas adequa- das são detalhados abaixo na seção (IV)(c). A célula eucariótica pode ser in vitro, ex vivo ou in vivo.
(IV) Métodos Para Modificar Sequências Cromossômicas
[0057] Outro aspecto da presente invenção abrange métodos para modificar uma sequência cromossômica em células eucarióticas. Em geral, os métodos compreendem introduzir na célula eucariótica de interesse pelo menos um sistema Cas9 geneticamente modificado como detalhado acima na seção (1) e/ou pelo menos um ácido nucleico que codifica o referido sistema Cas9 geneticamente modificado como detalhado acima na seção (Il).
[0058] Em modalidades em que a proteína Cas9 geneticamente modificada compreende atividade nuclease ou nickase, a modificação da sequência cromossômica pode compreender uma substituição de pelo menos um nucleotídeo, uma exclusão de pelo menos um nucleo- tídeo, uma inserção de pelo menos um nucleotídeo. Em algumas itera- ções, o método compreende introduzir na célula eucariótica um siste- ma Cas9 geneticamente modificado que compreende atividade nu- clease ou dois sistemas Cas9 geneticamente modificados que com- preendem atividade nickase e nenhum polinucleotídeo doador, de mo- do que o sistema ou sistemas Cas9 geneticamente modificados intro- duzam uma quebra de fita dupla no sítio de destino na sequência cro- mossômica e reparo da quebra de fita dupla por processos de reparo de DNA celular introduza pelo menos uma alteração de nucleotídeo (isto é, indel), inativando desse modo a sequência cromossômica (isto é, desativação genética). Em outras iterações, o método compreende introduzir na célula eucariótica um sistema Cas9 modificado que com-
preende atividade nuclease ou dois sistemas Cas9 modificados que compreendem atividade nickase, bem como o polinucleotídeo doador, de modo que o sistema ou sistemas Cas9 geneticamente modificados introduzam uma quebra de fita dupla no sítio-alvo na sequência cro- mossômica e reparo da quebra de fita dupla por processos de reparo de DNA celular levem a inserção ou troca de sequência no polinucleo- tídeo doador no sítio-alvo na sequência cromossômica (ou seja, corre- ção de genes ou ativação de genes).
[0059] Em modalidades da presente invenção, nas quais a proteí- na Cas9 geneticamente modificada compreende atividade de modifi- cação epigenética ou atividade de regulação de transcrição, a modifi- cação da sequência cromossômica pode compreender uma conversão de pelo menos um nucleotídeo no sítio-alvo ou próximo do sítio-alvo, uma modificação de pelo menos um nucleotídeo no sítio-alvo ou pró- ximo do sítio-alvo, uma modificação de pelo menos uma proteína his- tona no sítio-alvo ou próximo do sítio-alvo e/ou uma alteração na transcrição no sítio-alvo ou próximo do sítio-alvo na sequência cro- mossômica. (a) Introdução na Célula
[0060] Como mencionado acima, o método compreende introduzir na célula eucariótica pelo menos um sistema Cas9 geneticamente modificado e/ou ácido nucleico que codifica o referido sistema (e poli- nucleotídeo doador opcional). O referido pelo menos um sistema e/ou ácido nucleico/polinucleotídeo doador pode ser introduzido na célula de interesse por uma variedade de meios.
[0061] Em algumas modalidades da presente invenção, a célula pode ser transfectada com as moléculas apropriadas (isto é, proteína, DNA e/ou RNA). Métodos de transfecção adequados incluem nucleo- fecção (ou eletroporação), transfecção mediada por fosfato de cálcio, transfecção por polímero catiônico (por exemplo, DEAE-dextrano ou polietilenoimina), transdução viral, transfecção por virossoma, trans- fecção por vírion, transfecção por lipossoma, transfecção por liposso- ma catiônico, transfecção por imunolipossomo, transfecção por lipídio não lipossômico, transfecção por dendrímero, transfecção por choque térmico, magnetofecção, lipofecção, administração por biolística, impa- lefecção, sonoporação, transfecção óptica e absorção melhorada de ácidos nucleicos por agente proprietário. Métodos de transfecção são bem conhecidos no estado da técnica (ver, por exemplo, "Current Pro- tocols in Molecular Biology", Ausubel et al., John Wiley & Sons, Nova lorque, 2003, ou "Molecular Cloning: A Laboratory Manual", Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, Nova lorque, 3º edição, 2001). Em outras modalidades da presente invenção, as moléculas podem ser introduzidas na célula por microinjeção. Por exemplo, as moléculas podem ser injetadas no citoplasma ou núcleo das células de interesse. A quantidade de cada molécula introduzida na célula pode variar, mas aqueles versados no estado da técnica es- tão familiarizados com meios para determinar a quantidade apropria- da.
[0062] As várias moléculas podem ser introduzidas na célula si- multaneamente ou sequencialmente. Por exemplo, o sistema Cas9 geneticamente modificado (ou seu ácido nucleico codificador) e o poli- nucleotídeo doador podem ser introduzidos ao mesmo tempo. Alterna- tivamente, um pode ser introduzido primeiro e depois o outro pode ser introduzido posteriormente na célula.
[0063] Em geral, a célula é mantida em condições apropriadas pa- ra seu crescimento e/ou manutenção. Condições adequadas de cultu- ra de células são bem conhecidas no estado da técnica e são descri- tas, por exemplo, em Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105:5809-5814; Moehle et al., Proc. Natl. Acad. Sci. USA, 2007, 104:3055-3060; Urnov et a/., Nature, 2005, 435:646-651; e Lombardo et al., Nat. Biotechnol., 2007, 25:1298-1306. Aqueles versados no es- tado da técnica entendem que os métodos para cultivar células são conhecidos no estado da técnica e podem variar e variarão dependen- do do tipo de célula. Otimização de rotina pode ser usada, em todos os casos, para determinar as melhores técnicas para um tipo de célula específico. (b) Polinucleotídeo Doador Opcional
[0064] Em modalidades nas quais a proteína Cas9 geneticamente modificada compreende atividade nuclease ou nickase, o método pode compreender ainda introduzir pelo menos um polinucleotídeo doador na célula. O polinucleotídeo doador pode ser de fita simples ou dupla, linear ou circular e/ou RNA ou DNA. Em algumas modalidades da pre- sente invenção, o polinucleotídeo doador pode ser um vetor, por exemplo, um vetor plasmídico.
[0065] O polinucleotídeo doador compreende pelo menos uma se- quência doadora. Em alguns aspectos, a sequência doadora do poli- nucleotídeo doador pode ser uma versão modificada de uma sequên- cia cromossômica endógena ou nativa. Por exemplo, a sequência do- adora pode ser essencialmente idêntica a uma porção da sequência cromossômica na ou próxima à sequência direcionada pelo sistema Cas9 geneticamente modificado, mas que compreende pelo menos uma alteração de nucleotídeo. Assim, após integração ou troca com a sequência nativa, a sequência no local cromossômico alvo compreen- de pelo menos uma alteração de nucleotídeo. Por exemplo, a altera- ção pode ser uma inserção de um ou mais nucleotídeos, uma exclusão de um ou mais nucleotídeos, uma substituição de um ou mais nucleo- tídeos ou combinações dos mesmos. Como consequência da integra- ção "correção genética" da sequência modificada, a célula pode pro- duzir um produto genético modificado a partir da sequência cromos- sômica direcionada.
[0066] Em outros aspectos, a sequência doadora do polinucleotí- deo doador pode ser uma sequência exógena. Como usada no pre- sente documento, uma sequência "exógena" refere-se a uma sequên- cia que não é nativa da célula ou uma sequência cuja localização nati- va está em um local diferente no genoma da célula. Por exemplo, a sequência exógena pode compreender sequência codificadora de pro- teína, sequência esta que pode ligar-se operacionalmente a uma se- quência de controle promotora exógena de modo que, após integração no genoma, a célula seja capaz de expressar a proteína codificada pe- la sequência integrada. Alternativamente, a sequência exógena pode ser integrada na sequência cromossômica, de modo que sua expres- são seja regulada por uma sequência de controle promotora endóge- na. Em outras iterações, a sequência exógena pode ser uma sequên- cia de controle de transcrição, outra sequência de controle de expres- são, uma sequência codificadora de RNA e assim por diante. Como observado acima, a integração de uma sequência exógena em uma sequência cromossômica é denominada "knock in" (“ativação”).
[0067] Como pode ser apreciado por aqueles versados no estado da técnica, o comprimento da sequência doadora pode variar e varia- rá. Por exemplo, a sequência doadora pode variar em comprimento de vários nucleotídeos a centenas de nucleotídeos, bem como a centenas de milhares de nucleotídeos.
[0068] Tipicamente, a sequência doadora no polinucleotídeo doa- dor é flanqueada por uma sequência a montante e uma sequência a jusante, que têm identidade substancial de sequência com sequências localizadas a montante e a jusante, respectivamente, da sequência direcionada pelo sistema Cas9 geneticamente modificado. Devido a essas similaridades de sequência, as sequências a montante e a ju- sante do polinucleotídeo doador permitem recombinação homóloga entre o polinucleotídeo doador e a sequência cromossômica direcio-
nada, de modo que a sequência doadora possa ser integrada (ou tro- cada com) a sequência cromossômica.
[0069] A sequência a montante, como no presente documento usada, refere-se a uma sequência de ácido nucleico que compartilha identidade de sequência substancial com uma sequência cromossômi- ca a montante da sequência direcionada pelo sistema Cas9 genetica- mente modificado. Similarmente, a sequência a jusante refere-se a uma sequência de ácido nucleico que compartilha uma identidade substancial de sequência com uma sequência cromossômica a jusante da sequência direcionada pelo sistema Cas9 geneticamente modifica- do. Como no presente documento usada, a expressão "identidade substancial de sequência" refere-se a sequências com pelo menos cerca de 75% de identidade de sequência. Assim, as sequências a montante e a jusante no polinucleotídeo doador podem ter cerca de 75%, 76%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência a montante ou a jusante da sequência de destino. Em uma modalidade exemplar, as sequências a montante e a jusante no polinucleotídeo doador podem ter cerca de 95% ou 100% de identidade de sequência com sequên- cias cromossômicas a montante ou a jusante da sequência direciona- da pelo sistema Cas9 geneticamente modificado.
[0070] Em algumas modalidades da presente invenção, a sequên- cia a montante compartilha uma identidade substancial de sequência com uma sequência cromossômica localizada imediatamente a mon- tante da sequência direcionada pelo sistema Cas9 geneticamente mo- dificado. Em outras modalidades da presente invenção, a sequência a montante compartilha identidade de sequência substancial com uma sequência cromossômica que está localizada cerca de 100 (cem) nu- cleotídeos a montante da sequência-alvo. Assim, por exemplo, a se-
quência a montante pode compartilhar uma identidade substancial de sequência com uma sequência cromossômica localizada cerca de 1 a cerca de 20, cerca de 21 a cerca de 40, cerca de 41 a cerca de 60, cerca de 61 a cerca de 80 ou cerca de 81 a cerca de 100 nucleotídeos a montante da sequência alvo. Em algumas modalidades da presente invenção, a sequência a jusante compartilha identidade substancial de sequência com uma sequência cromossômica localizada imediatamen- te a jusante da sequência direcionada pelo sistema Cas9 genetica- mente modificado. Em outras modalidades da presente invenção, a sequência a jusante compartilha identidade de sequência substancial com uma sequência cromossômica que está localizada cerca de 100 (cem) nucleotídeos a jusante da sequência-alvo. Assim, por exemplo, a sequência a jusante pode compartilhar uma identidade substancial de sequência com uma sequência cromossômica localizada cerca de 1 a cerca de 20, cerca de 21 a cerca de 40, cerca de 41 a cerca de 60, cerca de 61 a cerca de 80 ou cerca de 81 a cerca de 100 nucleotídeos a jusante da sequência-alvo.
[0071] Cada sequência a montante ou a jusante pode variar em comprimento de cerca de 20 nucleotídeos a cerca de 5.000 nucleotí- deos. Em algumas modalidades da presente invenção, as sequências a montante e a jusante podem compreender cerca de 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1.000, 1.100, 1.200, 1.300, 1.400,
1.500, 1.600, 1.700, 1.800, 1.900, 2.000, 2.100, 2.200, 2.300, 2.400,
2.500, 2.600, 2.800, 3.000, 3.200, 3.400, 3.600, 3.800, 4.000, 4.200,
4.400, 4.600, 4.800 ou 5.000 nucleotídeos. Em modalidades específi- cas da presente invenção, as sequências a montante e a jusante po- dem variar em comprimento de cerca de 50 a cerca de 1.500 nucleotí- deos. c) Tipos de Células
[0072] Uma variedade de células eucarióticas é adequada para uso nos métodos no presente documento apresentados. Por exemplo, a célula pode ser uma célula humana, uma célula de mamífero não humano, uma célula de vertebrado não mamífero, uma célula de inver- tebrado, uma célula de inseto, uma célula vegetal, uma célula de leve- dura ou um organismo eucariótico de célula única. Em algumas moda- lidades da presente invenção, a célula pode ser um embrião celular. Por exemplo, um embrião de mamífero não humano, incluindo rato, hamster, roedor, coelho, felino, canino, ovino, suíno, bovino, equino e primata. Ainda em outras modalidades da presente invenção, a célula pode ser uma célula-tronco, como células-tronco embrionárias, célu- las-tronco do tipo ES, células-tronco fetais, células-tronco adultas e similares. Em uma modalidade da presente invenção, a célula-tronco não é uma célula-tronco embrionária humana. Além disso, as células- tronco podem incluir aquelas produzidas pelas técnicas descritas em WO02003/046141, que é no presente documento incorporado na ínte- gra, ou Chung et al. (Cell Stem Cell, 2008, 2:113-117). A célula pode estar in vitro (isto é, em cultura), ex vivo (isto é, em tecido isolado de um organismo) ou in vivo fisto é, em um organismo). Em modalidades exemplares da presente invenção, a célula é uma célula de mamífero ou linhagem de células de mamífero. Em modalidades exemplares da presente invenção, a célula é uma célula humana ou uma linhagem de células humanas.
[0073] Exemplos não limitativos de células ou linhagens de células de mamífero adequadas incluem células renais embrionárias humanas (HEK293, HEK293T); células de carcinoma cervical humano (HELA); células pulmonares humanas (W138); células hepáticas humanas (Hep G2); células de osteossarcoma humano U2-OS, células humanas AB549, células humanas A-431 e células humanas K562; células de ovário de hamster chinês (CHO), células de rim de bebê hamster (BHK); células NSO de mieloma de camundongo, células 313 de fi-
broblastos embrionários de camundongo (NIH3T3), células A20 de lin- foma B de camundongo; células B16 de melanoma de camundongo; células C2C12 de mioblasto de camundongo; células SP2/0 de mielo- ma de camundongo; células embrionárias C3H-10T1/2 de camundon- go; células CT26 de carcinoma de camundongo, células DuCuP da próstata de camundongo; células EMT6 de mama de camundongo; células Hepalcic7 de hepatoma de camundongo; células J5582 de mieloma de camundongo; células epiteliais MTD-1A de camundongo; células MyEnd do miocárdio de camundongo; células renais RenCa de camundongo; células pancreáticas RIN-5F de camundongo; células X64 de melanoma de camundongo; células YAC-1 de linfoma de ca- mundongo; células 9L de glioblastoma de rato; células RBL de linfoma B de rato; células B35 de neuroblastoma de rato; células de hepatoma de rato (FITC); células BRL 3A de fígado de rato búfalo; células renais caninas (MDCK); células mamárias caninas (CMT); células D17 de os- teossarcoma de rato; células DH82 de monócitos/macrófagos de rato; células de fibroblastos (COS7) transformadass em SV-40 de rim de macaco; células CVI-76 de rim de macaco; células de rim de macaco verde africano (VERO-76). Uma extensa lista de linhagens de células de mamíferos pode ser encontrada no catálogo da American Type Cul- ture Collection (ATCC, Manassas, VA).
(V) Aplicações
[0074] As composições e métodos no presente documento apre- sentados podem ser usados em uma variedade de aplicações terapêu- ticas, de diagnóstico, industriais e de pesquisa. Em algumas modali- dades de realização, a presente invenção pode ser usada para modifi- car qualquer sequência cromossômica de interesse em uma célula, animal ou vegetal, a fim de modelar e/ou estudar a função dos genes, estudar condições genéticas ou epigenéticas de interesse, ou estudar vias bioquímicas envolvidas em várias doenças ou distúrbios. Por exemplo, organismos transgênicos podem ser criados para modelar doenças ou distúrbios, em que a expressão de uma ou mais sequên- cias de ácidos nucleicos associadas a uma doença ou distúrbio é alte- rada. O modelo da doença pode ser usado para estudar os efeitos de mutações no organismo, estudar o desenvolvimento e/ou a progressão da doença, estudar o efeito de um composto farmaceuticamente ativo na doença e/ou avaliar a eficácia de uma estratégia de terapia genéti- ca potencial.
[0075] Em outras modalidades da presente invenção, as composi- ções e métodos podem ser usados para realizar triagens genômicas funcionais eficientes e econômicas, que podem ser usadas para estu- dar a função dos genes envolvidos em um processo biológico especiífi- co e como qualquer alteração na expressão gênica pode afetar o pro- cesso biológico, ou para realizar mutagênese de saturação ou de var- redura profunda de loci genômicos em conjunto com um fenótipo celu- lar. Mutagênese de saturação ou de varredura profunda pode ser usa- da para determinar características mínimas críticas e vulnerabilidades discretas de elementos funcionais necessários para expressão de ge- nes, resistência a medicamentos e reversão de doenças, por exemplo.
[0076] Em outras modalidades da presente invenção, as composi- ções e métodos no presente documento apresentados podem ser usados para testes de diagnóstico para estabelecer a presença de uma doença ou distúrbio e/ou para uso na determinação de opções de tratamento. Exemplos de testes de diagnóstico adequados incluem detecção de mutações específicas em células cancerígenas (por exemplo, mutação específica em EGFR, HER2 e similares), detecção de mutações específicas associadas a doenças específicas (por exemplo, repetições de trinucleotídeos, mutações na B-globina associ- adas a doença falciforme, SNPs específicos etc.), detecção de hepati- te, detecção de vírus (por exemplo, zika) e assim por diante.
[0077] Em modalidades adicionais da presente invenção, as com- posições e métodos no presente documento apresentados podem ser usados para corrigir mutações genéticas associadas a uma doença ou distúrbio específico, como, por exemplo, mutações corretas do gene para globina associadas à doença das células falciformes ou talasse- mia, mutações corretas no gene para a adenosina desaminase asso- ciadas à deficiência imunológica combinada grave (SCID), reduzir a expressão de HTT, o gene causador da doença de Huntington, ou cor- rigir mutações no gene para rodopsina para o tratamento da retinite pigmentosa. Tais modificações podem ser feitas em células ex vivo.
[0078] Ainda em outras modalidades da presente invenção, as composições e métodos no presente documento apresentados podem ser usados para gerar culturas com características aprimoradas ou maior resistência a tensões ambientais. A presente invenção também pode ser usada para gerar animais de fazenda com características aprimoradas ou animais de produção. Por exemplo, os porcos têm muitas características que os tornam atraentes como modelos biomé- dicos, especialmente em medicina regenerativa ou xenotransplante.
DEFINIÇÕES
[0079] A menos que definidos de outra forma, todos os termos técnicos e científicos no presente documento empregados têm o signi- ficado comumente entendido por aquele versado no estado da técnica ao qual esta invenção pertence. As seguintes referências fornecem aos especialistas uma definição geral de muitos dos termos usados nesta invenção: Singleton et al., Dictionary of Microbiology and Mole- cular Biology (2º Ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5º Ed., R. Rieger et al. (eds.), Springer Verlag (1991); e Hale e Marham, The Harper Collins Dictionary of Biology (1991). Como usados no presente documento, os termos a seguir têm os significados que lhes são atribu-
idos, a menos que especificados de outra forma.
[0080] Ao introduzir elementos da presente invenção ou suas mo- dalidades preferenciais, os artigos "um", "uma", "o", "a" e "referido", "referida" pretendem significar que há um ou mais dos elementos. Os termos "compreendendo", "incluindo" e "tendo" destinam-se a ser in- clusivos e significam que pode haver outros elementos além dos ele- mentos listados.
[0081] O termo "cerca de" quando usado em relação a um valor numérico, x, por exemplo, significa x + 5%.
[0082] Como usados no presente documento, os termos "comple- mentar" ou "complementaridade" referem-se à associação de ácidos nucleicos de fita dupla por emparelhamento de bases por meio de li- gações de hidrogênio específicas. O emparelhamento de bases pode ser o emparelhamento de bases padrão Watson-Crick (por exemplo, pares 5'-A G T C-3' com a sequência complementar 3'-T C A G-5'). O emparelhamento de bases também pode ser ligação de hidrogênio Hoogsteen ou ligação de hidrogênio Hoogsteen invertida. A comple- mentaridade é normalmente medida em relação a uma região dúplex e, portanto, exclui saliências, por exemplo. A complementaridade entre duas cadeias da região dúplex pode ser parcial e expressa como por- centagem (por exemplo, 70%), se apenas algumas (por exemplo, 70%) das bases forem complementares. As bases que não são com- plementares são "incompatíveis". A complementaridade pode também ser completa (isto é, 100%), se todas as bases na região dúplex forem complementares.
[0083] Como no presente documento usado, o termo "sistema CRISPR/Cas" ou "sistema Cas9" refere-se a um complexo que com- preende uma proteína Cas9 (isto é, nuclease, nickase ou proteína ca- taliticamente morta) e um RNA-guia.
[0084] O termo "sequência endógena", como no presente docu-
mento usado, refere-se a uma sequência cromossômica que é nativa da célula.
[0085] Como usado no presente documento, o termo "exógeno" refere-se a uma sequência que não é nativa à célula ou uma sequên- cia cromossômica cuja localização nativa no genoma da célula está em um local cromossômico diferente.
[0086] Um "gene", como usado no presente documento, refere-se a uma região do DNA (incluindo éxons e íntrons) que codifica um pro- duto gênico, bem como a todas as regiões de DNA que regulam a pro- dução do produto gênico, independentemente de tais sequências regu- ladoras serem ou não adjacentes às sequências codificadoras e/ou transcritas. Consequentemente, um gene inclui, mas não necessaria- mente com esta limitação, sequências promotoras, terminadores, se- quências reguladoras de tradução, tais como sítios de ligação a ribos- somos e sítios de entrada interna em ribossomos, potenciadores, si- lenciadores, isoladores, elementos de contorno, origens de replicação, sítios de fixação em matrizes e regiões de controle de loci.
[0087] O termo "heterólogo" refere-se a uma entidade que não é endógena ou nativa da célula de interesse. Por exemplo, uma proteína heteróloga refere-se a uma proteína que é derivada de ou foi original- mente derivada de uma fonte exógena, tal como uma sequência de ácidos nucleicos introduzida exogenamente. Em alguns casos, a prote- ína heteróloga não é normalmente produzida pela célula de interesse.
[0088] O termo "nickase" refere-se a uma enzima que quebra uma cadeia de uma sequência de ácidos nucleicos de fita dupla (isto é, cor- ta uma sequência de fita dupla). Por exemplo, uma nuclease com ati- vidade de clivagem de cadeia dupla pode ser modificada por mutação e/ou exclusão para funcionar como uma nickase e clivar apenas uma cadeia de uma sequência de cadeia dupla.
[0089] O termo "nuclease", como no presente documento usado,
refere-se a uma enzima que quebra ambas as cadeias de uma se- quência de ácidos nucleicos de cadeia dupla.
[0090] Os termos "ácido nucleico" e "polinucleotídeo" referem-se a um polímero de desoxirribonucleotídeo ou ribonucleotídeo, em con- formação linear ou circular, e em forma de fita simples ou dupla. Para os fins da presente invenção, esses termos não devem ser interpreta- dos como limitativos em relação ao comprimento de um polímero. Os termos podem abranger análogos conhecidos de nucleotídeos natu- rais, bem como nucleotídeos que são modificados nas porções base, açúcar e/ou fosfato (por exemplo, esqueletos de fosforotioato). Em ge- ral, um análogo de um nucleotídeo específico tem a mesma especifici- dade de emparelhamento de bases, isto é, um análogo de A se empa- relhará com T.
[0091] O termo "nucleotídeo" refere-se a desoxirribonucleotídeos ou ribonucleotídeos. Os nucleotídeos podem ser nucleotídeos padrões (isto é, adenosina, guanosina, citidina, timidina e uridina), isômeros de nucleotídeos ou análogos de nucleotídeos. Um análogo de nucleotídeo refere-se a um nucleotídeo que possui uma base purina ou pirimidina modificada ou uma porção ribose modificada. Um análogo de nucleotí- deo pode ser um nucleotídeo de ocorrência natural (por exemplo, ino- sina, pseudouridina etc.) ou um nucleotídeo de ocorrência não natural. Exemplos não limitativos de modificações nas porções de açúcar ou de base de um nucleotídeo incluem a adição (ou remoção) de grupos acetila, grupos amino, grupos carboxila, grupos carboximetila, grupos hidroxila, grupos metila, grupos fosforila e grupos tiol, bem como a substituição dos átomos de carbono e nitrogênio das bases por outros átomos (por exemplo, 7-desaza purinas). Os análogos de nucleotídeos também incluem nucleotídeos didesóxi, nucleotídeos 2'-O-metilA, áci- dos nucleicos bloqueados (LNA), ácidos nucleicos peptídicos (PNA) e morfolinos.
[0092] Os termos "polipeptídeo" e "proteína" são usados de forma intercambiável para se referir a um polímero de resíduos de aminoáci- dos.
[0093] Os termos "sequência-alvo", "sequência cromossômica al- vo" e "sítio-alvo" são usados de forma intercambiável para se referir à sequência específica no DNA cromossômico ao qual o sistema Cas9 geneticamente modificado é direcionado e ao sítio em que o sistema Cas9 geneticamente modificado modifica o DNA ou a(s) proteína(s) associada(s) ao DNA.
[0094] Técnicas para determinar a identidade da sequência de ácidos nucleicos e de aminoácidos são conhecidas no estado da téc- nica. Tipicamente, essas técnicas incluem a determinação da sequên- cia de nucleotídeos do MRNA para um gene e/ou a determinação da sequência de aminoácidos codificada por esse meio e a comparação dessas sequências com uma segunda sequência de nucleotídeos ou aminoácidos. Sequências genômicas também podem ser determina- das e comparadas dessa maneira. Em geral, identidade refere-se a uma correspondência exata de nucleotídeo para nucleotídeo ou ami- noácido para aminoácido de dois polinucleotídeos ou sequências de polipeptídeos, respectivamente. Duas ou mais sequências (polinucleo- tídeo ou aminoácido) podem ser comparadas determinando sua iden- tidade percentual. A identidade percentual de duas sequências, sejam sequências de ácidos nucleicos ou de aminoácidos, é o número de correspondências exatas entre duas sequências alinhadas, dividido pelo comprimento das sequências mais curtas e multiplicado por 100. Um alinhamento aproximado para sequências de ácidos nucleicos é fornecido pelo algoritmo de homologia local de Smith e Waterman, Ad- vances in Applied Mathematics 2:482-489 (1981). Esse algoritmo pode ser aplicado a sequências de aminoácidos usando a matriz de pontua- ção desenvolvida por Dayhoff, Atlas of Protein Sequences and Structu-
re, M.O. Dayhoff ed., 5 supl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., EUA, e normalizada por Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986). Uma implementação exem- plar desse algoritmo para determinar a porcentagem de identidade de uma sequência é fornecida pelo Genetics Computer Group (Madison, Wis.) no aplicativo utilitário "BestFit". Outros programas adequados para calcular a porcentagem de identidade ou similaridade entre se- quências são geralmente conhecidos no estado da técnica, por exem- plo, outro programa de alinhamento é o BLAST, usado com parâme- tros padrão. Por exemplo, BLASTN e BLASTP podem ser usados usando os seguintes parâmetros padrões: genetic code=standard; fil- ter=none; strand=both; cutoff=60; expect=10; Matrix=BLOSUM6?2; Descriptions=50 sequences; sort by=HIGH SCORE; Databases=non- redundant, GenBank+EMBL+DDBJ+PDB+GenBank CDS transla- tions+Swiss protein+Spupdate+PIR. Detalhes desses programas po- dem ser encontrados no site do GenBank.
[0095] Como várias alterações podem ser feitas nas células e nos métodos descritos acima sem se afastar do escopo da invenção, pre- tende-se que toda a matéria contida na descrição acima e nos exem- plos dados abaixo seja interpretada como ilustrativa e não em um sen- tido limitante.
EXEMPLOS
[0096] Os exemplos a seguir ilustram certos aspectos da invenção. Exemplo 1: Determinação dos requisitos de PAM para clivagem de DNA-alvo por ortólogos de Cas9
[0097] Ortólogos de Cas9 de Bacillus smithii, Lactobacillus rham- nosus, Parasutterella excrementihominis, Mycoplasma canis, Myco- plasma gallisepticum, Akkermansia glycaniphila, Akkermansia mu- ciniphila, Oenococcus kitaharae, Bifidobacterium bombi, Acidothermus cellulolyticus, Alicyclobacillus hesperidum, Wolinella succinogenes, Ni-
tratifractor salsuginis, Ralstonia syzygii e Corynebacterium diphtheria foram otimizados com códons para expressão em células humanas e marcados com uma localização nuclear de antígeno T grande SV40 (NLS) no término C (SEQ ID NOs: 1-30; ver Tabela 6 abaixo). A ex- pressão de cada ortólogo foi conduzida por um estimulador e promotor precoces imediatos do citomegalovírus humano (CMV). RNA CRISPR (crRNA) e crRNA transativador putativo (tracr»RNA) para cada ortólogo foram unidos para formar um único RNA-guia (sgRNA) (SEQ ID NOs: 31-45; ver Tabela 6 abaixo). A expressão de cada sgRNA foi conduzi- da por um promotor U6 humano. sgRNA transcrito in vitro foi prepara- do a partir de um modelo de PCR marcado com promotor T7 como um complemento para digestão in vitro.
[0098] Células K562 humanas foram transfectadas com plasmídeo que codifica Cas9 e plasmídeo de expressão de saRNA por nucleofec- ção. Cada transfecção consistiu de 2 milhões de células, 5 ug de DNA do plasmídeo codificador de Cas9 e 3 ug de DNA do plasmídeo de ex- pressão de sgRNA. Células foram colhidas aproximadamente 24 horas após a transfecção, lavadas com tampão PBS gelado e lisadas com 150 uL de solução de lise (HEPES 20 mM, pH 7,5; KCI 100 mM; MgCl2 mM, DTT 1 mM, glicerol a 5%, Triton X-100 a 0,1%, 1x inibidor de protease) com agitação constante por 30 minutos em uma câmara fria a 4ºC. Sobrenadante foi preparado removendo restos celulares resi- duais com centrifugação a 16.000 xg por 2 minutos a 4ºC e usado co- mo fonte de Cas9 RNP para digestão in vitro de uma biblioteca de PAM DNA de plasmídeo. A biblioteca continha 4º PAMs degenerados, cada um imediatamente precedido por um protoespaçador com a se- guinte configuração: -GTACAAACGGCAGAAGCTGGNNNNNNNN-3' (SEQ ID NO: 46). Cada digestão in vitro consistiu de 10 ul de sobre- nadante de lisado celular, 2 uL de tampão de digestão 5x (HEPES 100 MM, pH 7,5; KCI 500 mM; MgCl2 25 mM; DTT 5 mM; glicerol a 25%),
800 ng de DNA de biblioteca PAM e 20 pmoles de suplemento sa RNA transcrito in vitro em um volume de reação de 20 uL. A reação foi man- tida a 37ºC por 30 minutos e depois purificada com Kit de purificação por PCR. Bibliotecas de sequenciamento //lumina NextSeg foram pre- paradas a partir de produtos digeridos e submetidas a sequenciamento profundo. Os dados do sequenciamento profundo foram analisados usando um programa Weblogo para deduzir o requisito de PAM para cada ortólogo de Cas9.
[0099] Os resultados estão resumidos na FIG. 1. Os resultados revelaram vários ortólogos de Cas9 que usam PAMs A e/ou T para clivagem de DNA-alvo in vitro. Esses ortólogos de Cas9 poderiam for- necer um meio para atingir sítios genômicos ricos em AT. Os resulta- dos também revelaram vários ortólogos de Cas9 que usam um PAM adequado para atingir sítios genômicos ricos em GC. Esses ortólogos de Cas9 podem proporcionar esquemas de direcionamento alternati- vos a SpyCas9 em sítios genômicos ricos em GC para aumentar a re- solução e a especificidade do direcionamento. Exemplo 2: Modificação do genoma usando Cas9 de Bacillus smithii (BsmCas9) e Cas9 de Lactobacillus rhamnosus (LrhCas9)
[00100] Como mostrado na FIG. 1 e Tabela A (acima), os pequenos BsmCas9 (1095 aa) (SEQ ID NO: 2) e o LrhCas9 (SEQ ID NO: 4) usam um PAM 5-NNNNCAAA-3 'e um PAM 5-NGAAA-3 'PAM para ligação com o DNA-alvo, respectivamente. Esses novos usos dos PAMs fornecem um meio para atingir sítios genômicos ricos em AT. Para demonstrar a edição de genes, células K562 humanas (1 x 10º) foram nucleofectados com 5 ug de DNA plasmídico que codifica Cas9 e 3 ug de DNA plasmídico de expressão de sgRNA. Os sítios genômi- cos direcionados incluem o locus da tirosina-proteína fosfatase não receptora tipo 2 humana (PTN2), o locus de homeobox 1 humano de espiráculos vazios (EMX1), o locus de ligante 1 humano para morte celular programada 1 (PD1L1), o locus de porto seguro humano AAVSA1, o locus da oxidorredutase do citocromo p450 humano (POR) e o locus do membro 3 do grupo | da subfamília 1 de receptores nuclea- res humanos 1. DNA genômico foi preparado usando uma solução de extração de DNA (QuickExtract'") três dias após a transfecção e regi- ões genômicas alvo foram amplificadas por PCR (JumpStart Tag'" ReadyMix""). Os primers de PCR estão listados na Tabela 1. Tabela 1. Primers de PCR.
Locus | Primer direto (5-3) Primer reverso (5'-3') Tamanh [Ps |Pmediaa a meo Lo AATAACAAGAC (SEQ | GAGTG (SEQ ID NO:48) ID NO:47) CAGAG (SEQ ID NO:49)| CCT (SEQ ID NO:50) ACTCAAAC (SEQ ID CTTGCAG (SEQ ID NO:51) NO:52) CTCC (SEQ ID NO:53) | AMACC (SEQ ID NO:54) | o GTArIGEa ID NO 9 Tone EA IDNOSA) CGTAT (SEQ ID NO:55)| TCACA (SEQ ID NO:56) CATGT (SEQ ID NO:57)| CTTGG (SEQ ID NO:58)
[00101] Amplificação foi realizada usando a seguinte condição: 1 ciclo de 98ºC durante 2 minutos para desnaturação inicial; 34 ciclos de 98ºC durante 15 segundos, 62ºC durante 30 segundos e 72ºC durante 45 segundos; 1 ciclo de 72ºC durante 5 minutos; e permanência a 4ºC. Os produtos de PCR foram digeridos com nuclease Cel-1 e determi- nados em um gel de acrilamida a 10%. As taxas de mutação alvo fo- ram medidas usando /mageJ e expressas como porcentagens de in- serções e/ou exclusões (% de indels). Os resultados estão resumidos na Tabela 2. Esses resultados demonstram que ambos os ortólogos de Cas9 foram capazes de editar sítios genômicos endógenos em cé- lulas humanas usando um PAM 5-NNNNCAAA-3' (BsmCas9) ou um PAM 5'-NGAAA-3' (LrhCas9). Humanas K562. Nº protoespaçador (5'-3') (9-3)* (%) 9 TAGAA (SEQ ID NO:59) | AMA EMXT1/Alvo 1) GAAGGTGTGGTTCCAG | AGGACA 6,8 AACCGG (SEQ ID CFO EMXT1/Alvo 2) TGEGTTCCAGAACCGGA | AGTACA| 10,9 uia CSNMEODNOENIAA EMXT1/Alvo 3) CCCAGGTGAAGGTGTG | GAACC rea Cconema Nona Ga EMX1/Alvo 4) AGAANCCGGAGGACAAA GTACAA (SEQ ID NO:63) | AGA LrhCas9| PD1L1 CCTCTGGCACATCCTCC| TGAAA | 38,9 AAA (SEQ ID NO:64) | TSAAA | 35º | AAVS1 CTAGGGACAGGATTGG | AGAMA | 32,7 TGAC (SEQ |D NO:65) | ARAAA | 527 | PORIAIlIvo 1 | GOCTOGTACTGGCGAAT | GGAAA | 26,7 | GCT (SEQ ID NO:66) | PERSA | 267 | PORIAIlvo 2 | GCETGAAGAGCTACGAG | AGAAG ea AdeteaNOA PORIAIvo 3 | CATGGGGGAGATGGGC | TGAAG
MESA CAR/Alvo 1 | AGAGACTCTCTAGAAGG| AGAAMA | 31,7 GAC (SEQ ID NO:69) | ASRAA | 917 | CARIAlvo 2 | GTGAGAGTCTCCTCCCC| GGAAA | 27,0 AATG (SEQ ID NO:70) PERSA | 27º | | CARIAIvo 3 | GGGAGGAGACTCTCAC CTGA (SEQ ID NO:71)
Exemplo 3: Melhoramento do Cas9 de Parasutterella excrementi- hominis (PexCas9) por fusão com motivos moduladores da cro- matina
[00102] Cas9 de Parasutterella excrementihominis (PexCas9-NLS) (SEQ ID NO: 6) foi modificado por fusão com um peptídeo HMGN1 humano (SEQ ID NO: 72) no término N usando um ligante TGSG (SEQ ID NO: 109) e com um peptídeo HMGB1 caixa A humano (fusão PexCas9-HN1HB1; SEQ ID NO: 1 17) ou um peptídeo de domínio glo- bular central da histona humana H1 (PexCas9-HN1H1G; SEQ ID NO: 118) no término C usando um ligante LEGGGS (SEQ ID NQ: 108). ID NO:
PAKVEAKPKKAAAKDKSSDKKVQTKGKR GAKGKQAEVANQETKEDLPAENGETKTE
ESPASDEAGEKEAKSD humano caixa | KKHPDASVNFSEFSKKCSERWKTMSAKE A (HB1) KGKFEDMAKADKARYEREMKTYIPPKGE globular central| QKYIKSHYKVGENADSQ!IKLSIKRLVTTGV da histona H1/ | LKOTKGVGASGSFRLAKSDEP humana (H1G)
[00103] Células K562 humanas (1 x 105) foram transfectadas com DNA de plasmídeo que codifica a fusão PexCas9-NLS, PexCas9- HN1HB1 ou a fusão PexCas9-HN1H1G em quantidades molares equi- valentes (5 e 5,4 ug, respectivamente) e 3 ug de plasmídeo saRNA para direcionar um sítio genômico no locus da oxidorredutase do cito- cromo humano p450. DNA genômico foi preparado usando solução de extração de DNA (QuickExtract"Y) três dias após a transfecção e a re- gião genômica alvo foi amplificada por PCR usando o primer direto 5'- CTCCCCTGCTTCTTGTCGTAT-3' (SEQ ID NO: 55) e o primer reverso
5-ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 56). Amplificação foi realizada com a seguinte condição: 1 ciclo de 98ºC por 2 minutos para desnaturação inicial; 34 ciclos de 98ºC por 15 segundos, 62ºC por 30 segundos e 72ºC por 45 segundos; 1 ciclo de 72ºC durante 5 minutos; e permanência a 4ºC. Os produtos de PCR foram digeridos com nu- clease Cel-1 e determinados em um gel de acrilamida a 10%. As taxas de mutação alvo foram medidas usando ImageJ e expressas como porcentagens de inserções e/ou exclusões (% de indels). Os resulta- dos estão resumidos na Tabela 4. Os resultados demonstram que a fusão Cas9 com pelo menos um motivo modulador da cromatina au- menta sua eficiência na edição de genes em alvos endógenos em cé- lulas humanas.
PexCas9 em células humanas K562. Cas9 nuclease Locus (5-3) (5-3)* PexCas9-NLS — | POR | TGTACATGGGGG| ces Fusão PexCas9- AGATGGGC (SEQ HN1HB1 ID NO: 75) PexCas9HN1H1G * Os nucleotídeos determinantes do PAM estão sublinhados. Exemplo 4. Melhoramento do sistema Cas9 de Mycoplasma canis (McaCas9) por modificação de saaRNA
[00104] A sequência codificadora de crRNA do tipo selvagem de McaCas9 contém quatro resíduos de timidina consecutivos na região de repetição e prevê-se que três dos quatro resíduos de timidina em- parelhem-se com três resíduos de adenosina na suposta sequência de tracr»RNA quando o crRNA e o tracrRNA são unidos para formar um SARNA. Sabe-se que a RNA polimerase humana (Pol) Ill usa quatro ou mais resíduos de timidina consecutivos na cadeia de RNA codificador como sinal de terminação da transcrição. Para evitar uma terminação de transcrição precoce do saRNA de McaCas9 em células humanas, uma mutação T para C e uma mutação correspondente de A para G foram introduzidas no scaffold do saRNA para formar um scaffold de SAgRNA modificado com a seguinte sequência: 5'-
GUUCUAGUGUUGUACAAUAUUUGGGUGAAAACCCAAAUAUUGUACAUCCUAGAU CAAGGCGCUUAAUUGCUGCCGUAAUUGCUGAAAGCGUAGCUUUCAGUUUUUUUV- 3' (SEQ ID NO: 76), na qual os nucleotídeos mutados estão sublinha- dos. Prevê-se também que essa modificação aumente a estabilidade termodinâmica do scaffold do saRNA.
[00105] Células K562 humanas (1 x 10º) foram transfectadas com 5,5 ug de DNA de plasmídeo que codifica uma proteína de fusão McaCas9, que contém um peptídeo HMGN1 no término N e um peptí- deo de domínio globular da histona H1 no término C, e 3 ug de DNA do plasmídeo saRNA que codifica o scaffold do saRNA de controle ou o scaffold do saRNA modificado. DNA genômico foi preparado usando uma solução de extração de DNA (QuickExtract'"") três dias após a transfecção e a região genômica alvo foi amplificada por PCR usando o primer direto B"CTCCCCTGCTTCTTGTCGTAT-3' (SEQ ID NO: 55) e o primer reverso 5:- ACAGGTCGTGGACACTCACA-3' (SEQ ID NO: 56). A amplificação foi realizada com a seguinte condição: 1 ciclo de 98ºC durante 2 minutos para desnaturação inicial; 34 ciclos de 98ºC por 15 segundos, 62ºC por 30 segundos e 72ºC por 45 segundos; 1 ciclo de 72ºC por 5 minutos; e permanência a 4ºC. Os produtos de PCR foram digeridos com nuclease Cel-1 e determinados em um gel de acrilamida a 10%. As taxas de mutação alvo foram medidas usando ImageJ e expressas como porcentagens de inserções e/ou exclusões (% de indels). Os resultados estão resumidos na Tabela 5. Os resulta- dos demonstram que a atividade de um ortólogo de Cas9 em células de mamífero podem ser melhorados por modificação de seu scaffold de saRNA.
Tabela 5. Edição de genes usando McaCas9 em combinação com scaffold de saRNA de controle ou scaffold de sa RNA modificado. Scaffold de saRNA | Locus (5'-3') 3) (%) ATAGATGCGGCC| TesG de controle AAGGTGTACA Te ES modificado * Os nucleotídeos determinantes do PAM estão sublinhados. Exemplo 5. Melhoramento da atividade de McaCas9, BsmCas9, PexCas9 e LrhCas9 por fusão com motivos moduladores da cro- matina
[00106] Proteínas de fusão Cas9-CMM adicionais foram preparadas ligando as proteínas McaCas9-NLS, BsmCas9-NLS e LrhCas9-NLS com HMGN1 (HN1) no término amino e HMGB1 caixa A (HB1) ou o motivo globular central da histona H1 (H1G) no término carboxila para produzir McaCas9-HN1HB1 (SEQ ID NO: 123), McaCas9-HN1H1G (SEQ ID NO: 124), BsmCas9-HN1HB1 (SEQ ID NO: 119), Bsm- HN1H1G (SEQ ID NQ: 120), Lrh-HNIHB1 (SEQ ID NO: 121), LrhCas9-HN1H1G (SEQ ID NO: 122). A atividade nuclease dessas fusões e das fusões PexCas9-CMM descritas acima no Exemplo 3 fo- ram comparadas com a atividade da correspondente proteína Cas9 geneticamente modificada essencialmente como descrito acima nos Exemplos 2 e 3. A Tabela 6 apresenta o sítio de destino (isto é, proto- espaçador + PAM, mostrado em negrito com os nucleotídeos determi- nados sublinhados) em /oci específicos para cada Cas9 nuclease.
Tabela 6. Sítios-Alvo de Edição de Genes Cas9 Locus Sitio-alvo (5-3)
NO Mca |PORT |ATAGATGCGGCCAAGGTGTACATGGG Bsm |PTN2 Ra TACATOGETATANTAGAABBAGEATAT | Pex |PORT |TGTACATGGGGGAGATGGGCCEG | o Pon coTeroaaacaTOc Tea 8a
[00107] A porcentagem de indels sob cada condição é plotada nas FIGS. 2A-D. As combinações HN1HB1 e HN1IH1G aprimoraram signi- ficativamente os quatro ortólogos de Cas9 em pelo menos um sítio. Com base na magnitude da mudança de enovelamento, a modificação de fusão do CMM forneceu o maior aprimoramento em McaCas9, au- mentando sua atividade em pelo menos cinco vezes nos dois locais testados (FIG. 2A). A fusão de CMM proporcionou um aumento de mais de duas vezes em PexCas9 (FIG. 2B). A atividade de BsmCas9 foi aumentada em mais de três vezes em um sítio, mas houve apenas 20% de aumento no segundo sítio e nenhum efeito no terceiro sítio (FIG. 2C). Deve-se notar, no entanto, que todas as três nucleases de BsmCas9 foram altamente eficientes (> 35% de indels). LrhCas9 foi altamente eficiente nos dois sítios testados (22% e 33% de indels), mesmo sem a modificação da fusão (FIG. 2D). No entanto, a combina- ção HN1H1G ainda proporcionou um aprimoramento significativo nos dois sítios, com aumento de 70% e 28% na atividade. Esses resulta- dos demonstram que a estratégia de fusão de CMM aumenta a efici-
ência da edição de genes. Exemplo 6. Efeitos de fusões Cas9-CMM fora do alvo previsto
[00108] Para avaliar a atividade das fusões Cas9-CMM fora do alvo previsto, 1 a 5 sítios fora do alvo previsto em potencial, classificados como os melhores para cada sítio de destino, foram analisados usan- do o ensaio Surveyor Nuclease. Além dos dados de fusão de Cas9 e Cas9-CMM descritos acima no Exemplo 5, dados de fusões de Cas9 de Streptococcus pyogenes (SpyCas9), fusões SpyCas9-CMM, fusões de Cas9 de Streptococcus pasteurianus (SpaCas9), fusões Spa-CMM, fusões de Cas9 de Campylobacter jejuni (CjeCas9) e fusões CjeCas9- SMM também foram analisadas. De um total de 64 sítios potenciais fora do alvo previsto analisados, clivagem fora do alvo previsto foi de- tectada em 11 sítios, contribuída por 9 sequências-guia do total de 21 sequências-guia testadas. Nos 11 sítios fora do alvo previsto, o Cas9 de controle e as nucleases de fusão foram simultâneas, com exceção do sítio POR Spy 1-OT1, no qual nenhuma clivagem fora do alvo pre- visto foi detectada sob o SpyCas9 de controle. No geral, não houve diferença significativa entre as nucleases de fusão e o Cas9 de contro- le (FIG. 3). Por exemplo, em todos os 11 sítios fora do alvo previsto, a combinação de fusão HN1H1G teve uma média de 8,0 + 6,0% de in- dels e o Cas9 de controle apresentou em média 7,5 + 5,1% de indels. Da mesma forma, nos 10 sítios fora do alvo previsto relevantes para a combinação de fusão HN1HB1, não houve diferença significativa entre a combinação de fusão e o Cas9 de controle (6,9 + 5,7% versus 6,5 + 5,4% de indels). Tomados em conjunto, esses resultados mostram que o aprimoramento da atividade no alvo pelas combinações de fusão HN1H1B e HN1H1G geralmente não resulta em um aumento na ativi- dade fora do alvo previsto. Sistemas Cas9 Geneticamente Modificados
[00109] A Tabela7 apresenta as sequências de DNA humano e de proteínas Cas9/NLS geneticamente modificadas otimizadas por có- dons (SEQ ID NOS: 1-30, em que a sequência NLS está sublinhada) e as sequências de DNA de sgRNAs geneticamente modificadas (SEQ ID NOS: 31- 45; os resíduos N na extremidade 5' indicam a sequência- alvo programável). Também apresentadas nas fusões Cas9-CMM (SEQ ID NOS: 117-124). Sequência de DNA de BsmCas9/NLS (SEQ ID NO:1)
ATGAACTACAAGATGGGCCTCGACATCGGAATCGCCTCTGTTGG ATGGGCCGTGATCAACCTGGACCTGAAGAGAATCGAGGACCTC GGCGTGCGGATCTTCGACAAGGCTGAGCATCCTCAGAACGGCG AGTCTCTGGCCCTGCCTAGAAGAATTGCCAGAAGCGCCAGACG GCGGCTGCEGGAGAAGAAAGCACAGACTGGAACGGATCAGACGG CTGCTGGTGTCCGAGAACGTGCTGACCAAAGAAGAGATGAACCT GCTGTTCAAGCAGAAAAAGCAGATCGACGTGTGGCAGCTGAGA GTGGACGCCCTGGAAAGAAAGCTGAACAACGACGAGCTGGCCA GAGTGCTGCTGCACCTGGCCAAGAGAAGAGGCTTCAAGAGCAA CAGAAAGAGCGAGCGGAACAGCAAAGAGAGCAGCGAGTTCCTG AAGAACATCGAAGAGAACCAGAGCATTCTGGCCCAGTACAGATC CGTGGGCGAGATGATCGTGAAGGACAGCAAGTTCGCCTACCAC AAGCGGAACAAGCTGGACAGCTACAGCAACATGATCGCCAGGG
ACGATCTGGAAAGAGAGATCAAGCTGATCTTCGAGAAGCAGCGC GAGTTCAACAACCCCGTGTGCACCGAGAGACTGGAAGAGAAGTA|
CCTGAACATCTGGTCCAGCCAGCGGCCTTTCGCCTCCAAAGAGG ACATCGAGAAAAAAGTGGGCTTCTGCACCTTCGAGCCCAAAGAG AAAAGAGCCCCTAAGGCCACCTACACCTTCCAGAGCTTCATCGT GTGGGAGCACATCAACAAGCTGCGGCTGGTGTCTCCCGACGAG ACAAGAGCCCTGACCGAGATCGAGCGGAATCTGCTGTATAAGCA GGCCTTCAGCAAGAACAAGATGACCTACTACGACATCCGGAAGC TGCTGAACCTGAGCGACGACATCCACTTCAAGGGCCTGCTGTAC GACCCCAAGAGCAGCCTGAAGCAGATTGAGAACATCCGGTTTCT GGAACTGGACTCTTACCACAAGATCCGGAAGTGCATCGAGAATG TGTACGGCAAGGACGGCATCCGCATGTTCAACGAGACAGACATC GACACCTTCGGCTACGCCCTGACCATCTTCAAGGACGACGAGGA, TATCGTGGCCTACCTGCAGAACGAGTACATCACCAAGAACGGCA AGCGGGTGTCCAATCTGGCCAACAAGGTGTACGACAAGTCCCTG ATCGACGAACTGCTGAATCTGTCCTTCTCCAAATTCGCCCACCOTG AGCATGAAGGCCATCCGGAACATCCTGCCTTACATGGAACAGGG CGAAATCTACAGCAAGGCCTGCGAACTGGCCGGCTACAACTTCA CAGGCCCCAAGAAGAAAGAGAAGGCCCTGCTGCTGCCTGTGAT CCCCAATATCEGCCAATCCOTGTGGTCATGCGGGCCCTGACACAGA GCAGAAAGGTGGTCAACGCCATCATCAAGAAATACGGATCCCCC GTGTCCATCCACATEGAGCTGGCTAGGGATCTGAGCCACAGCTT CGACGAGCGGAAGAAGATCCAGAAGGACCAGACCGAGAACCGC AAGAAGAACGAAACCGCCATCAAGCAGCTGATCGAGTACGAGCT GACTAAGAACCCCACCGGCCTGGACATCGTGAAGTTCAAACTTT GGAGCGAGCAGCAAGGCAGATGCATGTACTCCCTGAAGCCTATT) GAGCTGGAAAGACTGCTGGAACCCGGCTACGTGGAAGTGGACC ACATTCTGCCCTACAGCAGAAGCCTGGACGACAGCTACGCCAAC AAAGTGCTGGTCCTGACAAAAGAGAACCGCGAAAAGGGCAATCA CACCCCTGTGGAATATCTCGGCCTGGGCTCTGAGCGGTGGAAG AAATTCGAGAAGTTCGTGCTGGCTAACAAGCAGTTCTCTAAGAA GAAGAAGCAGAACCTGCTCCGGCTGAGATACGAGGAAACCGAG GAAAAAGAGTTCAAAGAGCGGAACCTGAACGACACCCGGTACAT CTCCAAGTTCTTCGCCAACTTCATCAAAGAGCATCTGAAGTTCGC CGACGGCGACGGCGGCCAGAAAGTGTACACAATCAACGGCAAG ATCACCGCTCACCTGAGAAGCAGATGGGACTTCAACAAGAACCG GGAAGAGAGCGACCTGCACCACGCTGTGGATGCTGTGATTGTG GCCTGTGCCACACAGGGCATGATCAAGAAGATTACCGAGTTCTA
CAAGGCCCGCGAGCAGAACAAAGAGTCCGCCAAGAAAAAAGAA CCCATCTTTCCCcAGCCOTTGGCCOTCACTTEGCCGATGAGCTGAA
GGCTCGGCTGAGCAAGTTCCCTCAAGAGTCCATCGAGGCCTTC GCTCTGGGCAACTACGACAGAAAGAAGCTGGAATCCCTGCGGC CTGTGTTCGTGTCCAGAATGCCCAAGAGATCCGTGACAGGCGCT GCCCACCAAGAGACACTGAGAAGATGCGTGGGCATCGACGAGC AGTCTGGCAAGATTCAGACCGCCGTGAAAACAAAGCTGAGCGAC ATCAAGCTGGATAAGGACGGACACTTCCCCATGTACCAGAAAGA GTCTGACCCCAGAACCTACGAGGCCATCAGACAGAGGCTGCTC GAACACAACAACGACCCTAAGAAGGCCTTTCAAGAGCCACTGTA CAAGCCCAAAAAGAATGGCGAGCCCGGACCAGTGATCCGGACC GTGAAGATCATCGACACAAAGAACAAGGTGGTGCACCTGGACG GCAGCAAGACAGTGGCCTACAACTCCAACATCGTGCGGACCGA CGTGTTCGAGAAGGATGGCAAGTACTACTGCGTGCCCGTGTACA CTATGGATATCATGAAGGGCACCCTGCCTAACAAGGCCATCGAA
GCCAACAAGCCCTACTCCGAGTGGAAAGAGATGACCGAAGAGTA|
CACGTTCCAGTTCAGTCTGTTCCCCAACGACCTCGTGCGCATCG TGCTGCCAAGAGAGAAAACCATCAAGACCAGCACCAACGAGGAA ATCATCATTAAGGACATCTTTGCCTACTACAAGACCATCGACAGC GCCACAGGCGGCCTGGAACTGATCTCCCACGATCGGAACTTCA GCCTGAGAGGCGTGGGCTCTAAGACACTGAAGCGCTTTGAGAA GTATCAGGTGGACGTGCTGGGCAACATCCACAAAGTGAAGGGC GAGAAGAGAGTCGGCCTGGCCGCTCCTACCAACCAGAAAAAGG GAAAGACCGTGGACAGCCTGCAGAGCGTGTCCGATCCCAAGAA
GAAGAGGAAGGTG Sequência da proteína BsmCas9/NLS (SEQ ID NO:2)
MNYKMGLDIGIASVGWAVINLDLKRIEDLGVRIFDKAEHPQNGESLA LPRRIARSARRRLRRRKHRLERIRRLLVSENVLTKEEMNLLFKQKKQ IDVWQLRVDALERKLNNDELARVLLHLAKRRGFKSNRKSERNSKES SEFLKNIEENQSILAQYRSVGEMIVKDSKFAYHKRNKLDSYSNMIAR DDLEREIKLIFEKQREFNNPVCTERLEEKYLNIWSSQRPFASKEDIEK KVGFCTFEPKEKRAPKATYTFQSFIVWEHINKLRLVSPDETRALTEIE RNLLYKQAFSKNKMTYYDIRKLLNLSDDIHFKGLLYDPKSSLKQIENI RFLELDSYHKIRKCIENVYGKDGIRMFNETDIDTFGYALTIFKDDEDIV AYLQNEYITKNGKRVSNLANKVYDKSLIDELLNLSFSKFAHLSMKAIR NILPYMEQGEIYSKACELAGYNFTGPKKKEKALLLPVIPNIANPVVMR ALTQSRKVVNAIIKKYGSPVSIHIELARDLSHSFDERKKIQKDQTENR KKNETAIKQLIEYELTKNPTGLDIVKFKLWSEQQGRCMYSLKPIELER LLEPGYVEVDHILPYSRSLDDSYANKVLVLTKENREKGNHTPVEYLG LGSERWKKFEKFVLANKQFSKKKKQNLLRLRYEETEEKEFKERNLN
DTRYISKFFANFIKEHLKFADGDGGQKVYTINGKITAHLRSRWDFNK NREESDLHHAVDAVIVACATQGMIKKITEFYKAREQNKESAKKKEPI|
FPQPWPHFADELKARLSKFPQESIEAFALGNYDRKKLESLRPVFVS RMPKRSVTGAAHQETLRRCVGIDEQSGKIQTAVKTKLSDIKLDKDG HFPMYQKESDPRTYEAIRQRLLEHNNDPKKAFQEPLYKPKKNGEP GPVIRTVKIIDTKNKVVHLDGSKTVAYNSNIVRTDVFEKDGKYYCVPV YTMDIMKGTLPNKAIEANKPYSEWKEMTEEYTFQFSLFPNDLVRIVL PREKTIKTSTNEEIIIKDIFAYYKTIDSATGGLELISHDRNFSLRGVGSK TLKRFEKYQVDVLGNIHKVKGEKRVGLAAPTNQKKGKTVDSLQSVS DPKKKRKV
Sequência de DNA de LrhCas9/NLS (SEQ ID NO:3)
ATGACCAAGCTGAACCAGCCTTACGGCATCGGCCTGGACATCG GCAGCAATAGCATCGGCTTTGCCGTGGTGGACGCCAACAGCCA TCTGCTGAGACTGAAGGGCGAGACAGCCATCGGCGCCAGACTG TTTAGAGAGGGACAGAGCGCCGCTGACAGACGGGGAAGCAGAA CCACAAGAAGGCGGCTGTCCAGAACCAGATGGCGGCTGAGCTT CCTGCGGGATTTCTTCEGCCCCTCACATCACCAAGATCGACCCCG ACTTCTTTCTGCGGCAAAAATACTCCGAGATCAGCCCCAAGGAC
AAGGACAGGTTTAAGTACGAGAAGCGGCTGTTCAACGACCGGAC CGACGCCGAGTTCTACGAGGACTACCCCAGCATGTACCACCTGA|
GACTGCACCTGATGACCCACACACACAAGGCCGATCCTCGGGA AATCTTCCTGGCCATCCACCACATCCTGAAGTCCAGAGGCCACT TTCTGACACCCGGCGCTGCCAAGGACTTCAACACCGACAAAGTG GACCTTGAGGACATCTTCCCCGCTCTGACAGAGGCTTACGCCCA GGTGTACCCCGATCTGGAACTGACCTTCGATCTGGCCAAGGCC GACGACTTCAAGGCCAAGCTGCTGGACGAACAGGCCACACCTA GCGACACACAGAAAGCCCTGGTCAACCTGCTGCTGTCTAGCGAC GGCGAGAAAGAAATCGTGAAGAAGCGGAAGCAGGTCCTGACCG AGTTCGCCAAGGCCATCACCGGCCTGAAAACAAAGTTCAATCTG GCCCTGGGCACCGAGGTGGACGAAGCTGATGCTTCCAACTGGC AGTTCAGCATGGGCCAGCTGGACGACAAGTGGTCCAACATCGAA: ACCAGCATGACCGACCAGGGCACCGAAATCTTCGAGCAGATCCA: AGAGCTGTACCGGGCCAGACTGCTGAACGGAATTGTGCCTGCC GGCATGAGCCTGTCTCAGGCCAAAGTGGCCGATTACGGCCAGC ACAAAGAGGACCTGGAACTGTTCAAGACCTACCTGAAGAAGCTG AACGACCACGAGCTGGCCAAGACCATCAGGGGCCTGTACGATC GGTACATCAACGGCGACGACGCCAAGCCTTTCCTGCGCGAGGA TTTTGTGAAGGCCCTGACCAAAGAAGTGACAGCTCACCCCAACG AGGTGTCCGAACAGCTGCTGAACAGGATGGGCCAAGCCAACTT CATGCTGAAGCAGCGGACCAAGGCCAACGGCGCCATTCCTATTC, AGCTGCAGCAGAGAGAGCTGGACCAGATCATTGCCAACCAGAG CAAGTACTACGACTGGCTGGCCGCTCCTAATCCTGTGGAAGCCC ACAGATGGAAGATGCCCTACCAGCTGGATGAGCTGCTCAACTTT CACATCCCCTACTACGTGGGCCCTCTGATCACCCCTAAACAGCA GGCCGAGAGCGGCGAGAATGTGTTCGCTTGGATGGTCCGAAAG GACCCCAGCGGCAACATCACCCCTTACAACTTCGACGAGAAGGT GGACAGAGAGGCCAGCGCCAACACCTTCATCCAGAGAATGAAG ACCACCGACACATACCTGATCGGCGAGGACGTGCTGCCTAAGC AGAGCCTGCTGTACCAGAAATACGAGGTGCTGAACGAGCTGAAC AACGTGCGGATCAACAACGAGTGCCTGGGCACAGACCAGAAGC AGAGACTGATCAGAGAGGTGTTCGAGCGGCACAGCAGCGTGAC CATCAAACAGGTGGCCGACAATCTGGTGGCCCACGGCGATTTTG CCAGACGGCCTGAGATTAGAGGACTGGCCGATGAGAAGCGGTT CCTGAGCAGCCTGAGCACCTACCACCAGCTGAAAGAGATCCTGC ACGAGGCCATCGACGACCCCACCAAACTGCTGGATATCGAGAAC ATCATCACCTGGTCCACCGTGTTCGAGGACCACACCATCTTCGA GACAAAGCTGGCCGAGATCGAGTGGCTGGACCCCAAGAAGATC AACGAGCTGTCTGGCATCAGATACAGAGGCTGGGGCCAGTTCTC) CCGGAAGCTGCTCGATGGACTGAAGCTTGGCAATGGCCACACC GTGATTCAAGAACTGATGCTGAGCAACCACAACCTGATGCAGAT CCTGGCCGACGAGACACTGAAAGAAACCATGACAGAGCTGAATC AGGACAAGCTGAAAACCGACGACATCGAGGATGTGATCAACGAC GCCTACACAAGCCCCAGCAACAAAAAGGCCCTCAGACAGGTGCT) GAGAGTGGTCGAGGATATCAAGCACGCCGCCAACGGACAGGAC CCTAGCTGGCTGTTTATOEGAAACCGCCGATGGAACAGGCACCGC CGGCAAGAGAACACAGAGCCGGCAGAAACAGATCCAGACCGTG TACGCCAACGCCGCTCAAGAGCTGATCGATTCTGCCGTGCGGG GCGAGCTGGAAGATAAGATTGCTGACAAGGCCAGCTTCACCGAC, CGGCTGGTGCTGTACTTTATGCAAGGCGGCAGAGACATCTACAC AGGCGCCCCTCTGAACATOEGACCAGCTGAGCCACTACGATATCG ACCACATTCTGCCCCAGAGCCTGATCAAGGACGACAGCCTGGAC AACCGGGTGCTCGTGAACGCCACCATCAACCGCGAGAAGAACA ATGTGTTTGCCAGCACACTGTTCGCCGGAAAGATGAAGGCCACC TGGCGGAAATGGCACGAAGCCGGACTGATCTCTGGCAGAAAGC TGCGGAATCTGATGCTGCGGCCCGACGAGATCGACAAGTTTGC CAAGGGCTTCGTGGCCCGGCAGCTGGTTGAGACAAGACAGATC ATCAAGCTGACAGAGCAGATTGCCGCCGCTCAGTACCCCAACAC CAAGATTATTGCCGTGAAGGCCGGACTGTCCCATCAGCTGAGAG AGGAACTGGACTTCCCCAAGAACCGGGACGTGAACCACTACCAC CACGCCTTCGATGCCTTTCTGGCCGCTAGAATCEGGCACCTACCOT GCTGAAGAGATACCCCAAGCTGGCCCCATTCTTCACCTACGGCG AGTTTGCTAAGGTGGACGTCAAGAAGTTCCGCGAGTTCAACTTC ATCGGAGCCCTGACACACGCCAAGAAGAACATTATCGCCAAGGA CACCGGCGAGATCGTGTGGGACAAAGAGCGGGACATCAGAGAA CTGGACCGCATCTACAACTTCAAGCGGATGCTGATCACACACGA GGTGTACTTCGAGACTGCCGACCTGTTCAAGCAGACCATCTACG CCGCTAAGGACAGCAAAGAGAGAGGCGGCAGCAAGCAGCTGAT CCCTAAGAAGCAGGGCTACCCCACTCAGGTGTACGGCGGCTAC ACACAAGAGAGCGGCTCTTACAACGCCCTCGTCAGAGTGGCCG AGGCCGATACAACAGCCTACCAAGTGATCAAGATCAGCGCCCAG AACGCCAGCAAGATCGCCTCCGCCAACCTGAAAAGCCGCGAGA
AAGGCAAACAGCTCCTGAATGAGATCGTCGTGAAGCAGCTGGCT AAGCGGCGGAAGAACTGGAAGCCTAGCGCCAATAGCTTCAAGAT|
CGTGATCCCCAGATTEGGCATGGGCACCCTGTTCCAGAACGCTA AGTACGGCCTGTTCATGGTCAACAGCGACACCTACTACCGGAAC TACCAAGAACTCTGGCTGAGCCGGGAAAACCAGAAACTGCTGAA AAAGCTGTTCTCCATCAAATACGAGAAAACCCAGATGAACCACG ACGCCCTGCAGGTCTACAAGGCCATTATCGACCAGGTGGAAAAG TTCTTCAAGCTGTACGACATCAACCAGTTCCGCGCCAAGCTGAG CGACGCCATCGAGAGATTTGAGAAGCTGCCCATCAATACCGACG GCAACAAGATCGGCAAGACCGAGACTCTGAGACAGATCCTGATC GGACTGCAGGCCAATGGCACCCGGTCCAACGTGAAGAACCTGG GCATCAAGACCGATCTGGGCCTGCTGCAAGTCGGCAGCGGAAT CAAGCTGGACAAGGATACCCAGATCGTGTATCAGAGCCCCTCCG GCCTGTTTAAGCGGAGAATCCCACTGGCTGACCTGCCCAAGAAG
AAGAGGAAGGTG Sequência da proteína LrhCas9/NLS (SEQ ID NO:4)
MTKLNQPYGIGLDIGSNSIGFAVVDANSHLLRLKGETAIGARLFREG QSAADRRGSRTTRRRLSRTRWRLSFLRDFFAPHITKIDPDFFLRQK
YSEISPKDKDRFKYEKRLFNDRTDAEFYEDYPSMYHLRLHLMTHTH KADPREIFLAIHHILKSRGHFLTPGAAKDFNTDKVDLEDIFPALTEAYA|
QVYPDLELTFDLAKADDFKAKLLDEQATPSDTQKALVNLLLSSDGEK EIVKKRKQVLTEFAKAITGLKTKFNLALGTEVDEADASNWQFSMGQAL, DDKWSNIETSMTDQGTEIFEQIQELYRARLLNGIVPAGMSLSQAKVA DYGQHKEDLELFKTYLKKLNDHELAKTIRGLYDRYINGDDAKPFLRE DFVKALTKEVTAHPNEVSEQLLNRMGQANFMLKQRTKANGAIPIQL
QQARELDQIIANQSKYYDWLAAPNPVEAHRWKMPYQLDELLNFHIPY YVGPLITPKQQAESGENVFAWMVRKDPSGNITPYNFDEKVDREASA|
NTFIORMKTTDTYLIGEDVLPKQSLLYQKYEVLNELNNVRINNECLG TDQKQRLIREVFERHSSVTIKQVADNLVAHGDFARRPEIRGLADEKR FLSSLSTYHQLKEILHEAIDDPTKLLDIENIITWSTVFEDHTIFETKLAEI EWLDPKKINELSGIRYRGWGQFSRKLLDGLKLGNGHTVIQELMLSN HNLMOQILADETLKETMTELNQDKLKTDDIEDVINDAYTSPSNKKALR QVLRVVEDIKHAANGQDPSWLFIETADGTGTAGKRTASRQAKAIATV YANAAQELIDSAVRGELEDKIADKASFTDRLVLYFMQGGRDIYTGAP LNIDQLSHYDIDHILPOSLIKDDSLDNRVLVNATINREKNNVFASTLFA GKMKATWRKWHEAGLISGRKLRNLMLRPDEIDKFAKGFVARQLVE TRQIKLTEQIAAAQYPNTKIIAVKAGLSHQLREELDFPKNRDVNHYH HAFDAFLAARIGTYLLKRYPKLAPFFTYGEFAKVDVKKFREFNFIGAL THAKKNIIAKDTGEIVWDKERDIRELDRIYNFKRMLITHEVYFETADLF KQTIYAAKDSKERGGSKQLIPKKQGYPTQVYGGYTQESGSYNALVR VAEADTTAYQVIKISAQNASKIASANLKSREKGKQLLNEIVVKQLAKR RKNWKPSANSFKIVIPRFEGMGTLFQNAKYGLFMVNSDTYYRNYQEL WLSRENQKLLKKLFSIKYEKTQMNHDALQVYKAIIDQVEKFFKLYDIN QFRAKLSDAIERFEKLPINTDGNKIGKTETLRQILIGLAOANGTRSNVK NLGIKTDLGLLQVGSGIKLDKDTQIVYQASPSGLFKRRIPLADLPKKKR
KV Sequência de DNA de PexCas9/NLS (SEQ ID NO:5)
ATGGGCAAGACCCACATCATCGGCGTTGGCCTGGATCTCGGCG GCACATACACAGGCACCTTCATCACCAGCCATCCTAGCGACGAA GCCGAGCACAGAGATCACAGCAGCGCCTTCACCGTGGTCAACA GCGAGAAGCTGAGCTTCAGCAGCAAGAGCAGAACAGCCGTGCG GCACAGAGTGCGGAGCTACAAGGGCTTCGACCTGCGTAGAAGG CTGCTGCTTCTGGTGGCCGAGTATCAGCTGCTGCAGAAGAAGCA GACACTGGCCCCTGAGGAAAGAGAGAACCTGAGAATCGCCCTG AGCGGCTACCTGAAGAGAAGAGGCTACGCCAGAACCGAGGCCG AGACAGATACAAGCGTGCTGGAATCTCTGGACCCCAGCGTGTTC AGCAGCGCTCCCAGCTTCACCAATTTCTTCAACGACAGCGAGCC CCTGAACATCCAGTGGGAAGCCATTGCCAACTCTCCCGAGACAA CAAAGGCCCTGAACAAAGAGCTGAGCGGCCAGAAAGAGGCCGA CTTCAAGAAGTACATCAAGACCAGCTTTCCCGAGTACAGCGCCA AAGAGATTCTGGCCAACTACGTGGAAGGCAGACGGGCCATTCTG GACGCCAGCAAGTATATCGCCAACCTGCAGAGCCTGGGCCACA AGCACAGAAGCAAGTACCTGAGCGACATTCTGCAGGACATGAAG CGGGACAGCCGGATCACCAGACTGAGCGAAGCCTTTGGCAGCA CCGACAACCTGTGGCGGATCATCGGCAACATCAGCAATCTGCAA GAACGGGCCGTGCGGTGGTACTTCAACGATGCCAAGTTCGAGC AGGGCCAAGAGCAGCTGGATGCCGTGAAGCTGAAGAATGTGCT CGTGCGGGCCCTGAAGTATCTGCGGAGTGACGACAAAGAGTGG AGCGCCTCTCAGAAGCAGATCATCCAGTCTCTGGAACAGAGCGG
CGACGTGCTGGATGTGCTGGCTGGACTCEGACCCCGACAGAACA ATCCCTCCATACGAGGACCAGAACAACAGACGGCCTCCTGAGGA|
TCAGACCCTGTATCTGAACCCCAAGGCTCTGAGCAGCGAGTACG GCGAGAAGTGGAAGTCTTGGGCCAACAAGTTTGCCGGCGCTTA CCCTCTGCTGACCGAGGATCTGACCGAGATCCTGAAGAACACCG ACAGAAAGTCCCGGATCAAGATCAGATCCGATGTGCTGCCCGAC AGCGACTACAGACTGGCCTACATCCTGCAGAGAGCCTTCGATCG GTCTATCGCCCTGGACGAGTGCAGCATCAGAAGAACCGCCGAG GACTTCGAGAACGGCGTGGTCATCAAGAACGAGAAACTGGAAGA, TGTGCTGAGCGGACACCAGCTGGAAGAGTTTCTGGAATTTGCCA ATCGGTACTACCAAGAGACAGCCAAGGCCAAGAACGGCCTGTG GTTCCCAGAGAACGCCCTGCTGGAAAGAGCCGATCTGCACCCT CCTATGAAGAACAAGATTCTGAACGTGATCGTCGGACAGGCCCT GGGAGTGTCTCCTGCTGAGGGCACCGATTTCATCGAGGAAATTT GGAACAGCAAAGTGAAAGGCCGGTCCACCGTGCGGAGCATCTG TAACGCCATCGAGAATGAGAGAAAGACCTACGGACCCTACTTCA GCGAGGACTACAAGTTCGTGAAAACGGCCCTGAAAGAGGGCAA AACCGAGAAAGAGCTGTCCAAGAAATTCGCCGCCGTGATCAAGG TGCTGAAGATGGTGTCTGAGGTGGTGCCCTTTATCGGAAAAGAG CTGCGGCTEGTCTGACGAGGCCCAGAGCAAGTTCGACAATCTGTA, CTCTCTGGCCCAGCTGTACAACCTGATCGAGACAGAGCGGAAC GGCTTCAGCAAGGTGTCACTGGCTGCCCACCTGGAAAATGCCTG GCGGATGACCATGACAGATGGATCCGCCCAGTGCTGTAGACTG CCTGCCGATTGTGTGCGGCCCTTCGACGGCTTTATCCGGAAGG CCATCGACCGGAACTCTTGGGAAGTCGCCAAGCGGATTGCCGA GGAAGTGAAGAAGTCCGTCGACTTCACCAACGGCACCGTGAAG ATCCCTGTGGCCATCGAGGCCAACAGCTTCAACTTTACCGCCAG CCTGACCGACCTGAAGTACATTCAGCTCAAAGAACAGAAGCTCA AGAAGAAGTTGGAGGACATCCAGCGGAACGAAGAGAATCAAGA GAAGCGGTGGCTGAGCAAAGAGGAACGGATCAGAGCCGACAGC CACGGCATCTGTGCCTATACTGGCAGACCCCTGGATGACGTGG GCGAGATCGATCACATCATCCCCAGAAGCCTGACACTGAAGAAA AGCGAGAGCATCTACAACTCCGAAGTGAACCTGATCTTCGTGTC TGCCCAGGGCAATCAAGAAAAGAAGAACAACATCTACCTGCTGA GCAACCTCGCCAAGAACTACCTGGCCGCCGTGTTTGGCACAAG CGACCTGAGCCAGATCACCAACGAGATCGAGAGCACCGTGCTG CAGCTGAAAGCTGCTGGCAGACTGGGCTACTTCGATCTGCTGAG
CGAAAAAGAGCGGGCCTGCGCCAGACATGCCCTGTTTCTGAATA GCGACTCCGAGGCCAGACGCGCCGTGATTGATGTTCTTGGCTCT)|
CGGAGAAAGGCCAGCGTGAACGGAACCCAGGCTTGGTTTGTGC GGTCCATCTTCTCCAAAGTGCGGCAGGCACTGGCCGCTTGGAC ACAAGAAACAGGCAACGAGCTGATCTTTGACGCCATCAGCGTGC CAGCCGCCGATAGCTCTGAGATGAGGAAGAGATTCGCCGAGTA CCGGCCTGAGTTCAGAAAGCCCAAAGTGCAGCCTGTGGCCTCT CACAGCATCGACGCCATGTGCATCTATCTGGCCGCCTGCAGCGA, CCCCTTCAAGACCAAGAGAATGGGCTCTCAGCTGGCCATCTACG AGCCCATCAACTTCGATAACCTGTTCACCGGCAGCTGTCAAGTG ATCCAGAACACCCCTCGGAACTTCTCCGACAAGACCAATATCGC TAACAGCCCCATCTTCAAAGAGACAATCTACGCCGAGCGGTTCC TGGACATCATCGTGTCCAGAGGCGAGATTTTCATCGGCTACCOCC AGCAACATGCCCTTCGAGGAAAAGCCCAACCGGATCAGCATCG GCGGCAAGGACCCTTTCAGCATCCTGTCTGTGCTGGGCGCCTA CCTGGATAAGGCCCCTAGCAGCGAGAAAGAAAAGCTCACCATCT ACCGGGTCGTCAAGAACAAAGCCTTCGAGCTGTTCTCCAAGGTG GCCGGCAGCAAGTTTACCGCCGAAGAAGATAAGGCCGCCAAGA TCCTGGAAGCCCTGCACTTCGTGACCGTGAAACAGGATGTGGCC) GCCACCGTGTCCGATCTGATCAAGAGCAAGAAAGAACTGAGCAA GGATAGCATCGAGAACCTGGCCAAGCAGAAGGGCTGCCTGAAG AAGGTGGAATACTCCAGCAAAGAGTTCAAGTTCAAGGGCAGCCT GATCATCCCTGCCGCCGTGGAATGGGGAAAAGTGCTGTGGAAC GTGTTCAAAGAAAACACGGCCGAAGAACTGAAGGACGAGAACG CTCTGAGGAAGGCCCTGGAAGCTGCCTGGCCTAGCTCTTTCGG CACCAGAAACCTGCACTCTAAGGCCAAGCGGGTGTTCAGCCTGC CTGTGGTGGCTACACAATCTGGCGCCGTGCGGATCAGACGCAA GACAGCCTTCGGCGACTTCGTGTACCAGAGCCAGGACACAAACA, ACCTGTACAGCAGCTTCCCCGTGAAGAACGGCAAGCTGGATTGG AGCAGCCCTATCATTCACCCCGCTCTGCAGAACCGGAACCTGAC CGCCTACGGCTACAGATTCGTGGACCACGACAGATCCATCAGCA TGAGCGAGTTCAGAGAGGTGTACAACAAGGACGACCTGATGCG GATCGAGCTGGCCCAGGGAACAAGCAGCAGACGCTACCTGAGA GTGGAAATGCCCGGCGAGAAATTCCTCGCTTGGTTTGGCGAGAA, CAGCATCAGCCTGGGCTCCAGCTTCAAGTTCTCTGTGTCCGAGG TGTTCGACAACAAAATCTACACCGAGAACGCCGAGTTTACCAAG TTCCTGCCTAAGCCTAGAGAGGACAACAAGCACAACGGGACCAT CTTTTTCGAACTCGTGGGCCCCAGAGTGATCTTCAACTACATCGT TGGCGGAGCCGCCAGCAGCCTGAAAGAAATCTTTAGCGAGGCC
GGCAAAGAGCGGAGCCCCAAGAAGAAGAGGAAGGTG Sequência da proteína PexCas9/NLS (SEQ ID NO:6)
MGKTHIIGVGLDLGGTYTGTFITSHPSDEAEHRDHSSAFTVVNSEKL SFSSKSRTAVRHRVRSYKGFDLRRRLLLLVAEYQLLQKKQTLAPEE RENLRIALSGYLKRRGYARTEAETDTSVLESLDPSVFSSAPSFTNFF NDSEPLNIQWEAIANSPETTKALNKELSGQKEADFKKYIKTSFPEYS AKEILANYVEGRRAILDASKYIANLOSLGHKHRSKYLSDILQDMKRD SRITRLSEAFGSTDNLWRIIGNISNLOQERAVRWYFNDAKFEQGQEAQL DAVKLKNVLVRALKYLRSDDKEWSASQKQIIASLEASGDVLDVLAG
LDPDRTIPPYEDQNNRRPPEDOTLYLNPKALSSEYGEKWKSWANK FAGAYPLLTEDLTEILKNTDRKSRIKIRSDVLPDSDYRLAYILQRAFDR|
SIALDECSIRRTAEDFENGVVIKNEKLEDVLSGHQLEEFLEFANRYY QETAKAKNGLWFPENALLERADLHPPMKNKILNVIVGQALGVSPAE GTDFIEEIWNSKVKGRSTVRSICNAIENERKTYGPYFSEDYKFVKTA LKEGKTEKELSKKFAAVIKVLKMVSEVVPFIGKELRLSDEAQSKFDN LYSLAQLYNLIETERNGFSKVSLAAHLENAWRMTMTDGSAQCCRLP ADCVRPFDGFIRKAIDRNSWEVAKRIAEEVKKSVDFTNGTVKIPVAIE
ANSFNFTASLTDLKYIQLKEQKLKKKLEDIQORNEENQEKRWLSKEER IRADSHGICAYTGRPLDDVGEIDHIIPRSLTLKKSESIYNSEVNLIFVSA|! QGNQEKKNNIYLLSNLAKNYLAAVFGTSDLSQITNEIESTVLQLKAAG;
RLGYFDLLSEKERACARHALFLNSDSEARRAVIDVLGSRRKASVNG TQAWFVRSIFSKVRQALAAWTQETGNELIFDAISVYPAADSSEMRKR FAEYRPEFRKPKVQPVASHSIDAMCIYLAACSDPFKTKRMGSQLAIY EPINFDNLFTGSCQVIQNTPRNFSDKTNIANSPIFKETIYAERFLDIIVS RGEIFIGYPSNMPFEEKPNRISIGGKDPFSILSVLGAYLDKAPSSEKE
KLTIYRVVKNKAFELFSKVAGSKFTAEEDKAAKILEALHFVTVKQDVA ATVSDLIKSKKELSKDSIENLAKQKGCLKKVEYSSKEFKFKGSLIIPAA|
VEWGKVLWNVFKENTAEELKDENALRKALEAAWPSSFGTRNLHSK AKRVFSLPVVATOSGAVRIRRKTAFGDFVYQSQDTNNLYSSFPVKN GKLDWSSPIIHPALAONRNLTAYGYRFVDHDRSISMSEFREVYNKDD LMRIELAQGTSSRRYLRVEMPGEKFLAWFGENSISLGSSFKFSVSE VFDNKIYTENAEFTKFLPKPREDNKHNGTIFFELVGPRVIFNYIVGGA ASSLKEIFSEAGKERSPKKKRKV
Sequência de DNA de McaCas9/NLS (SEQ ID NO:7) ATGGAAAAGAAGCGGAAAGTCACCCTGGGCTTCGACCTGGGAAT|
CGCCTCTGTTGGATGGGCCATCEGTGGACAGCGAGACAAACCAG GTGTACAAGCTGGGCAGCAGACTGTTCGACGCCCCTGACACCA ACCTGGAAAGAAGAACCCAGCGGGGCACCAGAAGGCTGCTGCG GAGAAGAAAGTACCGGAACCAGAAATTCTACAACCTGGTCAAGC GGACCGAGGTGTTCGGCCTGTCTAGCAGAGAGGCCATCGAGAA CAGATTCAGAGAGCTGAGCATCAAGTACCCCAACATCATCGAGC TGAAAACAAAGGCCCTGAGCCAAGAAGTGTGCCCCGACGAGATT GCCTGGATTCTGCACGACTACCTGAAGAACCGGGGCTACTTCTA CGACGAGAAAGAGACAAAAGAGGACTTCGACCAGCAGACCGTG GAATCCATGCCTAGCTACAAGCTGAACGAGTTCTACAAGAAGTA CGGCTACTTCAAAGGCGCCCTGTCTCAGCCTACCGAGAGCGAG
ATGAAGGACAACAAGGACCTGAAAGAGGCATTCTTCTTCGACTT CTCCAACAAAGAGTGGCTGAAAGAGATCAACTACTTCTTCAACGT|
GCAGAAGAACATCCTGAGCGAGACATTCATCGAAGAGTTCAAGA AGATTTTCAGCTTCACCCGGGACATCAGCAAAGGCCCAGGCAGC GACAATATGCCCTCTCCTTACGGCATCTTCGGCGAGTTCGGCGA CAATGGCCAAGGCGGCAGATACGAGCACATCTGGGACAAGAAC ATCGGCAAGTGCAGCATCTTCACCAACGAGCAGAGAGCCCCTAA GTACCTGCCTAGCGCTCTGATCTTCAACTTCCTGAACGAGCTGG CCAACATCAGACTGTACAGCACCGACAAGAAGAATATCCAGCCT CTGTGGAAGCTGAGCAGCATCGATAAGCTGAATATCCTGCTGAA CCTGTTCAACCTGCCTATCAGCGAGAAGAAGAAAAAGCTGACCA GCACCAACATCAACGACATCGTGAAGAAAGAGTCCATCAAGAGC ATCATGCTGAGCGTCGAGGACATCGACATGATCAAGGATGAGTG GGCCGGCAAAGAACCCAACGTGTACGGCGTTGGACTGAGCGGC CTGAACATCGAGGAAAGCGCCAAAGAGAACAAGTTCAAGTTCCA AGACCTGAAGATCCTGAACGTCCTGATCAATCTGCTGGACAACG TGGGCATCAAGTTCGAGTTCAAGGACCGCAGCGACATCATCAAG AACCTGGAACTGCTGGATAACCTGTACCTGTTCCTGATCTACCA GAAAGAGAGCAACAACAAAGACAGCTCCATCGACCTGTTTATCG
CCAAGAACAAGTCCCTGAATATCGAGAACCTGAAGCTCAAGCTC AAAGAGTTCCTGCTCGGAGCCGGCAACGAGTTCGAGAACCACAA|
CAGCAAGACCCACAGCCTGTCCAAGAAGGCCATTGACGCCATCC TGCCTAAGCTGCTCGACAACAACGAAGGCTGGAATCTGGAAGCC ATCAAGAATTACGACGAGGAAATCAAGAGCCAGATCGAGGACAA CTCCAGCCTGATGGCCAAGCAGGATAAGAAGTACCTGAACGACA ACTTCCTCAAGGATGCCATTCTGCCGCCAAACGTGAAAGTGACC TTCCAGCAGGCCATCCTCATCTTCAACAAGATCATCCAGAAGTTC AGCAAGGATTTCGAGATCGACAAGGTCGTGATCGAACTGGCCAG AGAGATGACCCAGGACCAAGAGAACGACGCCCTGAAGGGAATC GCTAAGGCCCAGAAGTCCAAGAAAAGCCTGGTGGAAGAGAGAC TCGAAGCCAACAACATCGACAAGAGCGTGTTCAACGATAAGTAC GAGAAGCTTATCTACAAGATTTTCCTGTGGATCAGCCAGGACTTT AAGGACCCCTACACCGGCGCCAAGATCAGCGCCAATGAGATCG TGGATAACAAGGTGGAAATCGACCACATCATCCCTTACAGCCTG TGCTTCGACGACAGCAGCGCCAACAAAGTGCTGGTGCACAAGC AGAGCAATCAAGAGAAGTCTAACAGCCTGCCGTACGAGTACATC AAGCAGGGCCACTCCGGCTGGAACTGGGACGAGTTCACCAAAT ACGTGAAGCGGGTGTTCGTGAACAACGTGGACTCTATCCTGAGC AAGAAAGAGCGCCTGAAGAAGTCCGAGAATCTGCTGACCACCAG CTACGACGGCTATGAGAAGCTGGGCTTCCTGGCCAGAAACCTGA, ATGACACCAGATACGCCACCATCCTGTTCCGGGACCAGCTGAAC AATTACGCCGAGCACCACCTGATCGATAACAAGAAAATGTTCAAA GTGATCGCCATGAACGGGGCCGTGACCAGCTTCATCCGGAAGA ACATGAGCTACGACAACAAGCTGCGGCTGAAGGACAGAAGCGA CTTCAGCCACCACGCCTACGACGCCGCCATCATTGCCCOTGTTCA GCAACAAGACCAAGACGCTGTACAACCTGATTGACCCCAGCCTG AACGGCATCATCAGCAAGAGAAGCGAAGGCTATTGGGTCATCGA GGATCGGTACACAGGCGAGATCAAAGAGCTTAAGAAAGAGGATT GGACCTCTATCAAGAACAATGTGCAGGCCCGGAAGATCGCCAAA GAAATCGAGGAATATCTGATCGACCTGGACGATGAGGTGTTCTT CAGCCGGAAAACTAAGCGCAAGACCAACCGGCAGCTGTACAAT GAGACAATCTACGGAATCGCCGCCAAGACCGACGAGGACGGCA TCACCAACTACTACAAGAAAGAAAAGTTCTCCATCCTGGACGACA AGGACATCTACCTGCGGCTGCTGAGAGAACGCGAGAAGTTCGT GATCAACCAGAGCAACCCCGAAGTGATCGACCAGATTATCGAGA TCATCGAGAGCTACGGGAAAGAAAACAACATCCCCAGCCGCGAC GAGGCCATCAATATCAAGTACACGAAGAACAAGATTAACTACAAC CTCTACCTCAAGCAGTACATGCGGAGCCTGACCAAGAGCCTGGA, CCAGTTCAGCGAGGGCTTCATCAATCAGATGATCGCCAACAAGA CGTTCSGTGCTGTATAACCCCACCAAGAACACAACGCGGAAGATC AAGTTCCTGCGGCTCGTGAACGATGTGAAGATCAACGATATTCG CAAGAATCAAGTGATCAACAAGTTTAACGGGAAGAACAACGAGC CCAAGGCCTTCTACGAGAATATCAACAGCCTGGGCGCCATCGTG TTCAAGTCCTCCGCCAACAACTTCAAGACCCTGTCCATCAACACC
CAGATCGCCATCTTCGGAGACAAGAACTGGGATATCGAGGATTT CAAGACCTACAACATGGAAAAAATCGAGAAGTACAAAGAGATATA|
CGGCATCGACAAAACCTACAACTTCCACAGCTTTATCTTCCCCG GCACAATCCTGCTCGATAAGCAGAACAAAGAGTTCTACTACATCA GCAGCATCCAGACCGTGAACGACCAAATTGAGCTGAAGTTTCTG AACAAGATCGAGTTTAAGAACGACGACAACACCTCCGGGGCCAA CAAGCCTCCTCGGAGACTGAGATTCGGCATTAAGTCCATCATGA ACAACTACGAGCAGGTCGACATCAGCCCCTTCGGCATCAACAAG
AAGATATTCGAGCCCAAGAAGAAGAGGAAGGTG Sequência da proteína McaCas9/NLS (SEQ ID NO:8)
MEKKRKVTLGFDLGIASVGWAIVDSETNQVYKLGSRLFDAPDTNLE RRTARGTRRLLRRRKYRNQKFYNLVKRTEVFGLSSREAIENRFREL SIKYPNIIELKTKALSQEVCPDEIAWILHDYLKNRGYFYDEKETKEDF DQAQQTVESMPSYKLNEFYKKYGYFKGALSQPTESEMKDNKDLKEAF FFDFSNKEWLKEINYFFNVOQKNILSETFIEEFKKIFSFTRDISKGPGSD NMPSPYGIFGEFGDNGAGGRYEHIWDKNIGKCSIFTNEQRAPKYLP SALIFNFLNELANIRLYSTDKKNIQPLWKLSSIDKLNILLNLFNLPISEK KKKLTSTNINDIVKKESIKSIMLSVEDIDMIKDEWAGKEPNVYGVGLS GLNIEESAKENKFKFQDLKILNVLINLLDNVGIKFEFKDRSDIIKNLELL DNLYLFLIVQOKESNNKDSSIDLFIAKNKSLNIENLKLKLKEFLLGAGNE FENHNSKTHSLSKKAIDAILPKLLDNNEGWNLEAIKNYDEEIKSQIED NSSLMAKQDKKYLNDNFLKDAILPPNVKVTFQOQAILIFNKIIQKFSKDF EIDKVVIELAREMTQDQENDALKGIAKAQKSKKSLVEERLEANNIDK SVFNDKYEKLIYKIFLWISQDFKDPYTGAKISANEIVDNKVEIDHIIPYS LCFDDSSANKVLVHKQOSNQEKSNSLPYEYIKAQGHSGWNWDEFTKY VKRVFVNNVDSILSKKERLKKSENLLTTSYDGYEKLGFLARNLNDTR YATILFRDQLNNYAEHHLIDNKKMFKVIAMNGAVTSFIRKNMSYDNK LRLKDRSDFSHHAYDAAIIALFSNKTKTLYNLIDPSLNGIISKRSEGYW VIEDRYTGEIKELKKEDWTSIKNNVQARKIAKEIEEYLIDLDDEVFFSR KTKRKTNRQLYNETIYGIAAKTDEDGITNYYKKEKFSILDDKDIYLRLL REREKFVINQSNPEVIDQIEIIESYGKENNIPSRDEAINIKYTKNKINY NLYLKQYMRSLTKSLDQFSEGFINQMIANKTFVLYNPTKNTTRKIKFL RLVNDVKINDIRKNQVINKFNGKNNEPKAFYENINSLGAIVFKSSANN
FKTLSINTQIAIFGDKNWDIEDFKTYNMEKIEKYKEIYGIDKTYNFHSFI FPGTILLDKQNKEFYYISSIQTVNDQIELKFLNKIEFKNDDNTSGANKP|
PRRLRFGIKSIMNNYEQVDISPFGINKKIFEPKKKRKVPKKKRKV Sequência de DNA de MgaCas9/NLS (SEQ ID NO:9)
ATGAACAACAGCATCAAGAGCAAGCCCGAAGTGACCATCGGCCT GGATCTCGGCGTTGGCTCTGTTGGATGGGCCATCGTGGACAAC GAGACAAACATCATCCACCACCTGGGCAGCAGACTGTTCAGCCA GGCCAAGACAGCTGAGGACAGGCGGTCTTTCAGAGGCGTGCGG AGACTGATCCGGCGGAGAAAGTACAAGCTGAAGAGATTCGTGAA CCTGATCTGGAAGTACAACAGCTACTTCGGCTTCAAGAACAAAG AGGACATCCTGAACAACTACCAAGAGCAGCAGAAACTGCACAAC ACCGTGCTGAACCTGAAGCTCGAAGCCCTGAACGCCAAGATCGA CCCCAAGGCTCTGAGCTGGATTCTGCACGACTACCTGAAGAACC GGGGCCACTTCTACGAGGACAACCGGGACTTCAACGTGTACCC
CACAGAGGAACTGGCCAACTACTTCGACGAGTTCGGCTACTACA AGGGCATCATCGACAGCAAGAACGACGACGATGATAAGCTGGAA|
GAGGGCCTGACCAAGTACAAGTTCAGCAACCAGCACTGGCTGG AAGAAGTGAAGAAGGTCCTGAGCAACCAGACCGGCCTGCCTGA GAAGTTCAAAGAGGAATACGAGAGCCTGTTCAGCTACGTGCGGA
ACTACTCTGAAGGCCCTGGCAGCATCAACAGCGTGTCCCCATAC GGCATCTATCACCTGGACGAGAAAGAGGGCAAAGTCGTCCAGAA|
GTATAACAACATCTGGGACAAGACCATCGGGAAGTGCAGCATCT TCCCCGACGAGTACAGAGCCCCTAAGAACAGCCCTATCGCCATG ATCTTCAACGAGATCAACGAGCTGAGCACCATCCGGTCCTACAG CATCTACCTGACCGGCTGGTTCATCAATCAAGAGTTCAAGAAGG CCTACCTGAACAAGCTGCTGGACCTGCTGATCAAGACCAACAGC GAGAAGCCCATCGACGCCCGGCAGTTTAAGAAGCTGCGGGAAG AGACAATCGCCGAGAGCATCGGCAAAGAAACCCTGAAGGACGT
GGAAAGCGAGGAAAAGCTGGAAAAGGACGACCACAAGTGGAAG CTGAAGGGCCTGAAGCTGAACACCAACGGCAAGATCCAGTACAA|
CGACCTGTCTAGCCTGGCCAAGTTCGTGCACAAACTGAAGCAGC ACCTGAAACTGGACTTTCTGCTGGAAGATCAGTACACCCCTCTG GACAAGATCAACTTCCTGCAGAGCCTGTACGTGTACCTGGGCAA GCACCTGAGATACAGCAACAGAGTGGACAGCGCCAACCTGAAA GAGTTCAGCGACAGCTCCCGGCTGTTCGAGAGAGTGCTGCAAG AGCAGAAGGACGGCCTGTTCAAGCTGTTTGAGCAGACCGACAA GGACGACGAGAAGATCCTGACACAGACCCACAGCCTGTCCACC AAGGCTATGCTGCTGGCCATCACCAGAATGACCAACCTGGACAA TGACGAGGATAACCAGAAGAACAACGACAAAGGCTGGAACTTCG AGGCCATCAAGAACTTCGACCAGAAGTTCATCGACATCACCAAG ACGAACAACAACCTGAGCCTGAAGCAGGACAAGCGCTACCTGG ATGACCAGTTCATCAACGACGCCATTCTGAGCCCTGGCGTGAAG AGAATCCTGCGCGAGGCCACCAAGGTGTTCAACGCCATCCTCAA GCAGTTCTCCGAAGAGTACGACGTGACCAAGGTGGTCATCGAG CTGGCCAGAGAGCTGAGCGAAGAGAAAGAACTGGAAAACACCA AGAACTACAAGAAGCTTATCAAGAAGAACGGCGATAAGATCAGC GAGGGACTGAAAGCCCTGGGGATCGCCGAGGATAAGATCGAAG AGATCCTGAAGTCTCCCACCAAGTCCTACAAAGTGCTGCTGTGG CTGCAGCAGGACCACATCGATCCCTACAGCCAGAAAGAGATCGC CTTCGACGATATCCTGACCAAAACCGAAAAGACCGAGATCGACC ACATCATTCCTTACTCCATCAGCTTCEGACGACAGCAGCAGCAAC AAACTGCTGGTGCTGGCCGAGTCCAATCAGGCCAAGTCCAACCA GACACCTTACGAGTTTATCAACTCCGGCAAGGCCGAGATCACCT GGGAAGTGTACGAGGCCTACTGCCACAAGTTCAAAAACGGCGA CTCCAGCCTGCTGGACAGCACCCAGAGAAGCAAGAAATTCGCCA AGATGATGAAGACCGACACCAGCTCTAAGTACGACATCGGCTTT CTGGCCCGGAACCTGAACGACACCAGATACGCCACCATCGTGTT) CCGGGACGCTCTGAAGGACTACGCCAACAACCACCTGGTGGAA GATAAGCCCATGTTCAAGGTCGTGTGCATCAACGGCGGCGTGAC CAGCTTCCTGCGGAAGAACTTTGACCCCAAGTCTTGGTACGCCA AGAAGGACAGAGACAAGAACATTCACCACGCCGTGGACGCCAG CATCATCTCCATCTTCAGCAACGAGACTAAGACCCTGTTCAACCA GCTGACAAAGTTCGCCGACTACAAGCTGTTCAAGAATACCGACG GCTCTTGGAAGAAGATCGATCCTAAGACAGGCGTGGTGTCAGAA GTGACCGACGAGAATTGGAAGCAGATCCGCGTGCGCAACCAGG TGTCCGAGATCGCCAAAGTGATCGACAAGTACATCCAGGACAGC AACATCGAGCGGAAGGCCAGATACAGCCGGAAGATCGAGAACA AGACCAATATCAGCCTGTTTAACGACACCGTGTACTCCGCCAAG AAAGTGGGCTACGAGGATCAGATCAAGCGCAAGAACCTGAAAAC CCTGGACATCCACGAGAGCGCCGAGGAAAACAAGAACAGCAAA GTGAAAAAGCAGTTCGTGTACCGGAAGCTCGTGAACGTGTCCCT GCTGAACAATGACAAGCTGGCCGACCTGTTCGCCGAGAAAGAA GATATTCTGATGTACCGGGCCAATCCGTGGGTCATCAACCTGGC CGAGCAGATTTTCAACGAGTACACCGAGAACAAAAAGATCAAGA GCCAGAACGTGTTCGAGAAGTACATGCTGGATCTGACCAAAGAG TTCCCCGAGAAGTTTAGCGAGGCCTTCGTGAAGTCCATGATCAG AAACAAGACCGCCATCATCTACAACGTCGAGAAGGATGTGGTGC ACCGGATCAAGCGGCTGAAGATTCTGAGCAGCGAGCTGAAAGA AAACAAGTGGTCCAACGTGATCATCCGCTCCAAGAACGAGAGCG GCACCAAGCTGAGCTACCAGGACACCATCAACTCTATCGCCCTG ATGATCATGCGGAGCATCGACCCAACCGCCAAAAAACAGTACAT CAGGGTGCCCCTGAACACCCTGAATCTGCACCTGGGCGACCAG GACTTCGACCTGCACAATATCGACGCCTATCTGAAGAAGCCTAA GTTCGTCAAGTACCTGAAGGCCAATGAGATCGGCGACGAGTATA AGCCTTGGCGCGTGCTGACAAGCGGCACACTGCTGATCCACAA GAAAGACAAGAAACTCATGTACATCAGCAGCTTCCAGAACCTCA ACGACCTCATCGAGATCAAGAATCTGATCGAGACAGAGTACAAA GAAAACGTGGACTCAGACCCCAAGAAGAAGAAAAAGGCCAGCC AGATCCTGAGAAGCCTGAGCGTGATCCTGAACGATTACATCCTG CTGGATGCCAAGTATAACTTCGACATCCTGGGCCTGTCTAAGAA CAAGATTGACGAGATCCTCAACAGCAAGCTGGACCTCGACAAGA
TTGCCAAGCCCAAGAAGAAGAGGAAGGTG Sequência da proteína MgaCas9/NLS (SEQ ID NO:10) MNNSIKSKPEVTIGLDLGVGSVGWAIVDNETNIIHHLGSRLFSQAKTA| EDRRSFRGVRRLIRRRKYKLKRFVNLIWKYNSYFGFKNKEDILNNYQ]|
EQQKLHNTVLNLKLEALNAKIDPKALSWILHDYLKNRGHFYEDNRDF NVYPTEELANYFDEFGYYKGIIDSKNDDDDKLEEGLTKYKFSNQHW LEEVKKVLSNQTGLPEKFKEEYESLFSYVRNYSEGPGSINSVSPYGI YHLDEKEGKVVQKYNNIWDKTIGKCSIFPDEYRAPKNSPIAMIFNEIN ELSTIRSYSIYLTGWFINQEFKKAYLNKLLDLLIKTNSEKPIDARQFKK
LREETIAESIGKETLKDVESEEKLEKDDHKWKLKGLKLNTNGKIQYN DLSSLAKFVHKLKQHLKLDFLLEDQYTPLDKINFLOSLYVYLGKHLRY|
SNRVDSANLKEFSDSSRLFERVLQEQKDGLFKLFEQTDKDDEKILT QTHSLSTKAMLLAITRMTNLDNDEDNQKNNDKGWNFEAIKNFDQKF IDITKTNNNLSLKQDKRYLDDQFINDAILSPGVKRILREATKVFNAILK QFSEEYDVTKVVIELARELSEEKELENTKNYKKLIKKNGDKISEGLKA LGIAEDKIEEILKSPTKSYKVLLWLQQDHIDPYSQKEIAFDDILTKTEK TEIDHIIPYSISFDDSSSNKLLVLAESNQAKSNQTPYEFINSGKAEITW EVYEAYCHKFKNGDSSLLDSTAQRSKKFAKMMKTDTSSKYDIGFLAR NLNDTRYATIVFRDALKDYANNHLVEDKPMFKVVCINGGVTSFLRKN FDPKSWYAKKDRDKNIHHAVDASIISIFSNETKTLFNQLTKFADYKLF KNTDGSWKKIDPKTGVVSEVTDENWKOQIRVRNQVSEIAKVIDKYIQD SNIERKARYSRKIENKTNISLFNDTVYSAKKVGYEDQIKRKNLKTLDI HESAEENKNSKVKKQFVYRKLVNVSLLNNDKLADLFAEKEDILMYR ANPWVINLAEQIFNEYTENKKIKSQNVFEKYMLDLTKEFPEKFSEAF VKSMIRNKTAIIYNVEKDVVHRIKRLKILSSELKENKWSNVIIRSKNES
GTKLSYQDTINSIALMIMRSIDPTAKKQYIRVPLNTLNLHLGDQDFDL HNIDAYLKKPKFVKYLKANEIGDEYKPWRVLTSGTLLIHKKDKKLMY|
SSFQNLNDLIEIKNLIETEYKENVDSDPKKKKKASQILRSLSVILNDYIL
LDAKYNFDILGLSKNKIDEILNSKLDLDKIAKPKKKRKV Sequência de DNA de AgiCas9/NLS (SEQ ID NO:11)
ATGCAGAACATCACCTTCAGCTTCGACGTGGGCTACGCCTCTAT CGGATGGGCTGTTGTTCAGGCCCCTGCTCAGCCAGAGCAGGAC CCTGGAATAGTGGCCTGTGGCACCGTGCTGTTCCCTAGCGACG ATTGCCAGGCCTTCCAGCGGAGAAACTACCGGCGGCTGCGGAG GAACATCCGGTCCAGAAGAGTGCGGATCGAGCGGATCGGAAAG CTGCTGGTTCAGGCCGGAATCCTGACACCTGAGGAAAAGGCCA CACCTGGACACCCCGCTCCATTCTTTTTGGCAGCCCAGGCTTGG CAGGGCATCAGACAACTGTCTCCACTGGAAGTGTGGCACATCCT GCGTTGGTACGCCCACAACAGAGGCTACGACAACAATGCCGCC TGGGCCACCGTGTCCACCAAAGAGGATACCGAGAAAGTCAACAA CGCCCGGCACCTGATGCAGAAGTTTGGCGCCGAGACAATGTGC GCCACACTGTGCCATGCTATGGAACTGGACATGGACGTGCCCG
ATGCCGCCATGACAGTGTCTACACCAGCCTACAGAACCCTGAAC AGCGCCTTTCCTAGAGATGTGGTGCAGAGAGAGGTGCTGGACAT|
CCTGAGACACAGCGCCAGCCACATCAAAGAGCTGACCCCTGAG ATCATCCGGCTGATCGCCCAGCAAGAGGATCTGAGCACAGAGC AGAGAAGCGAGCTGGCCGCCAAGGGAATTAGACTGGCCAGAAG ATACCGGGGCAGCCTGCTGTTTGGACAGCTGCTGCCCAGATTC GACAACCGGATCATCAGACGGTGCCCCATCATCTGGGCCCACA CATTTGAGCAGGCCAAGACCAGCGGCATGAGCGAGAAAGAAGC TCAGGCCCTGGCTGACAAGGTGGCCAAAGTGCCTACAGCCGAC TGTCCCGAGTTCTACGCCTACAGATTCGCCCGCATCCTGAACAA TCTGAGAGCCAACGGACTGCCCCTGCCTGTGGAAGTTCGCTGT GAACTGATGCAGGCCGCCAGAGCCGAGGGAAAACTGACAGCCG CCAAGATCAAGAAAGAAATCATGAGGCTGATGGGCGACGTCGAG AGCAACATCGACCACTACTTCCATCTGCACCCCGACAGCGAGGA AGCCCTGATTCTCGATCCCGCTATGGAATGCCTGCACCGGACCOG GACTGTACGATGCCCTCAGCTCTGTCGTGCGAAGAGTGGCCCT GACCAGACTGCGGAGAGGCAAAATCTGTACCCCTGCCTACCTGC GGGACATGATGCTGAGACACGGCGAGGATACCCAGGCTCTGGA TCTGGCCATTGCCAAGCAGCAGGGAAGAAAGGCCCCTCGGCCT AGAAAGAACGACACAGATGCCAGCGCCGACGCCAGCATTGCAT GGCAAGATAAGCCCCTGGCTCCTAAGACAGCCTCTGGCAGAGC CCCTTATGCCAGACCAGTTCTGAGACAGGCCGTGGACGAGATCA, TGAATGGCGAGGACCCTACCAGGCCAGCTCTGGATGAACAGCA
TCCCGACGGCGAGGACAAGCCTTCTCACGGCTGTCTGTATGGC CTGCTGGACCCTGCCAGCAAAGAGAACGAGTACCTGAACAAGCT |
TCCCCTGGACGCCCTGACAAACAATCACCTCGTGCGGCACCGG ATGCTGATCCTGGATAGACTGACCCAGGACCTCGTCAGAGAGTT CGCTGACGGCGATCCCAGCAGAGTGGAACGGTTCTGTATCGAA GTGGGCAGAGAGCTGAGCGCCTTCTCTGGCATGACCAGCAAGC AGATCCAGTCCGAGCTGAACGAGCGGATGAAGCACTTCAAGAG CGCCGTGGCCTATCTGGCCAAACACGCCCCTGATATGGCCACAT) CTGCCGGCCTGATCCGGAAGTGCAGAATCGCTATGGACATGAAC TGGCAGTGCCCTTTCACCGGCCAGACCTACATGCCCTACGACCOT GCCTAAGCTGGAACGCGAGCACATCGTGCCCTACGCCAACAGA AAGACAGATGCCCTGTCTGCCCTGGTGCTGACATGGCTGGCCG TGAACAAGATGAAGGGCAAGAGAACCGCCTACCAGTTTATCAAA GAGTGCGAGGGCCAGAGCGTGCCCGGCAGAAATCAGAATATCG TGTCCGTGAAGCAGTACGAGACATTCGTGGAAAAGCTGGACACC AAGGGCCACGCCGACGACGCCAAGAGAAAAAAGACCCGGAAGA AACTGATGATGGTGGACAGACTGAGCAGCCAGGGAACAAACGG CGAGTCTGAGCTGGATTTCACCGAGGGCATGATGACCCAGAGC AGCCACCTGATGAAGATCGCCGCTAGAGGCGTGCGGAAGAACT TTCCTCACGCCACCGTGGACATGATCCCTGGCGCTATTACTGGC ACTGTGCGCAAGGCTTGGAAGGTGGCAGGATGCCTGGCCGGCA
TTTGTCCTGAAGCCGTCGATCCCGTGACACACAGAATCCAGGAC AAAGAGACACTGCGGCGGCTGACCCATCTGCATCATGCACTGGA|
TGCCTGCGTGCTGGGACTGATCCCTCACCTGATTCCAGAGCACA GATCCGGCCTGCTGAGAAAAGCTCTGGCCGCTAGAAGGCTGCC CGAGAATGTTCGGCAAGAGGTGGAAAGCGCCGTGTCCAAGCGG TACTACACCATCACAAAAGAGAGCAAACTGGAACTGCGGGATCT GCCCACCACACTGAAGAACTCTATCGCCGCCAAGCTGAGCGAG GGCAGAGTGGTGCAACACATCCCTGCCGATATGAGCGGAGCCA AGCTGGAAGAGACAATCTGGGGAATTGCCCCTGGCCAGCACAT CGACGACAATAGCGAGGTGGTCATCCGGCAGAAGTCCCTGAGC ATCGGCAAGGACGGCAACAGAATCAGAACCAGAAAGACCGACA AGCAGGGCAACCCCATCACCGAGAAGGCCTCTAAGCTCGTGGG CATCAAGCCTACCGGCACCAGCAAACTGCAGCCCATCAGAGGC GTGATCATCATCAAGGACAACTTCGCCATTGCTCTGGACCCCGT GCCAACCATGATTCCCCACCACAACGTGTACAAGCGGCTGGAAG AACTGCGGAAGCTGAACCACGGTAGACATGTGCGGCTGCTGAA AAAGGGCATGCTGATCAGGCTGAGCCACCAGAAGTCCGGCGAC AAGAACGGCATGTGGAAAGTGCGGAGCATCCAGGACCAGGGCT
CCTCTGGCCTGAAAGTGAATCTGCAGAGGCCCTACTACGCCGG CAAGATCGAGGACACCAGAACCGAGAATTGGAAGAACGTGTCCA|
TCAAGGCCCTGCTGAGCCAAGGCATGGAAATCCTGCCAACCACC
TACTGCGGCACCACACCTCCCAAGAAGAAGAGGAAGGTG Sequência da proteína AgliCas9/NLS (SEQ ID NO:12)
MQNITFSFDVGYASIGWAVVQAPAQPEQDPGIVACGTVLFPSDDCQ AFQRRNYRRLRRNIRSRRVRIERIGKLLVQAGILTPEEKATPGHPAP
FFLAAQAWQGIRQALSPLEVWHILRWYAHNRGYDNNAAWATVSTKE DTEKVNNARHLMQKFGAETMCATLCHAMELDMDVPDAAMTVSTPA|
YRTLNSAFPRDVVOREVLDILRHSASHIKELTPEIIRLIAQQEDLSTEQ RSELAAKGIRLARRYRGSLLFGQLLPRFDNRIIRRCPIIWAHTFEQAK TSGMSEKEAQALADKVAKVPTADCPEFYAYRFARILNNLRANGLPL PVEVRCELMQAARAEGKLTAAKIKKEIMRLMGDVESNIDHYFHLHP DSEEALILDPAMECLHRTGLYDALSSVVRRVALTRLRRGKICTPAYL RDMMLRHGEDTQALDLAIAKQQGRKAPRPRKNDTDASADASIAWQ DKPLAPKTASGRAPYARPVLRQAVDEIMNGEDPTRPALDEQHPDG EDKPSHGCLYGLLDPASKENEYLNKLPLDALTNNHLVRHRMLILDRL TQDLVREFADGDPSRVERFCIEVGRELSAFSGMTSKQIQSELNERM KHFKSAVAYLAKHAPDMATSAGLIRKCRIAMDMNWQCPFTGQTYM PYDLPKLEREHIVPYANRKTDALSALVLTWLAVNKMKGKRTAYQFIK
ECEGQSVPGRNQNIVSVKQYETFVEKLDTKGHADDAKRKKTRKKL MMVDRLSSQGTNGESELDFTEGMMTOSSHLMKIAARGVRKNFPHA|
TVDMIPGAITGTVRKAWKVAGCLAGICPEAVDPVTHRIQDKETLRRL THLHHALDACVLGLIPHLIPEHRSGLLRKALAARRLPENVRQEVESA VSKRYYTITKESKLELRDLPTTLKNSIAAKLSEGRVVQHIPADMSGAK
LEETIWGIAPGQHIDDNSEVVIRQKSLSIGKDGNRIRTRKTDKQGNP|
TEKASKLVGIKPTGTSKLQPIRGVINIKDNFAIALDPVPTMIPHHNVYK RLEELRKLNHGRHVRLLKKGMLIRLSHQKSGDKNGMWKVRSIQDQ GSSGLKVNLORPYYAGKIEDTRTENWKNVSIKALLSQGMEILPTTYC
GTTPPKKKRKV Sequência de DNA de AmuCas9/NLS (SEQ ID NO:13)
ATGAGCAGAAGCCTGACCTTCAGCTTCGACATCGGCTACGCCTC TATCGGCTGGGCCGTGATTGCCTCTGCCAGCCACGATGATGCC GATCCTAGCGTGTGTGGCTGTGGCACCGTGCTGTTCCCCAAGG ATGATTGCCAGGCCTTCAAGCGGAGAGAGTACCGGCGGCTGCG GAGAAACATCCGGTCCAGAAGAGTGCGGATCGAGCGGATTGGT AGACTGCTGGTGCAGGCCCAGATCATCACCCCTGAGATGAAGG AAACCAGCGGACACCCCGCTCCATTCTACCTGGCATCTGAGGCC CTGAAGGGCCACAGAACACTGGCCCCTATTGAACTGTGGCATGT GCTGCGTTGGTACGCCCACAACAGAGGCTACGACAACAACGCC AGCTGGTCCAACAGCCTGTCTGAGGATGGTGGCAACGGCGAGG ATACCGAGAGAGTGAAACACGCCCAGGACCTGATGGACAAGCA CGGCACAGCTACAATGGCCGAGACAATCTGCAGAGAGCTGAAG CTGGAAGAGGGCAAAGCCGACGCTCCTATGGAAGTGTCTACCC
CTGCCTACAAGAACCTGAACACCGCCTTTCCACGGCTGATCGTG GAAAAAGAAGTGCGGAGAATCCTGGAACTGAGCGCCCCTCTGAT|
CCCTGGACTGACAGCCGAGATCATCGAGCTGATCGCCCAGCAT CACCCTCTGACCACTGAACAGAGAGGCGTGCTGCTCCAGCACG GCATTAAGCTGGCCAGAAGATACAGAGGCAGCCTGCTGTTCGG CCAGCTGATCCCTAGATTCGACAACAGGATCATCAGCAGATGCC CCGTGACATGGGCCCAAGTGTATGAGGCCGAGCTGAAGAAGGG CAACAGCGAGCAGTCTGCCAGAGAGAGAGCCGAGAAGCTGAGC AAGGTGCCCACCGCCAATTGTCCCGAGTTCTACGAGTACCGGAT GGCCAGAATCCTGTGCAACATCAGAGCCGACGGCGAGCCTCTG AGCGCCGAGATTAGACGCGAGCTGATGAACCAGGCCAGACAAG AGGGAAAGCTGACCAAGGCCAGCCTGGAAAAGGCCATCTCTAG CCGGCTGGGCAAAGAAACCGAGACAAACGTGTCCAACTACTTCA CACTGCACCCCGACAGCGAGGAAGCCCTGTATCTGAATCCTGCC GTGGAAGTGCTGCAGAGAAGCGGCATCGGCCAGATTCTGAGCC CCAGCGTGTACAGAATCGCCGCCAACAGACTGCGGAGAGGCAA GAGCGTGACCCCTAACTACCTGCTGAATCTGCTGAAGTCCAGAG GCGAGTCTGGCGAGGCCCTGGAAAAAAAGATCGAGAAAGAGTC CAAGAAGAAAGAGGCCGACTACGCCGACACACCCCTGAAGCCT AAGTACGCCACAGGCAGAGCCCCTTACGCCAGAACCGTGCTGA AGAAAGTGGTGGAAGAGATCCTGGATGGCGAGGACCCTACCAG ACCTGCTAGAGGCGAAGCTCACCCTGACGGCGAACTGAAAGCC CACGATGGCTGCCTGTACTGCCTGCTGGATACCGACAGCAGCG TGAACCAGCACCAGAAAGAGCGGAGACTGGACACCATGACCAA CAACCACCTCGTGCGGCACCGGATGCTGATCCTGGACAGACTC CTGAAGGATCTGATCCAGGACTTCGCCGACGGCCAGAAGGACA GAATCAGCAGAGTGTGCGTGGAAGTCGGCAAAGAGCTGACCAC CTTCAGCGCTATGGACAGCAAGAAGATCCAGCGGGAACTGACC CTGCGGCAGAAGTCTCATACCGACGCCGTGAACAGACTGAAGA GAAAGCTTCCAGGCAAGGCCCTGAGCGCCAACCTGATCAGAAA GTGCAGAATCGCAATGGACATGAACTGGACATGCCCCTTCACCG GCGCCACATATGGCGATCACGAGCTGGAAAATCTGGAACTGGAA, CACATCGTGCCCCACAGCTTCAGACAGAGCAATGCCCTGTCTAG CCTGGTGCTGACATGGCCTGGCGTEGAACAGGATGAAGGGACAG AGAACCGGCTACGACTTCGTGGAACAAGAGCAAGAGAACCCCG TGCCTGACAAGCCCAACCTGCACATCTGCAGCCTGAACAACTAT CGCGAGCTGGTGGAAAAGCTGGACGACAAGAAGGGACACGAGG ACGACAGACGGCGGAAGAAGAAAAGAAAGGCCCTGCTGATGGT CCGAGGCCTGTCTCACAAACACCAGAGCCAGAACCACGAGGCC ATGAAAGAAATCGGCATGACCGAGGGCATGATGACCCAGAGCA GCCACCTGATGAAGCTGGCCTGCAAGAGCATCAAGACCAGCCT GCCTGACGCTCACATCGACATGATTCCAGGCGCCGTGACTGCC GAAGTTCGCAAAGCCTGGGATGTGTTCGGCGTGTTCAAAGAACT GTGCCCCGAAGCCGCCGATCCTGACTCTGGCAAGATCCTGAAA
GAGAACCTGCGGAGCCTGACTCATCTGCATCACGCCCTGGATG CCTGTGTGCTGGGACTGATCCCCTACATCATOCCCoGCTCACCAC
AATGGCCTGCTGAGAAGAGTCCTGGCCATGCGCAGAATCCCCG AGAAACTGATCCCTCAAGTGCGGCCCGTGGCCAACCAGAGACA
CTACGTGCTGAACGACGACGGCCGGATGATGCTGAGGGATCTG AGTGCCAGCCTGAAAGAAAACATCCGCGAGCAGCTGATGGAACA|
GCGAGTGATCCAGCACGTGCCCGCTGATATGGGCGGAGCACTG CTCAAAGAAACAATGCAGCGGGTGCTGAGCGTGGACGGCTCTG GCGAAGATGCTATGGTGTCCCTGTCTAAGAAGAAGGACGGCAAG AAAGAGAAGAATCAAGTCAAGGCCTCCAAGCTCGTGGGAGTGTT TCCTGAGGGCCCCAGCAAGCTGAAAGCTCTGAAGGCCGCCATC GAGATCGACGGCAATTATGGCGTGGCACTGGACCCCAAGCCTG TGGTCATCAGACACATCAAGGTGTTCAAGAGGATCATGGCCCTC AAAGAGCAGAACGGCGGCAAGCCAGTGCGCATCCTGAAAAAGG GCATGCTGATTCACCTGACCAGCAGCAAGGACCCTAAGCACGCT GGCGTTTGGAGAATCGAGAGCATCCAGGACAGCAAAGGCGGCG TGAAACTGGACCTGCAGAGGGCTCATTGCGCCGTGCCTAAGAAC AAGACCCACGAGTGCAATTGGAGAGAGGTGGACCTGATCTCCCT GCTGAAAAAGTACCAGATGAAGCGCTACCCCACCAGCTACACCG
GCACACCTAGACCCAAGAAGAAGAGGAAGGTG Sequência da proteína AmuCas9/NLS (SEQ ID NO:14)
MSRSLTFSFDIGYASIGWAVIASASHDDADPSVCGCGTVLFPKDDC QAFKRREYRRLRRNIRSRRVRIERIGRLLVQAQIITPEMKETSGHPA PFYLASEALKGHRTLAPIELWHVLRWYAHNRGYDNNASWSNSLSE DGGNGEDTERVKHAQDLMDKHGTATMAETICRELKLEEGKADAPM EVSTPAYKNLNTAFPRLIVEKEVRRILELSAPLIPGLTAEIELIAQHHP LTTEQRGVLLQHGIKLARRYRGSLLFGQLIPRFDNRIISRCPVTWAQ VYEAELKKGNSEQSARERAEKLSKVPTANCPEFYEYRMARILCNIR ADGEPLSAEIRRELMNQARQEGKLTKASLEKAISSRLGKETETNVSN YFTLHPDSEEALYLNPAVEVLORSGIGQILSPSVYRIAANRLRRGKS VTPNYLLNLLKSRGESGEALEKKIEKESKKKEADYADTPLKPKYATG RAPYARTVLKKVVEEILDGEDPTRPARGEAHPDGELKAHDGCLYCL LDTDSSVNQHOKERRLDTMTNNHLVRHRMLILDRLLKDLIQDFADG QKDRISRVCVEVGKELTTFSAMDSKKIQRELTLRQKSHTDAVNRLK RKLPGKALSANLIRKCRIAMDMNWTCPFTGATYGDHELENLELEHIV PHSFRQSNALSSLVLTWPGVNRMKGORTGYDFVEQEQENPVPDK PNLHICSLNNYRELVEKLDDKKGHEDDRRRKKKRKALLMVRGLSHK HQOSQNHEAMKEIGMTEGMMTQSSHLMKLACKSIKTSLPDAHIDMIP GAVTAEVRKAWDVFGVFKELCPEAADPDSGKILKENLRSLTHLHHA LDACVLGLIPYIIPAHHNGLLRRVLAMRRIPEKLIPQVRPVANQRHYV LNDDGRMMLRDLSASLKENIREQLMEQRVIQHVPADMGGALLKET MQRVLSVYDGSGEDAMVSLSKKKDGKKEKNQVKASKLVGVFPEGPS KLKALKAAIEIDGNYGVALDPKPVVIRHIKVFKRIMALKEQNGGKPVRI LKKGMLIHLTSSKDPKHAGVWRIESIQDSKGGVKLDLAORAHCAVPK
NKTHECNWREVDLISLLKKYQMKRYPTSYTGTPRPKKKRKV SEQ ID NO:15. OKiCas9/NLS DNA
ATGGCCAGAGATTACAGCGTCGGCCTGGATATCGGCACCTCTTC TGTTGGATGGGCCGCCATEGACAACAAGTACCACCTGATCCGG GCCAAGAGCAAGAACCTGATTGGCGTGCGGCTGTTCGATAGCG CCGTGACCGCCGAGAAGAGAAGAGGCTACAGAACCACCAGACG GCGGCTGAGCAGACGGCATTGGAGACTGAGACTGCTGAACGAC ATCTTCEGCCGGACCTCTGACCGATTTCEGGCGACGAGAATTTCCT GGCCAGACTGAAGTACAGCTGGGTTCACCCTCAAGACCAGAGC AATCAGGCCCACTTTGCCGCCGGACTGCTGTTCGACAGCAAAGA GCAGGACAAGGACTTCTACCGGAAGTACCCCACCATCTATCACC TGAGACTGGCCCTGATGAACGACGACCAGAAGCACGACCTGAG AGAGGTGTACCTGGCCATCCACCACCTGGTCAAGTACAGAGGC CACTTCCTGATCGAGGGCGACGTGAAAGCCGACAGCGCCTTTG ATGTGCACACCTTCGCCGACGCCATCCAGAGATACGCCGAGAG CAACAACTCCGACGAGAACCTGCTGGGCAAGATCGACGAGAAG AAGCTGAGCGCTGCCCTGACCGATAAGCACGGCAGCAAAAGCC AGAGAGCCGAGACAGCCGAAACCGCCTTCGACATCCTGGACCT GCAGTCCAAGAAGCAGATCCAGGCCATCCTGAAGTCCGTCGTG GGCAACCAGGCCAATCTGATGGCCATTTTTGGCCTGGACAGCAG CGCCATCAGCAAGGACGAGCAGAAGAACTACAAGTTCAGCTTCG ACGACGCCGACATCGATGAGAAGATCGCCGATTCTGAGGCCCT GCTGAGCGATACCGAGTTCGAGTTCCTGTGCGATCTGAAGGCC GCCTTTGACGGCCTGACACTGAAAATGCTGCTGGGCGACGACAA, GACCGTGTCCGCTGCTATGGTTCEGACGGTTCAACGAGCACCAGA, AGGACTGGGAGTACATCAAGAGCCACATCCGGAACGCCAAGAA
CGCCGGCAATGGCCTGTACGAGAAGTCTAAGAAGTTCGACGGC ATCAACGCCGCCTATCTGGCTCTGCAGTCCGACAACGAGGACGA|
CAGAAAGAAGGCCAAGAAGATTTTCCAGGACGAGATCAGCTCCG CCGACATTCCCGATGATGTGAAGGCCGATTTCCTGAAGAAGATT GACGACGATCAGTTCCTGCCTATCCAGCGGACCAAGAACAACGG CACAATCCCTCACCAGCTGCACCGGAACGAGCTGGAACAGATCA, TCGAGAAGCAGGGGATCTACTACCCATTCCTGAAGGACACCTAC CAAGAGAACAGCCACGAGCTGAACAAAATCACAGCCCTGATCAA CTTCAGGGTGCCCTACTACGTGGGCCCTCTGGTGGAAGAGGAA CAGAAAATCGCCGACGACGGCAAGAACATCCCCGATCCTACCAA CCACTGGATGGTCCGAAAGTCCAACGACACCATCACACCCTGGA ACCTGAGCCAGGTGGTCGACCTGGATAAGAGCGGCAGAAGATT CATCGAGCGGCTGACCGGCACCGATACCTATCTGATCGGAGAG CCCACACTGCCCAAGAACAGCCTGCTGTACCAGAAATTCGACGT GCTGCAAGAACTGAACAACATCCGCGTGTCCGGCAGACGGCTG GACATTAGAGCCAAGCAGGATGCCTTCGAGCACCTGTTCAAGGT GCAGAAAACCGTGTCTGCTACCAATCTGAAGGACTTCCTGGTGC AAGCCGGCTACATCAGCGAGGACACCCAGATTGAAGGACTCGC CGACGTGAACGGAAAGAACTTCAACAACGCCCTGACCACCTACA ACTACCTGGTGTCTGTGCTGGGCCGCGAGTTCGTGGAAAACCC CAGCAACGAGGAACTGCTGGAAGAGATTACCGAGCTGCAGACC GTGTTCGAGGACAAGAAGGTGCTGCGGAGACAGCTGGATCAGC TGGACGGACTGAGCGACCACAACAGAGAGAAGCTTTCCCGGAA GCACTACACCGGCTGGGGCAGAATCAGCAAGAAGCTGCTGACC ACCAAGATCGTGCAGAACGCCGACAAGATCGATAACCAGACCTT CGATGTGCCCCGGATGAACCAGAGCATCATCGACACCCTGTACA ACACCAAGATGAACCTGATGGAAATCATCAACAATGCCGAGGAT GACTTCGGCGTCAGAGCCTGGATCGACAAGCAGAACACCACCG ATGGCGACGAGCAGGACGTGTACAGCCTGATCGATGAACTGGC TGGCCCCAAAGAGATCAAGCGGGGCATCGTGCAGTCCTTTAGAA TCCTGGACGACATCACCAAGGCCGTGGGCTACGCCCCTAAACG GGTGTACCTCGAATTTGCCAGAAAGACCCAAGAGAGCCACCTGA CCAACAGCCGGAAGAACCAGCTGAGCACCCTGCTGAAGAATGC CGGCCTGTCTGAGCTGGTCACACAGGTGTCCCAGTATGATGCC GCCGCTCTGCAGAACGACCGGCTGTATCTTTACTTCCTGCAGCA AGGCAAGGACATGTACTCCGGCGAGAAGCTGAATCTGGACAAC CTGAGCAACTACGACATCGACCACATCATCCCTCAGGCTTACAC CAAGGACAACAGCCTGGACAACAGAGTGCTGGTGTCCAATATCA CCAACCGGCGGAAGTCCGACAGCAGCAACTATCTGCCCGCTCT GATCGATAAGATGCGGCCCTTTTGGAGCGTGCTGAGCAAGCAG GGGCTGCTGTCTAAGCACAAGTTCGCCAACCTGACCAGAACCAG AGACTTCGACGATATGGAAAAAGAGCGGTTTATCGCCCGCAGCC TGGTGGAAACCCGGCAGATCATTAAGAACGTGGCCAGCCTGATT GACAGCCACTTCGGCGGAGAGACAAAAGCCGTGGCCATTAGAA GCAGCCTGACAGCCGACATGCGGAGATACGTGGACATCCCCAA GAACCGGGACATCAACGACTACCACCACGCCTTCGATGCCCTGC TGTTTAGCACAGTGGGCCAGTACACCGAGAACAGCGGCCTGAT GAAGAAGGGCCAGCTGTCCGATTCTGCCGGCAACCAGTACAATC GGTACATCAAAGAGTGGATTCACGCCGCCAGGCTGAACGCACA GTCCCAGAGAGTGAACCCCTTCGGCTTTGTCGTGGGCTCCATGA GAAATGCTGCCCCTGGCAAGCTGAACCCCGAGACAGGGGAGAT CACCCCAGAGGAAAACGCCGACTGGTCTATCGCCGACCTGGAC TACCTGCACAAAGTGATGAATTTCCGGAAGATCACCGTGACCAG GCGGCTGAAGGATCAGAAAGGACAGCTGTACGACGAGAGCAGA TACCCCTCCGTGCTGCACGACGCCAAGTCTAAGGCCAGCATCAA CTTTGACAAGCACAAGCCCGTGGACCTGTACGGCGGCTTTAGCT CTGCCAAGCCTGCCTATGCCGCACTGATCAAGTTCAAGAACAAG TTCCGGCTGGTCAACGTGCTGCGGCAGTGGACCTACAGCGACA AGAACTCCGAGGACTATATCCTTGAGCAGATCAGAGGCAAGTAC CCTAAGGCCGAGATGGTGCTGTCTCACATCCCTTACGGCCAGCT GGTCAAGAAAGATGGCGCCCTGGTCACCATCTCTAGOEGCCACA GAGCTGCACAACTTTGAGCAGCTGTGGCTGCCTCTGGCCGACTA, CAAGCTGATCAACACACTGCTTAAGACCAAAGAGGACAACCTCG TCGATATCCTGCACAACCGGCTGGATCTCCCCGAGATGACAATC GAGAGCGCCTTCTACAAAGCCTTCGACTCCATCCTGAGCTTCGC CTTCAACAGATACGCCCTGCACCAGAACGCCCTCGTGAAACTGC AGGCCCACAGGGACGATTTCAATGCCCTGAACTACGAGGATAAG CAGCAGACCCTGGAAAGGATTCTGGACGCTCTGCATGCCTCTCC AGCCAGCAGCGACCTGAAGAAAATCAACCTGTCCAGCGGCTTCG GCCGGCTGTTTTCCCCTAGCCACTTTACCCTGGCCGACACCGAC GAGTTCATCTTCCAGAGCGTGACCGGCCTGTTCAGCACCCAGAA AACAGTGGCTCAGCTGTATCAAGAGACAAAGCCCAAGAAGAAGA
GGAAGGTG Sequência da proteína OKkiCas9/NLS (SEQ ID NO:16)
MARDYSVGLDIGTSSVGWAAIDNKYHLIRAKSKNLIGVRLFDSAVTA EKRRGYRTTRRRLSRRHWRLRLLNDIFAGPLTDFGDENFLARLKYS WVHPQDQSNQAHFAAGLLFDSKEQDKDFYRKYPTIYHLRLALMND DQKHDLREVYLAIHHLVKYRGHFLIEGDVKADSAFDVHTFADAIQRY AESNNSDENLLGKIDEKKLSAALTDKHGSKSQRAETAETAFDILDLO SKKQIQAILKSVYVGNQANLMAIFGLDSSAISKDEQKNYKFSFDDADID EKIADSEALLSDTEFEFLCDLKAAFDGLTLKMLLGDDKTVSAAMVRR FNEHQKDWEYIKSHIRNAKNAGNGLYEKSKKFDGINAAYLALQSDN EDDRKKAKKIFQDEISSADIPDDVKADFLKKIDDDQFLPIQRTKNNGT IPHQLHRNELEQIUEKQGIYYPFLKDTYQENSHELNKITALINFRVPYY VGPLVEEEQKIADDGKNIPDPTNHWMVRKSNDTITPWNLSQVVDLD KSGRRFIERLTGTDTYLIGEPTLPKNSLLYQKFDVLQELNNIRVSGRR LDIRAKQDAFEHLFKVQKTVSATNLKDFLVQAGYISEDTQIEGLADV NGKNFNNALTTYNYLVSVLGREFVENPSNEELLEEITELQTVFEDKK VLRRQLDQLDGLSDHNREKLSRKHYTGWGRISKKLLTTKIVOQNADKI DNQTFDVPRMNQSIIDTLYNTKMNLMEIINNAEDDFGVRAWIDKQNT TDGDEQDVYSLIDELAGPKEIKRGIVOSFRILDDITKAVGYAPKRVYL EFARKTQESHLTNSRKNQLSTLLKNAGLSELVTQVSQYDAAALQND RLYLYFLOQGKDMYSGEKLNLDNLSNYDIDHIIPQAYTKDNSLDNRV LVSNITNRRKSDSSNYLPALIDKMRPFWSVLSKQGLLSKHKFANLTR TRDFDDMEKERFIARSLVETRQIIKNVASLIDSHFGGETKAVAIRSSL TADMRRYVDIPKNRDINDYHHAFDALLFSTVGQYTENSGLMKKGQL SDSAGNQYNRYIKEWIHAARLNAQSQARVNPFGFVVGSMRNAAPGK LNPETGEITPEENADWSIADLDYLHKVMNFRKITVTRRLKDQKGAQLY DESRYPSVLHDAKSKASINFDKHKPVDLYGGFSSAKPAYAALIKFKN KFRLVNVLRQWTYSDKNSEDYILEQIRGKYPKAEMVLSHIPYGQLVK KDGALVTISSATELHNFEQLWLPLADYKLINTLLKTKEDNLVDILHNR LDLPEMTIESAFYKAFDSILSFAFNRYALHQNALVKLQAHRDDFNAL NYEDKQQTLERILDALHASPASSDLKKINLSSGFGRLFSPSHFTLAD
TDEFIFOSVTGLFSTQKTVAQLYQETKPKKKRKV Sequência de DNA de BboCas9/NLS (SEQ ID NO:17)
ATGAGCCAGCACCGGCGGTATAGAATCGGCATCGACGTGGGCC TGAATAGCGTTGGACTGGCCGCCGTGGAAATCGACGCCAACCA CGACAATCCTCTGGACGAGATCCCCATCAGCATCCTGAATGCCC AGAGCGTGATCCACGATGGCGGAGTGGACCCTGATGAGGCCAA GTCTGCTACAAGCAGACGGGCTTCTGCTGGCGTGGCCAGAAGA ACAAGACGGCTGCACAAGAGCAAGCGGCAGAGACTGGCCAAGC TGGACGAGGTGCTGAATGAGCTGGGCTACCCCGTGGAAGATGA GAGCCAGTTTCCAGCCGGCAGCAACCCCTATATCEGCTTGGCAAG TGCGGGCCAAACTGGCCGAGACATTCATCCCCGACGTGGAAAC CCGGAAGCGGATGATCTCTATOEGCCATCCGGCACATTGCCCGG CATAGAGGATGGCGGAATCCCTACTCTTCTGTGGCCGACGCCGA GCGGATGAGCCATACACCTTCTCCATTCATGGTGGAATACGCCA AGAAGCTGGACTTCGAGATCAACGACAGACGGACCAACGGCTTC) TATCACAGCCCTTGGCAGAGCGTGGACGAGGAAGGCAAGAGAC TGAGCAAGAGCGAGCTGGAAAAGCAGCCCAAGATCGAGGACTG GAACGACAACCCCATCAACGGCAAGACAATCGCCCAGCTGGTC GTGTCCTCTCTGGAACCCCAGACCAAGATCAGACGGGATCTGAC ACACGGCCTGCAGACCGAGAGCACCCTGAATATCCAGACAGAG AAGCTGCACCAGAGCGACTACATCCACGAACTGGAAACCATCTT CGAGCGGCAGCACGTGGACCAGACAACCCAAGAACAGCTGCTG GAAGCCACCTTCCACACCAAGAATCCTAAGGCCGTGGGAGCCG CCGCTAAGCTCGTTGGAAAAGATGCCCTGGACAGCCGGTACTAC AGAGCCAGCAGAGCCACACCAGCCTTCGAAGAGTACAGAGTGA TGGCCGCCATCGACACCCTGCGGATTAGAGAGCACGGCACCGA GAGACAGCTGACCACCGACGAGAGAAGAAAGCTGTTCGACTTCA, TCAAGGGGCTGCCCAGCAAAAAGACCAAGAACGAGCCCAGCAT CAGCTCCCTGACCTGGGGAGATGTGGCCGATTTTCTGGGCATCC AGCGGATCGATCTGAGAGGCCTGGGCTCTCTGAAAGACGGCGA ACCTGTGTCTGCCAAGCAGCCTCCTGTGATCGAGACAAACGACA TCATGCAGAAGGCCCCTGATCCAATCGCTGCCTGGTGGTCACAG GCCAACACCAAAGAACGGGACAGATTCGTCGAGTTCATGAGCAA CGCTGGCGCCATCAAGGACACCTCCGACGAAGTGCGGAACATT GACGCCGAGATCAGCCAGCTGCTCGAAGAACTGACCGGCTCTG AGCTGGAATCCCTGGATAAGATCACCCTGACCTCTGGCAGAGCC GCCTACAGCTCTCAGACCCTGAGAAACATCACCAACTATATGTAC GAGACAGGCTGCGACCTGACCACAGCCAGACAAGAGCTGTACC ACGTGGGCAAGAATTGGGCCCCTCCTGCTCCTCCTATCTACGAG CACACAGGCAACCCCAGCGTGGACAGAACCTTCAGCATCATCCA CAGATGGCTGTGCAACATGCGGGACCAGTACGGCGAGCCCGAG ACAGTGAATATCGAGTACGTCCGCGACGGCTTCAGCAGCACATC TACACAGCTGGCCGAGCAGCGCGAGCGGGATAGAAGATACGCC GACAACCTGAAGATGCTGAGCAACTACGAGGGCGCCAGCAGCA GATCAGATGTGCGGAGAATCAAGGCCCTGCAGAGACAGAACTG CCAGTGCATCTACTGCGGCCGGACCATCACCTTCGAGACATGCC AGATGGACCATGTGCTGCCCCGGAAAGGCCCTGGATCCGATAG CAAGTTCGAGAACCTGGTGGCCACATGCGGCGAGTGCAACAAG TCCAAGAGCGATACCCTGTACATGAACTGGGCCAAGACATACCC CAATACCAACCTGCAGGACGTGCTGAGAAGAATCCAAGAGTGGT CCAAGGACGGCTGGATGACCGACAAAAGATGGCGGCAGTACAA AGAGGCCCTGATCCTGAGACTGGAAGCTACCGAGAAGCAAGAG CCCCTGGACAATOEGGAGCATGGAAAGCGTGTCCTACATGGCCA GAGAGCTGCGGAACCGGATCTACGGCTTTTACGGCTGGCACGA CCAGGACGACGCCCTGAAACAAGGCAGACAGAGGGTGTTCGTG TCCAGCGGCAGTATGACAGCCGCTGCCAGAAGGACCCCTTTCG AGTCCCCACTGATTAAGGGCGCCGATGAGGAAACCTACGAGAG CAGCCTGCCTTGGCTGGATGGCATGAAGGGCAAGACCAGACTG GATCGGAGACACCATGCCGTGGACGCCAGCATCATTGCCATGAT) GAGGCCCCAGATCGTGAAGATCCTGACAGAGGCCCAAGAGATC AGAAGCGAGCAGCACGACAAGTACCGGAAGGGCCAGACACCTG ACTACGTGTGCAAGCGGCGGGACTACTGGCGGAATTGGAGAGG CACCCCTGACACCAGAGATGAGGAAGTGTTCAACTACTGGGCTG GGGAGCAGCTGAGAACCCTGACCGATCTGGTGTCCCAGAAGAT GGCCGACGACGAAATCCCCGTGATCTACCCCACCAGACTGAGA CTCGGCAATGGCAGCGCCCACAAGGATACCGTGGTGTCCATGA TGACCCGGAAAGTGGGCGACGAGCTGAGCATCACCGCCATCAA CAAAGCCGAAAGCGGAGCCCTGTACACAGCCCTGACCAGAGAC AGCGACTTCGACTGGAAAACCGGCCTGAGCGCCAATCCTAACC GGCGGATCAGAGTGCACGATAAGTGGTTCGAGGCCGACGATAC CATCAAGTTTCTGGAACCTGCCGTGGAAGTGGTGCTGAAGAACA ACACCAGAGCCAGAATCGACCCCGAGGCTCTGGATAAGGTGCA CAGCACACTGTACGTGCCCGTCAGAGGCGGAATCGCCGAAGCC GGAAATAGCATTCACCACGTGCGGTTCTACAAGATCCCCAAGCT GAACAGCAAGGGCAAGCAGACCGGCAGCATCTACGCCATGCTG
AGAGTGCTGACCATCGACCTGGCCATGAACCAGTACGACAAAGA GACAGGCAAGAAGCAGGACCTGTTCACCCTGCCACTGCCTGAAA|
GCAGCCTGAGCAGAAGATTCAGCGAGCCCAAACTGCGGCAGGC TCTGATCGATGGCACAGCCGAATATCTCGGATGGGCCGTCGTG GACGATGAGCTTGAGATCCCCGCCTTCGCCAACGCCAGAATCAC AGAGGAACAGGCCATTAACGGCAGCTTCACCGACAGACTGCTG CACAGCTTTCCCGGCACACACAAGTTCAGATTCGCCGGCTTCTC CCGGAACACCGAGATCGCCATTAGACCTGTGCAGCTGGCCTCT GAGGGCCTGATCGAAACCGATGAGAACCGGAAGAGACAGCAGC TGCGGCTGACCCAGCCTAACACCGAGTACAGCAACAGCATCAAG AACGTGCTGAAGTCCGGCCTGCACCTGAAAGTGAACACCCTGTT CCAGACAGGCATCCTGGTCACCAGGGCCAATAGCCAGGGAAAG CAGAGCATCCGGTTCAGCACAGTGGAAGAGCCCAAGAAGAAGA
GGAAGGTG Sequência da proteína BboCas9/NLS (SEQ ID NO:18)
MSQHRRYRIGIDVGLNSVGLAAVEIDANHDNPLDEIPISILNAQSVIH DGGVDPDEAKSATSRRASAGVARRTRRLHKSKRQRLAKLDEVLNE LGYPVEDESQFPAGSNPYIAWQVRAKLAETFIPDVETRKRMISIAIRH IARHRGWRNPYSSVADAERMSHTPSPFMVEYAKKLDFEINDRRTN GFYHSPWQSVDEEGKRLSKSELEKQPKIEDWNDNPINGKTIAQLVVY SSLEPQTKIRRDLTHGLQTESTLNIQTEKLHQSDYIHELETIFERQHV DQTTQEQLLEATFHTKNPKAVGAAAKLVGKDALDSRYYRASRATPA FEEYRVMAAIDTLRIREHGTERQLTTDERRKLFDFIKGLPSKKTKNE PSISSLTWGDVADFLGIQORIDLRGLGSLKDGEPVSAKQPPVIETNDIM
QKAPDPIAAWWSQANTKERDRFVEFMSNAGAIKDTSDEVRNIDAEI SQLLEELTGSELESLDKITLTSGRAAYSSQTLRNITNYMYETGCDLTT| ARQELYHVGKNWAPPAPPIYEHTGNPSVDRTFSIIHRWLCNMRDAQY|
GEPETVNIEYVRDGFSSTSTQLAE QRERDRRYADNLKMLSNYEGA SSRSDVRRIKALQORQNCQCIYCGRTITFETCAMDHVLPRKGPGSDS KFENLVATCGECNKSKSDTLYMNWAKTYPNTNLQDVLRRIQEWSK DGWMTDKRWRQYKEALILRLEATEKQEPLDNRSMESVSYMARELR NRIYGFYGWHDQDDALKQGRQAQRVFVSSGSMTAAARRTPFESPLIK GADEETYESSLPWLDGMKGKTRLDRRHHAVDASIIAMMRPQIVKILT EAQEIRSEQHDKYRKGQATPDYVCKRRDYWRNWRGTPDTRDEEVF NYWAGEQLRTLTDLVSQKMADDEIPVIYPTRLRLGNGSAHKDTVVS MMTRKVGDELSITAINKAESGALYTALTRDSDFDWKTGLSANPNRRI RVHDKWFEADDTIKFLEPAVEVVLKNNTRARIDPEALDKVHSTLYVP VRGGIAEAGNSIHHVRFYKIPKLNSKGKQTGSIYAMLRVLTIDLAMN QYDKETGKKQDLFTLPLPESSLSRRFSEPKLRQALIDGTAEYLGWA VVDDELEIPAFANARITEEQAINGSFTDRLLHSFPGTHKFRFAGFSR NTEIAIRPVQLASEGLIETDENRKRQQLRLTQPNTEYSNSIKNVLKSG
LHLKVNTLFQTGILVTRANSQGKQSIRFSTVEEPKKKRKV Sequência de DNA de AceCas9/NLS (SEQ ID NO:19)
ATGGGCGGATCTGAAGTGGGAACCGTGCCTGTGACTTGGAGAC TGGGAGTCGATGTGGGCGAGAGATCCATTGGACTGGCCGCCGT GTCCTACGAAGAGGACAAGCCCAAAGAAATCCTGGCTGCTGTGT CCTGGATTCACGATGGCGGAGTGGGCGACGAAAGAAGCGGAGC TAGTAGACTGGCCCTGAGAGGCATGGCCAGAAGGGCTAGACGG CTGCGGAGATTCCGTAGAGCCAGACTGCGCGACCTGGACATGC TGCTGTCTGAACTCGGATGGACCCCTCTGCCTGACAAGAACGTG TCACCTGTGGATGCCTGGCTGGCCAGAAAGAGACTGGCCGAGG AATACGTGGTGGACGAGACAGAGAGAAGAAGGCTGCTGGGCTA CGCCGTGTCTCACATGGCTAGACATAGAGGCTGGCGGAACCCC TGGACCACCATCAAGGACCTGAAGAACCTGCCTCAGCCTAGCGA CAGCTGGGAGAGAACCAGAGAAAGCCTGGAAGCCCGGTACTCC GTGTCTCTGGAACCTGGCACAGTTGGACAGTGGGCCGGATACC TGCTGCAGAGAGCCCCTGGCATCAGACTGAACCCTACACAGCA GAGCGCCGGAAGAAGGGCCGAACTGTCTAATGCCACCGCCTTC GAGACAAGACTGCGGCAAGAGGATGTGCTGTGGGAGCTGAGAT GTATCGCCGACGTTCAGGGCCTGCCTGAGGACGTGGTGTCCAA TGTGATCGACGCCGTGTTCTGCCAGAAAAGACCTAGCGTGCCCG CCGAGAGAATCGGCAGAGATCCTCTCGATCCCAGCCAGCTGAG AGCCAGCAGAGCCTGCCTGGAATTTCAAGAGTACCGGATCGTG GCCGCTEGTGGCCAACCTGAGAATCAGAGATGGCAGCGGCAGCA GACCCCTGAGTCTGGAAGAAAGAAACGCCGTGATCGAGGCCCT GCTGGCCCAGACAGAAAGAAGCCTCACTTGGAGCGACATTGCC CTGGAAATCCTGAAGCTGCCCAACGAGAGCGACCTGACCTCTGT GCCTGAAGAGGATGGCCCAAGCAGCCTGGCCTACTCTCAGTTC GCCCCTTTCGATGAGACAAGCGCCCGGATCGCCGAGTTTATCGC CAAGAACAGACGGAAGATCCCCACATTCGCCCAGTGGTGGCAA GAGCAGGATCGGACCAGTAGAAGCGATCTGGTGGCTGCCCTGG CCGACAATTCTATTGCCGGCGAGGAAGAACAAGAGCTGCTGGTG CATCTGCCCGACGCCGAACTTGAAGCTCTGGAAGGACTGGCTCT GCCCTCTGGCAGAGTGGCCTATAGCAGACTGACACTGAGCGGC CTGACCAGAGTGATGAGAGATGATGGCGTGGACGTGCACAACG CCCGCAAGACATGCTTCGGAGTGGACGACAATTGGCGGCCTCC ACTGCCTGCTCTGCATGAAGCTACAGGACACCCCGTGGTGGATA GAAACCTGGCTATCCTGCGGAAGTTCCTGAGCAGCGCCACCATG AGATGGGGCCCTCCACAGTCTATOEGTGGTGGAACTTGCCAGAG GCGCCAGCGAGAGCAGAGAAAGGCAGGCCGAAGAAGAAGCCG CTCGGAGAGCCCACAGAAAGGCCAACGACAGAATTAGAGCCGA ACTCAGAGCCTCCGGCCTGAGCGATCCTTCTCCOTGCCGATCTTG TTAGAGCCCGGCTGCTGGAACTGTACGACTGCCACTGTATGTAC TGTGGCGCCCCTATCTCOTGGGAGAACAGCGAGCTGGATCACAT) CGTGCCCAGAACAGATGGCGGATCCAACAGACACGAGAACCTG GCCATTACATGCGGCGCCTGCAACAAAGAAAAAGGCAGAAGGC CCTTEGCCAGCTGGGCCGAGACAAGCAATAGAGTGCAGCTGCG GGACGTGATCGACCGGGTGCAGAAGCTGAAGTACAGCGGCAAC ATGTACTGGACCCGGGACGAGTTCAGCCGGTACAAGAAAAGCG TGGTGGCCCGGCTEAAGCGGAGAACCTCTGATCCTGAAGTGAT CCAGAGCATCGAGAGCACCGGCTATGCTGCCGTGGCTCTGAGA GATAGACTGCTGAGCTACGGCGAGAAGAATGGCGTGGCACAGG TGGCCGTTTTTAGAGGCGGAGTGACAGCCGAGGCCAGAAGATG GCTGGACATCTCCATCEGAGCGGCTGTTCAGTAGAGTGGCCATCT TCGCCCAGAGCACCTCCACCAAGAGGCTGGATAGAAGGCACCA CGCCGTGGATGCTGTGGTGCTGACAACACTGACACCCGGCGTG GCCAAGACACTGGCTGATGCTAGAAGCAGAAGAGTGTCCGCCG AGTTCTGGCGCAGACCAAGCGACGTGAACAGACACAGCACCGA GGAACCTCAGAGCCCCGCCTACAGACAGTGGAAAGAGAGCTGT TCTGGCCTGGGCGACCTGCTGATTTCTACCGCCGCCAGAGATTC TATCGCCGTGGCTGCTCCTCTGAGACTGAGGCCAACAGGCGCA CTGCACGAGGAAACCCTGAGAGCCTTTAGCGAGCACACAGTGG
GAGCCGCTTGGAAGGGCGCTGAGCTGAGAAGAATCGTGGAACC CGAAGTGTACGCCGCCTTCCTGGCACTTACAGATCCTGGCGGCA|
GATTCCTGAAGGTGTCCCCTAGCGAAGATGTGCTGCCTGCCGAC GAGAACAGGCACATTGTGCTGAGCGACAGAGTGCTGGGCCCCA GAGACAGAGTGAAACTGTTCCCCGACGACCGGGGCAGCATCAG AGTCAGAGGTGGCGCAGCCTATATCGCCAGCTTTCACCACGCCA GAGTGTTCAGATGGGGAAGCAGCCACTCTCCTAGCTTCGCCCTG CTGAGAGTCTCTCTGGCTGATCTGGCTGTGGCTGGCCTGCTTAG
AGATGGGGTCGACGTGTTCACAGCCGAGCTGCCACCTTGGACT CCCEGCTTGGAGATATGCCTCTATOEGCCCTGGTCAAGGCCGTGGA|
AAGCGGCGACGCTAAGCAAGTTGGATGGCTGGTGCCTGGCGAC GAACTGGATTTTGGACCTGAGGGCGTGACAACCGCTGCCGGCG ATCTGAGCATGTTCCTGAAGTACTTTCCCGAGCGGCACTGGGTC GTGACCGGCTTCGAAGATGACAAGAGGATCAACCTGAAGCCTGC CTTCCTGTCTGCCGAACAGGCTGAGGTGCTGAGGACTGAGAGA AGCGACAGACCCGACACACTGACAGAGGCCGGCGAAATTCTGG CCCAGTTCTTCCCTAGATGTTGGCGGGCCACAGTGGCTAAGGTG CTGTGCCATCCTGGCCTGACCGTGATCAGAAGAACAGCCCTGG GACAGCCTAGGTGGCGGAGAGGACATCTGCCTTATTCATGGCG GCCTTGGAGCGCCGATCCTTGGAGTGGCGGAACACCTCCCAAG
AAGAAGAGGAAGGTG Sequência da proteína AceCas9/NLS (SEQ ID NO:20) MGGSEVGTVPVTWRLGVDVGERSIGLAAVSYEEDKPKEILAAVSW!
HDGGVGDERSGASRLALRGMARRARRLRRFRRARLRDLDMLLSEL GWTPLPDKNVSPVDAWLARKRLAEEYVVDETERRRLLGYAVSHMA RHRGWRNPWTTIKDLKNLPQPSDSWERTRESLEARYSVSLEPGTV GQWAGYLLAORAPGIRLNPTAQQAQSAGRRAELSNATAFETRLRQEDVL WELRCIADVOGLPEDVVSNVIDAVFCAKRPSVPAERIGRDPLDPSQ LRASRACLEFQEYRIVAAVANLRIRDGSGSRPLSLEERNAVIEALLA QTERSLTWSDIALEILKLPNESDLTSVPEEDGPSSLAYSQFAPFDET SARIAEFIAKNRRKIPTFAQWWQEQDRTSRSDLVAALADNSIAGEEE QELLVHLPDAELEALEGLALPSGRVAYSRLTLSGLTRVMRDDGVDV HNARKTCFGVDDNWRPPLPALHEATGHPVVDRNLAILRKFLSSATM RWGPPQSIVVELARGASESRERQAEEEAARRAHRKANDRIRAELR ASGLSDPSPADLVRARLLELYDCHCMYCGAPISWENSELDHIVPRT DGGSNRHENLAITCEGACNKEKGRRPFASWAETSNRVQLRDVIDRV QKLKYSGNMYWTRDEFSRYKKSVVARLKRRTSDPEVIQSIESTGYA AVALRDRLLSYGEKNGVAQVAVFRGGVTAEARRWLDISIERLFSRV AIFAQSTSTKRLDRRHHAVDAVVLTTLTPGVAKTLADARSRRVSAEF WRRPSDVNRHSTEEPQOSPAYRQWKESCSGLGDLLISTAARDSIAV AAPLRLRPTGALHEETLRAFSEHTVGAAWKGAELRRIVEPEVYAAFL) ALTDPGGRFLKVSPSEDVLPADENRHIVLSDRVLGPRDRVKLFPDD RGSIRVRGGAAYIASFHHARVFRWGSSHSPSFALLRVSLADLAVAG LLRDGVDVFTAELPPWTPAWRYASIALVKAVESGDAKQVGWLVPG DELDFGPEGVTTAAGDLSMFLKYFPERHWVVTGFEDDKRINLKPAF LSAEQAEVLRTERSDRPDTLTEAGEILAQFFPRCOWRATVAKVLCHP
GLTVIRRTALGQPRWRRGHLPYSWRPWSADPWSGGTPPKKKRKV Sequência de DNA de AheCas9/NLS (SEQ ID NO:21)
ATGGCCTATAGACTGGGCCTCGACATCGGCATCACATCTGTTGG ATGGGCCGTCSGTGGCCCTGGAAAAGGATGAGTCTGGACTGAAG CCCGTGCGCATCCAGGATCTGGGCGTCAGAATCTTCGACAAGG CCGAGGATAGCAAGACCGGCGCTTCTCTGGCTCTGCCCAGAAG AGAAGCCAGAAGCGCCAGAAGAAGAACCCGGCGGAGAAGGCAC AGACTGTGGCGCGTGAAAAGACTGCTGGAACAGCACGGCATCC TGAGCATGGAACAGATCGAGGCCCTGTACGCCCAGAGAACAAG CAGCCCTGATGTGTATGCCCTGAGAGTGGCCGGCCTGGACAGA TGTCTGATCGCCGAAGAGATCGCCCGGGTGCTGATTCACATTGC CCACAGAAGAGGCTTCCAGAGCAACAGAAAGAGCGAGATCAAG GACAGCGACGCCGGCAAGCTGCTGAAGGCCGTGCAAGAGAACG AGAACCTGATGCAGAGCAAGGGCTACAGAACCGTGGCCGAGAT GCTGGTGTCTGAGGCCACAAAGACAGACGCCGAGGGAAAGCTG GTGCACGGCAAGAAGCACGGCTACGTCAGCAACGTGCGGAACA AGGCCGGCGAGTACAGACACACAGTGTCCAGACAGGCCATCGT GGACGAAGTGCGGAAGATTTTCGCCGCTCAGAGAGCCCTGGGC AACGACGTGATGAGCGAGGAACTGGAAGATAGCTACCTGAAGAT
CCTGTGCAGCCAGCGGAACTTCGATGATGGCCCTGGCGGCGAT TCTCCTTATGGACACGGAAGCGTTAGCCCCGACGGCGTCAGACA|
GAGCATCTACGAGAGAATGGTCGGAAGCTGCACCTTCGAGACA GGCGAGAAGAGAGCCCCTAGAAGCAGCTACAGCTTCGAGCGGT TTCAGCTGCTGACCAAGGTGGTCAACCTGCGGATCTACCGGCAG CAAGAGGATGGCGGCAGATACCCTTGTGAACTGACCCAGACCG AGCGGGCCAGAGTGATCGATTGTGCCTACGAGCAGACCAAGAT CACCTACGGAAAGCTGAGAAAGCTGCTGGACATGAAGGACACC GAGAGCTTTGCCGGCCTGACCTACGGCCTGAACAGAAGCAGAA ACAAGACCGAGGACACCGTGTTCGTGGAAATGAAGTTCTACCAC GAAGTCCGCAAGGCCCTGCAGAGAGCCGGGGTTTTCATTCAGG ACCTGAGCATCGAGACACTGGACCAGATCGGCTGGATTCTGAGC GTGTGGAAGTCCGACGACAACCGGCGGAAGAAGCTGTCTACAC TGGGCCTGAGCGACAACGTGATCGAAGAACTGCTGCCCCTGAA CGGCTCCAAGTTTGGCCACCTGAGCCTGAAGGCCATCAGAAAGA, TCCTGCCTTTCCTGGAAGATGGGTACAGCTACGACGTGGCCTGET GAACTGGCCGGCTATCAGTTTCAGGGCAAGACAGAGTACGTGAA, GCAGCGGCTGCTGCCTCCACTTGGAGAAGGCGAAGTGACAAAC CCCGTTGTGCGCAGAGCACTGAGCCAGGCCATCAAGGTTGTGA ACGCCGTGATCAGAAAGCACGGCAGCCCAGAGAGCATCCACAT CGAACTGGCCAGAGAGCTGAGCAAGAACCTGGACGAGCGGAGA AAGATCGAGAAGGCCCAGAAAGAAAATCAGAAGAACAACGAGCA GATTAAGGACGAGATCCGCGAGATCCTGGGATCCGCCCATGTG ACCGGAAGAGACATCGTGAAGTACAAGCTGTTCAAACAGCAACA AGAGTTCTGCATGTACAGCGGCGAGAAGCTGGACGTGACCAGA CTGTTTGAGCCTGGCTATGCCGAGGTGGACCACATCATCCCTTA CGGCATCAGCTTCEGACGACTCCTACGACAACAAGGTGCTGGTTA AGACCGAGCAGAACCGGCAGAAGGGCAATAGAACCCCTCTGGA ATACCTGCGGGACAAGCCTGAGCAGAAGGCCAAGTTTATCGCCC TGGTGGAATCTATCCCTCTGAGCCAGAAAAAGAAAAACCACCTC CTGATGGACAAGCGGGCCATCGACCTGGAACAAGAGGGCTTCA GAGAGCGGAACCTGAGCGATACCCGGTACATCACACGGGCCCT GATGAACCACATCCAGGCTTGGCTGCTGTTCGACGAGACAGCCA, GCACCAGATCCAAGAGGGTCGTGTGTGTGAATGGCGCCGTGAC CGCCTACATGAGAGCTAGATGGGGCCTGACAAAGGATAGAGAT GCCGGCGATAAGCACCACGCCGCTGATGCTGTGGTGGTGGCCT GTATCGGAGACAGCCTGATCCAGAGAGTGACCAAATACGACAAG
TTCAAGCGGAACGCCCTGGCCGACCGGAACAGATATGTGCAGC AGGTTTCCAAGAGCGAGGGCATCACCCAGTACGTGGACAAAGAA|
ACCGGCGAGGTGTTCACCTGGGAGTCCTTCGATGAGCGGAAGT TCCTGCCTAACGAGCCCCTGGAACCTTGGCCATTCTTCAGGGAT GAGCTGCTGGCCAGACTGAGCGACGACCCCTCCAAGAACATCA GAGCCATCGGCCTGCTGACCTACAGCGAGACTGAGCAGATCGA TCCCATCTTEGTGTCCAGAATGCCCACCAGAAAAGTGACCGGCG CAGCCCACAAAGAGACAATCAGATCCCCACGGATCGTGAAGGTG GACGATAACAAGGGCACCGAGATCCAGGTGGTGGTGTCTAAGG TGGCCCTGACCGAGCTGAAGCTGACCAAAGACGGCGAAATCAA GGATTACTTCAGGCCCGAGGACGACCCCAGACTGTACAACACCC TGAGAGAACGGCTGGTGCAGTTCGGCGGAGATGCCAAGGCCGC CTTCAAAGAACCCGTGTACAAGATCAGCAAGGACGGCTCTGTGC GGACCCCTGTGCGGAAAGTGAAGATTCAAGAGAAGCTGACACTG GGCGTGCCAGTGCATGGCGGAAGAGGAATTGCCGAGAATGGCG GCATGGTCCGAATCGACGTGTTCGCCAAAGGCGGCAAGTACTAC TTCGTGCCCATCTACGTGGCCGACGTGCTGAAGAGAGAGCTGC CCAACAGACTGGCCACCGCTCACAAGCCTTACAGCGAATGGCG CGTGGTGGACGACAGCTACCAGTTCAAGTTCTCTCTGTACCCCA ACGATGCCGTGATGATCAAGCCCAGCAGAGAGGTGGACATCAC CTACAAGGACCGGAAAGAGCCCGTCGGCTGCCGGATCATGTAC TTTGTGTCCGCCAATATCGCCAGCGCCTCCATCAGCCTGAGAAC CCACGATAACTCCGGCGAGCTGGAAGGACTGGGCATCCAAGGA CTGGAAGTGTTCGAGAAATACGTCGTGGGCCCTCTGGGCGACA CACACCCTGTGTACAAAGAACGGCGGATGCCCTTCAGAGTGGAA
CGGAAGATGAACCCCAAGAAGAAGAGGAAGGTG Sequência da proteína AheCas9/NLS (SEQ ID NO:22)
MAYRLGLDIGITSVGWAVVALEKDESGLKPVRIQDLGVRIFDKAEDS KTGASLALPRREARSARRRTRRRRHRLWRVKRLLEQHGILSMEQIE ALYAQRTSSPDVYALRVAGLDRCLIAEEIARVLIHAHRRGFOSNRKS EIKDSDAGKLLKAVQENENLMQSKGYRTVAEMLVSEATKTDAEGKL VHGKKHGYVSNVRNKAGEYRHTVSRQAIVDEVRKIFAAQRALGND VMSEELEDSYLKILCSQORNFDDGPGGDSPYGHGSVSPDGVRAOSIY ERMVGSCTFETGEKRAPRSSYSFERFQLLTKVVNLRIYRQQEDGG RYPCELTQTERARVIDCAYEQTKITYGKLRKLLDMKDTESFAGLTYG LNRSRNKTEDTVFVEMKFYHEVRKALQRAGVFIQDLSIETLDQIGWI LSVWKSDDNRRKKLSTLGLSDNVIEELLPLNGSKFGHLSLKAIRKILP FLEDGYSYDVACELAGYQFQGKTEYVKQRLLPPLGEGEVTNPVVR RALSQAIKVVNAVIRKHGSPESIHIELARELSKNLDERRKIEKAQKEN QKNNEQIKDEIREILGSAHVTGRDIVKYKLFKQQQEFCMYSGEKLDV TRLFEPGYAEVDHIIPYGISFDDSYDNKVLVKTEQNRQKGNRTPLEY LRDKPEQKAKFIALVESIPLSQKKKNHLLMDKRAIDLEQEGFRERNL SDTRYITRALMNHIQAWLLFDETASTRSKRVVCVNGAVTAYMRARW GLTKDRDAGDKHHAADAVVVACIGDSLIQRVTKYDKFKRNALADRN RYVAQQVSKSEGITQYVDKETGEVFTWESFDERKFLPNEPLEPWPFF) RDELLARLSDDPSKNIRAIGLLTYSETEQIDPIFYSRMPTRKVTGAAH KETIRSPRIVKVDDNKGTEIQVVVSKVALTELKLTKDGEIKDYFRPED DPRLYNTLRERLVQFGGDAKAAFKEPVYKISKDGSVRTPVRKVKIQ EKLTLGVPVHGGRGIAENGGMVRIDVFAKGGKYYFVPIYVADVLKR ELPNRLATAHKPYSEWRVVDDSYQFKFSLYPNDAVMIKPSREVDIT YKDRKEPVGCRIMYFVSANIASASISLRTHDNSGELEGLGIQGLEVF
EKYVVGPLGDTHPVYKERRMPFRVERKMNPKKKRKV Sequência de DNA de WsuCas9/NLS (SEQ ID NO0:23)
ATGCTGGTGTCCCCTATCTCTGTGGATCTCEGGCGGCAAGAATAC CGGCTTCTTCAGCTTCACCGACAGCCTGGACAATAGCCAGAGCG GCACCGTGATCTACGACGAGAGCTTCGTGCTGAGCCAAGTGGG CAGAAGAAGCAAGCGGCACAGCAAGCGGAACAACCTGAGAAAC AAGCTGGTCAAGCGGCTGTTCCTGCTGATCCTGCAAGAGCACCA CGGCCTGAGCATCGACGTTCTGCCCGATGAGATCCGGGGCCTG TTCAACAAGAGAGGCTACACCTACGCCGGCTTCGAGCTGGACGA GAAGAAGAAGGACGCCCTGGAAAGCGATACCCTGAAAGAGTTC CTGAGCGAGAAGCTGCAGTCCATCGACAGAGACAGCGACGTGG AAGATTTCCTGAACCAGATCGCCAGCAACGCCGAGAGCTTTAAG GACTACAAGAAAGGCTTCGAGGCCGTGTTCGCCAGCGCCACAC ACAGCCCCAACAAGAAGCTGGAACTGAAGGACGAGCTGAAGTC CGAGTACGGCGAGAACGCCAAAGAACTGCTGGCCGGCCTGAGA GTGACCAAAGAGATCCTGGACGAGTTCGACAAGCAAGAGAACCA, GGGCAACCTGCCTCGGGCCAAGTACTTTGAGGAACTGGGCGAG TATATCGCCACCAACGAGAAAGTCAAGAGCTTCTTCGACAGCAA CAGCCTGAAGCTGACCGACATGACCAAGCTGATCGGCAACATCA GCAACTACCAGCTGAAAGAGCTGCGGCGGTACTTCAACGACAAA GAGATGGAAAAGGGCGACATCTGGATTCCCAACAAGCTGCACAA GATCACCGAGAGATTTGTGCGGAGCTGGCACCCCAAGAACGAC GCCGATAGACAGAGAAGGGCCGAGCTGATGAAGGACCTGAAGT CCAAAGAAATCATGGAACTGCTGACCACCACCGAGCCTGTGATG ACAATCCCTCCTTACGACGACATGAACAACAGAGGCGCCGTGAA GTGTCAGACCCTGCGGCTGAATGAGGAATACCTGGACAAACATC TGCCCAACTGGCGGGATATCGCCAAGAGACTGAACCACGGCAA GTTCAACGACGACCTGGCCGACTCTACCGTGAAGGGCTACAGC GAGGATAGCACCCTGCTGCACAGACTGCTGGACACCTCTAAAGA GATCGACATCTACGAGCTGCGGGGCAAGAAGCCCAACGAGCTG CTGGTTAAGACACTGGGCCAGAGCGACGCCAACAGACTGTATG GCTTCGCCCAGAACTACTATGAGCTGATCCGGCAGAAAGTGCGC GCTGGCATTTGGGTGCCCGTGAAGAACAAGGATGACTCCCTGAA, CCTGGAAGATAACTCCAACATGCTGAAGCGGTGCAACCACAATC CTCCACACAAGAAGAATCAGATCCACAACCTGGTGGCCGGCATC CTGGGAGTGAAACTGGATGAGGCCAAGTTCGCCGAGTTCGAGA AAGAGCTTTGGAGCGCCAAAGTGGGCAACAAGAAACTGAGCGC CTACTGCAAGAACATCGAGGAACTGAGAAAGACCCACGGCAACA CCTTCAAGATCGATATAGAGGAACTGCGCAAGAAGGACCCCGCC GAGCTGTCCAAAGAGGAAAAGGCCAAGCTGAGACTGACCGACG ACGTGATCCTGAATGAGTGGTCCCAGAAGATCGCCAACTTCTTT GACATCGACGACAAGCACCGGCAGCGGTTCAACAACCTGTTCAG CATGGCCCAGCTGCACACAGTGATCGACACACCCAGAAGCGGC
TTCAGCTCTACCTGCAAAAGATGCACCGCCGAGAACAGGTTCAG AAGCGAGACAGCCTTCTACAACGACGAGACAGGCGAGTTCCACA|
AGAAGGCCACAGCCACCTGTCAGAGACTGCCCGCTGATACCCA GAGGCCTTTCAGCGGAAAGATCGAGCGGTACATCGACAAGCTG GGATACGAGCTGGCCAAGATCAAGGCTAAAGAACTGGAAGGCAT) GGAAGCTAAAGAAATCAAGGTGCCCATCATCCTGGAACAGAACG
CCTTCGAGTACGAGGAAAGCCTGCGGAAGTCTAAGACCGGATC CAACGACAGAGTGATCAACTCCAAGAAAGACCGCGACGGAAAGA|
AACTGGCCAAGGCCAAAGAGAACGCCGAGGACAGGCTGAAGGA CAAGGACAAGCGGATCAAGGCCTTCAGCAGCGGCATCTGCCCT TACTGCGGAGATACCATCGGAGATGACGGCGAGATCGACCACAT) CCTGCCTAGAAGCCACACACTGAAAATCTACGGGACCGTGTTCA ACCCCGAGGGCAATCTGATCTACGTGCACCAGAAGTGCAACCAG GCCAAAGCCGACAGCATCTACAAGCTGAGCGATATCAAGGCCG GCGTGTCAGCCCAGTGGATTGAAGAACAGGTGGCCAACATTAAG GGGTACAAGACCTTCAGCGTGCTGTCCGCCGAACAGCAGAAGG CCTTTAGATACGCCCTGTTCCTCCAGAACGACAACGAGGCCTAC AAAAAGGTGGTGGACTGGCTGCGGACCGACCAGTCTGCTAGAG TGAACGGCACACAGAAGTACCTGGCCAAAAAGATCCAAGAGAAG CTCACCAAGATGCTGCCTAACAAGCACCTGAGCTTCGAGTTCAT CCTGGCCGATGCCACCGAGGTGTCAGAGCTGAGAAGGCAGTAC GCCAGACAGAACCCTCTGCTGGCTAAGGCCGAGAAGCAGGCCC CTTCTTCTCACGCCATTGATGCCGTGATGGCCTTCGTGGCCAGA TACCAGAAGGTGTTCAAGGACGGCACCCCTCCTAACGCCGATGA GGTGGCAAAACTGGCTATGCTGGACAGCTGGAACCCCGCCTCT AATGAGCCTCTGACAAAGGGCCTGTCCACGAACCAGAAAATCGA GAAGATGATCAAGAGCGGCGACTACGGCCAGAAAAACATGAGA GAGGTGTTCGGCAAGTCCATCTTCGGAGAGAATGCCATCGGCG AGAGATACAAGCCCATCGTGGTTCAAGAAGGCGGCTACTACATC GGCTACCCCGCCACAGTGAAAAAGGGCTACGAACTGAAGAACT GCAAGGTGGTCACCAGCAAGAACGATATTGCCAAGCTGGAAAAG ATCATCAAGAACCAGGACCTGATCTCTCTGAAAGAGAATCAGTAC ATCAAAATCTTCTCCATCAACAAGCAGACCATCAGCGAGCTGAG CAACCGCTACTTCAACATGAATTACAAGAACCTGGTCGAGCGGG ACAAAGAAATTGTGGGACTGCTTGAGTTTATCGTCGAGAACTGC CGGTACTACACCAAGAAAGTGGACGTGAAGTTCGCCCCTAAGTA CATCCACGAGACAAAGTACCCCTTCTACGATGACTGGCGGAGAT TCGACGAGGCCTGGCGGTATCTGCAAGAAAACCAGAACAAGAC CAGCTCCAAGGACCGCTTCGTGATCGATAAGAGCAGCCTGAACG AGTACTACCAGCCAGACAAGAATGAGTACAAGCTGGACGTGGAC ACCCAGCCTATCTGGGACGACTTCTGCCGGTGGTACTTCCTGGA CAGATACAAGACCGCCAACGACAAGAAGTCCATCCGCATCAAGG CCCGCAAGACATTCTCCCTGCTGGCTGAGTCTGGCGTGCAGGG CAAAGTGTTCCGGGCCAAGAGAAAGATCCCTACCGGCTACGCCT ATCAGGCCCTGCCTATGGACAACAACGTGATCGCTGGCGATTAC GCCAACATTCTGCTGGAAGCCAACAGCAAGACCCTGAGCCTGGT GCCTAAGAGCGGCATCAGCATTGAGAAGCAGCTGGACAAAAAG CTCGACGTCATCAAAAAGACCGACGTGCGCGGCCTGGCAATCG ACAACAACTCCTTCTTCAACGCCGACTTCGACACACACGGCATC CGGCTGATCGTGGAAAACACCAGCGTGAAAGTGGGAAACTTCCC CATCAGCGCCATCGATAAGTCCGCCAAGCGGATGATCTTCAGAG CCCTGTTTGAGAAAGAGAAGGGGAAGCGCAAGAAAAAGACCAC CATCAGCTTCAAAGAAAGCGGCCCTGTGCAGGACTACCTCAAGG TGTTCCTGAAAAAGATCGTGAAGATCCAGCTGAGAACCGACGGC TCCATCTCCAACATCGTCGTGCGGAAGAATGCCGCCGATTTCAC CCTGAGCTTTAGAAGCGAGCACATCCAGAAACTGCTGAAGCCCA
AGAAGAAGAGGAAGGTG Sequência da proteína WsuCas9/NLS (SEQ ID NO:24)
MLVSPISVDLGGKNTGFFSFTDSLDNSQSGTVIYDESFVLSQVGRR SKRHSKRNNLRNKLVKRLFLLILQEHHGLSIDVLPDEIRGLFNKRGYT] YAGFELDEKKKDALESDTLKEFLSEKLQSIDRDSDVEDFLNQIASNA ESFKDYKKGFEAVFASATHSPNKKLELKDELKSEYGENAKELLAGL RVTKEILDEFDKQENQGNLPRAKYFEELGEYIATNEKVKSFFDSNSL KLTDMTKLIGNISNYQLKELRRYFNDKEMEKGDIWIPNKLHKITERFV RSWHPKNDADRQRRAELMKDLKSKEIMELLTTTEPVMTIPPYDDMN NRGAVKCQTLRLNEEYLDKHLPNWRDIAKRLNHGKFNDDLADSTVK] GYSEDSTLLHRLLDTSKEIDIYELRGKKPNELLVKTLGQSDANRLYG FAQNYYELIRQKVRAGIWVPVKNKDDSLNLEDNSNMLKRCNHNPP
HKKNQIHNLVAGILGVKLDEAKFAEFEKELWSAKVGNKKLSAYCKNI EELRKTHGNTFKIDIEELRKKDPAELSKEEKAKLRLTDDVILNEWSQK|
IANFFDIDDKHRQRFNNLFSMAQLHTVIDTPRSGFSSTCKRCTAENR FRSETAFYNDETGEFHKKATATCQRLPADTQRPFSGKIERYIDKLGY ELAKIKAKELEGMEAKE!KVPIILEQNAFEYEESLRKSKTGSNDRVINS KKDRDGKKLAKAKENAEDRLKDKDKRIKAFSSGICPYCGDTIGDDG EIDHILPRSHTLKIYGTVFNPEGNLIYVHQOKCNQAKADSIYKLSDIKAG VSAQWIEEQVANIKGYKTFSVLSAEQQKAFRYALFLQNDNEAYKKV VDWLRTDQSARVNGTQKYLAKKIQEKLTKMLPNKHLSFEFILADATE VSELRRQYARQNPLLAKAEKQAPSSHAIDAVMAFVARYQKVFKDGT PPNADEVAKLAMLDSWNPASNEPLTKGLSTNQKIEKMIKSGDYGQK NMREVFGKSIFGENAIGERYKPIVVQEGGYYIGYPATVKKGYELKNC KVVTSKNDIAKLEKIIKNQDLISLKENQYIKIFSINKQTISELSNRYFNM NYKNLVERDKEIVGLLEFIVENCRYYTKKVDVKFAPKYIHETKYPFYD DWRRFDEAWRYLQENQNKTSSKDRFVIDKSSLNEYYQPDKNEYKL DVDTQPIWDDFCRWYFLDRYKTANDKKSIRIKARKTFSLLAESGVQ GKVFRAKRKIPTGYAYQALPMDNNVIAGDYANILLEANSKTLSLVPK SGISIEKQLDKKLDVIKKTDVRGLAIDNNSFFNADFDTHGIRLIVENTS VKVGNFPISAIDKSAKRMIFRALFEKEKGKRKKKTTISFKESGPVQDY LKVFLKKIVKIQLRTDGSISNIVVRKNAADFTLSFRSEHIQKLLKPKKK RKV
Sequência de DNA de NsaCas9/NLS (SEQ ID NO:25)
ATGAAGAAGATCCTGGGCGTCGACCTGGGCATCACCAGCTTTGG ATACGCCATCCTGCAAGAGACAGGCAAGGACCTGTACAGATGCC TGGACAACAGCGTGGTCATGCGGAACAACCCCTACGACGAGAA GTCTGGCGAGAGCAGCCAGAGCATCCGCAGCACCCAGAAATCC ATGCGGCGGCTGATCGAGAAGCGGAAGAAACGGATCAGATGCG TGGCCCAGACAATGGAACGCTACGGCATCCTGGACTACTCCGA GACAATGAAGATCAACGACCCCAAGAACAACCCGATCAAGAACA GATGGCAGCTGAGAGCCGTGGACGCCTGGAAAAGACCTCTGAG CCCTCAAGAGCTGTTCGCCATCTTTGCCCACATGGCCAAGCACC GGGGCTACAAGTCTATCEGCCACCGAGGACCTGATCTACGAGCT GGAACTGGAACTCGGCCTGAACGACCCTGAGAAAGAGTCCGAG AAGAAGGCCGACGAGCGGAGACAGGTGTACAACGCCCTGAGAC ACCTGGAAGAACTGCGGAAGAAGTACGGCGGCGAGACAATCGC
CCAGACCATCCACAGAGCTGTGGAAGCCGGCGACCTGCGGAGC TACAGAAACCACGACGACTACGAGAAGATGATCCGCAGAGAGGA|
CATCGAGGAAGAGATTGAGAAGGTCCTGCTGCGGCAGGCTGAA CTGGGAGCACTTGGACTGCCTGAGGAACAGGTGTCCGAGCTGA TCGATGAGCTGAAGGCCTGCATCACCGACCAAGAGATGCCCAC CATCGACGAGAGCCTGTTCGGCAAGTGCACCTTCTACAAGGACG
AGCTGGCCGCTCCTGCCTACAGCTACCTGTACGACCTGTACCGG CTGTACAAGAAGCTGGCCGACCTGAACATCGACGGCTACGAAGT|
GACCCAAGAGGACCGCGAGAAAGTGATCGAGTGGGTCGAGAAA AAGATCGCCCAGGGCAAGAACCTGAAGAAAATCACCCACAAGGA CCTCCGGAAGATCCTCGGACTGGCCCCTGAGCAGAAGATTTTCG
GCGTCGAGGACGAGAGAATCGTCAAGGGAAAGAAAGAACCCCG GACCTTCGTGCCCTTCTTCTTCCTGGCCGATATCGCCAAGTTCAA|
AGAACTGTTTGCCAGCATCCAGAAGCACCCCGACGCTCTGCAGA TTTTCAGAGAACTGGCCGAGATCCTGCAGCGGAGCAAGACACCT CAAGAGGCCCTGGATAGACTGAGAGCCCTGATGGCCGGCAAGG GCATCGACACCGATGACAGAGAGCTGCTGGAACTCTTCAAGAAC AAGCGGAGCGGCACAAGAGAGCTGAGCCACCGCTATATCCTGG
AAGCCCTGCCTCTGTTCCTGGAAGGCTATGACGAGAAAGAGGTG CAGAGAATCCTGGGCTTTGACGACCGCGAGGACTACAGCAGATA|
CCCCAAGAGCCTGCGGCATCTGCACCTGAGAGAGGGCAACCTG TTCGAGAAAGAAGAGAATCCCATCAACAACCACGCCGTGAAGTC CCTGGCTTCTTGGGCCCTGGGACTGATCGCTGACCTGTCTTGGA GATACGGCCCCTTCGATGAGATCATCCTGGAAACCACCAGGGAC GCCCTGCCTGAGAAGATCCGGAAAGAAATCGACAAGGCCATGC GCGAGAGAGAGAAAGCCCTGGACAAGATCATCGGCAAGTACAA GAAAGAGTTCCCCAGCATCGACAAGCGGCTGGCCAGAAAGATTC AGCTGTGGGAGAGACAGAAAGGCCTCGATCTGTACTCCGGCAA AGTGATCAACCTGAGCCAGCTGCTCGATGGATCCGCCGACATCG AGCACATCGTGCCTCAGTCTCTEGGCGGCCTGAGCACCGACTA CAATACCATCGTGACCCTGAAGTCCGTGAACGCCGCCAAGGGC AATAGACTGCCTGGCGATTGGCTGGCCGGAAATCCCGACTACAG AGAACGGATCGGCATGCTGTCTGAGAAGGGCCTGATCGACTGG AAGAAGAGGAAGAACCTGCTGGCCCAGAGCCTGGACGAAATCT ACACCGAGAACACCCACAGCAAAGGCATCCGGGCCACAAGCTA CCTGGAAGCTCTGGTTGCCCAGGTGCTGAAGCGGTACTACCCAT TTCCTGATCCTGAGCTGCGCAAGAATGGCATCGGCGTGCGGAT GATCCCCGGAAAAGTGACCAGCAAGACCAGAAGCCTGCTGGGA ATCAAGAGCAAGAGCCGCGAGACAAACTTCCACCACGCCGAGG ATGCCCTGATTCTGAGCACACTGACCAGAGGCTGGCAGAACCG GCTGCACAGAATGCTGAGAGACAACTACGGCAAGAGCGAGGCC GAGCTGAAAGAACTCTGGAAAAAGTACATGCCCCACATCGAGGG CCTGACACTGGCCGACTATATCGATGAGGCCTTCCGGCGGTTCA TGAGCAAGGGCGAAGAGTCCCTGTTCTACCGGGACATGTTCGAC ACCATCCGGTCCATCAGCTACTGGGTCGACAAGAAGCCTCTGAG CGCCAGCAGCCACAAAGAAACCGTGTACAGCAGCAGACACGAG GTGCCCACACTGAGGAAAAACATTCTGGAAGCCTTCGACAGCCT GAACGTGATCAAGGACCGGCACAAGCTGACCACCGAAGAGTTC ATGAAGCGCTACGACAAAGAGATCCGGCAGAAGCTGTGGCTGC ACCGCATCGGCAACACCAACGACGAGTCTTACCGCGCCGTGGA AGAGAGAGCCACACAGATTGCCCAGATCCTGACCAGATACCAGC TCATGGACGCCCAGAATGACAAAGAAATTGATGAGAAGTTTCAG CAGGCCCTGAAAGAGCTGATCACAAGCCCCATCGAAGTGACTG GCAAGCTGCTGCGGAAAATGAGATTCGTGTACGACAAGCTGAAC GCCATGCAGATCGACAGAGGCCTGGTGGAAACCGACAAGAACA TGCTGGGCATCCACATCAGCAAGGGCCCCAATGAGAAGCTGATC TTCAGACGGATGGACGTGAACAACGCCCACGAGCTGCAAAAAGA, ACGCAGCGGAATCCTGTGCTACCTGAACGAGATGCTGTTCATCOT TCAACAAGAAGGGGCTGATTCACTACGGCTGCCTGCGGTCTTAC CTCGAAAAAGGCCAGGGCAGCAAGTATATCGCCCTGTTCAACCC TCGGTTCCCEGCCAATCC TAAGGCTCAGCCTAGCAAGTTCACCA GCGACAGCAAGATCAAGCAAGTCGGCATCGGCAGCGCCACCGG AATCATTAAGGCCCACCTGGATCTGGATGGCCACGTGCGCTCTT ATGAGGTGTTCGGAACACTGCCCGAGGGCAGCATCGAGTGGTT CAAAGAGGAAAGCGGCTACGGCAGAGTGGAAGATGACCCTCAC
CACCCCAAGAAGAAGAGGAAGGTG Sequência da proteína NsaCas9/NLS (SEQ ID NO:26)
MKKILGVDLGITSFGYAILQETGKDLYRCLDNSVVMRNNPYDEKSGE SSQSIRSTAKSMRRLIEKRKKRIRCVAQTMERYGILDYSETMKINDP KNNPIKNRWQLRAVDAWKRPLSPQELFAIFAHMAKHRGYKSIATED LIVELELELGLNDPEKESEKKADERRQVYNALRHLEELRKKYGGETI AQTIHRAVEAGDLRSYRNHDDYEKMIRREDIEEEIEKVLLRQAELGA LGLPEEQVSELIDELKACITDQEMPTIDESLFGKCTFYKDELAAPAYS
YLYDLYRLYKKLADLNIDGYEVTQEDREKVIEWVEKKIAQGKNLKKIT HKDLRKILGLAPEQKIFGVEDERIVKGKKEPRTFVPFFFLADIAKFKEL) FASIQKHPDALQIFRELAEILARSKTPQEALDRLRALMAGKGIDTDDR|
ELLELFKNKRSGTRELSHRYILEALPLFLEGYDEKEVORILGFDDRE DYSRYPKSLRHLHLREGNLFEKEENPINNHAVKSLASWALGLIADLS WRYGPFDEIILETTRDALPEKIRKEIDKAMREREKALDKIIGKYKKEFP SIDKRLARKIQLWERQKGLDLYSGKVINLSQLLDGSADIEHIVPQOSLG GLSTDYNTIVTLKSVYNAAKGNRLPGDWLAGNPDYRERIGMLSEKGLI DWKKRKNLLAQSLDEIYTENTHSKGIRATSYLEALVAQVLKRYYPFP DPELRKNGIGVRMIPGKVTSKTRSLLGIKSKSRETNFHHAEDALILST LTRGWONRLHRMLRDNYGKSEAELKELWKKYMPHIEGLTLADYIDE AFRRFMSKGEESLFYRDMFDTIRSISYWVDKKPLSASSHKETVYSS RHEVPTLRKNILEAFDSLNVIKDRHKLTTEEFMKRYDKEIRQKLWLH RIGNTNDESYRAVEERATQIAQILTRYQLMDAQNDKEIDEKFQAQALK ELITSPIEVTGKLLRKMRFVYDKLNAMQIDRGLVETDKNMLGIHISKG PNEKLIFRRMDVNNAHELQKERSGILCYLNEMLFIFNKKGLIHYGCL RSYLEKGQGSKYIALFNPRFPANPKAQPSKFTSDSKIKQVGIGSATG IIKAHLDLDGHVRSYEVFGTLPEGSIEWFKEESGYGRVEDDPHHPK
KKRKV Sequência de DNA de RsyCas9/NLS (SEQ ID NO:27)
ATGGCCGAGAAGCAGCACAGATGGGGACTCGACATCGGCACCA ATTCTATCGGCTGGGCCGTGATCGCCCTGATCGAAGGCAGACCT GCTGGACTGGTGGCTACCGGCAGCAGAATCTTTAGCGACGGCA GAAACCCCAAGGACGGCAGCTCTCTGGCCGTCGAGAGAAGAGG ACCTCGGCAGATGCGGCEGGAGAAGAGACAGATATCTCCGGCGG AGGGACAGATTCATGCAGGCCCTGATCAACGTGGGCCTGATGC CTGGGGATGCCGCCGCTAGAAAAGCCCTGGTCACCGAGAATCC CTACGTGCTGAGACAGAGAGGCCTGGACCAAGCTCTGACCCTG CCTGAATTTGGCAGAGCCCTGTTCCACCTGAACCAGCGGAGAG GCTTCCAGAGCAACAGAAAGACCGATCGGGCCACCGCCAAAGA AAGCGGCAAAGTGAAGAACGCCATTGCCGCCTTCAGAGCCGGC ATGGGCAATGCCAGAACAGTGGGAGAAGCCCTGGCCAGACGAC TGGAAGATGGCAGACCAGTGCGGGCCAGAATGGTCGGACAGGG CAAAGATGAGCACTACGAGCTGTATATCGCCAGAGAGTGGATCG CCCAAGAGTTCGATGCCCTGTGGGCCAGCCAGCAGAGATTTCAT GCTGAGGTGCTGGCCGACGCCGCCAGAGATAGACTGAGAGCCA TCCTGCTGTTCCAGCGGAAGCTGCTGCCTGTGCCTGTGGGCAA GTGCTTCCTGGAACCTAACCAGCCTAGAGTGGCCGCTGCTCTGC CTAGCGCTCAGAGATTCAGACTGATGCAAGAGCTGAACCACCTG AGAGTGATGACCCTGGCCGACAAGAGAGAGAGGCCCCTGAGCT TCCAAGAGAGAAACGATCTGCTGGCCCAGCTGGTGGCCAGACC TAAGTGCGGCTTCGACATGCTGCGGAAGATCGTGTTCGGCGCC AACAAAGAGGCCTACAGATTCACCATCGAGAGCGAGCGGCGGA AAGAACTGAAGGGCTGTGATACAGCCGCCAAGCTGGCCAAAGT GAATGCCCTGGGAACTAGATGGCAGGCTCTGTCCCTGGACGAG CAGGATAGACTCGTGTGCCTGCTGCTGGACGGCGAGAATGATG CTGTGCTGGCTGATGCCCTGCGGGAACACTATGGACTGACAGA CGCCCAGATCGACACACTGCTGGGCCTGTCTTTTGAGGACGGC CACATGAGACTGGGGAGAAGCGCTCTGCTGAGAGTCCTGGATG CCCTGGAATCCGGAAGAGATGAGCAGGGACTGCCCCTGTCCTA CGATAAGGCTGTTGTGGCTGCCGGCTATCCAGCTCACACAGCC GATCTGGAAAACGGCGAGAGAGATGCACTGCCCTACTACGGCG AGCTGCTGTGGCGGTATACACAGGATGCCCCTACCGCCAAGAA CGACGCCGAGAGAAAGTTCGGCAAGATCGCCAATCCTACCGTG CACATCGGCCTGAATCAGCTGAGAAAGCTTGTCAATGCCCTGAT CCAGAGATACGGCAAGCCCGCTCAGATCGTGGTGGAACTGGCC AGAAATCTGAAGGCTGGCCTGGAAGAGAAAGAGCGGATCAAGA AACAGCAGACCGCCAACCTGGAACGGAACGAGAGAATCCGGCA GAAGCTGCAGGACGCTGGCGTGCCCGACAACAGAGAAAACCGG CTGCGGATGCGGCTEGTTCGAGGAACTCGGACAAGGCAATGGAC TGGGCACCCCTTGCATCTACTCCGGCAGACAGATCAGCCTGCAG AGACTGTTCAGCAACGACGTGCAGGTCGACCACATCCTGCCTTT CAGCAAGACCCTGGATGACAGCTTCGCCAACAAGGTGCTCGCC CAGCACGACGCCAACAGATACAAGGGCAACAGAGGCCCTTTCG AGGCCTTCGGAGCCAACAGAGATGGCTACGCCTGGGACGACAT TAGAGCCAGAGCAGCCGTGCTGCCCCGGAACAAGAGAAACAGA TTTGCCGAGACAGCCATGCAGGACTGGCTGCACAACGAGACTG ACTTTCTGGCTCGGCAGCTGACCGATACCGCCTACCTTAGCAGA GTGGCCAGGCAGTACCTGACCGCCATCTGCAGCAAGGACGACG TGTACGTTAGCCCCGGCAGACTGACTGCCATGCTGAGAGCTAAG TGGGGCCTGAACAGAGTGCTGGATGGCGTGATGGAAGAACAGG GCAGACCCGCCGTGAAGAACCGGGATGATCACAGACACCACGC CATCGACGCCGTGGTTATTGGCGCCACAGATAGAGCCATGCTGC AACAGGTGGCCACACTGGCCGCTAGAGCTAGAGAACAGGACGC CGAAAGGCTGATCGGCGACATGCCTACGCCTTGGCCTAATTTCC TTGAGGACGTGCGGGCTGCCGTGGCCAGATGTGTGGTTTCTCA CAAGCCCGACCACGGACCAGAAGGCGGCCTGCATAACGATACA GCCTACGGCATTGTGGCCGGACCATTCEGAGGATGGCAGATACA GAGTGCGGCACCGGGTGTCCCTGTTCGATCTGAAACCTGGCGA CCTGAGCAACGTCCGCTGTGATGCTCCTCTGCAAGCCGAGCTG GAACCCATCTTCGAGCAGGACGATGCCAGGGCCAGAGAAGTGG CTCTTACAGCCCTGGCTGAGCGGTACAGACAGCGGAAAGTGTG GCTGGAAGAACTGATGAGCGTGCTGCCTATCAGACCCAGAGGC GAGGACGGAAAGACCCTGCCAGATAGCGCTCCTTACAAGGCCT ACAAGGGCGACTCCAACTACTGCTATGAGCTGTTCATCAATGAG
CGCGGCAGATGGGATGGCGAGCTGATCTCTACCTTCCGGGCCA ATCAGGCCGCTTACCGGCGGTTCAGAAATGACCCAGCCAGGTTC|
AGAAGATACACCGCTGGCGGTAGACCCCTGCTGATGAGACTGT GTATCAACGACTATATCGCCGTGGGCACAGCCGCCGAGAGGAC CATCTTTAGAGTGGTCAAGATGAGCGAGAACAAGATCACTCTGG CCGAGCACTTCGAAGGCGGAACCCTGAAACAGAGGGATGCCGA CAAGGACGATCCCTTCAAGTATCTGACAAAGAGCCCTGGCGCTC TGCGCGATCTGGGAGCTAGAAGAATCTTCGTGGACCTGATCGGC CGCGTGCTGEGACCCAGGCATTAAGGGCGATCCCAAGAAGAAGA
GGAAGGTG Sequência da proteína Rey Cas9/NLS (SEQ ID NO:28) MAEKQHRWGLDIGTNSIGWAVIALIEGRPAGLVATGSRIFSDGRNPK|
DGSSLAVERRGPROQMRRRRDRYLRRRDRFMQALINVGLMPGDAA ARKALVTENPYVLRORGLDQALTLPEFGRALFHLNQRRGFQSNRKT] DRATAKESGKVKNAIAAFRAGMGNARTVGEALARRLEDGRPVRAR MVGQGKDEHYELYIAREWIAQEFDALWASQQRFHAEVLADAARDR LRAILLFORKLLPVPVGKCFLEPNQPRVAAALPSAQRFRLMQELNHL RVMTLADKRERPLSFQERNDLLAQLVARPKCGFDMLRKIVFGANKE AYRFTIESERRKELKGCDTAAKLAKVNALGTRWOQALSLDEQDRLVC LLLDGENDAVLADALREHYGLTDAQIDTLLGLSFEDGHMRLGRSALL RVLDALESGRDEQGLPLSYDKAVVAAGYPAHTADLENGERDALPY YGELLWRYTQDAPTAKNDAERKFGKIANPTVHIGLNQLRKLVNALIQ RYGKPAQIVVELARNLKAGLEEKERIKKQQTANLERNERIRQKLQDA GVPDNRENRLRMRLFEELGQGNGLGTPCIYSGRQISLARLFSNDV QVDHILPFSKTLDDSFANKVLAQHDANRYKGNRGPFEAFGANRDG YAWDDIRARAAVLPRNKRNRFAETAMQDWLHNETDFLARQLTDTA YLSRVARQYLTAICSKDDVYVSPGRLTAMLRAKWGLNRVLDGVME EQGRPAVKNRDDHRHHAIDAVVIGATDRAMLQQVATLAARAREQD AERLIGDMPTPWPNFLEDVRAAVARCVVSHKPDHGPEGGLHNDTA YGIVAGPFEDGRYRVRHRVSLFDLKPGDLSNVRCDAPLQAELEPIF EQDDARAREVALTALAERYRQRKVWLEELMSVLPIRPRGEDGKTLP DSAPYKAYKGDSNYCYELFINERGRWDGELISTFRANQAAYRRFRN DPARFRRYTAGGRPLLMRLCINDYIAVGTAAERTIFRVVKMSENKITL) AEHFEGGTLKQRDADKDDPFKYLTKSPGALRDLGARRIFVDLIGRVL
DPGIKGDPKKKRKV Sequência de DNA de CdiCas9/NLS (SEQ ID NO:29)
ATGAAGTACCACGTGGGCATCGACGTGGGCACCTTTTCTGTTGG ACTGGCCGCCATCGAAGTGGACGATGCCGGAATGCCTATCAAG ACCCTGAGCCTGGTGTCCCACATCCACGATTCTGGACTGGACCC CGACGAGATCAAGAGCGCCGTTACAAGACTGGCCAGCAGCGGA ATCGCCAGAAGAACCAGACGGCTGTACCGGCGGAAGAGAAGAA GGCTGCAGCAGCTGGACAAGTTCATCCAGAGACAAGGCTGGCC CGTGATCGAGCTGGAAGATTACAGCGACCCTCTGTACCCCTGGA AAGTGCGGGCTGAACTGGCTGCCAGCTATATCGCCGATGAGAAA GAGCGGGGCGAGAAGCTGTCTGTGGCCCTGAGACACATTGCCA GACACAGAGGATGGCGGAACCCCTACGCCAAGGTGTCCTCTCT GTATCTGCCTGACGGCCCTAGCGACGCCTTCAAGGCCATCAGA GAGGAAATCAAGAGAGCCAGCGGCCAGCCTGTGCCTGAAACAG CTACAGTGGGCCAGATGGTCACCCTGTGTGAACTGGGCACCCT GAAGTTGAGAGGCGAAGGCGGAGTGCTGTCTGCCAGACTCCAG CAGAGCGATTACGCCAGAGAGATCCAAGAGATTTGCCGGATGCA AGAGATCGGCCAAGAGCTGTACAGAAAGATCATCGATGTGGTGT TCGCCGCCGAGTCTCCTAAGGGATCTGCCTCTAGCAGAGTGGG CAAAGACCCTCTGCAGCCCGGCAAGAATAGAGCCCTGAAAGCCT) CCGATGCCTTCCAGAGATACCGGATCGCCGCTCTGATCGGCAAC CTGAGAGTTAGAGTGGACGGCGAGAAGAGGATTCTGAGCGTGG
AAGAGAAAAACCTGGTGTTCGACCACCTGGTCAATCTGACCCCT AAGAAAGAACCCGAGTGGGTCACAATCGCCGAGATCCTGGGAAT|
CGACAGAGGCCAGCTGATCGGAACCGCCACCATGACAGATGAT GGCGAAAGAGCCGGCGCTCGGCCTCCTACACATGACACCAATC GGAGCATCGTGAACAGCAGAATCGCCCCTCTGGTGGACTGGTG GAAAACCGCCTCTGCTCTGGAACAGCACGCTATGGTCAAGGCCC TGTCCAATGCCGAGGTGGACGACTTCGATTCTCCTGAGGGCGC CAAAGTGCAGGCCTTCTTTGCCGACCTGGACGACGATGTGCACG CCAAGCTGGATAGCCTGCATCTGCCTGTTGGCAGAGCCGCCTAC AGCGAGGATACACTTGTGCGGCTGACCAGACGGATGCTGAGTG ATGGCGTGGACCTGTACACCGCCAGACTGCAAGAGTTTGGCATC GAGCCTAGCTGGACCCCTCCAACACCTAGAATCGGAGAGCCCG TGGGAAACCCCGCTGTGGACAGAGTGCTGAAAACCGTGTCCAG ATGGCTGGAAAGCGCCACCAAAACATGGGGCGCTCCCGAGAGA GTGATCATCGAACACGTGCGCGAGGGCTTCGTGACCGAGAAAA GGGCCAGAGAAATGGATGGCGACATGCGGAGAAGGGCCGCCA GAAATGCCAAGCTGTTCCAAGAAATGCAAGAAAAGCTGAACGTG CAGGGCAAGCCCTCCAGAGCCGACCTTTGGAGATACCAGAGCG TGCAGAGACAGAACTGCCAGTGCGCCTACTGTGGCAGCCCTATC ACCTTCAGCAACAGCGAGATGGACCACATCGTGCCTAGAGCCG GCCAGGGATCCACCAACACCAGAGAAAATCTGGTGGCCGTGTG CCACAGATGCAACCAGAGCAAGGGCAACACCCCATTCGCCATCT GGGCCAAGAACACCTCTATCGAGGGCGTEGTCCGTGAAAGAAGC CGTGGAAAGAACCAGGCACTGGGTCACCGATACCGGCATGAGA AGCACCGACTTCAAGAAATTCACCAAGGCCGTGGTGGAACGGTT CCAGAGGGCCACAATGGACGAGGAAATTGACGCCCGCAGCATG GAAAGCGTGGCCTGGATGGCCAATGAGCTGAGAAGTAGAGTGG CCCAGCACTTEGCCAGCCACGGCACAACAGTCAGAGTGTACAG AGGCAGCCTGACCGCCGAAGCTCGTAGAGCCTCTGGAATCAGC GGCAAGCTGAAGTTCTTTGACGGCGTGGGCAAGAGCAGACTGG ACAGAAGGCACCACGCCATTGATGCCGCCGTGATCGCCTTCACC AGCGACTATGTGGCCGAAACACTGGCCGTGCGGAGCAACCTCA AACAGAGCCAGGCTCACAGACAAGAGGCTCCTCAGTGGCGCGA GTTCACAGGCAAAGATGCCGAACACAGAGCCGCTTGGAGAGTG TGGTGCCAGAAGATGGAAAAACTGAGCGCCCTGCTGACCGAGG ACCTGAGAGATGATAGAGTGGTGGTCATGAGCAACGTGCGCCT
GAGACTCGGAAATGGCAGCGCCCACAAAGAGACAATCGGAAAG CTGAGCAAAGTGAAGCTGTCCAGCCAGCTGAGCGTGTCCGACAT|
CGATAAGGCCAGCTCTGAGGCCCTTTGGTGCGCCCTGACAAGA GAACCTGGCTTCGACCCCAAAGAGGGACTGCCTGCCAATCCTGA|
GCGGCACATCAGAGTGAATGGCACCCATGTGTACGCCGGCGAC AACATCGGCCTGTTTCCAGTGTCTGCCGGATCTATCGCTCTGAG AGGCGGATATGCCGAGCTGGGCAGCTCTTTCCATCACGCCAGG GTGTACAAGATCACAAGCGGCAAGAAACCCGCCTTTGCCATGCT GAGAGTGTATACCATCGACCTGCTGCCTTACCGGAACCAGGACC TGTTCAGCGTGGAACTGAAGCCCCAGACCATGAGCATGAGACAG GCCGAGAAGAAGCTGAGGGACGCCCTGGCTACAGGCAACGCCG AATATCTTGGATGGCTGGTGGTGGATGACGAGCTGGTGGTCGAT ACCAGCAAGATCGCCACCGACCAAGTGAAGGCTGTGGAAGCCG AACTGGGAACCATCAGACGTTGGCGCGTGGACGGCTTTTTCAGC CCCTCTAAGCTGAGACTGCGGCCCCTGCAGATGAGCAAAGAGG GCATCAAGAAAGAGAGCGCCCCTGAGCTGTCCAAGATCATTGAC AGACCTGGCTGGCTGCCCGCCGTGAACAAGCTGTTTTCTGACG GCAACGTGACCGTCGTGCGGAGAGATTCTCTGGGCAGAGTGCG CCTGGAAAGCACAGCACATCTGCCCGTGACATGGAAGGTGCAG
CCCAAGAAGAAGAGGAAGGTG Sequência da proteína CdiCas9/NLS (SEQ ID NO:30)
MKYHVGIDVGTFSVGLAAIEVDDAGMPIKTLSLVSHIHDSGLDPDKIK SAVTRLASSGIARRTRRLYRRKRRRLQQLDKFIQRQGWPVIELEDY SDPLYPWKVRAELAASYIADEKERGEKLSVALRHIARHRGWRNPYA KVSSLYLPDEPSDAFKAIREEIKRASGQPVPETATVGQMVTLCELGT LKLRGEGGVLSARLQQSDHAREIQEICRMQEIGQELYRKIIDVVFAA ESPKGSASSRVGKDPLQPGKNRALKASDAFQRYRIAALIGNLRVRV DGEKRILSVEEKNLVFDHLVNLAPKKEPEWVTIAEILGIDRGQLIGTA TMTDDGERAGARPPTHDTNRSIVNSRIAPLVDWWKTASALEQHAM VKALSNAEVDDFDSPEGAKVQAFFADLDDDVHAKLDSLHLPVGRAA YSEDTLVRLTRRMLADGVDLYTARLQEFGIEPSWTPPAPRIGEPVG NPAVDRVLKTVSRWLESATKTWGAPERVIIEHVREGFVTEKRAREM DGDMRRRAARNAKLFQEMQEKLNVAQGKPSRADLWRYQSVOARQN CQCAYCGSPITFESNSEMDHIVPRAGQGSTNTRENLVAVCHRCONQS KGNTPFAIWAKNTSIEGVSVKEAVERTRHWVTDTGMRSTDFKKFTK AVVERFOQRATMDEEIDARSMESVAWMANELRSRVAQHFASHGTTV RVYRGSLTAEARRASGISGKLEFLDGVGKSRLDRRHHAIDAAVIAFT SDYVAETLAVRSNLKAOSQAHRQEAPQWREFTGKDAEHRAAWRVW CQKMEKLSALLTEDLRDDRVVVMSNVRLRLGNGSAHEETIGKLSKV KLGSQLSVSDIDKASSEALWCALTREPDFDPKDGLPANPERHIRVN GTHVYAGDNIGLFPVSAGSIALRGGYAELGSSFHHARVYKITSGKKP AFAMLRVYTIDLLPYRNQDLFSVELKPQTMSMRQAEKKLRDALATG NAEYLGWLVVDDELVVDTSKIATDQVKAVEAELGTIRRWRVDGFFG DTRLRLRPLQMSKEGIKKESAPELSKIIDRPGWLPAVNKLFSEGNVT
VVRRDSLGRVRLESTAHLPVTWKVQPKKKRKV Bsm Cas9 sgRNA (SEQ ID NO: No 31)
NNNNNNNNNNNNNNNNNNNNGUCAUAGUUCCCCUAAGAUUAUU GAAACAAUGAUCUUAGGGUUACUAUGAUAAGGGCUUUCUACUU UAGGGGUAGAGAUGUCCCGCGGCGUUGGGGAUCGCCUAUUGC
CCUUAAAGGGCACUCCCCAUUUVUAAUUVUULVUUVU Lrh Cas9 sgRNA (SEQ ID NO:32) NNNNNNNNNNNNNNNNNNNNGUCUCAGGUAGAUGUCAGAUCAA|
UCAGAAAUGAUUGAUCUGACAUCUACGAGUUGAGAUCAAACAA AGCUUCAGCUGAGUUUCAAUUUCUGAGCCCAUGUUGGGCCAU
ACAUAUGCCACCCGAGUGCAAAUCGGGUGGCUUUUUUVUV Pex Cas9 sgRNA (SEQ ID NO:33)
NNNNNNNNNNNNNNNNNNNNGUUUCAGUAGUUGUUAGAAGAAU GAAAAUUCUUUUAACAACGAAGUCGCCUUCGGGCGAGCUGAAA UCAAUUUGAUUAAAUAUUVAGAUCCGGCUACUGAGGUCUUUGAC
CUUAUCCGGAUUAACGAAGAGCCUCCGAGGAGGCUUUUUUUV Mca Cas9 sgRNA (SEQ ID NO:34)
NNNNNNNNNNNNNNNNNNNNGUUUUAGUGUUGUACAAUAUUU GGGUGAAAACCCAAAUAUUGUACAUCCUAAAUCAAGGCGCUUA
AUUGCUGCCGUAAUUGCUGAAAGCGUAGCUUUCAGUUUUUUUV Mga Cas9 sgRNA (SEQ ID NO:35)
NNNNNNNNNNNNNNNNNNNNGUUUUAGCACUGUACAAUACUUG UGUAAGCAAUAACGAAAAUUAUUGCUUACACAAUUAUUGUCGU GCUAAAAUAAGGCGCUGUUAAUGCAGCUGCCGCAUCCGCCAGA
GCAUUUAUGCUCUGGCUUUUUUUV Agl Cas9 sgaRNA (SEQ ID NO:36)
NNNNNNNNNNNNNNNNNNNNGUUUUGCCUUGAAUCCAAAGUAA GGCAUGGUAgaaaUAUUAUUCCUGUGGAUUCAAGACAAAAUUUG
AAAUGCAAACCGAUUCCCCGGCUGCAAGCCAGCCACACCGGUC
UUUCAAAGCAUUUUUUU Amu Cas9 sgRNA (SEQ ID NO:37)
NNNNNNNNNNNNNNNNNNNNGUUUUGCCUUGAAUCCAAAACGG
AUUCAAGACAAAAUUUGAAAUGCAAACCGAUUUUCCUGACUGC CAGCCAGUCACACCGGUAACAAAAGCAUUUUUVUUU" Oki Cas9 sgRNA (SEQ ID NO:38)
NNNNNNNNNNNNNNNNNNNNGCUUCAGAUGUGUGUCAGAUCA AUGAgaaaUCAUUGAUCUGACACACAGCAUUGAAGUAAAGCAAG
AUUAAUUUCAAGCUUAAUUUUCUUCACAUUUUAUGUGCAGAAG GGCUUAUGCCCACAAUACAUAAAAAGUCCGCAUUCACUUGCGG
ACUUUUAUUUUUUVU Bbo Cas9 saRNA (SEQ ID NO:39)
NNNNNNNNNNNNNNNNNNNNGUUUCAAAUUCAAUCUAAAGCGA AAGCUAUACUUAUUAUUGAAUUUGAAAUAAGGCUGUUCCUUCG UUAGUUCAGUCGAUUGCUCCUCCGGUAUUGCUVAUGCAUGCC
GGAGUUUUUU Ace Cas9 sgaRNA (SEQ ID NO:40)
NNNNNNNNNNNNNNNNNNNNGCUGGGGAGCCUGUCUGAAAAG ACAGGCUACCUAGCAAGACCCCUUCGUGGGGUCGCAUUCUUVUC
ACCCCCUCGCAGCAGCGAGGGGGUUCGUUUUUUV Ahe Cas9 sgRNA (SEQ ID NO:41)
NNNNNNNNNNNNNNNNNNNNGUCAUAGUUCCCUCACAAGCCUC GAUGUGGAAACACAUCAAGGCUUGCGAGGUUGCUAUGAUAAG GCAACAGGCCGCAAAGCACUGACCCGCAUUCCAAUGAAUGCGG
GUCAUCUACUUUUUVUUU Wsu Cas9 sgRNA (SEQ ID NO:42)
NNNNNNNNNNNNNNNNNNNNGUUUCACAGGCUAAGCGGAUUU GCgaaaGCAAAUCCGUUCGAUGCCUUGAAAUCAUCAAAAAGAUA
UAAUAGACCCGCCCACUGUAUUGUACAUGGCGGGACUUUUUVU
U Nsa Cas9 sgRNA (SEQ ID NO:43)
NNNNNNNNNNNNNNNNNNNNGUUAUAAGACCCCUCAAAACCCC ACCCUGUUACAAUGUUGUAACAGGGUAGGGUUAUUUGAGGGG UCUUAUAAUCAAGAACUGUUACAACAGUUCCAUUCUAGGGCCC
AUCUUCGGACGGGCCUCAGCCUUUUVUUUVUY Rsy Cas9 sgRNA (SEQ ID NO:44)
NNNNNNNNNNNNNNNNNNNNGUUGUAGCCAGAGCGCAAUUCC CGAUCUGCUGAAAAGCAGAUCGGGAAUUGCGCUUUGCUACUAA CAAGCUGAAUCCGUUAGGAGUAAAUGCACCAAAUGAGAGGGCC
GGCUUAUGCCGGCCCUUUGCUUUUUVUU Cdi Cas9 sgRNA (SEQ ID NO:45)
NNNNNNNNNNNNNNNNNNNNACUGGGGUUCAGUUCUCAAAAAC CCUGAUAGACUUCGAAAAGUCACUAACUUAAUUAAAUAGAACU GAACCUCAGUAAGCAUUGGCUCGUUUCCAAUGUUGAUUGCUC CGCCGEGUECUCCUVAUVAUUVAAGGGCGCCGGCUUUCUUVUUVUUUY
U Fusão PexCas9-HN1HB1 (SEQ ID NO:117) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK|
SSDKKVATKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMGKTHIIGVGLDLGGTYTGTFITSHPSDEA EHRDHSSAFTVVNSEKLSFSSKSRTAVRHRVRSYKGFDLRRRLLLL VAEYQLLQOKKQTLAPEERENLRIALSGYLKRRGYARTEAETDTSVLE SLDPSVFSSAPSFTNFFNDSEPLNIQWEAIANSPETTKALNKELSGQ KEADFKKYIKTSFPEYSAKEILANYVEGRRAILDASKYIANLQOSLGHK HRSKYLSDILQDMKRDSRITRLSEAFGSTDNLWRIIGNISNLQERAV RWYFNDAKFEQGQEQLDAVKLKNVLVRALKYLRSDDKEWSASQK QIIQASLEQSGDVLDVLAGLDPDRTIPPYEDQNNRRPPEDQTLYLNPK ALSSEYGEKWKSWANKFAGAYPLLTEDLTEILKNTDRKSRIKIRSDV LPDSDYRLAYILAQRAFDRSIALDECSIRRTAEDFENGVVIKNEKLEDV LSGHQLEEFLEFANRYYQETAKAKNGLWFPENALLERADLHPPMK NKILNVIVGQALGVSPAEGTDFIEEIWNSKVKGRSTVRSICNAIENER KTYGPYFSEDYKFVKTALKEGKTEKELSKKFAAVIKVLKMVSEVVPFI GKELRLSDEAQSKFDNLYSLAQLYNLIETERNGFSKVSLAAHLENA WRMTMTDGSAQCCRLPADCVRPFDGFIRKAIDRNSWEVAKRIAEE VKKSVDFTNGTVKIPVAIEANSFNFTASLTDLKYIQLKEQKLKKKLEDI QRNEENQEKRWLSKEERIRADSHGICAYTGRPLDDVGEIDHIIPRSL TLKKSESIYNSEVNLIFYSAQGNQEKKNNIYLLSNLAKNYLAAVFGTS DLSQITNEIESTVLQALKAAGRLGYFDLLSEKERACARHALFLNSDSE ARRAVIDVLGSRRKASVNGTQAWFVRSIFSKVRQALAAWTQETGN ELIFDAISVYPAADSSEMRKRFAEYRPEFRKPKVQPVASHSIDAMCIYL) AACSDPFKTKRMGSQLAIYEPINFDNLFTGSCQVIQNTPRNFSDKTN IANSPIFKETIYAERFLDIIVSRGEIFIGYPSNMPFEEKPNRISIGGKDP FSILSVLGAYLDKAPSSEKEKLTIYRVVKNKAFELFSKVAGSKFTAEE DKAAKILEALHFVTVKQDVAATVSDLIKSKKELSKDSIENLAKQKGCL KKVEYSSKEFKFKGSLIIPAAVEWGKVLWNVFKENTAEELKDENALR KALEAAWPSSFGTRNLHSKAKRVFSLPVVATQSGAVRIRRKTAFGD FVYQSQDTNNLYSSFPVKNGKLDWSSPIIHPALQNRNLTAYGYRFV DHDRSISMSEFREVYNKDDLMRIELAQGTSSRRYLRVEMPGEKFLA WFGENSISLGSSFKFSVSEVFDNKIYTENAEFTKFLPKPREDNKHNG TIFFELVGPRVIFNYIVGGAASSLKEIFSEAGKERSPKKKRKVLEGGG GSGKGDPKKPRGKMSSYAFFVQTCREEHKKKHPDASVNFSEFSK
KCSERWKTMSAKEKGKFEDMAKADKARYEREMKTYIPPKGE Fusão PexCas9-HN1H1G (SEQ ID NO:118) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK]
SSDKKVATKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMGKTHIIGVGLDLGGTYTGTFITSHPSDEA EHRDHSSAFTVVNSEKLSFSSKSRTAVRHRVRSYKGFDLRRRLLLL VAEYQLLQOKKQTLAPEERENLRIALSGYLKRRGYARTEAETDTSVLE SLDPSVFSSAPSFTNFFNDSEPLNIQWEAIANSPETTKALNKELSGQ KEADFKKYIKTSFPEYSAKEILANYVEGRRAILDASKYIANLQOSLGHK HRSKYLSDILQDMKRDSRITRLSEAFGSTDNLWRIIGNISNLQERAV RWYFNDAKFEQGQEQLDAVKLKNVLVRALKYLRSDDKEWSASQK QIIQASLEQSGDVLDVLAGLDPDRTIPPYEDQNNRRPPEDQTLYLNPK ALSSEYGEKWKSWANKFAGAYPLLTEDLTEILKNTDRKSRIKIRSDV LPDSDYRLAYILAQRAFDRSIALDECSIRRTAEDFENGVVIKNEKLEDV LSGHQLEEFLEFANRYYQETAKAKNGLWFPENALLERADLHPPMK NKILNVIVGQALGVSPAEGTDFIEEIWNSKVKGRSTVRSICNAIENER KTYGPYFSEDYKFVKTALKEGKTEKELSKKFAAVIKVLKMVSEVVPFI GKELRLSDEAQSKFDNLYSLAQLYNLIETERNGFSKVSLAAHLENA WRMTMTDGSAQCCRLPADCVRPFDGFIRKAIDRNSWEVAKRIAEE VKKSVDFTNGTVKIPVAIEANSFNFTASLTDLKYIQLKEQKLKKKLEDI QRNEENQEKRWLSKEERIRADSHGICAYTGRPLDDVGEIDHIIPRSL TLKKSESIYNSEVNLIFYSAQGNQEKKNNIYLLSNLAKNYLAAVFGTS DLSQITNEIESTVLALKAAGRLGYFDLLSEKERACARHALFLNSDSE ARRAVIDVLGSRRKASVNGTQAWFVRSIFSKVRQALAAWTQETGN ELIFDAISVYPAADSSEMRKRFAEYRPEFRKPKVQPVASHSIDAMCIYL) AACSDPFKTKRMGSQLAIYEPINFDNLFTGSCQVIQNTPRNFSDKTN IANSPIFKETIYAERFLDIIVSRGEIFIGYPSNMPFEEKPNRISIGGKDP FSILSVLGAYLDKAPSSEKEKLTIYRVVKNKAFELFSKVAGSKFTAEE DKAAKILEALHFVTVKQDVAATVSDLIKSKKELSKDSIENLAKQKGCL KKVEYSSKEFKFKGSLIIPAAVEWGKVLWNVFKENTAEELKDENALR KALEAAWPSSFGTRNLHSKAKRVFSLPVVATQSGAVRIRRKTAFGD FVYQSQDTNNLYSSFPVKNGKLDWSSPIIHPALQNRNLTAYGYRFV DHDRSISMSEFREVYNKDDLMRIELAQGTSSRRYLRVEMPGEKFLA WFGENSISLGSSFKFSVSEVFDNKIYTENAEFTKFLPKPREDNKHNG TIFFELVGPRVIFNYIVGGAASSLKEIFSEAGKERSPKKKRKVLEGGG GSSTDHPKYSDMIVAAIQGAEKNRAGSSRQSIQKYIKSHYKVGENAD
SQIKLSIKRLVYTITGVLKATKGVGASGSFRLAKSDEP Fusão BsmCas9-HN1HB1 (SEQ ID NO:119) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK]
SSDKKVQTKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMNYKMGLDIGIASVGWAVINLDLKRIEDLG VRIFDKAEHPQNGESLALPRRIARSARRRLRRRKHRLERIRRLLVSE NVLTKEEMNLLFKQKKQIDVWQLRVDALERKLNNDELARVLLHLAK RRGFKSNRKSERNSKESSEFLKNIEENQSILAQYRSVGEMIVKDSKF AYHKRNKLDSYSNMIARDDLEREIKLIFEKQREFNNPVCTERLEEKY LNIWSSQRPFASKEDIEKKVGFCTFEPKEKRAPKATYTFQSFIVWEH INKLRLVSPDETRALTEIERNLLYKQAFSKNKMTYYDIRKLLNLSDDIH FKGLLYDPKSSLKQIENIRFLELDSYHKIRKCIENVYGKDGIRMFNET DIDTFGYALTIFKDDEDIVAYLQNEYITKNGKRVSNLANKVYDKSLIDE LLNLSFSKFAHLSMKAIRNILPYMEQGEIYSKACELAGYNFTGPKKK EKALLLPVIPNIANPVYVMRALTOASRKVVNAIIKKYGSPVSIHIELARDL SHSFDERKKIQOKDQTENRKKNETAIKQLIEYELTKNPTGLDIVKFKLW SEQQGRCMYSLKPIELERLLEPGYVEVDHILPYSRSLDDSYANKVLV LTKENREKGNHTPVEYLGLGSERWKKFEKFVLANKQFSKKKKQNLL RLRYEETEEKEFKERNLNDTRYISKFFANFIKEHLKFADGDGGQKVY TINGKITAHLRSRWDFNKNREESDLHHAVDAVIVACATQGMIKKITEF) YKAREQNKESAKKKEPIFPQPWPHFADELKARLSKFPQESIEAFALG NYDRKKLESLRPVFVSRMPKRSVTGAAHQETLRRCVGIDEQSGKIQ TAVKTKLSDIKLDKDGHFPMYQKESDPRTYEAIRQRLLEHNNDPKK AFQEPLYKPKKNGEPGPVIRTVKIIDTKNKVVHLDGSKTVAYNSNIVR TDVFEKDGKYYCVPVYTMDIMKGTLPNKAIEANKPYSEWKEMTEEY TFQFSLFPNDLVRIVLPREKTIKTSTNEENINIKDIFAYYKTIDSATGGLEL ISHDRNFSLRGVGSKTLKRFEKYQVDVLGNIHKVKGEKRVGLAAPT NQOKKGKTVDSLOSVSDPKKKRKVLEGGGGSGKGDPKKPRGKMSS YAFFVQTCREEHKKKHPDASVNFSEFSKKCSERWKTMSAKEKGK
FEDMAKADKARYEREMKTYIPPKGE Fusão BsmCas9-HN1H1G (SEQ ID NO:120)
MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDKS SDKKVATKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPASD EAGEKEAKSDTGSGMNYKMGLDIGIASVGWAVINLDLKRIEDLGVRI FDKAEHPOQNGESLALPRRIARSARRRLRRRKHRLERIRRLLVSENVL TKEEMNLLFKQKKQIDVWQLRVDALERKLNNDELARVLLHLAKRRG FKSNRKSERNSKESSEFLKNIEENQSILAQYRSVGEMIVKDSKFAYH KRNKLDSYSNMIARDDLEREIKLIFEKQREFNNPVCTERLEEKYLNI WSSQRPFASKEDIEKKVGFCTFEPKEKRAPKATYTFQSFIVWEHINK, LRLVSPDETRALTEIERNLLYKQAFSKNKMTYYDIRKLLNLSDDIHFK GLLYDPKSSLKQIENIRFLELDSYHKIRKCIENVYGKDGIRMFNETDID TFGYALTIFKDDEDIVAYLQNEYITKNGKRVSNLANKVYDKSLIDELL NLSFSKFAHLSMKAIRNILPYMEQGEIYSKACELAGYNFTGPKKKEK ALLLPVIPNIANPVVMRALTOSRKVVNAIIKKYGSPVSIHIELARDLSH SFDERKKIQKDQTENRKKNETAIKQLIEYELTKNPTGLDIVKFKLWSE QQAGRCMYSLKPIELERLLEPGYVEVDHILPYSRSLDDSYANKVLVLT KENREKGNHTPVEYLGLGSERWKKFEKFVLANKQFSKKKKQNLLR LRYEETEEKEFKERNLNDTRYISKFFANFIKEHLKFADGDGGQKVYT INGKITAHLRSRWDFNKNREESDLHHAVDAVIVACATQGMIKKITEF YKAREQNKESAKKKEPIFPQPWPHFADELKARLSKFPQESIEAFALG NYDRKKLESLRPVFVSRMPKRSVTGAAHQETLRRCVGIDEQSGKIQ TAVKTKLSDIKLDKDGHFPMYQKESDPRTYEAIRQRLLEHNNDPKK AFQEPLYKPKKNGEPGPVIRTVKIIDTKNKVVHLDGSKTVAYNSNIVR TDVFEKDGKYYCVPVYTMDIMKGTLPNKAIEANKPYSEWKEMTEEY TFQFSLFPNDLVRIVLPREKTIKTSTNEEINIKDIFAYYKTIDSATGGLEL ISHDRNFSLRGVGSKTLKRFEKYQVDVLGNIHKVKGEKRVGLAAPT NQKKGKTVDSLQOSVSDPKKKRKVLEGGGGSSTDHPKYSDMIVAAI QAEKNRAGSSRQSIQKYIKSHYKVGENADSQIKLSIKRLVTTGVLK
QTKGVGASGSFRLAKSDEP Fusão LrhCas9-HN1HB1 (SEQ ID NO:121) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK]
SSDKKVAQTKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMTKLNQPYGIGLDIGSNSIGFAVVDANSHL
LRLKGETAIGARLFREGOSAADRRGSRTTRRRLSRTRWRLSFLRDF FAPHITKIDPDFFLRQKYSEISPKDKDRFKYEKRLFNDRTDAEFYEDY]|
PSMYHLRLHLMTHTHKADPREIFLAIHHILKSRGHFLTPGAAKDFNT DKVDLEDIFPALTEAYAQVYPDLELTFDLAKADDFKAKLLDEQATPS DTQKALVNLLLSSDGEKEIVKKRKQVLTEFAKAITGLKTKFNLALGTE VDEADASNWQFSMGQLDDKWSNIETSMTDQGTEIFEQIQELYRAR LLNGIVPAGMSLSQAKVADYGQHKEDLELFKTYLKKLNDHELAKTIR
GLYDRYINGDDAKPFLREDFVKALTKEVTAHPNEVSEQLLNRMGQA NFMLKQRTKANGAIPIQLQQRELDQIIANASKYYDWLAAPNPVEAHR|
WKMPYQLDELLNFHIPYYVGPLITPKQQAESGENVFAWMVRKDPS GNITPYNFDEKVDREASANTFIQRMKTTDTYLIGEDVLPKQSLLYQK YEVLNELNNVRINNECLGTDQKQRLIREVFERHSSVTIKQVADNLVA HGDFARRPEIRGLADEKRFLSSLSTYHQLKEILHEAIDDPTKLLDIENI ITWSTVFEDHTIFETKLAEIEWLDPKKINELSGIRYRGWGQFSRKLLD GLKLGNGHTVIQELMLSNHNLMQILADETLKETMTELNQDKLKTDDI EDVINDAYTSPSNKKALRQVLRVVEDIKHAANGQDPSWLFIETADGT GTAGKRTASRQKQIQTVYANAAQELIDSAVRGELEDKIADKASFTD RLVLYFMQGGRDIYTGAPLNIDQLSHYDIDHILPQSLIKDDSLDNRVL VNATINREKNNVFASTLFAGKMKATWRKWHEAGLISGRKLRNLMLR PDEIDKFAKGFVARQLVETRQIKLTEQIAAAQYPNTKIIAVKAGLSHQ LREELDFPKNRDVNHYHHAFDAFLAARIGTYLLKRYPKLAPFFTYGE FAKVDVKKFREFNFIGALTHAKKNIIAKDTGEIVWDKERDIRELDRIYN FKRMLITHEVYFETADLFKQTIYAAKDSKERGGSKQLIPKKQGYPTQ
VYGGYTQESGSYNALVRVAEADTTAYQVIKISAQNASKIASANLKSR EKGKQLLNEIVVKQLAKRRKNWKPSANSFKIVIPRFGMGTLFQNAKY|
GLFMVNSDTYYRNYQELWLSRENQKLLKKLFSIKYEKTQMNHDALQ VYKAIIDQVEKFFKLYDINQFRAKLSDAIERFEKLPINTDGNKIGKTET LRQILIGLOANGTRSNVKNLGIKTDLGLLQVGSGIKLDKDTQIVYQSP SGLFKRRIPLADLPKKKRKVLEGGGGSGKGDPKKPRGKMSSY AFF VQTCREEHKKKHPDASVNFSEFSKKCSERWKTMSAKEKGKFEDM
AKADKARYEREMKTYIPPKGE Fusão LrhCas9-HN1H1G (SEQ ID NO:122) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK]
SSDKKVAQTKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMTKLNQPYGIGLDIGSNSIGFAVVDANSHL
LRLKGETAIGARLFREGQSAADRRGSRTTRRRLSRTRWRLSFLRDF FAPHITKIDPDFFLRQKYSEISPKDKDRFKYEKRLFNDRTDAEFYEDY]|
PSMYHLRLHLMTHTHKADPREIFLAIHHILKSRGHFLTPGAAKDFNT DKVDLEDIFPALTEAYAQVYPDLELTFDLAKADDFKAKLLDEQATPS DTQKALVNLLLSSDGEKEIVKKRKQVLTEFAKAITGLKTKFNLALGTE VDEADASNWQFSMGQLDDKWSNIETSMTDQGTEIFEQIQELYRAR LLNGIVPAGMSLSQAKVADYGQHKEDLELFKTYLKKLNDHELAKTIR
GLYDRYINGDDAKPFLREDFVKALTKEVTAHPNEVSEQLLNRMGQA NFMLKQRTKANGAIPIQLQQRELDQIIANQSKYYDWLAAPNPVEAHR|
WKMPYQLDELLNFHIPYYVGPLITPKQQAESGENVFAWMVRKDPS GNITPYNFDEKVDREASANTFIQRMKTTDTYLIGEDVLPKQSLLYQK YEVLNELNNVRINNECLGTDQKQRLIREVFERHSSVTIKQVADNLVA HGDFARRPEIRGLADEKRFLSSLSTYHQLKEILHEAIDDPTKLLDIENI ITWSTVFEDHTIFETKLAEIEWLDPKKINELSGIRYRGWGQFSRKLLD GLKLGNGHTVIQELMLSNHNLMQILADETLKETMTELNQDKLKTDDI EDVINDAYTSPSNKKALRQVLRVVEDIKHAANGQDPSWLFIETADGT GTAGKRTASRQAKQIQTVYANAAQELIDSAVRGELEDKIADKASFTD RLVLYFMQGGRDIYTGAPLNIDQLSHYDIDHILPQSLIKDDSLDNRVL VNATINREKNNVFASTLFAGKMKATWRKWHEAGLISGRKLRNLMLR PDEIDKFAKGFVARQLVETRQIKLTEQIAAAQYPNTKIIAVKAGLSHQ LREELDFPKNRDVNHYHHAFDAFLAARIGTYLLKRYPKLAPFFTYGE FAKVDVKKFREFNFIGALTHAKKNIIAKDTGEIVWDKERDIRELDRIYN FKRMLITHEVYFETADLFKQTIYAAKDSKERGGSKQLIPKKQGYPTQ
VYGGYTQESGSYNALVRVAEADTTAYQVIKISAQNASKIASANLKSR EKGKQLLNEIVVKQLAKRRKNWKPSANSFKIVIPRFEGMGTLFQNAKY|
GLFMVNSDTYYRNYQELWLSRENQKLLKKLFSIKYEKTQMNHDALQ VYKAIIDQVEKFFKLYDINQFRAKLSDAIERFEKLPINTDGNKIGKTET LRQILIGLOANGTRSNVKNLGIKTDLGLLQVGSGIKLDKDTQIVYQSP SGLFKRRIPLADLPKKKRKVLEGGGGSSTDHPKYSDMIVAAIQAEK NRAGSSRQSIQKYIKSHYKVGENADSQIKLSIKRLVTTGVLKQTKG
VGASGSFRLAKSDEP Fusão McaCas9-HN1HB1 (SEQ ID NO:123) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK|
SSDKKVQTKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMEKKRKVTLGFDLGIASVGWAIVDSETNQ VYKLGSRLFDAPDTNLERRTQRGTRRLLRRRKYRNQKFYNLVKRTE VFGLSSREAIENRFRELSIKYPNIELKTKALSQEVCPDEIAWILHDYL KNRGYFYDEKETKEDFDQQTVESMPSYKLNEFYKKYGYFKGALSQ PTESEMKDNKDLKEAFFFDFSNKEWLKEINYFFNVQKNILSETFIEEF KKIFSFTRDISKGPGSDNMPSPYGIFGEFGDNGQGGRYEHIWDKNI GKCSIFTNEQRAPKYLPSALIFNFLNELANIRLYSTDKKNIQPLWKLS SIDKLNILLNLFNLPISEKKKKLTSTNINDIVKKESIKSIMLSVEDIDMIK DEWAGKEPNVYGVGLSGLNIEESAKENKFKFQDLKILNVLINLLDNV GIKFEFKDRSDIIKNLELLDNLYLFLIYQKESNNKDSSIDLFIAKNKSLN IENLKLKLKEFLLGAGNEFENHNSKTHSLSKKAIDAILPKLLDNNEGW NLEAIKNYDEEIKSQIEDNSSLMAKQDKKYLNDNFLKDAILPPNVKVT FQQAILIFNKIIQOKFSKDFEIDKVVIELAREMTQDQENDALKGIAKAQK SKKSLVEERLEANNIDKSVFNDKYEKLIYKIFLWISQDFKDPYTGAKIS, ANEIVDNKVEIDHIIPYSLCFDDSSANKVLVHKQSNQEKSNSLPYEYI KQAGHSGWNWDEFTKYVKRVFVNNVDSILSKKERLKKSENLLTTSYD GYEKLGFLARNLNDTRYATILFRDQLNNYAEHHLIDNKKMFKVIAMN GAVTSFIRKNMSYDNKLRLKDRSDFSHHAYDAAIIALFSNKTKTLYNL IDPSLNGIISKRSEGYWVIEDRYTGEIKELKKEDWTSIKNNVQARKIA KEIEEYLIDLDDEVFFSRKTKRKTNRQLYNETIYGIAAKTDEDGITNYY KKEKFSILDDKDIYLRLLREREKFVINQSNPEVIDQIEIIESYGKENNIP SRDEAINIKYTKNKINYNLYLKQYMRSLTKSLDQFSEGFINQMIANKT FVLYNPTKNTTRKIKFLRLVNDVKINDIRKNQVINKFNGKNNEPKAFY ENINSLGAIVFKSSANNFKTLSINTQIAIFGDKNWDIEDFKTYNMEKIE KYKEIYGIDKTYNFHSFIFPGTILLDKQNKEFYYISSIQTVNDQIELKFL NKIEFKNDDNTSGANKPPRRLRFGIKSIMNNYEQVDISPFGINKKIFE PKKKRKVLEGGGGSGKGDPKKPRGKMSSYAFFVQTCREEHKKKH PDASVNFSEFSKKCSERWKTMSAKEKGKFEDMAKADKARYERE
MKTYIPPKGE Fusão McaCas9-HN1H1G (SEQ ID NO:124) MPKRKVSSAEGAAKEEPKRRSARLSAKPPAKVEAKPKKAAAKDK|
SSDKKVATKGKRGAKGKQAEVANQETKEDLPAENGETKTEESPA SDEAGEKEAKSDTGSGMEKKRKVTLGFDLGIASVGWAIVDSETNQ VYKLGSRLFDAPDTNLERRTAQRGTRRLLRRRKYRNQKFYNLVKRTE VFGLSSREAIENRFRELSIKYPNIIELKTKALSQEVCPDEIAWILHDYL KNRGYFYDEKETKEDFDQQTVESMPSYKLNEFYKKYGYFKGALSQ PTESEMKDNKDLKEAFFFDFSNKEWLKEINYFFNVQKNILSETFIEEF KKIFSFTRDISKGPGSDNMPSPYGIFGEFGDNGQAGGRYEHIWDKNI GKCSIFTNEQRAPKYLPSALIFNFLNELANIRLYSTDKKNIQPLWKLS SIDKLNILLNLFNLPISEKKKKLTSTNINDIVKKESIKSIMLSVEDIDMIK DEWAGKEPNVYGVGLSGLNIEESAKENKFKFQDLKILNVLINLLDNV GIKFEFKDRSDIIKNLELLDNLYLFLIYQKESNNKDSSIDLFIAKNKSLN IENLKLKLKEFLLGAGNEFENHNSKTHSLSKKAIDAILPKLLDNNEGW NLEAIKNYDEEIKSQIEDNSSLMAKQDKKYLNDNFLKDAILPPNVKVT
FQQAILIFNKIIOKFSKDFEIDKVVIELAREMTQDQENDALKGIAKAQK SKKSLVEERLEANNIDKSVFNDKYEKLIYKIFLWISQDFKDPYTGAKIS, ANEIVDNKVEIDHIIPYSLCFDDSSANKVLVHKQSNQEKSNSLPYEY|
KQGHSGWNWDEFTKYVKRVFVNNVDSILSKKERLKKSENLLTTSYD GYEKLGFLARNLNDTRYATILFRDQLNNYAEHHLIDNKKMFKVIAMN GAVTSFIRKNMSYDNKLRLKDRSDFSHHAYDAAIIALFSNKTKTLYNL IDPSLNGIISKRSEGYWVIEDRYTGEIKELKKEDWTSIKNNVQARKIA KEIEEYLIDLDDEVFFSRKTKRKTNRQLYNETIYGIAAKTDEDGITNYY KKEKFSILDDKDIYLRLLREREKFVINQSNPEVIDQUEIIESYGKENNIP SRDEAINIKYTKNKINYNLYLKQYMRSLTKSLDQFSEGFINQMIANKT FVLYNPTKNTTRKIKFLRLVNDVKINDIRKNQVINKFNGKNNEPKAFY ENINSLGAIVFKSSANNFKTLSINTQIAIFGDKNWDIEDFKTYNMEKIE KYKEIYGIDKTYNFHSFIFPGTILLDKQNKEFYYISSIQTVNDQIELKFL NKIEFKNDDNTSGANKPPRRLRFGIKSIMNNYEQVDISPFGINKKIFE PKKKRKVLEGGGGSSTDHPKYSDMIVAAIQAEKNRAGSSRQSIQK YIKSHYKVGENADSQIKLSIKRLVTTGVLKQTKGVGASGSFRLAKS DEP

Claims (46)

REIVINDICAÇÕES
1. Sistema que compreende uma proteína Cas9 genetica- mente modificada e um RNA-guia geneticamente modificado, caracte- rizado pelo fato de que o RNA-guia geneticamente modificado é proje- tado para complexar-se com a proteína Cas9 geneticamente modifica- da e o RNA-guia geneticamente modificado compreende uma sequên- cia-guia 5' projetada para hibridar-se com uma sequência-alvo em uma sequência de cadeia dupla, em que a sequência-alvo é 5' em relação a um motivo adjacente ao protoespaçador (PAM) e o PAM tem uma se- quência como listada na Tabela A.
2. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a proteína Cas9 geneticamente modificada compre- ende pelo menos uma modificação em relação à sua contraparte do tipo selvagem.
3. Sistema, de acordo com a reivindicação 2, caracterizado pelo fato de que o referido pelo menos uma modificação compreende a adição de pelo menos um domínio heterólogo.
4. Sistema, de acordo com a reivindicação 2 ou 3, caracte- rizado pelo fato de que pelo menos um domínio heterólogo é um sinal de localização nuclear, um domínio penetrante de células, um domínio marcador, um motivo de modulação da cromatina, um domínio de mo- dificação epigenética, um domínio de regulação da transcrição, um domínio de ligação com o aptâmero de RNA ou combinação dos mesmos.
5. Sistema, de acordo com a reivindicação 2, caracterizado pelo fato de que o referido pelo menos uma modificação compreende uma substituição de um ou mais aminoácidos, uma inserção de um ou mais aminoácidos, uma exclusão de um ou mais aminoácidos ou com- binação das mesmas.
6. Sistema, de acordo com a reivindicação 5, caracterizado pelo fato de que o referido pelo menos uma modificação está dentro de um domínio RuvC, domínio HNH, domínio REC, domínio de intera- ção com PAM ou combinação dos mesmos.
7. Sistema, de acordo com qualquer uma das reivindica- ções 1 a 6, caracterizado pelo fato de que a proteína Cas9 genetica- mente modificada é uma nuclease e quebra as duas cadeias de uma sequência de fita dupla, é uma nickase e quebra uma das cadeias de uma sequência de fita dupla ou não possui atividade nuclease ou nickase.
8. Sistema, de acordo com qualquer uma das reivindica- ções 1 a 7, caracterizado pelo fato de que o RNA-guia geneticamente modificado é uma única molécula.
9. Sistema, de acordo com qualquer uma das reivindica- ções 1 a 8, caracterizado pelo fato de que a sequência do RNA-guia geneticamente modificado é otimizada para facilitar o emparelhamento de bases no RNA-guia geneticamente modificado, minimizar o empa- relhamento de bases no RNA-guia geneticamente modificado, aumen- tar a estabilidade do RNA-guia geneticamente modificado, facilitar a transcrição do RNA-guia geneticamente modificado em uma célula eu- cariótica ou uma combinação dos mesmos.
10. Sistema, de acordo com qualquer uma das reivindica- ções 1 a 9, caracterizado pelo fato de que a proteína Cas9 genetica- mente modificada é de Bacillus smithii, Lactobacillus rhamnosus, Pa- rasutterella excrementihominis, Mycoplasma canis, Mycoplasma gailli- septicum, Akkermansia glycaniphila, Akkermansia muciniphila, Oe- nococcus kitaharae, Bifidobacterium bombi, Acidothermus cellulolyti- cus, Alicyclobacillus hesperidum, Wolinella succinogenes, Nitratifractor salsuginis, Ralstonia syzygii ou Corynebacterium diphtheria.
11. Sistema, de acordo com qualquer uma das reivindica- ções 1 a 10, caracterizado pelo fato de que a proteína Cas9 genetica-
mente modificada é de Bacillus smithii e a sequência PAM que ela re- conhece é 5-NNNNCAAA-3', a proteína Cas9 geneticamente modifi- cada é de Lactobacillus rhamnosus e a sequência PAM que ela reco- nhece é 5-NGAAA-3', a proteína Cas9 geneticamente modificada é de Parasutterella excrementihominis e a sequência PAM que ela reco- nhece é 5'- NGG-3', a proteína Cas9 geneticamente modificada é de Mycoplasma canis e a sequência PAM que ela reconhece é 5-NNGG- 3', a proteína Cas9 geneticamente modificada é de Mycoplasma galli- septicum e a sequência PAM que ela reconhece é 5'-NNAAT-3', a pro- teína Cas9 geneticamente modificada é de Akkermansia glycaniphila e a sequência PAM que ela reconhece é 5-NNNRTA-3', a proteína Cas9 geneticamente modificada é de Akkermansia muciniphila e a sequên- cia PAM que ela reconhece é 5-MMACCA-3', a proteína Cas9 geneti- camente modificada é de Oenococcus kitaharae e a sequência PAM que ela reconhece é 5-NNG-3', a proteína Cas9 geneticamente modi- ficada é de Bifidobacterium bombi e a sequência PAM que ela reco- nhece é 5-NNNNGRY-3', a proteína Cas9 geneticamente modificada é de Acidothermus cellulolyticus e a sequência PAM que ela reconhece é 5-NGG-3', a proteína Cas9 geneticamente modificada é de Alicyclo- bacillus hesperidum e a sequência PAM que ela reconhece é 5-NGG- 3', a proteína Cas9 geneticamente modificada é de Wolinella succino- genes e a sequência PAM que ela reconhece é 5-NGG-3', a proteína Cas9 geneticamente modificada é de Nitratifractor salsuginis e a se- quência PAM que ele ela reconhece é 5-NRGNK-3', a proteína Cas9 geneticamente modificada é de Ralstonia syzygii e a sequência PAM que ela reconhece é 5-GGGRG-3', ou a proteína Cas9 geneticamente modificada é de Corynebacterium diphtheria e a sequência PAM que ela reconhece é 5-NNAMMMC-3', em que Ké Gou T; Mé Aou C; Né A, C, GouTRé Aou G;eYéCouT.
12. Sistema, de acordo com qualquer uma das reivindica-
ções 1 a 11, caracterizado pelo fato de que a proteína Cas9 genetica- mente modificada tem uma sequência de aminoácidos com pelo me- nos cerca de 90% de identidade de sequência com a SEQ ID NO: 2,4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 117, 118, 119, 120, 121, 122, 123 ou 124.
13. Sistema, de acordo com qualquer uma das reivindica- ções 1 a 12, caracterizado pelo fato de que a proteína Cas9 genetica- mente modificada tem uma sequência de aminoácidos como estabele- cida na SEQ ID NO: 2, 4,6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 117, 118, 119, 120, 121, 122, 123 ou 124.
14. Pluralidade de ácidos nucleicos que codificam o sistema como definido em qualquer uma das reivindicações 1 a 13, caracteri- zada pelo fato de que compreende pelo menos um ácido nucleico que codifica a proteína Cas9 geneticamente modificada e pelo menos um ácido nucleico que codifica o RNA-guia geneticamente modificado.
15. Pluralidade de ácidos nucleicos, de acordo com a rei- vindicação 14, caracterizada pelo fato de que pelo menos um ácido nucleico que codifica a proteína Cas9 geneticamente modificada é RNA.
16. Pluralidade de ácidos nucleicos, de acordo com a rei- vindicação 14, caracterizada pelo fato de que o referido pelo menos um ácido nucleico que codifica a proteína Cas9 geneticamente modifi- cada é DNA.
17. Pluralidade de ácidos nucleicos, de acordo com qual- quer uma das reivindicações 14 a 16, caracterizada pelo fato de que o referido pelo menos um ácido nucleico que codifica a proteína Cas9 geneticamente modificada é otimizado por códons para expressão em uma célula eucariótica.
18. Pluralidade de ácidos nucleicos, de acordo com a rei- vindicação 17, caracterizada pelo fato de que a célula eucariótica é uma célula humana, uma célula de mamífero não humano, uma célula de vertebrado não mamífero, uma célula de invertebrado, uma célula vegetal ou um organismo eucariótico de célula única.
19. Pluralidade de ácidos nucleicos, de acordo com a rei- vindicação 14, caracterizada pelo fato de que o referido pelo menos um ácido nucleico que codifica o RNA-guia geneticamente modificado é DNA.
20. Pluralidade de ácidos nucleicos, de acordo com qual- quer uma das reivindicações 14 a 19, caracterizada pelo fato de que o referido pelo menos um ácido nucleico que codifica a proteína Cas9 geneticamente modificada está operacionalmente ligado a uma se- quência promotora de fago para síntese de RNA in vitro ou expressão de proteína em uma célula bacteriana, e o referido pelo menos um ácido nucleico que codifica o RNA-guia geneticamente modificado está operacionalmente ligado a uma sequência promotora de fago para sín- tese de RNA in vitro.
21. Pluralidade de ácidos nucleicos, de acordo com qual- quer uma das reivindicações 14 a 19, caracterizada pelo fato de que o referido pelo menos um ácido nucleico que codifica a proteína Cas9 geneticamente modificada está operacionalmente ligado a uma se- quência promotora eucariótica para expressão em uma célula eucarió- tica, e o referido pelo menos um ácido nucleico que codifica o RNA- guia geneticamente modificado está operacionalmente ligado a uma sequência promotora eucariótica para expressão em uma célula euca- riótica.
22. Vetor, caracterizado pelo fato de que compreende a plu- ralidade de ácidos nucleicos como definida em qualquer uma das rei- vindicações 14 a 21.
23. Vetor, de acordo com a reivindicação 22, caracterizado pelo fato de que é um vetor de plasmídeo, um vetor viral ou um repli-
con de RNA viral autorreplicante.
24. Célula eucariótica, caracterizada pelo fato de que com- preende pelo menos um sistema que contém uma proteína Cas9 ge- neticamente modificada e um RNA-guia geneticamente modificado como definido em qualquer uma das reivindicações 1 a 13, pelo menos um ácido nucleico como definido em qualquer uma das reivindicações 14 a 21, ou pelo menos um vetor como definido na reivindicação 22 ou
23.
25. Célula eucariótica, de acordo com a reivindicação 24, caracterizada pelo fato de que é uma célula humana, uma célula de mamífero não humano, uma célula vegetal, uma célula de vertebrado não mamífero, uma célula de invertebrado ou um organismo eucarióti- co de célula única.
26. Célula eucariótica, de acordo com a reivindicação 24 ou 25, caracterizada pelo fato de que é in vivo, ex vivo ou in vitro.
27. Método para modificar uma sequência cromossômica em uma célula eucariótica, caracterizado pelo fato de que compreende introduzir na célula eucariótica de pelo menos um sistema que com- preende uma proteína Cas9 geneticamente modificada e um RNA-guia geneticamente modificado como definido em qualquer uma das reivin- dicações 1 a 13, pelo menos um ácido nucleico como definido em qualquer uma das reivindicações 14 a 21, ou pelo menos um vetor como definido na reivindicação 22 ou 23, e opcionalmente pelo menos um polinucleotídeo doador, em que o referido pelo menos um RNA- guia geneticamente modificado guia o referido pelo menos uma proteí- na Cas9 geneticamente modificada para o sítio-alvo na sequência cromossômica, de modo que ocorra modificação da sequência cro- mossômica.
28. Método, de acordo com a reivindicação 27, caracteriza- do pelo fato de que a modificação compreende uma substituição de pelo menos um nucleotídeo, uma exclusão de pelo menos um nucleo- tídeo, uma inserção de pelo menos um nucleotídeo, uma conversão de pelo menos um nucleotídeo, uma modificação de pelo menos um nu- cleotídeo, uma modificação de pelo menos uma proteína histona asso- ciada ou combinação das mesmas.
29. Método, de acordo com a reivindicação 27 ou 28, carac- terizado pelo fato de que a proteína Cas9 geneticamente modificada tem atividade nuclease ou nickase, o referido pelo menos um polinu- cleotídeo doador não é introduzido na célula e a modificação compre- ende pelo menos um indel.
30. Método, de acordo com a reivindicação 29, caracteriza- do pelo fato de que a modificação compreende inativação da sequên- cia cromossômica.
31. Método, de acordo com a reivindicação 27 ou 28, carac- terizado pelo fato de que a proteína Cas9 geneticamente modificada possui atividade nuclease ou nickase, o referido pelo menos um poli- nucleotídeo doador é introduzido na célula e a modificação compreen- de uma alteração de pelo menos um nucleotídeo na sequência cro- mossômica.
32. Método, de acordo com a reivindicação 31, caracteriza- do pelo fato de que o referido pelo menos um polinucleotídeo doador é uma sequência doadora que possui pelo menos uma alteração de nu- cleotídeo em relação à sequência próxima ao sítio-alvo na sequência cromossômica.
33. Método, de acordo com a reivindicação 31, caracteriza- do pelo fato de que o referido pelo menos um polinucleotídeo doador compreende uma sequência doadora que corresponde a uma sequên- cia exógena.
34. Método, de acordo com a reivindicação 32 ou 33, carac- terizado pelo fato de que a sequência doadora é flanqueada por se-
quências que apresentam identidade substancial com sequências lo- calizadas a montante e a jusante do sítio-alvo na sequência cromos- sômica.
35. Método, de acordo com a reivindicação 32 ou 33, carac- terizado pelo fato de que a sequência doadora é flanqueada por sali- ências curtas que são compatíveis com saliências geradas pelo referi- do pelo menos uma proteína Cas9 geneticamente modificada.
36. Método, de acordo com qualquer uma das reivindica- ções 27 a 35, caracterizado pelo fato de que a célula eucariótica é uma célula humana, uma célula de mamífero não humano, uma célula vegetal, uma célula de vertebrado não mamífero, uma célula de inver- tebrado ou um organismo eucariótico de única célula.
37. Método, de acordo com qualquer uma das reivindica- ções 27 a 36, caracterizado pelo fato de que a célula eucariótica é in vivo, ex vivo ou in vitro.
38. Proteína de fusão, caracterizada pelo fato de que com- preende uma proteína Cas9 ligada a pelo menos um motivo modulador da cromatina, em que a proteína Cas9 é uma proteína Cas9 de Baci- llus smithii, Lactobacillus rhamnosus, Parasutterella excrementihomi- nis, Mycoplasma canis, Mycoplasma gallisepticum, Akkermansia glycaniphila, Akkermansia muciniphila, Oenococcus kitaharae, Bifido- bacterium bombi, Acidothermus cellulolyticus, Alicyclobacillus hesperi- dum, Wolinella succinogenes, Nitratifractor salsuginis, Ralstonia sy- zygii ou Corynebacterium diphtheria
39. Proteína de fusão, de acordo com a reivindicação 38, caracterizada pelo fato de que o referido pelo menos um motivo de modulação da cromatina é um domínio de ligação ao DNA do grupo de alta mobilidade (HMG) caixa (HMGB), uma proteína (HMGN) de liga- ção com nucleossomo HMG, um domínio globular central de uma vari- ante da histona H1, um domínio de ligação ao DNA de uma proteína complexa de remodelação da cromatina ou uma combinação dos mesmos.
40. Proteína de fusão, de acordo com a reivindicação 38 ou 39, caracterizada pelo fato de que o referido pelo menos um motivo de modulação da cromatina é um domínio HMGB1 caixa A, proteína HMGN1, proteína HMGN2, proteína HMGN3a, proteína HMGN3b, do- mínio globular central da histona H1, domínio de ligação ao DNA da proteína chave de imitação (ISWI), domínio de ligação ao DNA da pro- teína cromodomínio-helicase-DNA 1 (CHD1) ou uma combinação dos mesmos.
41. Proteína de fusão, de acordo com qualquer uma das reivindicações 38 a 40, caracterizada pelo fato de que o referido pelo menos um motivo de modulação da cromatina está ligado à proteína Cas9 diretamente por meio de uma ligação química, indiretamente por meio de um ligante ou uma combinação dos mesmos.
42. Proteína de fusão, de acordo com qualquer uma das reivindicações 38 a 41, caracterizada pelo fato de que o referido pelo menos um motivo de modulação da cromatina está ligado à proteína Cas9 em seu término N, término C, um local interno ou uma combina- ção dos mesmos.
43. Proteína de fusão, de acordo com qualquer uma das reivindicações 38 a 42, caracterizada pelo fato de que compreende ainda pelo menos um sinal de localização nuclear.
44. Proteína de fusão, de acordo com qualquer uma das reivindicações 38 a 43, caracterizada pelo fato de que compreende ainda pelo menos um domínio penetrante de células, pelo menos um domínio marcador ou uma combinação dos mesmos.
45. Proteína de fusão, de acordo com qualquer uma das reivindicações 38 a 44, caracterizada pelo fato de que a proteína de fusão tem uma sequência de aminoácidos com pelo menos 90% de identidade de sequência com a SEQ ID NO: 117, 118, 119, 120, 121, 122, 123 ou 124.
46. Proteína de fusão, de acordo com qualquer uma das reivindicações 38 a 45, caracterizada pelo fato de que a proteína de fusão tem uma sequência de aminoácidos como estabelecido na SEQ ID NO: 117, 118, 119, 120, 121, 122, 123 ou 124.
BR112020010479-5A 2018-02-15 2019-02-15 sistemas cas9 geneticamente modificados para modificação de genoma eucariótico BR112020010479A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862631304P 2018-02-15 2018-02-15
US62/631,304 2018-02-15
US201862720525P 2018-08-21 2018-08-21
US62/720,525 2018-08-21
PCT/US2019/018335 WO2019161290A1 (en) 2018-02-15 2019-02-15 Engineered cas9 systems for eukaryotic genome modification

Publications (1)

Publication Number Publication Date
BR112020010479A2 true BR112020010479A2 (pt) 2020-11-24

Family

ID=65995829

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020010479-5A BR112020010479A2 (pt) 2018-02-15 2019-02-15 sistemas cas9 geneticamente modificados para modificação de genoma eucariótico

Country Status (11)

Country Link
US (2) US10767193B2 (pt)
EP (1) EP3752607A1 (pt)
JP (2) JP7109547B2 (pt)
KR (3) KR20230022258A (pt)
CN (1) CN111902536A (pt)
AU (3) AU2019222568B2 (pt)
BR (1) BR112020010479A2 (pt)
CA (1) CA3084020A1 (pt)
IL (1) IL274528A (pt)
SG (1) SG11202007382TA (pt)
WO (1) WO2019161290A1 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111492B2 (en) * 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
JP2021523745A (ja) 2018-05-16 2021-09-09 シンテゴ コーポレイション ガイドrna設計および使用のための方法およびシステム
US10947517B2 (en) 2019-02-15 2021-03-16 Sigma-Aldrich Co. Llc CRISPR/Cas fusion proteins and systems
AU2020231380A1 (en) 2019-03-07 2021-09-23 The Regents Of The University Of California CRISPR-Cas effector polypeptides and methods of use thereof
CN114829602A (zh) 2019-12-17 2022-07-29 西格马-奥尔德里奇有限责任公司 拟杆菌属中的基因组编辑
GB2617659B (en) * 2020-02-14 2024-05-01 Metagenomi Inc Enzymes with RuvC domains
KR20220161383A (ko) 2020-03-31 2022-12-06 메타지노미, 인크. 클래스 ii, 유형 ii crispr 시스템
CN112159801B (zh) * 2020-07-13 2022-11-15 复旦大学 SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用
CN113717960B (zh) * 2021-08-27 2023-07-18 电子科技大学 一种新Cas9蛋白、CRISPR-Cas9基因组定向编辑载体及基因组编辑方法
CN114657181B (zh) * 2022-04-01 2023-08-25 安徽大学 一种靶向H1.4的sgRNA以及H1.4基因编辑方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005510232A (ja) 2001-11-26 2005-04-21 アドバンスド セル テクノロジー、インク. 再プログラムされたヒト体細胞核ならびに自系および同系なヒト幹細胞の製造および使用方法
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
KR101844123B1 (ko) 2012-12-06 2018-04-02 시그마-알드리치 컴퍼니., 엘엘씨 Crispr-기초된 유전체 변형과 조절
EP3122880B1 (en) * 2014-03-26 2021-05-05 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
KR102630014B1 (ko) * 2014-10-01 2024-01-25 더 제너럴 하스피탈 코포레이션 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법
AU2017274145B2 (en) * 2016-06-02 2020-07-23 Sigma-Aldrich Co Llc Using programmable DNA binding proteins to enhance targeted genome modification
AU2017292169B2 (en) * 2016-07-06 2021-12-23 Vertex Pharmaceuticals Incorporated Materials and methods for treatment of pain related disorders
BR112019012155A2 (pt) * 2016-12-14 2019-11-12 Stichting Technische Wetenschappen uso de pelo menos uma molécula-guia de rna e uma proteína cas, método de ligação, clivagem, marcação ou modificação de um polinucleotídeo alvo de fita dupla, célula transformada, e, complexo de nucleoproteína
AU2018311504A1 (en) 2017-07-31 2020-03-12 Reflection Biotechnologies Limited Cellular models of and therapies for ocular diseases

Also Published As

Publication number Publication date
AU2022200130A1 (en) 2022-02-10
SG11202007382TA (en) 2020-08-28
US10767193B2 (en) 2020-09-08
KR102465067B1 (ko) 2022-11-10
JP7109547B2 (ja) 2022-07-29
US20190249200A1 (en) 2019-08-15
KR20200121342A (ko) 2020-10-23
KR102494449B1 (ko) 2023-01-31
AU2024202158A1 (en) 2024-05-02
KR20230022258A (ko) 2023-02-14
JP2022122910A (ja) 2022-08-23
IL274528A (en) 2020-06-30
US20200354752A1 (en) 2020-11-12
EP3752607A1 (en) 2020-12-23
CN111902536A (zh) 2020-11-06
KR20220015502A (ko) 2022-02-08
JP2021505180A (ja) 2021-02-18
CA3084020A1 (en) 2019-08-22
WO2019161290A1 (en) 2019-08-22
AU2022200130B2 (en) 2024-03-07
AU2019222568B2 (en) 2021-10-14
AU2019222568A1 (en) 2020-05-21

Similar Documents

Publication Publication Date Title
BR112020010479A2 (pt) sistemas cas9 geneticamente modificados para modificação de genoma eucariótico
KR102458395B1 (ko) 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선
JP7469285B2 (ja) 標的化されたゲノム修飾を増強するためのヌクレオソーム相互作用タンパク質ドメインの使用
JP2020530992A (ja) Crispr/casアクチベーターシステムのための合成ガイドrna
US11965184B2 (en) CRISPR/Cas fusion proteins and systems
US20230058352A1 (en) High Fidelity SpCas9 Nucleases for Genome Modification

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]