BR112020005323A2

BR112020005323A2 - polinucleotídeos, composições e métodos para edição de genoma

Info

Publication number: BR112020005323A2
Application number: BR112020005323-6A
Authority: BR
Inventors: Christian Dombrowski; Jonathan Douglas Finn; Amy Madison Rhoden SMITH; Seth C. Alexander
Original assignee: Intellia Therapeutics, Inc.
Priority date: 2017-09-29
Filing date: 2018-09-28
Publication date: 2020-09-24
Also published as: US20200354702A1; TW201923077A; SG11202002562QA; KR20200058508A; PH12020550359A1; IL273307A; JP2021500863A; EP3687581A1; CA3077255A1; MX2020003602A; US20240076636A1; CO2020005181A2; CN111405912A; EA202090873A1; IL311278A; WO2019067910A1; US11697806B2; AU2018339089A1; AR113154A1

Abstract

Composições e métodos para edição de genes. Em algumas modalidades, é fornecido um polinucleotídeo que codifica Cas9 que pode fornecer um ou mais dentre eficiência de edição melhorada, imunogenicidade reduzida ou outros benefícios.

Description

Relatório Descritivo da Patente de Invenção para “POLINUCLEOTÍDEOS, COMPOSIÇÕES E MÉTODOS PARA EDIÇÃO DE GENOMA”.

[0001] Este pedido reivindica o benefício de prioridade ao Pedido Provisório 62/556.144 dos Estados Unidos, que foi depositado em 29 de setembro de 2017 e que foi incorporado por referência na sua totalidade.

[0002] O presente pedido contém uma Listagem de Sequência, que foi submetida eletronicamente no formato ASCII e está incorporada por meio deste a título de referência em sua totalidade. A referida cópia ASCII, criada em 28 de setembro de 2018, é nomeada 2018-09- 28_01155-0020-00PCT_ST25.txt e tem 963.200 bytes de tamanho.

[0003] A presente divulgação refere-se a polinucleotídeos, composições e métodos para edição de genoma que envolvem agentes de ligação ao DNA guiado por RNA, como sistemas CRISPR-Cas e subunidades dos mesmos.

[0004] Agentes de ligação ao DNA guiado por RNA, como sistemas CRISPR-Cas, podem ser usados para edição direcionada de genoma, incluindo células eucarióticas e in vivo. Foi demonstrado que essa edição é capaz de inativar certos alelos deletérios ou corrigir certas mutações pontuais deletérias. O agente pode ser expresso in situ, fornecendo mRNA que o codifica. As abordagens existentes podem, no entanto, fornecer menos eficiência de edição do que o desejado ou podem ser indesejáveis imunogênicas, por exemplo, podem provocar uma elevação indesejável nos níveis de citocinas.

[0005] Assim, há uma necessidade de polinucleotídeos, composições e métodos aprimorados para edição do genoma. A presente divulgação visa fornecer composições e métodos para edição de genoma que fornecem um ou mais benefícios, como pelo menos um de eficiência de edição melhorada ou imunogenicidade reduzida (por exemplo, elevação reduzida de citocinas após a administração) ou pelo menos para fornecer ao público uma escolha útil. Em algumas modalidades, é fornecido um polinucleotídeo que codifica um agente de ligação ao DNA guiado por RNA, em que um ou mais de seu uso de códons, sequência de não codificação (por exemplo, uma UTR), domínio heterólogo (por exemplo, NLS) e/ou teor de nucleotídeos difere dos polinucleotídeos existentes de uma maneira aqui divulgada. Verificou-se que esses recursos podem fornecer benefícios como os descritos acima. Em algumas modalidades, a eficiência de edição melhorada ocorre ou é específica para um tipo de órgão ou célula de um mamífero, como o fígado ou hepatócitos.

SUMÁRIO

[0006] A Modalidade 1 é um mRNA compreendendo um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de uridina que varia de seu teor mínimo de uridina a 150% do teor mínimo de uridina.

[0007] A Modalidade 2 é um mRNA compreendendo um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de dinucleotídeo de uridina que varia de seu teor mínimo de dinucleotídeo de uridina a 150% do teor mínimo de uridina.

[0008] A Modalidade 3 é um mRNA compreendendo um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de adenina que varia de seu teor mínimo de uridina a 150% do teor mínimo de adenina.

[0009] A Modalidade 4 é um mRNA compreendendo um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de dinucleotídeo de adenina que varia de seu teor mínimo de dinucleotídeo de adenina a 150% do teor mínimo de adenina.

[0010] A Modalidade 5 é um mRNA compreendendo uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175, em que o mRNA compreende um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA.

[0011] A Modalidade 6 é um mRNA compreendendo um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA, em que o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos seus primeiros 30, 50, 70, 100 , 150, 200, 250 ou 300 nucleotídeos.

[0012] A Modalidade 7 é o mRNA de qualquer uma das modalidades anteriores compreendendo o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são (i) códons listados na Tabela 1, Tabela 2 ou Tabela 3, ou (ii) um conjunto de códons listados na Tabela 4.

[0013] A Modalidade 8 é um mRNA que codifica um agente de ligação ao DNA guiado por RNA, caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação ao DNA guiado por RNA, em que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons listados na Tabela 1, Tabela 2, Tabela 3 ou (ii) um conjunto de códons listados na Tabela 4.

[0014] A Modalidade 9 é o mRNA da modalidade 7 ou 8, em que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto U 1 baixo definido na Tabela 4.

[0015] A Modalidade 10 é o mRNA da modalidade 7 ou 8, em que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto A baixo definido na Tabela 4.

[0016] A Modalidade 11 é o mRNA da modalidade 7 ou 8, em que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto A/U baixo definido na Tabela 4.

[0017] A Modalidade 9 é o mRNA da modalidade 7 ou 8, em que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto de meia vida longa definido na Tabela 4.

[0018] A Modalidade 13 é o mRNA de qualquer uma das modalidades 7 a 12, em que pelo menos 80%, 85%, 90%, 95%, 98%, 99% ou 100% dos códons são (i) códons listados na Tabela 1, Tabela 2 ou Tabela 3 ou (ii) um conjunto de códons listados na Tabela 4.

[0019] A Modalidade 14 é o mRNA de qualquer uma das modalidades 1 a 5 ou 7 a 13, em que o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos seus primeiros 30, 50, 70, 100, 150, 200, 250 ou 300 nucleotídeos.

[0020] A Modalidade 15 é o mRNA de qualquer uma das modalidades anteriores, em que o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18 , 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos os primeiros 10%, 12%, 15%, 20%, 25% , 30% ou 35% de sua sequência.

[0021] A Modalidade 16 é o mRNA de qualquer uma das modalidades 1 a 4 ou 6 a 15, em que o mRNA compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27,

29, 30, 50, 52, 54, 65 ou 66, ou 107-175.

[0022] A Modalidade 17 é o mRNA de qualquer uma das modalidades anteriores, em que o quadro de leitura aberto tem um teor de dinucleotídeo de uridina que varia de seu teor mínimo de dinucleotídeo de uridina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125 %, 130%, 135%, 140%, 145% ou 150% do teor mínimo de dinucleotídeo de uridina.

[0023] A Modalidade 18 é o mRNA de qualquer uma das modalidades anteriores, em que o quadro de leitura aberto tem um teor de uridina que varia de seu teor mínimo de uridina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% ou 150% do teor mínimo de uridina.

[0024] A Modalidade 19 é o mRNA de qualquer uma das modalidades anteriores, em que o quadro de leitura aberto tem um teor de adenina que varia de seu teor mínimo de uridina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% ou 150% do teor mínimo de adenina.

[0025] A Modalidade 20 é o mRNA de qualquer uma das modalidades anteriores, em que o quadro de leitura aberto tem um teor de dinucleotídeo adenina que varia de seu teor mínimo de dinucleotídeo de adenina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% ou 150% do teor mínimo de dinucleotídeo de adenina.

[0026] A Modalidade 21 é o mRNA de qualquer uma das modalidades anteriores, em que compreende uma UTR 5' com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 32, 34, 36, 38, 41 ou 75-77.

[0027] A Modalidade 22 é o mRNA de qualquer uma das modalidades anteriores, em que uma UTR 3' com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 33, 35, 37, 39 ou 40.

[0028] A Modalidade 23 é o mRNA da modalidade 21 ou 22, em que o mRNA compreende uma UTR 5' e uma UTR 3' da mesma fonte.

[0029] A Modalidade 24 é o mRNA de qualquer uma das modalidades anteriores, em que compreende um capeamento 5' selecionado de Cap0, Cap1 e Cap2.

[0030] A Modalidade 25 é o mRNA de qualquer uma das modalidades anteriores, em que o quadro de leitura aberto possui códons que aumentam a tradução do mRNA em um mamífero.

[0031] A Modalidade 26 é o mRNA da modalidade 25, em que o quadro de leitura aberto possui códons que aumentam a tradução do mRNA em um órgão específico de um mamífero.

[0032] A Modalidade 27 é o mRNA da modalidade 26, em que o órgão é fígado.

[0033] A Modalidade 28 é o mRNA de qualquer uma das modalidades 25 a 27, em que o mamífero é um humano.

[0034] A Modalidade 29 é o mRNA de qualquer uma das modalidades 25 a 28, em que os códons aumentam a tradução do mRNA no mamífero em relação à tradução de um mRNA compreendendo um ORF com uma sequência que consiste na SEQ ID NO: 5.

[0035] A Modalidade 30 é o mRNA de qualquer uma das modalidades anteriores, em que quando o mRNA é administrado a um mamífero em uma composição farmacêutica, o mamífero exibe uma resposta de citocina pelo menos 5 vezes menor que um mamífero que foi administrado com um mRNA compreendendo um ORF que codifica uma nuclease Cas9 com superior a 150% do teor mínimo de uridina.

[0036] A Modalidade 31 é o mRNA da modalidade 30, em que o mRNA que compreende o ORF que codifica a Cas9 nuclease com mais que 150% do teor mínimo de uridina tem uma sequência que consiste em SEQ ID NO: 5.

[0037] A Modalidade 132 é o mRNA de qualquer uma das modalidades anteriores, em que o agente de ligação ao DNA guiado por RNA possui atividade de endonuclease de fita dupla.

[0038] A Modalidade 33 é o mRNA da modalidade 32, em que o agente de ligação ao DNA guiado por RNA compreende uma Cas clivase.

[0039] A Modalidade 34 é o mRNA de qualquer uma das modalidades anteriores, em que o agente de ligação ao DNA guiado por RNA tem atividade de nickase.

[0040] A Modalidade 35 é o mRNA da modalidade 34, em que o agente de ligação ao DNA guiado por RNA compreende uma Cas nickase.

[0041] A Modalidade 36 é o mRNA de qualquer uma das modalidades 1 a 31, em que o agente de ligação ao DNA guiado por RNA compreende um domínio de ligação a dCas DNA.

[0042] A Modalidade 37 é o mRNA de qualquer uma das modalidades 33 ou 35 a 36, em que o domínio de ligação Cas clivase, Cas nickase, ou dCas DNA é um domínio de ligação a Cas9 clivase, Cas9 nickase, ou dCas9 DNA.

[0043] A Modalidade 38 é o mRNA de qualquer uma das modalidades anteriores, em que o agente de ligação ao DNA guiado por RNA codificado compreende um sinal de localização nuclear (NLS).

[0044] A Modalidade 39 é o mRNA da modalidade 38, em que o NLS está ligado ao C-terminal do agente de ligação ao DNA guiado por RNA.

[0045] A Modalidade 40 é o mRNA da modalidade 38, em que o NLS está ligado ao N-terminal do agente de ligação ao DNA guiado por RNA.

[0046] A Modalidade 41 é o mRNA de qualquer uma das modalidades 38 a 40, em que o NLS compreende uma sequência com pelo menos 80%, 85%, 90% ou 95% de identidade com qualquer uma das SEQ ID NOs: 78-91.

[0047] A Modalidade 42 é o mRNA de qualquer uma das modalidades 38 a 40, em que o NLS compreende a sequência de qualquer uma das SEQ ID NOs: 78-91.

[0048] A Modalidade 43 é o mRNA de qualquer uma das modalidades 38 a 42, em que o NLS é codificado por uma sequência com pelo menos 80%, 85%, 90%, 95%, 98% ou 100% de identidade com a sequência de qualquer uma das SEQ ID NOs : 92-104.

[0049] A Modalidade 44 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 4, 7 ou 9.

[0050] A Modalidade 45 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 4, 7 ou 9.

[0051] A Modalidade 46 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 98% de identidade com a SEQ ID NO: 4, 7 ou 9.

[0052] A Modalidade 47 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência 100% idêntica à SEQ ID NO: 4, 7 ou 9.

[0053] A Modalidade 48 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 111, 114 ou 117.

[0054] A Modalidade 49 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 111, 114 ou 117.

[0055] A Modalidade 50 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 98% de identidade com a SEQ ID NO: 111, 114 ou 117.

[0056] A Modalidade 51 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência 100% idêntica à SEQ ID NO: 112, 122 ou 125.

[0057] A Modalidade 52 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 112, 122 ou 125.

[0058] A Modalidade 53 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 112, 122 ou 125.

[0059] A Modalidade 54 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 90% de identidade com as SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175.

[0060] A Modalidade 55 é o mRNA de qualquer uma das modalidades 37 a 43, em que compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[0061] A Modalidade 56 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência com pelo menos 98% de identidade com as SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175.

[0062] A Modalidade 57 é o mRNA de qualquer uma das modalidades 37 a 43, em que o mRNA compreende uma sequência 100% idêntica às SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175.

[0063] A Modalidade 58 é o mRNA de qualquer uma das modalidades 37 a 57, em que o mRNA codifica um polipeptídeo compreendendo a sequência de aminoácidos da SEQ ID NO: 3, 6, 8 ou 186-196.

[0064] A Modalidade 59 é o mRNA de qualquer uma das modalidades anteriores, em que o agente de ligação ao DNA guiado por RNA compreende ainda um domínio funcional heterólogo.

[0065] A Modalidade 60 é o mRNA da modalidade 59, em que o domínio funcional heterólogo é uma Fokl nuclease.

[0066] A Modalidade 61 é o mRNA da modalidade 59, em que o domínio funcional heterólogo é um domínio regulador da transcrição.

[0067] A Modalidade 62 é o mRNA de qualquer uma das modalidades anteriores, em que quando uma quantidade eficaz do mRNA é administrada a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, um indel é formado no locus TTR em pelo menos 50% do DNA genômico obtido a partir de hepatócitos do mamífero.

[0068] A Modalidade 63 é o mRNA de qualquer uma das modalidades anteriores, em que quando uma quantidade eficaz do mRNA é administrada a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, a concentração de TTR sérica do mamífero é reduzida em pelo menos 50%.

[0069] A Modalidade 64 é o mRNA de qualquer uma das modalidades anteriores, em que pelo menos 10% da uridina é substituída por uma uridina modificada.

[0070] A Modalidade 65 é o mRNA da modalidade 64, em que a uridina modificada é um ou mais de N1-metil-pseudouridina, pseudouridina, 5-metoxiuridina ou 5-iodouridina.

[0071] A Modalidade 66 é o mRNA da modalidade 64, em que a uridina modificada é uma ou ambas de N1-metil-pseudouridina ou 5- metoxiuridina.

[0072] A Modalidade 67 é o mRNA da modalidade 64, em que a uridina modificada é N1-metil-pseudouridina.

[0073] A Modalidade 68 é o mRNA da modalidade 64, em que a uridina modificada é 5-metoxiuridina.

[0074] A Modalidade 69 é o mRNA de qualquer uma das modalidades 64 a 68, em que 15% a 45% da uridina é substituída pela uridina modificada.

[0075] A Modalidade 70 é o mRNA de qualquer uma das modalidades 64 a 68, em que pelo menos 20% ou pelo menos 30% da uridina são substituídos pela uridina modificada.

[0076] A Modalidade 71 é o mRNA da modalidade 70, em que pelo menos 80% ou pelo menos 90% da uridina é substituída pela uridina modificada.

[0077] A Modalidade 72 é o mRNA da modalidade 70, em que 100% de uridina é substituída pela uridina modificada.

[0078] A Modalidade 73 é o mRNA de qualquer uma das modalidades 64 a 72, em que quando uma quantidade eficaz do mRNA é administrada a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, um indel é formado no locus TTR em pelo menos 70% ou pelo menos 90% do DNA genômico obtido a partir de hepatócitos do mamífero.

[0079] A Modalidade 74 é o mRNA de qualquer uma das modalidades 64 a 73, em que quando o mRNA é administrado a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, a concentração de TTR sérica do mamífero é reduzida em pelo menos 70% ou pelo menos 90%.

[0080] A Modalidade 75 é o mRNA da modalidade 62, 63, 71 ou 72, em que o animal é um camundongo e o RNA guia tem uma sequência que consiste na SEQ ID NO: 42.

[0081] A Modalidade 76 é o mRNA da modalidade 62, 63, 71 ou 72,

em que o animal é um rato e o RNA guia tem uma sequência que consiste na SEQ ID NO: 69.

[0082] A Modalidade 77 é o mRNA de qualquer uma das modalidades anteriores, em que o mRNA compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

[0083] A Modalidade 78 é o mRNA de qualquer uma das modalidades anteriores, em que o mRNA compreende uma sequência com pelo menos 95% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

[0084] A Modalidade 79 é o mRNA de qualquer uma das modalidades anteriores, em que o mRNA compreende uma sequência com pelo menos 98% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

[0085] A Modalidade 80 é o mRNA de qualquer uma das modalidades anteriores, em que o mRNA compreende uma sequência com pelo menos 99% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

[0086] A Modalidade 81 é o mRNA de qualquer uma das modalidades anteriores, em que o mRNA compreende uma sequência com 100% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

[0087] A Modalidade 82 é um construto de expressão compreendendo um promotor operacionalmente ligado a uma sequência que codifica um mRNA como definido em qualquer uma das modalidades anteriores.

[0088] A Modalidade 83 é um plasmídeo compreendendo o construto de expressão da modalidade 82.

[0089] A Modalidade 84 é uma célula hospedeira compreendendo o construto de expressão da modalidade 82 ou o plasmídeo da modalidade 83.

[0090] A modalidade 85 é um método para preparar um mRNA compreendendo contatar o construto de expressão como definido na modalidade 82 ou o plasmídeo como definido na modalidade 83 com uma RNA polimerase em condições permissivas para a transcrição do mRNA.

[0091] A Modalidade 86 é o método da modalidade 85, em que a etapa de contato é realizada in vitro.

[0092] A Modalidade 87 é uma composição compreendendo um mRNA como definido em qualquer uma das modalidades 1 a 81 e pelo menos um RNA guia.

[0093] A Modalidade 88 é uma nanopartícula lipídica compreendendo um mRNA de acordo com qualquer uma das modalidades 1 a 81.

[0094] A Modalidade 89 é uma composição farmacêutica compreendendo um mRNA como definido em qualquer uma das modalidades 1 a 81 e um transportador farmaceuticamente aceitável.

[0095] A Modalidade 90 é a nanopartícula lipídica da modalidade 88 ou a composição farmacêutica da modalidade 89, compreendendo ainda pelo menos um RNA guia.

[0096] A Modalidade 91 e á composição ou nanopartícula lipídica, de acordo com qualquer uma das reivindicações 87 a 90, em que pelo menos um RNA guia direciona TTR.

[0097] A Modalidade 92 é um método para editar ou modificar um genoma de um gene alvo compreendendo contatar uma célula com o mRNA, o construto de expressão, a composição ou a nanopartícula lipídica de qualquer uma das reivindicações 1-83 ou 87-91.

[0098] A Modalidade 93 é o uso do mRNA, construto de expressão, composição ou nanopartícula lipídica de qualquer uma das reivindicações de 1 a 83 ou 87 a 91 para edição do genoma ou modificação de um gene alvo.

[0099] A Modalidade 94 é o uso do mRNA, construto de expressão, composição ou nanopartícula lipídica de qualquer uma das reivindicações de 1 a 83 ou 87 a 91 para a fabricação de um medicamento para edição ou modificação de genoma de um gene alvo.

[00100] A Modalidade 95 é o método ou uso de qualquer uma das reivindicações 92 a 94, em que a edição ou modificação do genoma do gene alvo ocorre em uma célula do fígado.

[00101] A Modalidade 96 é o método ou uso da reivindicação 95, em que a célula hepática é um hepatócito.

[00102] A Modalidade 97 é o método ou uso de qualquer uma das reivindicações 92 a 96, em que a edição ou modificação do genoma do gene alvo é in vivo.

[00103] A Modalidade 98 é o método ou uso de qualquer uma das reivindicações 92 a 97, em que a edição ou modificação do genoma do gene alvo está em uma célula isolada ou cultivada.

BREVE DESCRIÇÃO DAS SEQUÊNCIAS DIVULGADAS SEQ ID NO Descrição 1 Sequência de codificação do DNA de Cas9 usando o análogo da timidina dos códons mínimos de uridina listados na Tabela 3, com códons de início e parada 2 Sequência de codificação de DNA de Cas9 usando códons com expressão geralmente alta em humanos 3 Sequência de aminoácidos de Cas9 com um sinal de localização nuclear (1xNLS) como os aminoácidos C-terminais 4 ORF de mRNA de Cas9 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 5 OR9 de mRNA de Cas9 usando códons com expressão geralmente alta em humanos, com códons de início e parada 6 Sequência de aminoácidos de Cas9 nickase com 1xNLS como os 7 aminoácidos C-terminais 7 ORF de mRNA de Cas9 nickase que codifica SEQ ID NO: 6 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada

SEQ ID NO Descrição 8 Sequência de aminoácidos de dCas9 com 1xNLS como os 7 aminoácidos C-terminais 9 ORF de mRNA de dCas9 que codifica SEQ ID NO: 8 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 10 Sequência de codificação de mRNA de Cas9 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 11 Sequência de codificação de mRNA de Cas9 nickase usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 12 Sequência de codificação de mRNA de dCas9 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 13 Sequência de aminoácidos de Cas9 (sem NLS) 14 ORF de mRNA de Cas9 que codifica SEQ ID NO: 13 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 15 Sequência de codificação de Cas9 que codifica SEQ ID NO:13 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 16 Sequência de aminoácidos de Cas9 nickase (sem NLS) 17 ORF de mRNA de Cas9 nickase que codifica SEQ ID NO: 16 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 18 Sequência de codificação de Cas9 nickase que codifica SEQ ID NO:16 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 19 Sequência de aminoácidos de dCas9 (sem NLS) 20 ORF de mRNA de dCas9 que codifica SEQ ID NO: 13 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 21 Sequência de codificação de dCas9 que codifica SEQ ID NO:13 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de

SEQ ID NO Descrição proteínas de fusão) 22 Sequência de aminoácidos de Cas9 com dois sinais de localização nuclear (2xNLS) como aminoácidos C-terminais 23 ORF de mRNA de Cas9 que codifica SEQ ID NO: 13 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 24 Sequência de codificação de Cas9 que codifica SEQ ID NO:13 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 25 Sequência de aminoácidos de Cas9 nickase com dois sinais de localização nuclear como aminoácidos C-terminais 26 ORF de mRNA de Cas9 nickase que codifica SEQ ID NO: 16 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 27 Sequência de codificação de Cas9 nickase que codifica SEQ ID NO:16 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 28 Sequência de aminoácidos de dCas9 com dois sinais de localização nuclear como aminoácidos C-terminais 29 ORF de mRNA de dCas9 que codifica SEQ ID NO: 13 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 30 Sequência de codificação de dCas9 que codifica SEQ ID NO:13 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 31 Promotor T7 32 Beta-globina humana 5' UTR 33 Beta-globina humana 3' UTR 34 Alfa-globina humana 5' UTR 35 Alfa-globina humana 3' UTR 36 Xenopus laevis beta-globina 5' UTR 37 Xenopus laevis beta-globina 3' UTR 38 Hormônio de crescimento bovino 5' UTR 39 Hormônio de crescimento bovino 3' UTR

SEQ ID NO Descrição 40 Mus musculus hemoglobina alfa, cadeia adulta 1 (Hba-a1), 3'UTR 41 HSD17B4 5’ UTR 42 RNA guia único G282 direcionado ao gene TTR de camundongo 43 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de ALB 44 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 4 e 3' UTR de ALB 45 ORF de Cas9 alternativa com teor U de 19,36% 46 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 45, sequência de Kozak e 3' UTR de ALB 47 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 45 e 3' UTR de ALB 48 Transcrito de Cas9 compreendendo ORF e Cas9 usando códons com expressão geralmente alta em humanos 49 Transcrito de Cas9 compreendendo a sequência Kozak com ORF de Cas9 usando códons com expressão geralmente alta em humanos 50 ORF de Cas9 com junções de emenda removidas; 12,75% de teor de U 51 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 50, sequência de Kozak e 3' UTR de ALB 52 ORF de Cas9 com códons mínimos de uridina frequentemente usados em humanos em geral; 12,75% de teor de U 53 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 52, sequência de Kozak e 3' UTR de ALB 54 ORF de Cas9 com códons mínimos de uridina não frequentemente usados em humanos em geral; 12,75% de teor de U 55 Transcrito de Cas9 com 5' UTR de HSD, ORF correspondente à SEQ ID NO: 54, sequência de Kozak e 3' UTR de ALB 56 Transcrito de Cas9 com AGG como primeiros três nucleotídeos para uso com CleanCapTM, 5' UTR de HSD, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de ALB 57 Transcrito de Cas9 com 5' UTR de CMV, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de ALB 58 Transcrito de Cas9 com 5' UTR de HBB, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de HBB 59 Transcrito de Cas9 com 5' UTR de XBG, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de XBG 60 Transcrito de Cas9 com AGG como primeiros três nucleotídeos para uso

SEQ ID NO Descrição com CleanCapTM, 5' UTR de XBG, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de XBG 61 Transcrito de Cas9 com AGG como primeiros três nucleotídeos para uso com CleanCapTM, 5' UTR de HSD, ORF correspondente à SEQ ID NO: 4, sequência de Kozak e 3' UTR de ALB 62 Sequência 30/30/39 poli-A 63 sequência poli-A 100 64 RNA guia único G209 direcionado ao gene TTR de camundongo 65 ORF que codifica Neisseria meningitidis Cas9 usando códons mínimos de uridina, conforme listado na Tabela 3, com códons de início e parada 66 ORF que codifica Neisseria meningitidis Cas9 usando códons mínimos de uridina, conforme listado na Tabela 3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 67 Transcrição compreendendo SEQ ID NO: 65 (codificando Neisseria meningitidis Cas9) 68 Sequência de aminoácidos de Neisseria meningitidis Cas9 69 RNA guia único G390 direcionado ao gene TTR de rato 70 RNA guia único G502 direcionado ao gene TTR do macaco cynomolgus 71 RNA guia único G509 direcionado ao gene TTR do macaco cynomolgus 72 RNA guia único G534 direcionado ao gene TTR de rato 73 Sequência de codificação de DNA de eGFP 74 Padrão sgRNA modificado 75 CMV-1 5’ UTR 76 CMV-2 5’ UTR 77 CMV-3 5’ UTR 78 SV40 NLS 79 NLS 1 exemplificativo 80 NLS 2 exemplificativo 81 NLS 3 exemplificativo 82 NLS 4 exemplificativo 83 NLS 5 exemplificativo 84 NLS 6 exemplificativo 85 NLS 7 exemplificativo 86 NLS 8 exemplificativo 87 NLS 9 exemplificativo 88 NLS 10 exemplificativo 89 NLS 11 exemplificativo

SEQ ID NO Descrição 90 SV40 NLS alternativo 91 Nucleoplasmina NLS 92 Sequência de codificação exemplificativa para SV40 NLS 93 Sequência de codificação exemplificativa para NLS1 94 Sequência de codificação exemplificativa para NLS2 95 Sequência de codificação exemplificativa para NLS3 96 Sequência de codificação exemplificativa para NLS4 97 Sequência de codificação exemplificativa para NLS5 98 Sequência de codificação exemplificativa para NLS6 99 Sequência de codificação exemplificativa para NLS7 100 Sequência de codificação exemplificativa para NLS8 101 Sequência de codificação exemplificativa para NLS9 102 Sequência de codificação exemplificativa para NLS10 103 Sequência de codificação exemplificativa para NLS11 104 Sequência de codificação exemplificativa para SV40 NLS alternativo 105 sequência de Kozak exemplificativa 107 ORF de Cas9 usando códons de meia-vida longos da Tabela 4, com códons de início e parada 108 ORF de Cas9 usando códons ricos em U da Tabela 4, com códons de início e parada 109 ORF de Cas9 usando códons de G baixo da Tabela 4, com códons de início e parada 110 ORF de Cas9 usando códons de C baixo da Tabela 4, com códons de início e parada 111 ORF de Cas9 usando códons de A baixo da Tabela 4, com códons de início e parada 112 ORF de Cas9 usando códons de A/U baixo da Tabela 4, com códons de início e parada 113 ORF de Cas9 usando códons A baixos da Tabela 4, com duas sequências NLS do terminal C e códons de início e parada 114 ORF de Cas9 nickase usando códons de A baixo da Tabela 4, com códons de início e parada 115 ORF de Cas9 nickase usando códons de A baixo da Tabela 4, com códons de início e parada e sem NLS 116 ORF de Cas9 nickase usando códons A baixos da Tabela 4, com duas sequências NLS do terminal C e códons de início e parada 117 ORF de dCas9 usando códons de A baixo da Tabela 4, com códons de início

SEQ ID NO Descrição e parada 118 ORF de dCas9 usando códons de A baixo da Tabela 4, com códons de início e parada e sem NLS 119 ORF de dCas9 usando códons A baixos da Tabela 4, com duas sequências NLS do terminal C e códons de início e parada 120 ORF de Cas9 usando códons de A/U baixo da Tabela 4, com duas sequências NLS do terminal C e códons de início e parada 121 ORF de Cas9 usando códons de A/U baixo da Tabela 4, com códons de início e parada e sem NLS 122 ORF de Cas9 nickase usando códons de A/U baixo da Tabela 4, com códons de início e parada 123 ORF de Cas9 nickase usando códons de A/U baixo da Tabela 4, com duas sequências NLS do terminal C e códons de início e parada 124 ORF de Cas9 nickase usando códons de A/U baixo da Tabela 4, com códons de início e parada e sem NLS 125 ORF de dCas9 usando códons de A/U baixo da Tabela 4, com códons de início e parada 126 ORF de dCas9 usando códons A/U baixos da Tabela 4, com duas sequências NLS do terminal C e códons de início e parada 127 ORF de dCas9 usando códons de A/U baixo da Tabela 4, com códons de início e parada e sem NLS 128 ORF de Nme Cas9 usando códons de A baixo da Tabela 4, com códons de início e parada 129 ORF de Nme Cas9 usando códons de A/U baixo da Tabela 4, com códons de início e parada 130 Quadro de leitura aberto para Cas9 com NLS1, com códons de início e parada 131 Quadro de leitura aberto para Cas9 com NLS2, com códons de início e parada 132 Quadro de leitura aberto para Cas9 com NLS3, com códons de início e parada 133 Quadro de leitura aberto para Cas9 com NLS4, com códons de início e parada 134 Quadro de leitura aberto para Cas9 com NLS5, com códons de início e parada 135 Quadro de leitura aberto para Cas9 com NLS6, com códons de início e parada

SEQ ID NO Descrição 136 Quadro de leitura aberto para Cas9 com NLS7, com códons de início e parada 137 Quadro de leitura aberto para Cas9 com NLS8, com códons de início e parada 138 Quadro de leitura aberto para Cas9 com NLS9, com códons de início e parada 139 Quadro de leitura aberto para Cas9 com NLS10, com códons de início e parada 140 Quadro de leitura aberto para Cas9 com NLS11, com códons de início e parada 141 ORF de Cas9 usando códons com expressão geralmente alta em humanos (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 142 ORF de Cas9 usando códons de meia-vida longos da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 143 ORF de Cas9 usando códons ricos em U da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 144 ORF de Cas9 usando códons de G baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 145 ORF de Cas9 usando códons de C baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 146 ORF de Cas9 usando códons de A baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 147 ORF de Cas9 usando códons de A/U baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 148 ORF de Cas9 usando códons de A baixo da Tabela 4, com duas sequências NLS C-terminais (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 149 ORF de Cas9 nickase usando códons de A baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 150 ORF de Cas9 nickase usando códons de A baixo da Tabela 4 (sem NLS e

SEQ ID NO Descrição sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 151 ORF de Cas9 nickase usando códons de A baixo da Tabela 4, com duas sequências NLS C-terminais (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 152 ORF de dCas9 usando códons de A baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 153 ORF de dCas9 usando códons de A baixo da Tabela 4 (sem NLS e sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 154 ORF de dCas9 usando códons de A baixo da Tabela 4, com duas sequências NLS C-terminais (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 155 ORF de Cas9 usando códons de A/U baixo da Tabela 4, com duas sequências NLS C-terminais (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 156 ORF de Cas9 usando códons de A/U baixo da Tabela 4 (sem NLS e sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 157 ORF de Cas9 nickase usando códons de A/U baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 158 ORF de Cas9 nickase usando códons de A/U baixo da Tabela 4, com duas sequências NLS C-terminais (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 159 ORF de Cas9 nickase usando códons de A/U baixo da Tabela 4 (sem NLS e sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 160 ORF de dCas9 usando códons de A/U baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 161 ORF de dCas9 usando códons de A/U baixo da Tabela 4, com duas sequências NLS C-terminais (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 162 ORF de dCas9 usando códons de A/U baixo da Tabela 4 (sem NLS e sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão)

SEQ ID NO Descrição 163 ORF de Nme Cas9 usando códons de A baixo da Tabela 4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 164 ORF de Nme Cas9 usando códons de A/U baixo da Tabela 4 (sem códons de partida ou parada; adequado para inclusão na sequência de codificação das proteínas de fusão) 165 Quadro de leitura aberto para Cas9 com NLS1 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 166 Quadro de leitura aberto para Cas9 com NLS2 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 167 Quadro de leitura aberto para Cas9 com NLS3 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 168 Quadro de leitura aberto para Cas9 com NLS4 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 169 Quadro de leitura aberto para Cas9 com NLS5 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 170 Quadro de leitura aberto para Cas9 com NLS6 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 171 Quadro de leitura aberto para Cas9 com NLS7 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 172 Quadro de leitura aberto para Cas9 com NLS8 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 173 Quadro de leitura aberto para Cas9 com NLS9 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 174 Quadro de leitura aberto para Cas9 com NLS10 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas de fusão) 175 Quadro de leitura aberto para Cas9 com NLS11 (sem códons de início ou parada; adequado para inclusão na sequência de codificação de proteínas

SEQ ID NO Descrição de fusão) 176 Transcrição de mRNA com XBG UTRs e Cas9 ORF com códons U 1 baixos da Tabela 4 177 Transcrição de mRNA com XBG UTRs e Cas9 ORF com códons de A baixo da Tabela 4 178 Transcrição de mRNA com XBG UTRs e Cas9 ORF com códons de U/A baixos da Tabela 4 179 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, HSD 5' UTR e ALB 3' UTR humano 180 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, CMV- 1 5' UTR e ALB 3' UTR humano 181 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, CMV- 2 5' UTR e ALB 3' UTR humano 182 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, CMV- 3 5' UTR e ALB 3' UTR humano 183 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, HBA 5' UTR e ALB 3' UTR humano 184 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, HBB 5' UTR e ALB 3' UTR humano 185 transcrito de mRNA com ORF que codifica Cas9 com etiqueta HiBiT, XBG 5' UTR e ALB 3' UTR humano 186 Sequência de aminoácidos para Cas9 com NLS1 187 Sequência de aminoácidos para Cas9 com NLS2 188 Sequência de aminoácidos para Cas9 com NLS3 189 Sequência de aminoácidos para Cas9 com NLS4 190 Sequência de aminoácidos para Cas9 com NLS5 191 Sequência de aminoácidos para Cas9 com NLS6 192 Sequência de aminoácidos para Cas9 com NLS7 193 Sequência de aminoácidos para Cas9 com NLS8 194 Sequência de aminoácidos para Cas9 com NLS9 195 Sequência de aminoácidos para Cas9 com NLS10 196 Sequência de aminoácidos para Cas9 com NLS11 197 RNA guia G506 direcionado a TTR 198 RNA guia G510 direcionado a TTR

[00104] Veja a Tabela de Sequências abaixo para as próprias sequências. As sequências de transcrito geralmente incluem GGG como os três primeiros nucleotídeos para uso com ARCA ou AGG como os três primeiros nucleotídeos para uso com CleanCapTM. Por conseguinte, os três primeiros nucleotídeos podem ser modificados para uso com outras abordagens de capeamento, como a enzima de captação de Vaccinia. Promotores e sequências poli-A não estão incluídas nas sequências de transcrição. Um promotor como um promotor T7 (SEQ ID NO: 31) e uma sequência poli-A como SEQ ID NO: 62 ou 63 podem ser anexados às sequências de transcrito divulgadas nas extremidades 5' e 3', respectivamente. A maioria das seqüências de nucleotídeos é fornecida como DNA, mas pode ser facilmente convertida em RNA alterando Ts para Us.

BREVE DESCRIÇÃO DAS FIGURAS

[00105] As Figuras 1A-1D mostram níveis de IFN alfa, IL-6, TNF alfa e MCP-1 após administração de PBS ou nanopartículas lipídicas (LNP) LNP417-LNP421 a 0,5 ou 1 mg/kg (mpk).

[00106] As Figuras 2A-2B mostram níveis séricos de TTR e porcentagem de edição hepática após administração da formulação de PBS ou LNP LNP417-LNP421 a 0,5 ou 1 mpk.

[00107] A FIGURA 3 mostra rendimentos de transcrição in vitro (IVT) para transcrição a partir de construtos de DNA de Cas9. A transcrição foi realizada com uridina-5'-trifosfato não modificado (UTP) ou apenas com N1-metil-pseudo-UTP (0 no eixo horizontal), misturada com uma proporção indicada de 5-metóxi UTP (20-80 no eixo horizontal) ou com 100% de 5-metóxi UTP (100). Para cada conjunto de três barras, a barra esquerda usou N1-metil-pseudo-UTP e/ou 5-metóxi UTP e SEQ ID NO: 2; a barra central usou UTP não modificado e/ou 5-metóxi UTP e SEQ ID NO: 2; e a barra direita usou UTP não modificado e/ou 5-metóxi UTP e SEQ ID NO: 1.

[00108] A FIGURA 4 mostra a pureza do mRNA dos resultados da transcrição in vitro (IVT) para Cas9 (SEQ ID NO: 2) e construtos de DNA otimizados por Cas9 (SEQ ID NO: 1) . A transcrição foi realizada a partir da sequência Cas9 da SEQ ID NO: 2 com uridina-5'-trifosfato não modificado (UTP) (quadrados) ou com N1-metil-pseudo-UTP (círculos escuros) isoladamente (0) ou misturados com a proporção indicada de 5-metóxi UTP (20-80) ou com 100% de 5-metóxi UTP (100). A transcrição foi realizada a partir da sequência Cas9 de SEQ ID NO: 1 (círculos claros) com UTP não modificado (0) ou misturada com uma razão indicada de 5-metóxi UTP (20-80) ou com 100% de 5-metóxi UTP (100 ) Cada sequência de codificação incluía um sinal de localização nuclear.

[00109] As Figuras 5A-5D mostram resultados de manchas no anticorpo anti-dsRNA. Os resultados são com controle de RNA de fita dupla (A), Cas9 transcrita na presença de UTP e/ou 5-metóxi UTP (B), sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 transcrita na presença de UTP e/ou 5-metóxi UTP (C) e Cas9 transcrito na presença de N1-metil-pseudo-UTP e/ou 5-metóxi UTP (D). Os painéis (B) - (D) foram realizados com transcritos contendo 0% a 100% de 5- metóxi UTP e 100% a 0% de UTP ou N1-metil UTP.

[00110] As Figuras 6A e 6B mostram eficiência de edição in vitro de mRNAs em células Neuro 2A tratadas com mRNA de Cas9, apresentadas como edição percentual (A) ou edição EC50 (B). O efeito de concentrações crescentes de 5-metóxi-UTP no mRNA de Cas9 foi avaliado. A transcrição foi realizada a partir da sequência Cas9 da SEQ ID NO: 2 com N1-metil-pseudo-UTP (série esquerda em A; círculos escuros em B) ou com uridina-5'-trifosfato não modificado (UTP) (série central em A; quadrados em B) sozinhos (0) ou misturados com uma proporção indicada de 5-metóxi UTP (20-80), ou com 100% de 5-metóxi UTP (100). A transcrição foi realizada a partir da sequência Cas9 de SEQ ID NO: 1 (série direita em A; círculos claros em B) com UTP não modificado (0) ou misturada com uma razão indicada de 5-metóxi UTP

(20-80) ou com 100% de 5-metóxi UTP (100 ) Cada sequência de codificação incluía um sinal de localização nuclear.

[00111] As Figuras 7A-7D apresentam níveis séricos de citocinas 4 horas após a dose para as formulações LNP LNP720-LNP724. O asterisco na FIGURA 7A indica que pelo menos uma medição individual estava abaixo do limite de detecção.

[00112] As Figuras 8A e 8B apresentam níveis séricos de TTR (A) e porcentagem de edição de TTR no fígado (B) 7 dias após a dosagem com as formulações LNP LNP720-LNP724. O asterisco na FIGURA 8A indica que pelo menos uma medição individual estava abaixo do limite de detecção.

[00113] A FIGURA 9 mostra a porcentagem de edição de TTR no baço 7 dias após a dosagem com as formulações LNP LNP720-LNP724 a 1 mpk.

[00114] A FIGURA 10 mostra a porcentagem de edição de TTR em hepatócitos primários de camundongo (PMH) com formulações LNP LNP720-LNP724 e LNP685.

[00115] As Figuras 11A e 11B mostram níveis séricos de TTR após a dosagem de formulações compreendendo mRNAs de Cas9 nas quais os ORFs tinham sequências da SEQ ID NO: 5 ou 4. Os dados de TTR são apresentados como níveis séricos (A) ou porcentagem em relação aos níveis de TTR em animais tratados com TSS (B).

[00116] A FIGURA 12 mostra a porcentagem de edição de TTR no fígado após a dosagem de formulações compreendendo um mRNA de Cas9 no qual a ORF tinha a sequência da SEQ ID NO: 5 ou 4 a 5 mpk ou 2 mpk.

[00117] As Figuras 13A-E mostram níveis séricos de TTR e a porcentagem de edição de TTR no fígado após a dosagem das formulações de LNP indicadas.

[00118] A FIGURA 14 mostra a porcentagem de edição de TTR em hepatócitos primários de camundongo (PMH) tratados com 0,3, 1, 3 ou 10 ng de LNP815-821, 823 ou 824.

[00119] As Figuras 15A-B mostram níveis séricos de TTR após a dosagem de formulações de LNP contendo um mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO: 5 ou 4 nas razões e quantidades indicadas em Guia:Cas9.

[00120] As Figuras 16A-B mostram porcentagem de edição de TTR no fígado após a dosagem de formulações de LNP contendo um mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO: 5 ou 4 nas razões e valores indicados em Guia:Cas9.

[00121] As Figuras 17A-B mostra a porcentagem de edição de TTR no baço após a dosagem de formulações de LNP contendo um mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO: 5 ou 4 nas razões e quantidades indicadas em Guia:Cas9.

[00122] A FIGURA 18 mostra uma Western blot para expressão de Cas9 no fígado após a dosagem de formulações de LNP contendo um mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO: 5 ou 4 nas razões indicadas de Guia:Cas9.

[00123] As Figuras 19A-B mostram níveis séricos de TTR após a dosagem das formulações de LNP indicadas nas quantidades indicadas.

[00124] A FIGURA 20 mostra a porcentagem de edição de TTR no fígado após a dosagem das formulações de LNP indicadas nas quantidades indicadas.

[00125] As Figuras 21A-C mostra níveis de edição do fígado (A) e TTR sérica (B em µg/ml; C como porcentagem do controle TSS) após a dosagem das formulações de LNP indicadas nas quantidades indicadas.

[00126] As Figuras 22A-D mostra TTR sérica e resultados de edição após a dosagem de formulações de LNP nas razões e quantidades indicadas.

[00127] A FIGURA 23 mostra a expressão da proteína Cas9 em células Hep2G após tratamento com mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO indicada.

[00128] A FIGURA 24 mostra a porcentagem de edição em células HepG2 após tratamento com mRNA de Cas9, em que os ORFs tinham a sequência da SEQ ID NO indicada nas concentrações indicadas.

[00129] A FIGURA 25 mostra a expressão de Cas9 no fígado após a dosagem de formulações de LNP com mRNA de Cas9 nas quais os ORFs tinham a sequência da SEQ ID NO indicada.

[00130] A FIGURA 26 mostra resultados de edição in vivo no locus TTR após a dosagem de formulações de LNP com mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO indicada.

[00131] As Figuras 27A-B mostram TTR sérica (A) e TTR sérica (% TSS) (B) após a dosagem de formulações de LNP com mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO indicada.

[00132] A FIGURA 28 mostra edição hepática in vivo após a dosagem de formulações de LNP com mRNA de Cas9 nas quais os ORFs tinham a sequência da SEQ ID NO indicada nas quantidades indicadas.

[00133] As Figuras 29A-B mostram níveis séricos de TTR (A) e TTR sérica (% TSS) (B) após a dosagem de formulações de LNP com mRNA de Cas9 em que os ORFs tinham a sequência da SEQ ID NO indicada nas quantidades indicadas.

[00134] As Figuras 30A-B mostram níveis séricos de TTR (A) e a % de edição no fígado (B) após a dosagem de formulações de LNP com mRNA de Cas9 nas quais os transcritos tinham a sequência da SEQ ID NO indicada.

[00135] A FIGURA 31 mostra a porcentagem de edição de TTR no fígado após a dosagem de LNPs formuladas com mRNAs com o capeamento a sequência de transcrição indicados nas doses indicadas.

[00136] FIGURA 32 mostra os níveis séricos de TTR após a dosagem de LNPs formulados com mRNAs com a sequência cap e transcrição indicada nas quantidades indicadas.

[00137] A FIGURA 33 mostra a porcentagem de edição de TTR no fígado após a dosagem de LNPs formulados com mRNAs que codificam Cas9 em que os ORFs tinham a sequência da SEQ ID NO indicada, incluindo um NLS como indicado.

[00138] As Figuras 34A-B mostram níveis séricos de TTR (A) e TTR sérica (% TSS) (B) após a dosagem de LNPs formulados com mRNAs que codificam Cas9 nos quais os ORFs tinham a sequência da SEQ ID NO indicada, incluindo um NLS como indicado.

[00139] A FIGURA 35 mostra a correlação da atividade de NLS e eficiência de edição após a dosagem de LNPs formulados com mRNAs que codificam Cas9 e incluindo sequências NLS de várias classes e níveis de atividade.

[00140] A FIGURA 36 mostra os níveis de expressão da proteína Cas9 em células HepG2 a partir de transcritos de mRNA com as sequências indicadas e 5' UTRs como indicado.

DESCRIÇÃO DETALHADA DE CERTAS MODALIDADES

[00141] Será feita agora referência com detalhes de certas modalidades da invenção, cujos exemplos são ilustrados nos desenhos que acompanham. Enquanto a invenção será descrita em conjunto com as modalidades ilustradas, será entendido que não se destina a limitar a invenção às modalidades. Pelo contrário, a invenção destina-se a abranger todas as alternativas, modificações e equivalentes, que podem ser incluídas dentro da invenção como definido pelas reivindicações anexas.

[00142] Antes de descrever os presentes ensinamentos em detalhes, deve-se entender que a divulgação não se limita a composições específicas ou etapas do processo, pois podem variar. Deve-se notar que, tal como é usado aqui neste relatório descritivo, as formas singulares "um", "uma" e "o", "a" incluem referências plurais a menos que o contexto dite claramente o contrário. Assim, por exemplo, a referência a "um conjugado" inclui uma pluralidade de conjugados e a referência a "uma célula" inclui uma pluralidade de células e semelhantes.

[00143] Os intervalos numéricos são inclusivos dos números que definem a faixa. Os valores medidos e mensuráveis são entendidos como aproximados, levando em consideração dígitos significativos e o erro associado à medição. Além disso, o uso de "compreende", "compreendem", "compreendendo", "contém", "contêm", "contendo", "inclui", "incluem" e "incluindo" não se destina a ser limitativo. Deve ser entendido que a descrição geral anterior e a descrição detalhada são exemplificativas e explicativas apenas e não são restritivas dos ensinamentos.

[00144] O termo "cerca de" ou "aproximadamente" significa um erro aceitável para um valor específico, conforme determinado por um versado na técnica, que depende em parte de como o valor é medido ou determinado, ou um grau de variação que não substancialmente afeta as propriedades do objeto descrito, por exemplo, dentro de 10%, 5%, 2% ou 1%. Por conseguinte, a menos que indicado o contrário, os parâmetros numéricos estabelecidos no seguinte relatório descritivo e nas reivindicações anexas são aproximações que podem variar dependendo das propriedades desejadas que se buscam obter. Ao final, e não como uma tentativa de limitar a aplicação da doutrina de equivalentes ao escopo das reivindicações, cada parâmetro numérico deve ser pelo menos interpretado à luz do número de dígitos significativos relatados e pela aplicação de técnicas de arredondamento ordinárias.

[00145] A menos que especificamente indicado no relatório descritivo acima, modalidades no relatório descritivo que recitam "compreendendo" vários componentes também são contempladas como "consistindo em" ou "consistindo essencialmente em" os componentes recitados; modalidades no relatório descritivo que recitam "consistindo em" vários componentes também são contempladas como "compreendendo" ou "consistindo essencialmente em" os componentes recitados; e modalidades no relatório descritivo que recitam "consistindo essencialmente em" vários componentes também são contempladas como "consistindo em" ou "compreendendo" os componentes recitados (essa intercambiabilidade não se aplica ao uso desses termos nas reivindicações).

[00146] Os títulos de seção aqui utilizados são apenas para fins organizacionais e não devem ser interpretados como limitando a matéria desejada de qualquer forma. No caso de qualquer literatura incorporada por referência contradizer o conteúdo expresso deste relatório descritivo, incluindo mas não se limitando a uma definição, o conteúdo expresso deste relatório descritivo controla. Embora os presentes ensinamentos sejam descritos em conjunto com várias modalidades, não se pretende que os presentes ensinamentos sejam limitados a tais modalidades. Pelo contrário, os presentes ensinamentos abrangem várias alternativas, modificações e equivalentes, como será apreciado pelos versados na técnica. A. Definições

[00147] Salvo indicação em contrário, os seguintes termos e frases como aqui utilizado, destinam-se a ter os seguintes significados:

[00148] O termo "ou combinações dos mesmos", conforme aqui utilizado, refere-se a todas as permutações e combinações dos termos listados que precedem o termo. Por exemplo, "A, B, C ou combinações dos mesmos" deve incluir pelo menos um de: A, B, C, AB, AC, BC ou

ABC, e se a ordem for importante em um contexto específico, também BA, CA, CB, ACB, CBA, BCA, BAC ou CAB. Continuando com este exemplo, estão expressamente incluídas combinações que contêm repetições de um ou mais itens ou termos, como BB, AAA, AAB, BBC, AAABCCCC, CBBAAA, CABABB e assim por diante. O versado na técnica entenderá que normalmente não há limite para o número de itens ou termos em qualquer combinação, a menos que seja aparente do contexto.

[00149] Conforme utilizado neste documento, o termo "kit" refere-se a um conjunto embalado de componentes relacionados, como um ou mais polinucleotídeos ou composições e um ou mais materiais relacionados, como dispositivos de distribuição (por exemplo, seringas), solventes, soluções, tampões, instruções, ou dessecantes.

[00150] "Ou" é usado no sentido inclusivo, ou seja, equivalente a "e/ou", a menos que o contexto exija de outra forma.

[00151] "Polinucleotídeo" e "ácido nucleico" são usados aqui para se referir a um composto multimérico compreendendo nucleosídeos ou análogos de nucleosídeos que possuem bases heterocíclicas nitrogenadas ou análogos de bases ligados entre si ao longo de uma espinha dorsal, incluindo RNA convencional, DNA, RNA-DNA misto e polímeros que são análogos dos mesmos. Uma "espinha dorsal" de ácido nucleico pode ser constituída por uma variedade de ligações, incluindo uma ou mais ligações de açúcar-fosfodiéster, ligações peptídeo-ácido nucleico ("ácidos nucleicos peptídicos" ou PNA; PCT WO 95/32305), ligações fosforotioato, ligações metilfosfonato ou combinações das mesmas. As frações de açúcar de um ácido nucleico podem ser ribose, desoxirribose ou compostos semelhantes com substituições, por exemplo, substituições 2' metóxi ou 2' haleto. As bases nitrogenadas podem ser bases convencionais (A, G, C, T, U), análogos dos mesmos (por exemplo, uridinas modificadas, como 5-

metoxiuridina, pseudouridina ou N1-metilpseudouridina, ou outras); inosina; derivados de purinas ou pirimidinas (por exemplo, N4-metil desoxiganosina, deaza ou aza-purinas, deaza ou aza-pirimidinas, bases de pirimidina com grupos substituintes na posição 5ou 6 (por exemplo, 5-metilcitosina), bases de purinas com uma substituinte nas posições 2, 6 ou 8, 2-amino-6-metilaminopurina, O6-metilguanina, 4-tio-pirimidinas, 4-amino-pirimidinas, 4-dimetil-hidrazina-pirimidinas e O4-alquil- pirimidinas; Patente US 5.378.825 e PCT WO 93/13121). Para discussão geral, ver The Biochemistry of the Nucleic Acids 5-36, Adams et al., ed., 11th ed., 1992). Os ácidos nucleicos podem incluir um ou mais resíduos "abásicos", onde a espinha dorsal não inclui base nitrogenada para a(s) posição(ões) do polímero (Patente US 5.585.481). Um ácido nucleico pode compreender apenas açúcares, bases e ligações de RNA ou DNA convencionais, ou pode incluir componentes e substituições convencionais (por exemplo, bases convencionais com ligações 2' metóxi ou polímeros contendo ambas as bases convencionais e um ou mais análogos de bases). O ácido nucleico inclui "ácido nucleico bloqueado" (LNA), um análogo contendo um ou mais monômeros de nucleotídeo LNA com uma unidade de furanose bicíclica bloqueada em um RNA que imita a conformação do açúcar, o que aumenta a afinidade da hibridação em relação a sequências complementares de RNA e DNA (Vester e Wengel, 2004 Biochemistry 43(42):13233-41). O RNA e o DNA têm diferentes frações de açúcar e podem diferir pela presença de uracil ou análogos no RNA e timina ou análogos no DNA.

[00152] "Uridina modificada" é usado aqui para se referir a um nucleosídeo diferente da timidina com os mesmos aceitadores de ligação de hidrogênio que a uridina e uma ou mais diferenças estruturais da uridina. Em algumas modalidades, uma uridina modificada é uma uridina substituída, isto é, uma uridina na qual um ou mais substituintes não prótons (por exemplo, alcoxi, como metóxi) tomam o lugar de um próton. Em algumas modalidades, uma uridina modificada é pseudouridina. Em algumas modalidades, uma uridina modificada é uma pseudouridina substituída, ou seja, uma pseudouridina na qual um ou mais substituintes não prótons (por exemplo, alquil, como metil) tomam o lugar de um próton. Em algumas modalidades, uma uridina modificada é uma uridina substituída, pseudouridina ou uma pseudouridina substituída.

[00153] "Posição da uridina", conforme utilizado neste documento, refere-se a uma posição em um polinucleotídeo ocupado por uma uridina ou uma uridina modificada. Assim, por exemplo, um polinucleotídeo no qual "100% das posições de uridina são uridinas modificadas" contém uma uridina modificada em todas as posições que seriam uridinas em um RNA convencional (onde todas as bases são padrão A, U, C ou G bases) da mesma sequência. A menos que indicado de outra forma, um U em uma sequência polinucleotídica de uma tabela de sequências ou listagem de sequências, ou que acompanha, esta divulgação pode ser uma uridina ou uma uridina modificada.

[00154] Como utilizado neste documento, uma primeira sequência é considerada "compreendendo uma sequência com pelo menos X% de identidade para" uma segunda sequência se um alinhamento da primeira sequência com a segunda sequência mostrar que X% ou mais das posições da segunda sequência em sua totalidade é correspondida pela primeira sequência. Por exemplo, a sequência AAGA compreende uma sequência com 100% de identidade com a sequência AAG porque um alinhamento daria 100% de identidade, pois existem correspondências para todas as três posições da segunda sequência. As diferenças entre RNA e DNA (geralmente a troca de uridina por timidina ou vice-versa) e a presença de análogos de nucleosídeos, como uridinas modificadas, não contribuem para diferenças de identidade ou complementaridade entre polinucleotídeos, desde que os nucleotídeos relevantes (como timidina, uridina ou uridina modificada) tenham o mesmo complemento (por exemplo, adenosina para toda timidina, uridina ou uridina modificada; outro exemplo é a citosina e a 5- metilcitosina, ambas com guanosina como complemento). Assim, por exemplo, a sequência 5'-AXG em que X é qualquer uridina modificada, como pseudouridina, N1-metil pseudouridina ou 5-metoxiuridina, é considerada 100% idêntica à AUG, pois ambas são perfeitamente complementares à mesma sequência (5'-CAU). Exemplos de algoritmos de alinhamento são os algoritmos Smith-Waterman e Needleman- Wunsch, que são bem conhecidos na técnica. Um versado na técnica entenderá qual escolha de algoritmo e configurações de parâmetro é apropriada para um determinado par de sequências a serem alinhadas; para sequências de comprimento e identidade geralmente semelhantes e esperadas > 50% para aminoácidos ou > 75% para nucleotídeos, o algoritmo Needleman-Wunsch com configurações padrão da interface do algoritmo Needleman-Wunsch fornecida pelo EBI no www.ebi.ac.uk servidor web é geralmente apropriado.

[00155] "mRNA" é usado aqui para se referir a um polinucleotídeo que não é DNA e compreende um quadro de leitura aberto que pode ser traduzido em um polipeptídeo (isto é, pode servir como um substrato para tradução por um ribossomo e tRNAs amino-acilados). O mRNA pode compreender uma espinha dorsal de fosfato-açúcar incluindo resíduos de ribose ou análogos dos mesmos, por exemplo, resíduos de 2'-metóxi-ribose. Em algumas modalidades, os açúcares de uma espinha dorsal de mRNA fosfato-açúcar consistem essencialmente em resíduos de ribose, resíduos de 2'-metóxi-ribose ou uma combinação dos mesmos. Em geral, os mRNAs não contêm uma quantidade substancial de resíduos de timidina (por exemplo, 0 resíduos ou menos que 30, 20, 10, 5, 4, 3 ou 2 resíduos de timidina; ou menos que 10%,

9%, 8%, 7%, 6%, 5%, 4%, 4%, 3%, 2%, 1%, 0,5%, 0,2% ou 0,1% de timidina). Um mRNA pode conter uridinas modificadas em algumas ou todas as suas posições de uridina.

[00156] Como utilizado neste documento, um "agente de ligação ao DNA guiado por RNA" significa um polipeptídeo ou complexo de polipeptídeos com atividade de ligação a RNA e DNA, ou uma subunidade de ligação ao DNA desse complexo, em que a atividade de ligação ao DNA é específica da sequência e depende da sequência do RNA. Agentes de ligação ao DNA guiados por RNA exemplificativos incluem Cas clivases/nickases e formas inativadas dos mesmos ("agentes de ligação ao DNA de dCas"). "Nuclease de Cas", também chamada de "proteína Cas", como aqui utilizada, abrange agentes de ligação ao DNA de Cas clivases, Cas nickases, e dCas DNA. Os agentes de ligação ao DNA de Cas clivases/nickases incluem um complexo Csm ou Cmr de um sistema CRISPR tipo III, a subunidade Cas10, Csm1 ou Cmr2, um complexo em cascata de um sistema CRISPR tipo I, a subunidade Cas3 do mesmo e as Cas nucleases Classe 2. Como utilizado neste documento, uma "Cas nuclease Classe 2" é um polipeptídeo de cadeia única com atividade de ligação ao DNA guiada por RNA, como uma Cas9 nuclease ou uma Cpf1 nuclease. As Cas nucleases Classe 2 incluem Cas clivases Classe 2 e Cas nickases Classe 2 (por exemplo, variantes H840A, D10A ou N863A), que possuem ainda clivases de DNA guiadas por RNA ou atividade de nickase e agentes de ligação do dCl da Classe 2, nas quais a atividade de clivase/nickase é inativada. As Cas nucleases Classe 2 incluem, por exemplo, Cas9, Cpf1, C2c1, C2c2, C2c3, HF Cas9 (por exemplo, variantes N497A, R661A, Q695A, Q926A), HypaCas9 (por exemplo, variantes N692A, M694A, Q695A, H698A), eSPCas9 1.0) (por exemplo, variantes K810A, K1003A, R1060A) e eSPCas9 (1.1) (por exemplo, variantes K848A, K1003A, R1060A) e modificações das mesmas. A proteína Cpf1, Zetsche et al., Cell, 163:1-13 (2015), é homóloga a Cas9 e contém um domínio de nuclease semelhante a RuvC. As sequências Cpf1 de Zetsche são incorporadas por referência na sua totalidade. Ver, por exemplo, Zetsche, Tabelas S1 e S3. "Cas9" inclui Spy Cas9, as variantes de Cas9 listadas aqui e equivalentes dos mesmos. Ver, por exemplo, Makarova et al., Nat Rev Microbiol, 13(11): 722-36 (2015); Shmakov et al., Molecular Cell, 60:385-397 (2015).

[00157] Como utilizado neste documento, o "teor mínimo de uridina" de um determinado quadro de leitura aberto (ORF) é o toer de uridina de um ORF que (a) usa um códon mínimo de uridina em todas as posições e (b) codifica a mesma sequência de aminoácidos que o ORF fornecido. O(s) códon(s) mínimo(s) de uridina para um dado aminoácido é o(s) códon(s) com menos uridinas (geralmente 0 ou 1, exceto um códon para fenilalanina, onde o códon mínimo de uridina possui 2 uridinas). Os resíduos de uridina modificados são considerados equivalentes às uridinas com o objetivo de avaliar o teor mínimo de uridina.

[00158] Como utilizado neste documento, o "teor mínimo de dinucleotídeo de uridina" de um determinado quadro de leitura aberto (ORF) é o menor toer possível de dinucleotídeo de uridina (UU) de um ORF que (a) usa um códon mínimo de uridina (como discutido acima) em todas as posições e (b) codifica a mesma sequência de aminoácidos que o ORF fornecido. O teor de dinucleotídeo de uridina (UU) pode ser expresso em termos absolutos como a enumeração de dinucleotídeos de UU em um ORF ou em uma base de taxa como a porcentagem de posições ocupadas pelas uridinas de dinucleotídeos de uridina (por exemplo, AUUAU teria um teor de dinucleotídeo de uridina de 40% porque 2 de 5 posições são ocupadas pelas uridinas de um dinucleotídeo de uridina). Os resíduos de uridina modificados são considerados equivalentes às uridinas com o objetivo de avaliar o teor mínimo de dinucleotídeo de uridina.

[00159] Como utilizado neste documento, o "teor mínimo de adenina" de um determinado quadro de leitura aberto (ORF) é o toer de adenina de um ORF que (a) usa um códon mínimo de adenina em todas as posições e (b) codifica a mesma sequência de aminoácidos que o ORF fornecido. O(s) códon(s) mínimo (s) de adenina para um dado aminoácido é o códon(s) com menos adeninas (geralmente 0 ou 1, exceto um códon para lisina e asparagina, onde o códon mínimo de adenina possui 2 adeninas). Os resíduos de adenina modificados são considerados equivalentes a adeninas com o objetivo de avaliar o teor mínimo de adenina.

[00160] Como utilizado neste documento, o "teor mínimo de dinucleotídeo de adenina" de um determinado quadro de leitura aberto (ORF) é o menor teor possível de dinucleotídeo de adenina (AA) de um ORF que (a) usa um códon mínimo de adenina (como discutido acima) em todas as posições e (b) codifica a mesma sequência de aminoácidos que o ORF fornecido. O teor de dinucleotídeo de adenina (AA) pode ser expresso em termos absolutos como a enumeração de dinucleotídeos de AA em um ORF ou em uma base de taxa como a porcentagem de posições ocupadas pelas adeninas de dinucleotídeos de adenina (por exemplo, a UAAUA teria um teor de dinucleotídeo de adenina de 40% porque 2 de 5 posições são ocupadas pelas adeninas de um dinucleotídeo de adenina). Os resíduos de adenina modificados são considerados equivalentes a adeninas com o objetivo de avaliar o teor mínimo de dinucleotídeo de adenina.

[00161] "RNA guia", "gRNA" e "guia" são usados aqui de forma intercambiável para se referir a um crRNA (também conhecido como RNA CRISPR) ou à combinação de um crRNA e um trRNA (também conhecido como tracrRNA). O crRNA e o trRNA podem ser associados como uma única molécula de RNA (RNA guia único, sgRNA) ou em duas moléculas de RNA separadas (RNA guia duplo, dgRNA). "RNA guia" ou "gRNA" refere-se a cada tipo. O trRNA pode ser uma sequência de ocorrência natural ou uma sequência de trRNA com modificações ou variações em comparação com as sequências de ocorrência natural.

[00162] Como utilizado neste documento, uma "sequência guia" refere-se a uma sequência dentro de um RNA guia que é complementar a uma sequência alvo e funciona para direcionar um RNA guia para uma sequência alvo para ligação ou modificação (por exemplo, clivagem) por um agente de ligação de DNA guiado por RNA. Uma "sequência guia" também pode ser referida como "sequência alvo" ou "sequência espaçadora". Uma sequência guia pode ter 20 pares de bases de comprimento, por exemplo, no caso de Streptococcus pyogenes (por exemplo, Spy Cas9) e homólogos/ortólogos de Cas9 relacionados. Sequências mais curtas ou mais longas também podem ser usadas como guias, por exemplo, 15, 16, 17, 18, 19, 21, 22, 23, 24 ou 25 nucleotídeos de comprimento. Em algumas modalidades, a sequência alvo está em um gene ou em um cromossomo, por exemplo, e é complementar à sequência guia. Em algumas modalidades, o grau de complementaridade ou identidade entre uma sequência guia e sua sequência alvo correspondente pode ser de cerca de 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%. Em algumas modalidades, a sequência guia e a região alvo podem ser 100% complementares ou idênticas. Em outras modalidades, a sequência guia e a região alvo podem conter pelo menos uma incompatibilidade. Por exemplo, a sequência guia e a sequência alvo podem conter 1, 2, 3 ou 4 incompatibilidades, em que o comprimento total da sequência alvo é pelo menos 17, 18, 19, 20 ou mais pares de bases. Em algumas modalidades, a sequência guia e a região alvo podem conter 1-4 incompatibilidades, onde a sequência guia compreende pelo menos 17, 18, 19, 20 ou mais nucleotídeos. Em algumas modalidades, a sequência guia e a região alvo podem conter 1, 2, 3 ou 4 incompatibilidades, onde a sequência guia compreende 20 nucleotídeos.

[00163] As sequências alvo das proteínas Cas incluem as cadeias positivas e negativas do DNA genômico (isto é, a sequência fornecida e o complemento inverso da sequência), pois um substrato de ácido nucleico para uma proteína Cas é um ácido nucleico de fita dupla. Por conseguinte, quando se diz que uma sequência guia é “complementar a uma sequência alvo”, deve ser entendido que a sequência guia pode direcionar um RNA guia para se ligar ao complemento reverso de uma sequência alvo. Assim, em algumas modalidades, onde a sequência guia liga o complemento reverso de uma sequência alvo, a sequência guia é idêntica a certos nucleotídeos da sequência alvo (por exemplo, a sequência alvo que não inclui o PAM), exceto a substituição de U por T na sequência guia.

[00164] Conforme utilizado neste documento, "indels" refere-se a mutações de inserção/deleção que consistem em vários nucleotídeos que são inseridos ou excluídos no sítio de quebras de fita dupla (DSBs) no ácido nucleico alvo.

[00165] Conforme utilizado neste documento, "knockdown" refere-se a uma diminuição na expressão de um produto genético específico (por exemplo, proteína, mRNA ou ambos). O knockdown de uma proteína pode ser medido detectando a proteína secretada pelo tecido ou pela população de células (por exemplo, no soro ou no meio celular) ou detectando a quantidade celular total da proteína de uma população de tecidos ou células de interesse. Os métodos para medir o knockdown do mRNA são conhecidos e incluem o sequenciamento do mRNA isolado de uma população de tecidos ou células de interesse. Em algumas modalidades, "knockdown" pode se referir a alguma perda de expressão de um produto genético específico, por exemplo, uma diminuição na quantidade de mRNA transcrito ou uma diminuição na quantidade de proteína expressa ou secretada por uma população de células (incluindo populações in vivo como as encontradas nos tecidos).

[00166] Conforme utilizado neste documento, "knockout" refere-se a uma perda de expressão de uma proteína específica em uma célula. O knockout pode ser medido detectando a quantidade de secreção de proteína de um tecido ou população de células (por exemplo, no soro ou no meio celular) ou detectando a quantidade celular total de uma proteína de um tecido ou de uma população de células. Em algumas modalidades, os métodos da divulgação "knockout" uma proteína alvo em uma ou mais células (por exemplo, em uma população de células incluindo populações in vivo, como as encontradas nos tecidos). Em algumas modalidades, um knockout não é a formação da proteína alvo mutante, por exemplo, criada por indels, mas a perda completa de expressão da proteína alvo em uma célula.

[00167] Conforme utilizado neste documento, "ribonucleoproteína" (RNP) ou "complexo RNP" refere-se a um RNA guia junto com um agente de ligação ao DNA guiado por RNA, como uma Cas nuclease, nickase, ou agente de ligação ao DNA de dCas (por exemplo, Cas9). Em algumas modalidades, o RNA guia guia o agente de ligação ao DNA guiado por RNA, como Cas9, a uma sequência alvo, e o RNA guia hibrida com e o agente se liga à sequência alvo; nos casos em que o agente é uma clivase ou uma nickase, a ligação pode ser seguida por clivagem ou corte.

[00168] Conforme utilizado neste documento, uma "sequência alvo" refere-se a uma sequência de ácido nucleico em um gene alvo que possui complementaridade com a sequência guia do gRNA. A interação da sequência alvo e a sequência guia direciona um agente de ligação ao DNA guiado por RNA para se ligar e potencialmente cortar ou clivar (dependendo da atividade do agente), dentro da sequência alvo.

[00169] Conforme utilizado neste documento, "tratamento" refere-se a qualquer administração ou aplicação de um terapêutico para doença ou distúrbio em um sujeito e inclui inibir a doença, interromper seu desenvolvimento, aliviar um ou mais sintomas da doença, curar a doença ou impedir a recorrência de um ou mais sintomas da doença. B. Polinucleotídeos e composições exemplificativas

1. mRNAs e ORFs com baixo teor de uridina

[00170] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina que varia de seu teor mínimo de uridina a cerca de 150% de seu teor mínimo de uridina. Em algumas modalidades, o teor de uridina do ORF é menor ou igual a cerca de 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102% ou 101% do seu teor mínimo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina igual ao seu teor mínimo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 150% do seu teor mínimo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 145% do seu teor mínimo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 140% do seu teor mínimo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 135% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 130% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 125% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 120% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 115% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 110% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 105% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 104% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor que ou igual a cerca de 103% do seu teor mínimo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 102% do seu teor mínimo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina menor ou igual a cerca de 101% do seu teor mínimo de uridina.

[00171] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina que varia de seu teor mínimo de dinucleotídeo de uridina a 200% de seu teor mínimo de uridina. Em algumas modalidades, o teor de dinucleotídeo de uridina do ORF é menor que ou igual a cerca de 195%, 190%, 185%, 180%, 175%, 170%, 165%, 160%, 155%, 150%, 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102% ou 101% de seu teor mínimo de dinucleotídeo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina igual ao seu teor mínimo de dinucleotídeo uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 200% do seu teor mínimo de dinucleotídeo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 195% do seu teor mínimo de dinucleotídeo de uridina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 190% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 185% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 180% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 175% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 170% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 165% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 160% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 155% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina igual ao seu teor mínimo de dinucleotídeo uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 150% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 145% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 140% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 135% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 130% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 125% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 120% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 115% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 110% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 105% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 104% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 103% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 102% do seu teor mínimo de dinucleotídeo de uridina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina menor ou igual a cerca de 101% do seu teor mínimo de dinucleotídeo de uridina.

[00172] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA, que compreende um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de uridina que varia de seu teor mínimo de dinucleotídeo de uridina até o teor de dinucleotídeo de uridina que é 90% ou menos do teor máximo de dinucleotídeo de uridina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão. Em algumas modalidades, o teor de dinucleotídeo de uridina do ORF é menor ou igual a cerca de 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35% , 30%, 25%, 20%, 15%, 10% ou 5% do teor máximo de dinucleotídeo de uridina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão.

[00173] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de trinucleotídeo de uridina que varia de 0 trinucleotídeos de uridina a 1, 2, 3, 4, 5, 6, 7 , 8, 9, 10, 20, 30, 40 ou 50 trinucleotídeos de uridina (onde uma quantidade maior de uridinas conta como o número de segmentos únicos de três uridinas dentro dele, por exemplo, um tetranucleotídeo de uridina contém dois trinucleotídeos de uridina, um pentanucleotídeo de uridina contém três trinucleotídeos de uridina, etc.). Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de trinucleotídeo de uridina que varia de 0% de trinucleotídeos de uridina a 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 1,5% ou 2% de uridina, em que o teor percentual de trinucleotídeos de uridina é calculado como a porcentagem de posições em uma sequência que são ocupadas por uridinas que fazem parte de um trinucleotídeo de uridina (ou maior número de uridinas), de modo que as sequências UUUAAA e UUUUAAAA tenham um teor de 50% de trinucleotídeo de uridina. Por exemplo, em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 2%. Por exemplo, em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 1,5%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 1%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,9%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,8%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,7%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,6%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,5%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,4%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,3%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,2%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de uridina menor ou igual a 0,1%. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) que não contém trinucleotídeos de uridina.

[00174] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA, que compreende um quadro de leitura aberto (ORF) com um teor de trinucleotídeo de uridina que varia de seu teor mínimo de trinucleotídeo de uridina até o teor de trinucleotídeo de uridina que é 90% ou menos do teor máximo de trinucleotídeo de uridina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão. Em algumas modalidades, o teor de trinucleotídeo de uridina do ORF é menor ou igual a cerca de 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35% , 30%, 25%, 20%, 15%, 10% ou 5% do teor máximo de trinucleotídeo de uridina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão.

[00175] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com homopolímeros mínimos de nucleotídeos, por exemplo, cadeias repetitivas dos mesmos nucleotídeos. Por exemplo, em algumas modalidades, ao selecionar um códon de uridina mínimo dos códons listados na Tabela 1, um mRNA é construído selecionando os códons de uridina mínimos que reduzem o número e o comprimento dos homopolímeros de nucleotídeos, por exemplo, selecionando GCA em vez de GCC para alanina ou selecionando GGA em vez de GGG para glicina ou selecionando AAG em vez de AAA para lisina.

[00176] Um determinado ORF pode ser reduzido no teor de uridina ou no teor de dinucleotídeo de uridina ou no teor de trinucleotídeo de uridina, por exemplo, usando códons mínimos de uridina em uma porção suficiente do ORF. Por exemplo, uma sequência de aminoácidos para um agente de ligação ao DNA guiado por RNA pode ser retrotraduzida em uma sequência de ORF convertendo aminoácidos em códons, em que parte ou todo o ORF usa os códons de uridina mínimos exemplificativos mostrados abaixo. Em algumas modalidades, pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% ou 100% dos códons no ORF são códons listados na Tabela 1. Tabela 1. Códons mínimos de uridina exemplificativos Aminoácido Códon mínimo de uridina A Alanina GCA ou GCC ou GCG G Glicina GGA ou GGC ou GGG V Valina GUC ou GUA ou GUG

Aminoácido Códon mínimo de uridina D Ácido aspártico GAC E Ácido glutâmico GAA ou GAG I Isoleucina AUC ou AUA T Treonina ACA ou ACC ou ACG N Asparagina AAC K Lisina AAG ou AAA S Serina AGC R Arginina AGA ou AGG L Leucina CUG ou CUA ou CUC P Prolina CCG ou CCA ou CCC H Histidina CAC Q Glutamina CAG ou CAA F Fenilalanina UUC Y Tirosina UAC C Cisteína UGC W Triptofano UGG M Metionina AUG

[00177] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) que consiste em um conjunto de códons dos quais pelo menos cerca de 75%, 80%, 85%, 90%, 95 %, 98%, 99% ou 100% dos códons são códons listados na Tabela 1.

2. mRNAs e ORFs com baixo teor de adenina

[00178] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina que varia de seu teor mínimo de adenina a cerca de 150% de seu teor mínimo de adenina. Em algumas modalidades, o teor de adenina do ORF é menor ou igual a cerca de 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102% ou 101% do seu teor mínimo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina igual ao seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 150% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor que ou igual a cerca de 145% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 140% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 135% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor que ou igual a cerca de 130% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 125% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 120% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor que ou igual a cerca de 115% do seu teor mínimo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 110% do seu teor mínimo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 105% do seu teor mínimo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor que ou igual a cerca de 104% do seu teor mínimo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 103% do seu teor mínimo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 102% do seu teor mínimo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de adenina menor ou igual a cerca de 101% do seu teor mínimo de adenina.

[00179] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina que varia de seu teor mínimo de adenina a 200% de seu teor mínimo de dinucleotídeo de adenina. Em algumas modalidades, o teor de adenina de uridina do ORF é menor que ou igual a cerca de 195%, 190%, 185%, 180%, 175%, 170%, 165%, 160%, 155%, 150%, 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%,

102% ou 101% de seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina igual ao seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 200% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 195% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 190% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 185% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 180% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 175% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 170% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 165% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 160% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 155% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 150% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 145% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 140% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 135% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 130% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 125% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 120% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 115% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 110% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 105% do seu teor mínimo de dinucleotídeo de adenina.

Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 104% do seu teor mínimo de dinucleotídeo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 103% do seu teor mínimo de dinucleotídeo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 102% do seu teor mínimo de dinucleotídeo de adenina. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina menor ou igual a cerca de 101% do seu teor mínimo de dinucleotídeo de adenina.

[00180] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA, que compreende um quadro de leitura aberto (ORF) com um teor de dinucleotídeo de adenina que varia de seu teor mínimo de dinucleotídeo de adenina até o teor de dinucleotídeo de uridina que é 90% ou menos do teor máximo de dinucleotídeo de adenina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão. Em algumas modalidades, o teor de dinucleotídeo de adenina do ORF é menor ou igual a cerca de 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% ou 5% do teor máximo de dinucleotídeo de adenina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão.

[00181] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de trinucleotídeo de adenina que varia de 0 trinucleotídeos de adenina a 1, 2, 3, 4, 5, 6, 7 , 8, 9, 10, 20, 30, 40 ou 50 trinucleotídeos de adenina (onde uma quantidade maior de adeninas conta como o número de segmentos únicos de três adeninas dentro dele, por exemplo, um tetranucleotídeo de adenina contém dois trinucleotídeos de adenina, um pentanucleotídeo de adenina contém três trinucleotídeos de adenina, etc.). Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de trinucleotídeo de uridina que varia de 0% de trinucleotídeos de adenina a 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 1,5% ou 2% de adenina, em que o teor percentual de trinucleotídeos de adenina é calculado como a porcentagem de posições em uma sequência que são ocupadas por adenina que fazem parte de um trinucleotídeo de adenina (ou maior número de adenina), de modo que as sequências UUUAAA e UUUUAAAA tenham um teor de 50% de trinucleotídeo de adenina.

Por exemplo, em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 2%. Por exemplo, em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 1,5%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 1%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,9%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,8%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,7%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,6%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,5%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,4%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,3%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,2%. Em algumas modalidades, o ORF tem um teor de trinucleotídeo de adenina menor ou igual a 0,1%. Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) que não contém trinucleotídeos de adenina.

[00182] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com homopolímeros mínimos de nucleotídeos, por exemplo, cadeias repetitivas dos mesmos nucleotídeos. Por exemplo, em algumas modalidades, ao selecionar um códon de adenina mínimo dos códons listados na Tabela 1, um mRNA é construído selecionando os códons de adenina mínimos que reduzem o número e o comprimento dos homopolímeros de nucleotídeos, por exemplo, selecionando GCA em vez de GCC para alanina ou selecionando GGA em vez de GGG para glicina ou selecionando AAG em vez de AAA para lisina.

[00183] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA, que compreende um quadro de leitura aberto (ORF) com um teor de trinucleotídeo de adenina que varia de seu teor mínimo de trinucleotídeo de adenina até o teor de trinucleotídeo de uridina que é 90% ou menos do teor máximo de trinucleotídeo de adenina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão. Em algumas modalidades, o teor de trinucleotídeo de adenina do ORF é menor ou igual a cerca de 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35% , 30%, 25%, 20%, 15%, 10% ou 5% do teor máximo de trinucleotídeo de adenina de uma sequência de referência que codifica a mesma proteína que o mRNA em questão.

[00184] Um determinado ORF pode ser reduzido no teor de adenina ou no teor de dinucleotídeo de adenina ou no teor de trinucleotídeo de adenina, por exemplo, usando códons de adenina mínimos em uma porção suficiente do ORF. Por exemplo, uma sequência de aminoácidos para um agente de ligação ao DNA guiado por RNA pode ser retrotraduzida em uma sequência de ORF convertendo aminoácidos em códons, em que parte ou todo o ORF usa os códons de adenina mínimos exemplificativos mostrados abaixo. Em algumas modalidades, pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% ou 100% dos códons no ORF são códons listados na Tabela 2. Tabela 2. Códons mínimos de adenina exemplificativos Aminoácido Códon mínimo de adenina A Alanina GCU ou GCC ou GCG G Glicina GGU ou GGC ou GGG V Valina GUC ou GUU ou GUG D Ácido aspártico GAC ou GAU E Ácido glutâmico GAG I Isoleucina AUC ou AUU T Treonina ACU ou ACC ou ACG N Asparagina AAC ou AAU K Lisina AAG S Serina UCU ou UCC ou UCG R Arginina CGU ou CGC ou CGG L Leucina CUG ou CUC ou CUU P Prolina CCG ou CCU ou CCC H Histidina CAC ou CAU Q Glutamina CAG F Fenilalanina UUC ou UUU Y Tirosina UAC ou UAU C Cisteína UGC ou UGU W Triptofano UGG M Metionina AUG

[00185] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) que consiste em um conjunto de códons dos quais pelo menos cerca de 75%, 80%, 85%, 90%, 95 %, 98%, 99% ou 100% dos códons são códons listados na Tabela 2.

3. mRNAs e ORFs com baixo teor de adenina e baixo teor de uridina

[00186] Na medida do possível, qualquer um dos recursos descritos acima em relação ao baixo teor de adenina pode ser combinado com qualquer um dos recursos descritos acima em relação ao baixo teor de uridina. Por exemplo, um mRNA pode ser fornecido que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) com um teor de uridina que varia de seu teor mínimo de uridina a cerca de 150% de seu teor mínimo de uridina (por exemplo, um teor de uridina do ORF é menor ou igual a cerca de 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102% ou 101% de seu teor mínimo de uridina) e um teor de adenina que varia de seu teor mínimo de adenina a cerca de 150% de seu teor mínimo de adenina (por exemplo, menor ou igual a cerca de 145%, 140%, 135%, 130%, 125%, 120 %, 115%, 110%, 105%, 104%, 103%, 102% ou 101% do seu teor mínimo de adenina). O mesmo acontece com os dinucleotídeos de uridina e adenina. Da mesma forma, o teor de nucleotídeos de uridina e dinucleotídeos de adenina na ORF pode ser como estabelecido acima. Da mesma forma, o teor de dinucleotídeos de uridina e nucleotídeos de adenina na ORF pode ser como estabelecido acima.

[00187] Um determinado ORF pode ser reduzido no teor de nucleotídeo de uridina e adenina e/ou dinucleotídeo, por exemplo, usando códons mínimos de uridina e adenina em uma porção suficiente do ORF. Por exemplo, uma sequência de aminoácidos para um agente de ligação ao DNA guiado por RNA pode ser retrotraduzida em uma sequência de ORF convertendo aminoácidos em códons, em que parte ou todo o ORF usa os códons de adenina e uridina mínimos exemplificativos mostrados abaixo. Em algumas modalidades, pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% ou 100% dos códons no ORF são códons listados na Tabela 3. Tabela 3. Códons mínimos de uridina e adenina exemplificativos Aminoácido Códon mínimo de uridina A Alanina GCC ou GCG G Glicina GGC ou GGG V Valina GUC ou GUG D Ácido aspártico GAC E Ácido glutâmico GAG I Isoleucina AUC T Treonina ACC ou ACG N Asparagina AAC K Lisina AAG S Serina AGC ou UCC ou UCG R Arginina CGC ou CGG L Leucina CUG ou CUC P Prolina CCG ou CCC H Histidina CAC Q Glutamina CAG F Fenilalanina UUC Y Tirosina UAC C Cisteína UGC W Triptofano UGG M Metionina AUG

[00188] Em algumas modalidades, é fornecido um mRNA que codifica um agente de ligação ao DNA guiado por RNA compreendendo um quadro de leitura aberto (ORF) que consiste em um conjunto de códons dos quais pelo menos cerca de 75%, 80%, 85%, 90%, 95 %, 98%, 99% ou 100% dos códons são códons listados na Tabela 3. Como pode ser visto na Tabela 3, cada um dos três códons de serina listados contém um A ou um U. Em algumas modalidades, a minimização da uridina é priorizada usando códons AGC para serina. Em algumas modalidades, a minimização de adenina é priorizada usando os códons UCC e/ou UCG para serina.

4. Códons que aumentam a tradução e/ou correspondem a tRNAs altamente expressos; conjuntos de códons exemplificativos

[00189] Em algumas modalidades, o mRNA compreende um ORF com códons que aumentam a tradução em um mamífero, como um humano. Em outras modalidades, o mRNA compreende uma ORF com códons que aumentam a tradução em um órgão, como o fígado, do mamífero, por exemplo, um humano. Em outras modalidades, o mRNA compreende um ORF com códons que aumentam a tradução em um tipo de célula, como um hepatócito, do mamífero, por exemplo, um humano. Um aumento na tradução em um mamífero, tipo de célula, órgão de um mamífero, humano, órgão de um humano, etc., pode ser determinado em relação à extensão da tradução da sequência do tipo selvagem da ORF ou em relação a uma ORF com uma distribuição de códons correspondente à distribuição de códons do organismo do qual o ORF foi derivado ou do organismo que contém o ORF mais semelhante no nível de aminoácidos, como S. pyogenes, S. aureus, outro procarionte, conforme o caso para Cas nucleases derivadas em procariotas, como as Cas nucleases de outros procariotas descritos abaixo. Alternativamente, em algumas modalidades, um aumento na tradução para uma sequência Cas9 em um mamífero, tipo de célula, órgão de um mamífero, humano, órgão de um humano, etc., é determinado em relação à tradução de um ORF com a sequência da SEQ ID NO: 5 com todos os demais iguais, incluindo quaisquer mutações pontuais aplicáveis, domínios heterólogos e semelhantes. Os códons úteis para aumentar a expressão em um ser humano, incluindo o fígado humano e os hepatócitos humanos, podem ser códons correspondentes a tRNAs altamente expressos no fígado/hepatócitos humanos, discutidos em Dittmar KA, PLos Genetics 2(12): e221 (2006). Em algumas modalidades, pelo menos cerca de 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons que correspondem a tRNAs altamente expressos (por exemplo, o tRNA de maior expressão para cada aminoácido) em um mamífero, como um humano. Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons correspondentes a tRNAs altamente expressos (por exemplo, o tRNA expresso mais alto para cada aminoácido) em um órgão de mamífero, como um órgão humano. Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons que correspondem a tRNAs altamente expressos (por exemplo, o tRNA de maior expressão para cada aminoácido) em um fígado de mamífero, como um fígado de humano. Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons correspondentes a tRNAs altamente expressos (por exemplo, o tRNA expresso mais alto para cada aminoácido) em um hepatócito de mamífero, tal como um hepatócito humano.

[00190] Alternativamente, podem ser utilizados códons correspondentes a tRNAs altamente expressos em um organismo (por exemplo, humano) em geral.

[00191] Qualquer uma das abordagens anteriores para a seleção de códons pode ser combinada com os códons mínimos de uridina e/ou adenina mostrados acima, por exemplo, iniciando com os códons da Tabela 1, 2 ou 3 e, em seguida, quando mais de uma opção estiver disponível, usando o códon que corresponde a um tRNA mais altamente expresso, seja no organismo (por exemplo, humano) em geral, ou em um tipo de órgão ou célula de interesse, como fígado ou hepatócitos

(por exemplo, fígado humano ou hepatócitos humanos).

[00192] Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons de um conjunto de códons mostrado em Tabela 4 (por exemplo, o conjunto de códons U1 baixo, A baixo ou A/U baixo). Os códons nos conjuntos U1 baixo, G baixo, C baixo, A e baixo A/U usam códons que minimizam os nucleotídeos indicados enquanto também usam códons correspondentes a tRNAs altamente expressos, onde mais de uma opção está disponível. Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons do conjunto de códon U1 baixo mostrado na Tabela

4. Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons do conjunto de códons A baixo mostrado na Tabela 4. Em algumas modalidades, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% dos códons em um ORF são códons do conjunto de códon A/U baixo mostrado na Tabela 4. Tabela 4. Conjuntos de Códons Exemplificativos U baixo 1 U baixo 2 U alto G baixo C baixo A baixo A/U baixo Meia-vida longa Aminoácido Gly GGC GGG GGT GGC GGA GGC GGC GGT Glu GAG GAA GAA GAA GAG GAG GAG GAA Asp GAC GAC GAT GAC GAT GAC GAC GAC Val GTG GTA GTT GTC GTG GTG GTG GTC Ala CGC GCG GCT CGC GCT CGC CGC CGC Arg AGA CGA CGT AGA AGA CGG CGG AGA Ser AGC AGC TCT TCC AGT TCC AGC TCT Lys AAG AAA AAA AAA AAG AAG AAG AAG Asn AAC AAC AAT AAC AAT AAC AAC AAC Met ATG ATG ATG ATG AGT ATG ATG ATG Ile ATC ATA ATT ATC ATT ATC ATC ATC Thr ACC ACG ACT ACC ACA ACC ACC ACC Trp TGG TGG TGG TGG TGG TGG TGG TGG Cys TGC TGC TGT TGC TGT TGC TGC TGC

U baixo 1 U baixo 2 U alto G baixo C baixo A baixo A/U baixo Meia-vida longa Aminoácido Tyr TAC TAC TAT TAC TAT TAC TAC TAC Leu CTG CTA TTA CTC TTG CTG CTG TTG Phe TTC TTC TTT TTC TTT TTC TTC TTC Gln CAG CAA CAA CAA CAG CAG CAG CAA His CAC CAC CAT CAC CAT CAC CAC CAC

5. Agente de ligação ao DNA guiado por RNA codificado

[00193] Em algumas modalidades, o agente de ligação ao DNA guiado por RNA é uma Cas nuclease Classe 2. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA possui atividade de clivase, que também pode ser referida como atividade de endonuclease de fita dupla. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA compreende uma Cas nuclease, como uma Cas nuclease Classe 2 (que pode ser, por exemplo, uma Cas nuclease do Tipo II, V ou VI). As Cas nucleases Classe 2 incluem, por exemplo, proteínas Cas9, Cpf1, C2c1, C2c2 e C2c3 e modificações das mesmas. Exemplos de nucleases Cas9 incluem aquelas dos sistemas CRISPR do tipo II de S. pyogenes, S. aureus e outros procariontes (ver, por exemplo, a lista no próximo parágrafo) e versões modificadas (por exemplo, engenheiradas ou mutantes). Ver, por exemplo, US2016/0312198 A1; US 2016/0312199 A1. Outros exemplos de Cas nucleases incluem um complexo Csm ou Cmr de um sistema CRISPR do tipo III ou a subunidade Cas10, Csm1 ou Cmr2 do mesmo; e um complexo Cascade de um sistema CRISPR do tipo I ou a sua subunidade Cas3 do mesmo. Em algumas modalidades, a Cas nuclease pode ser de um sistema Tipo IIA, Tipo IIB ou Tipo IIC. Para discussão de vários sistemas CRISPR e Cas nucleases, ver, por exemplo, Makarova et al., NAT. REV. MICROBIOL. 9:467-477 (2011); Makarova et al., NAT. REV. MICROBIOL, 13: 722-36 (2015); Shmakov et al., MOLECULAR CELL, 60:385-397 (2015).

[00194] As espécies exemplificativas não limitativas das quais a Cas nuclease pode ser derivada incluem Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Listeria innocua, Lactobacillus gasseri, Francisella novicida, Wolinella succinogenes, Sutterella wadsworthensis, Gammaproteobacterium, Neisseria meningitidis, Campylobacter jejuni, Pasteurella multocida, Fibrobacter succinogene, Rhodospirillum rubrum, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Lactobacillus buchneri, Treponema denticola, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, Streptococcus pasteurianus, Neisseria cinerea, Campylobacter lari, Parvibaculum lavamentivorans, Corynebacterium diphtheria, Acidaminococcus sp., Lachnospiraceae bacterium ND2006, e Acaryochloris marina.

[00195] Em algumas modalidades, a Cas nuclease é a Cas9 nuclease de Streptococcus pyogenes. Em algumas modalidades, a Cas nuclease é a Cas9 nuclease de Streptococcus thermophilus. Em algumas modalidades, a Cas nuclease é a Cas9 nuclease de Neisseria meningitidis. Em algumas modalidades, a Cas nuclease é a Cas9 nuclease de Staphylococcus aureus. Em algumas modalidades, a Cas nuclease é a Cpf1 nuclease de Francisella novicida. Em algumas modalidades, a Cas nuclease é a Cpf1 nuclease de Acidaminococcus sp. Em algumas modalidades, a Cas nuclease é a Cpf1 nuclease de Lachnospiraceae bacterium ND2006. Em outras modalidades, a Cas nuclease é a Cpf1 nuclease de Francisella tularensis, Lachnospiraceae bacterium, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium, Parcubacteria bacterium, Smithella, Acidaminococcus, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi, Leptospira inadai, Porphyromonas crevioricanis, Prevotella disiens, ou Porphyromonas macacae. Em certas modalidades, a Cas nuclease é uma Cpf1 nuclease de um Acidaminococcus ou Lachnospiraceae.

[00196] Cas9 do tipo selvagem possui dois domínios de nuclease: RuvC e HNH. O domínio RuvC cliva a fita de DNA não alvo, e o domínio HNH cliva a fita alvo de DNA. Em algumas modalidades, a Cas9 nuclease compreende mais de um domínio RuvC e/ou mais de um domínio HNH. Em algumas modalidades, a Cas9 nuclease é uma Cas9 do tipo selvagem. Em algumas modalidades, a Cas9 é capaz de induzir uma quebra de fita dupla no DNA alvo. Em certas modalidades, a Cas nuclease pode clivar dsDNA, pode clivar uma fita de dsDNA ou pode não ter atividade de clivase ou nickase de DNA. Uma sequência de aminoácidos Cas9 exemplificativa é fornecida como SEQ ID NO: 3. Uma sequência ORF de mRNA de Cas9 exemplificativa, que inclui códons de início e parada, é fornecida como SEQ ID NO: 4. Uma sequência de codificação de mRNA de Cas9 exemplificativa, adequada para inclusão em uma proteína de fusão, é fornecida como SEQ ID NO: 10.

[00197] Em algumas modalidades, são utilizadas Cas nucleases quiméricas, em que um domínio ou região da proteína é substituído por uma porção de uma proteína diferente. Em algumas modalidades, um domínio de Cas nuclease pode ser substituído por um domínio de uma nuclease diferente, como Fok1. Em algumas modalidades, uma Cas nuclease pode ser uma nuclease modificada.

[00198] Em outras modalidades, a Cas nuclease pode ser de um sistema CRISPR/Cas de Tipo I. Em algumas modalidades, a Cas nuclease pode ser um componente do complexo Cascade de um sistema CRISPR/Cas Tipo I. Em algumas modalidades, a Cas nuclease pode ser uma proteína Cas3. Em algumas modalidades, a Cas nuclease pode ser de um sistema CRISPR/Cas de Tipo III. Em algumas modalidades, a Cas nuclease pode ter uma atividade de clivagem de RNA.

[00199] Em algumas modalidades, o agente de ligação ao DNA guiado por RNA possui atividade de nickase de fita única, isto é, pode cortar uma fita de DNA para produzir uma quebra de fita única, também conhecida como "corte". Em algumas modalidades, o agente de ligação ao DNA guiado por RNA compreende uma Cas nickase. Uma nickase é uma enzima que cria um corte no dsDNA, isto é, corta uma fita, mas não a outra da dupla hélice do DNA. Em algumas modalidades, uma Cas nickase é uma versão de uma Cas nuclease (por exemplo, uma Cas nuclease discutida acima) na qual um sítio ativo endonucleolítico é inativado, por exemplo, por uma ou mais alterações (por exemplo, mutações pontuais) em um domínio catalítico. Ver, por exemplo, Patente US 8.889.356 para discussão de Cas nickases e alterações exemplificativas no domínio catalítico. Em algumas modalidades, uma Cas nickase como uma Cas9 nickase tem um domínio RuvC ou HNH inativado. Uma sequência de aminoácidos Cas9 nickase exemplificativa é fornecida como SEQ ID NO: 6. Uma sequência ORF de mRNA de Cas9 nickase exemplificativa, que inclui códons de início e parada, é fornecida como SEQ ID NO: 7. Uma sequência de codificação de mRNA de Cas9 nickase exemplificativa, adequada para inclusão em uma proteína de fusão, é fornecida como SEQ ID NO: 11.

[00200] Em algumas modalidades, o agente de ligação ao DNA guiado por RNA é modificado para conter apenas um domínio de nuclease funcional. Por exemplo, a proteína do agente pode ser modificada de modo que um dos domínios da nuclease seja mutado ou completamente ou parcialmente excluído para reduzir sua atividade de clivagem de ácido nucleico. Em algumas modalidades, uma nickase é usada tendo um domínio RuvC com atividade reduzida. Em algumas modalidades, uma nickase é usada tendo um domínio RuvC inativo. Em algumas modalidades, uma nickase é usada tendo um domínio HNH com atividade reduzida. Em algumas modalidades, uma nickase é usada tendo um domínio HNH inativo.

[00201] Em algumas modalidades, um aminoácido conservado dentro de um domínio de nuclease da proteína Cas é substituído para reduzir ou alterar a atividade da nuclease. Em algumas modalidades, uma Cas nuclease pode compreender uma substituição de aminoácidos no domínio da RuvC nuclease ou semelhante a RuvC. Substituições de aminoácidos exemplificativas no domínio da RuvC nuclease ou semelhante a RuvC incluem D10A (com base na proteína Cas9 de S. pyogenes ). Ver, por exemplo, Zetsche et al. (2015) Cell Oct 22:163(3): 759-771. Em algumas modalidades, a Cas nuclease pode compreender uma substituição de aminoácidos no domínio da HNH nuclease ou semelhante a HNH. Substituições de aminoácidos exemplificativos no domínio da HNH nuclease ou semelhante a HNH incluem E762A, H840A, N863A, H983A e D986A (com base na proteína Cas9 de S. pyogenes). Ver, por exemplo, Zetsche et al. (2015). Outras substituições de aminoácidos exemplificativas incluem D917A, E1006A e D1255A (com base na sequência de Francisella novicida U112 Cpf1 (FnCpf1) (UniProtKB - A0Q7Q2 (CPF1_FRATN)).

[00202] Em algumas modalidades, um mRNA que codifica uma nickase é fornecido em combinação com um par de RNAs guia que são complementares às fitas de sentido e antissentido da sequência alvo, respectivamente. Nesta modalidade, os RNAs guia direcionam a nickase para uma sequência alvo e introduzem um DSB gerando um nick em fitas opostas da sequência alvo (isto é, duplo corte). Em algumas modalidades, o uso de duplo corte pode melhorar a especificidade e reduzir os efeitos fora do alvo. Em algumas modalidades, uma nickase é usada junto com dois RNAs guia separados, direcionando fitas opostas de DNA, para produzir um corte duplo no DNA alvo. Em algumas modalidades, uma nickase é usada junto com dois RNAs guia separados que são selecionados para estarem próximos para produzir um corte duplo no DNA alvo.

[00203] Em algumas modalidades, o agente de ligação ao DNA guiado por RNA carece de atividade de clivase e nickase. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA compreende um polipeptídeo de ligação ao DNA de dCas. Um polipeptídeo dCas possui atividade de ligação ao DNA, enquanto essencialmente carece de atividade catalítica (clivase/nickase). Em algumas modalidades, o polipeptídeo dCas é um polipeptídeo dCas9. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA sem atividade de clivase e nickase ou o polipeptídeo de ligação a dCas é uma versão de uma nuclease Cas (por exemplo, uma nuclease Cas discutida acima) na qual seus sítios ativos endonucleolíticos são inativados, por exemplo, por uma ou mais alterações (por exemplo, mutações pontuais) em seus domínios catalíticos. Ver, por exemplo, US 2014/0186958 A1; US 2015/0166980 A1. Uma sequência de aminoácidos dCas9 exemplificativa é fornecida como SEQ ID NO: 8. Uma sequência ORF de mRNA de dCas9 exemplificativa, que inclui códons de início e parada, é fornecida como SEQ ID NO: 9. Uma sequência de codificação de mRNA de dCas9 exemplificativa, adequada para inclusão em uma proteína de fusão, é fornecida como SEQ ID NO: 12.

6. Domínios funcionais heterólogos; sinais de localização nuclear

[00204] Em algumas modalidades, o agente de ligação ao DNA guiado por RNA compreende um ou mais domínios funcionais heterólogos (por exemplo, é ou compreende um polipeptídeo de fusão).

[00205] Em algumas modalidades, o domínio funcional heterólogo pode facilitar o transporte do agente de ligação ao DNA guiado por RNA para o núcleo de uma célula. Por exemplo, o domínio funcional heterólogo pode ser um sinal de localização nuclear (NLS). Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com 1-10 NLS(s). Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com 1-5 NLS(s). Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com um NLS. Quando um NLS é usado, o NLS pode ser ligado no N-terminal ou no C-terminal da sequência do agente de ligação ao DNA guiada por RNA. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido no C-terminal com pelo menos um NLS. Um NLS também pode ser inserido na sequência do agente de ligação ao DNA guiado por RNA. Em outras modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com mais de um NLS. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com 2, 3, 4 ou 5 NLSs. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com dois NLSs. Em certas circunstâncias, os dois NLSs podem ser os mesmos (por exemplo, dois SV40 NLSs) ou diferentes. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA é fundido a duas sequências SV40 NLS ligadas no terminal carbóxi. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com dois NLSs, um ligado no N-terminal e um no C- terminal. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com 3 NLSs. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser fundido com nenhum NLS. Em algumas modalidades, o NLS pode ser uma sequência monopartida, como, por exemplo, o SV40 NLS, PKKKRKV (SEQ ID NO: 78) ou PKKKRRV (SEQ ID NO: 90). Em algumas modalidades, o NLS pode ser uma sequência bipartida, como o NLS da nucleoplasmina, KRPAATKKAGQAKKKK (SEQ ID NO: 91). Em algumas modalidades, a sequência NLS pode compreender LAAKRSRTT (SEQ ID NO: 79), QAAKRSRTT (SEQ ID NO: 80), PAPAKRERTT (SEQ ID NO: 81), QAAKRPRTT (SEQ ID NO: 82), RAAKRPRTT (SEQ ID NO : 83), AAAKRSWSMAA (SEQ ID NO: 84), AAAKRVWSMAF (SEQ ID NO: 85), AAAKRSWSMAF (SEQ ID NO: 86), AAAKRKYFAA (SEQ ID NO: 87), RAAKRKAFAA (SEQ ID NO: 88) ou RAAKRKYFAV (SEQ ID NO: 89). Em uma modalidade específica, um único PKKKRKV (SEQ ID NO: 78) NLS pode ser ligado no C-terminal do agente de ligação ao DNA guiado por RNA. Um ou mais ligantes são opcionalmente incluídos no sítio de fusão. Em algumas modalidades, um ou mais NLS(s) de acordo com qualquer uma das modalidades anteriores estão presentes no agente de ligação ao DNA guiado por RNA em combinação com um ou mais domínios funcionais heterólogos adicionais, como qualquer um dos domínios funcionais heterólogos descritos abaixo.

[00206] Em algumas modalidades, o domínio funcional heterólogo pode ser capaz de modificar a meia-vida intracelular do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, a meia-vida do agente de ligação ao DNA guiado por RNA pode ser aumentada. Em algumas modalidades, a meia-vida do agente de ligação ao DNA guiado por RNA pode ser reduzida. Em algumas modalidades, o domínio funcional heterólogo pode ser capaz de aumentar a estabilidade do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, o domínio funcional heterólogo pode ser capaz de reduzir a estabilidade do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, o domínio funcional heterólogo pode atuar como um peptídeo sinal para degradação de proteínas. Em algumas modalidades, a degradação de proteínas pode ser mediada por enzimas proteolíticas, como, por exemplo, proteassomas, proteases lisossômicas ou proteases de calpaína. Em algumas modalidades, o domínio funcional heterólogo pode compreender uma sequência PEST. Em algumas modalidades, o agente de ligação ao DNA guiado por RNA pode ser modificado pela adição de ubiquitina ou uma cadeia de polubiquitina. Em algumas modalidades, a ubiquitina pode ser uma proteína do tipo ubiquitina (UBL). Exemplos não limitativos de proteínas do tipo ubiquitina incluem modificador pequeno do tipo ubiquitina (SUMO), proteína reativa cruzada da ubiquitina (UCRP, também conhecida como gene 15 estimulado por interferon-15 (ISG15)), modificador-1 relacionado à ubiquitina (URM1), proteína-8 desregulada no desenvolvimento expressa em células precursoras dos neurônios (NEDD8, também chamada Rub1 em S. cerevisiae), associada ao antígeno leucocitário humano F (FAT10), autofagia-8 (ATG8) e -12 (ATG12), proteína semelhante a Fau ubiquitina (FUB1), UBL ancorado na membrana (MUB), modificador de dobra de ubiquitina-1 (UFM1) e proteína-5 semelhante à ubiquitina (UBL5).

[00207] Em algumas modalidades, o domínio funcional heterólogo pode ser um domínio marcador. Exemplos não limitativos de domínios marcadores incluem proteínas fluorescentes, marcadores de purificação, marcadores de epítopos e sequências de genes repórteres. Em algumas modalidades, o domínio marcador pode ser uma proteína fluorescente. Exemplos não limitativos de proteínas fluorescentes adequadas incluem proteínas fluorescentes verdes (por exemplo, GFP, GFP-2, tagGFP, turboGFP, sfGFP, EGFP, Esmeralda, Verde Azami, Verde Azami Monomérico, CopGFP, AceGFP, ZsGreen1), proteínas fluorescentes amarelas (por exemplo, YFP, EYFP, Citrina, Vênus, YPet, PhiYFP, ZsYellow1), proteínas fluorescentes azuis (por exemplo, EBFP, EBFP2, Azurita, mKalamal, GFPuv, Safira, Safira-T), proteínas fluorescentes cianas (por exemplo, ECFP, cerúleo, CyPet, AmCyan1, Midoriishi-Cyan), proteínas fluorescentes vermelhas (por exemplo, mKate, mKate2, mPlum, monômero DsRed, mCherry, mRFP1, DsRed- Express, DsRed2, DsRed-monômero, HcRed-Tandem, HcRed1, AsRed2, eRedberry2, mStrawberry, Jred) e proteínas fluorescentes laranjas (mOrange, mKO, Kusabira-Orange, Komabira-Monomérica- Orange, mTangerina, tdTomato) ou qualquer outra proteína fluorescente adequada. Em outras modalidades, o domínio marcador pode ser uma etiqueta de purificação e/ou uma etiqueta de epítopo. Etiquetas exemplificativas não limitativas incluem glutationa-S- transferase (GST), proteína de ligação à quitina (CBP), proteína de ligação à maltose (MBP), tioredoxina (TRX), poli (NANP), etiqueta de purificação por afinidade em tandem (TAP), myc, AcV5 , AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis, 8xHis, proteína transportadora de biotina carboxil (BCCP), poli-His e calmodulina. Genes repórter exemplificativos não limitativos incluem glutationa-S-transferase (GST), peroxidase de rábano silvestre (HRP), cloranfenicol acetiltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase ou proteínas fluorescentes.

[00208] Em modalidades adicionais, o domínio funcional heterólogo pode direcionar o agente de ligação ao DNA guiado por RNA para uma organela, tipo de célula, tecido ou órgão específico. Em algumas modalidades, o domínio funcional heterólogo pode direcionar o agente de ligação ao DNA guiado por RNA para mitocôndrias.

[00209] Em outras modalidades, o domínio funcional heterólogo pode ser um domínio efetor. Quando o agente de ligação ao DNA guiado por RNA é direcionado para sua sequência alvo, por exemplo, quando uma Cas nuclease é direcionada para uma sequência alvo por um gRNA, o domínio efetor pode modificar ou afetar a sequência alvo. Em algumas modalidades, o domínio efetor pode ser escolhido a partir de um domínio de ligação de ácido nucleico, um domínio nuclease (por exemplo, um domínio nuclease não Cas), um domínio de modificação epigenética, um domínio de ativação transcricional ou um domínio repressor transcricional. Em algumas modalidades, o domínio funcional heterólogo é uma nuclease, como uma nuclease FokI. Ver, por exemplo, Patente US 9.023.649. Em algumas modalidades, o domínio funcional heterólogo é um ativador ou repressor da transcrição. Ver, por exemplo, Qi et al., “Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression,” Cell 152:1173-83 (2013); Perez-Pinera et al., “RNA-guided gene activation by CRISPR-Cas9- based transcription factors,” Nat. Methods 10:973-6 (2013); Mali et al., “CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering,” Nat. Biotechnol. 31:833-8 (2013); Gilbert et al., “CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes,” Cell 154:442-51 (2013). Como tal, o agente de ligação ao DNA guiado por RNA torna-se essencialmente um fator de transcrição que pode ser direcionado para ligar uma sequência alvo desejada usando um RNA guia. Em certas modalidades, o domínio de modificação do DNA é um domínio de metilação, como um domínio de desmetilação ou metiltransferase. Em certas modalidades, o domínio efetor é um domínio de modificação de DNA, como um domínio de edição de base. Em modalidades particulares, o domínio de modificação do DNA é um domínio de edição de ácido nucleico que introduz uma modificação específica no DNA, como um domínio desaminase. Ver, por exemplo, WO 2015/089406; US 2016/0304846. Os domínios de edição de ácido nucleico, domínios deaminase e variantes de Cas9 descritos em WO 2015/089406 e US 2016/0304846 são aqui incorporados por referência.

7. UTRs; Sequências de Kozak

[00210] Em algumas modalidades, o mRNA compreende pelo menos uma UTR da hidroxisteroide 17-beta desidrogenase 4 (HSD17B4 ou HSD), por exemplo, uma UTR de 5' da HSD. Em algumas modalidades, o mRNA compreende pelo menos uma UTR de um mRNA de globina, por exemplo, mRNA de alfa globina humana (HBA), mRNA de beta globina humana (HBB) ou mRNA de Xenopus laevis beta globina (XBG). Em algumas modalidades, o mRNA compreende um 5' UTR, 3' UTR ou 5' e 3' UTRs de um mRNA de globina, como HBA, HBB ou XBG. Em algumas modalidades, o mRNA compreende uma UTR 5' do hormônio de crescimento bovino, citomegalovírus (CMV), Hba-a1 de camundongo, HSD, um gene da albumina, HBA, HBB ou XBG. Em algumas modalidades, o mRNA compreende uma UTR 3' do hormônio de crescimento bovino, citomegalovírus, Hba-a1 de camundongo, HSD, um gene de albumina, HBA, HBB ou XBG. Em algumas modalidades, o mRNA compreende UTRs 5' e 3' do hormônio de crescimento bovino, citomegalovírus, Hba-a1 de camundongo, HSD, um gene da albumina, HBA, HBB, XBG, proteína de choque térmico 90 (Hsp90), gliceraldeído 3-fosfato desidrogenase (GAPDH), beta-actina, alfa-tubulina, proteína tumoral (p53) ou receptor do fator de crescimento epidérmico (EGFR).

[00211] Em algumas modalidades, o mRNA compreende UTRs 5' e 3' que são da mesma fonte, por exemplo, um mRNA expressado constitutivamente como actina, albumina ou globina como HBA, HBB ou XBG.

[00212] Em algumas modalidades, um mRNA divulgado neste documento compreende uma UTR 5' com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 32, 34, 36, 38 ou 41. Em algumas modalidades, um mRNA divulgado neste documento compreende uma UTR 3' com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 33, 35, 37, 39 ou 40. Em algumas modalidades, qualquer um dos níveis de identidade anteriores é de pelo menos 95%, pelo menos 98%, pelo menos 99% ou 100%. Em algumas modalidades, um mRNA divulgado neste documento compreende uma UTR 5' com a sequência de qualquer uma das SEQ ID NOs: 32, 34, 36, 38 ou 41. Em algumas modalidades, um mRNA divulgado neste documento compreende uma UTR 3' com a sequência de qualquer uma das SEQ ID NOs: 33, 35, 37, 39 ou 40.

[00213] Em algumas modalidades, o mRNA não compreende uma UTR 5', por exemplo, não há nucleotídeos adicionais entre o capeamento 5' e o códon de partida. Em algumas modalidades, o mRNA compreende uma sequência de Kozak (descrita abaixo) entre o capeamento 5' e o códon de início, mas não possui nenhuma UTR 5' adicional. Em algumas modalidades, o mRNA não compreende uma UTR 3', por exemplo, não há nucleotídeos adicionais entre o códon de parada e a cauda poli-A.

[00214] Em algumas modalidades, o mRNA compreende uma sequência de Kozak. A sequência de Kozak pode afetar o início da tradução e o rendimento geral de um polipeptídeo traduzido de um mRNA. Uma sequência de Kozak inclui um códon de metionina que pode funcionar como o códon de início. Uma sequência de Kozak mínima é NNNRUGN em que pelo menos um dos seguintes é verdadeiro: o primeiro N é A ou G e o segundo N é G. No contexto de uma sequência nucleotídica, R significa uma purina (A ou G). Em algumas modalidades, a sequência de Kozak é RNNRUGN, NNNRUGG, RNNRUGG, RNNAUGN, NNNAUGG, ou RNNAUGG. Em algumas modalidades, a sequência de Kozak é rccRUGg com zero incompatibilidades ou com até uma ou duas incompatibilidades para posições em minúsculas. Em algumas modalidades, a sequência de Kozak é rccAUGg com zero incompatibilidades ou com até uma ou duas incompatibilidades para posições em minúsculas. Em algumas modalidades, a sequência Kozak é gccRccAUGG (nucleotídeos 4 a 13 de SEQ ID NO: 105) com zero incompatibilidades ou com até uma, duas ou três incompatibilidades para posições em minúsculas. Em algumas modalidades, a sequência de Kozak é gccAccAUG com zero incompatibilidades ou com até uma, duas, três ou quatro incompatibilidades para posições em minúsculas. Em algumas modalidades, a sequência de Kozak é GCCACCAUG. Em algumas modalidades, a sequência Kozak é gccgccRccAUGG (SEQ ID NO: 105) com zero incompatibilidades ou com até uma, duas, três ou quatro incompatibilidades para posições em minúsculas.

8. Sequências exemplificativas

[00215] Em algumas modalidades, o mRNA compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA, em que o ORF compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175. Em algumas modalidades, o mRNA compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA, em que o agente de ligação ao DNA guiado por RNA compreende uma sequência de aminoácidos com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 3, 6, 8 , 13, 16, 19, 22, 25, 28, 68 ou 186-196, em que o ORF tem um teor de uridina que varia de seu teor mínimo de uridina a 150% do teor mínimo de uridina e/ou possui um teor de dinucleotídeo de uridina variando de seu teor mínimo de dinucleotídeo de uridina a 150% do teor mínimo de dinucleotídeo de uridina. Em algumas modalidades, o mRNA compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA, em que o agente de ligação ao DNA guiado por RNA compreende uma sequência de aminoácidos com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 3, 6, 8 , 13, 16, 19, 22, 25, 28, 68 ou 186-196, em que o ORF tem um teor de adenina que varia de seu teor mínimo de adenina a 150% do teor mínimo de adenina e/ou tem um teor de dinucleotídeo de adenina variando de seu teor mínimo de dinucleotídeo de adenina a 150% do teor mínimo de dinucleotídeo de adenina. Em algumas dessas modalidades, o teor de nucleotídeos de adenina e uridina é menor ou igual a 150% de seus respectivos mínimos. Em algumas modalidades, o teor de dinucleotídeo de adenina e uridina é menor ou igual a 150% de seus respectivos mínimos. Em algumas modalidades, o mRNA compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 67, em que a sequência compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA. Em algumas modalidades, o mRNA compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 67, em que a sequência compreende um ORF que codifica um DNA guiado por RNA agente de ligação, em que os três primeiros nucleotídeos das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 67 são omitidos. Em algumas modalidades, qualquer um dos níveis de identidade anteriores é de pelo menos 95%, pelo menos 98%, pelo menos 99% ou 100%.

[00216] Em algumas modalidades, o mRNA compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA, em que o ORF tem pelo menos 90% de identidade com qualquer uma das SEQ

ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos seus primeiros 30, 50, 70, 100, 150, 200, 250 ou 300 nucleotídeos. Os primeiros 30, 50, 70, 100, 150, 200, 250 ou 300 nucleotídeos são medidos a partir do primeiro nucleotídeo do códon de início (normalmente ATG), de modo que A seja o nucleotídeo 1, T seja o nucleotídeo 2, etc. Em algumas modalidades, o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18 , 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos os primeiros 10%, 12%, 15%, 20%, 25% , 30% ou 35% de sua sequência. O comprimento da sequência do ORF é o número de nucleotídeos do início do códon de início ao final do códon de parada e os primeiros 10%, 12%, 15%, 20%, 25%, 30% ou 35% da sua sequência corresponde ao número de nucleotídeos que começam no primeiro nucleotídeo do códon de início que constituem a porcentagem indicada do comprimento da sequência total.

[00217] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 43, opcionalmente em que o ORF da SEQ ID NO: 43 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00218] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 44, opcionalmente em que o ORF da SEQ ID NO: 44 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00219] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 56, opcionalmente em que o ORF da SEQ ID NO: 56 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00220] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 57, opcionalmente em que o ORF da SEQ ID NO: 57 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00221] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 58, opcionalmente em que o ORF da SEQ ID NO: 58 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00222] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 59, opcionalmente em que o ORF da SEQ ID NO: 59 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00223] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 60, opcionalmente em que o ORF da SEQ ID NO: 60 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00224] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 61, opcionalmente em que o ORF da SEQ ID NO: 61 (ou seja, SEQ ID NO: 4) é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00225] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 176, opcionalmente em que o ORF da SEQ ID NO: 176 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00226] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 177, opcionalmente em que o ORF da SEQ ID NO: 177 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00227] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 178, opcionalmente em que o ORF da SEQ ID NO: 178 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00228] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 179, opcionalmente em que o ORF da SEQ ID NO: 179 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00229] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 180, opcionalmente em que o ORF da SEQ ID NO: 180 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00230] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 181, opcionalmente em que o ORF da SEQ ID NO: 181 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00231] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 182, opcionalmente em que o ORF da SEQ ID NO: 182 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52,

54, 65, 66 ou 107-175.

[00232] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 183, opcionalmente em que o ORF da SEQ ID NO: 183 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00233] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 184, opcionalmente em que o ORF da SEQ ID NO: 184 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00234] Em algumas modalidades, o mRNA que compreende um ORF que codifica um agente de ligação ao DNA guiado por RNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 185, opcionalmente em que o ORF da SEQ ID NO: 185 é substituído por um ORF alternativo de qualquer uma das SEQ ID NO: 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

[00235] Em algumas modalidades, o grau de identidade para as sequências opcionalmente substituídas das SEQ ID NOs 43, 44, 56-61 ou 176-185 é de pelo menos 95%. Em algumas modalidades, o grau de identidade para as sequências opcionalmente substituídas das SEQ ID NOs 43, 44, 56-61 ou 176-185 é de pelo menos 98%. Em algumas modalidades, o grau de identidade para as sequências opcionalmente substituídas das SEQ ID NOs 43, 44, 56-61 ou 176-185 é de pelo menos 99%. Em algumas modalidades, o grau de identidade para as sequências opcionalmente substituídas das SEQ ID NOs 43, 44, 56-61 ou 176-185 é de 100%.

9. Cauda de Poli-A

[00236] Em algumas modalidades, o mRNA compreende ainda uma cauda poli-adenilada (poli-A). Em alguns casos, a cauda poli-A é "interrompida" com uma ou mais "âncoras" de nucleotídeos não adenina em um ou mais locais dentro da cauda poli-A. As caudas poli-A podem compreender pelo menos 8 nucleotídeos de adenina consecutivos, mas também compreender um ou mais nucleotídeos não adenina. Como utilizado neste documento, "nucleotídeos não adenina" refere-se a nucleotídeos naturais ou não naturais que não compreendem adenina. Os nucleotídeos de guanina, timina e citosina são nucleotídeos não adenina exemplificativos. Assim, as caudas de poli-A no mRNA aqui descrito podem compreender nucleotídeos de adenina consecutivos localizados 3' a nucleotídeos que codificam um agente de ligação ao DNA guiado por RNA ou uma sequência de interesse. Em alguns casos, as caudas poli-A no mRNA compreendem nucleotídeos de adenina não consecutivos localizados 3' para nucleotídeos que codificam um agente de ligação ao DNA guiado por RNA ou uma sequência de interesse, em que nucleotídeos não adenina interrompem os nucleotídeos adenina em intervalos espaçados regular ou irregularmente.

[00237] Em algumas modalidades, a cauda de poli-A é codificada no plasmídeo usado para a transcrição in vitro de mRNA e torna-se parte do transcrito. A sequência poli-A codificada no plasmídeo, ou seja, o número de nucleotídeos de adenina consecutivos na sequência poli-A, pode não ser exata, por exemplo, uma sequência de 100 poli-A no plasmídeo pode não resultar precisamente em uma sequência de 100 poli-A no mRNA transcrito. Em algumas modalidades, a cauda de poli- A não é codificada no plasmídeo e é adicionada por cauda de PCR ou cauda enzimática, por exemplo, usando a polimerase de E. coli poli (A).

[00238] Em algumas modalidades, o um ou mais nucleotídeos não adenina são posicionados para interromper os nucleotídeos adenina consecutivos, de modo que uma proteína de ligação a poli(A) possa se ligar a um trecho de nucleotídeos adenina consecutivos. Em algumas modalidades, um ou mais nucleotídeos não adenina estão localizados após pelo menos 8, 9, 10, 11 ou 12 nucleotídeos adenina consecutivos. Em algumas modalidades, o um ou mais nucleotídeos não adenina está localizado após pelo menos 8-50 nucleotídeos adenina consecutivos. Em algumas modalidades, o um ou mais nucleotídeos não-adenina está localizado após pelo menos 8-100 nucleotídeos adenina consecutivos. Em algumas modalidades, o nucleotídeo não adenina é após um, dois, três, quatro, cinco, seis ou sete nucleotídeos de adenina e é seguido por pelo menos 8 nucleotídeos adenina consecutivos.

[00239] A cauda poli-A da presente divulgação pode compreender uma sequência de nucleotídeos de adenina consecutivos seguidos por um ou mais nucleotídeos não adenina, opcionalmente seguidos por nucleotídeos adenina adicionais.

[00240] Em algumas modalidades, a cauda poli-A compreende ou contém um nucleotídeo não adenina ou um trecho consecutivo de 2-10 nucleotídeos não adenina. Em algumas modalidades, o(s) nucleotídeo(s) não adenina estão localizados após pelo menos 8, 9, 10, 11 ou 12 nucleotídeos adenina consecutivos. Em alguns casos, o um ou mais nucleotídeos não adenina estão localizados após pelo menos 8-50 nucleotídeos adenina consecutivos. Em algumas modalidades, o um ou mais nucleotídeos não adenina estão localizados após pelo menos 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 , 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 , ou 50 nucleotídeos adenina consecutivos.

[00241] Em algumas modalidades, o nucleotídeo não adenina é guanina, citosina ou timina. Em alguns casos, o nucleotídeo não adenina é um nucleotídeo guanina. Em algumas modalidades, o nucleotídeo não adenina é um nucleotídeo citosina. Em algumas modalidades, o nucleotídeo não adenina é um nucleotídeo timina. Em alguns casos, onde mais de um nucleotídeo não adenina está presente, o nucleotídeo não adenina pode ser selecionado de: a) nucleotídeos guanina e timina; b) nucleotídeos de guanina e citosina; c) nucleotídeos de timina e citosina; ou d) nucleotídeos de guanina, timina e citosina. Um exemplo de cauda poli-A compreendendo nucleotídeos não adenina é fornecido como SEQ ID NO: 62.

10. Nucleotídeos modificados

[00242] Em algumas modalidades, um mRNA compreende uma uridina modificada em algumas ou todas as posições de uridina. Em algumas modalidades, a uridina modificada é uma uridina modificada na posição 5, por exemplo, com um halogênio ou C1-C3 alcóxi. Em algumas modalidades, a uridina modificada é uma pseudouridina modificada na posição 1, por exemplo, com um C1-C3 alquil. A uridina modificada pode ser, por exemplo, pseudouridina, N1-metil- pseudouridina, 5-metoxiuridina, 5-iodouridina ou uma combinação dos mesmos. Em algumas modalidades, a uridina modificada é 5- metoxiuridina. Em algumas modalidades, a uridina modificada é 5- iodouridina. Em algumas modalidades, a uridina modificada é pseudouridina. Em algumas modalidades, a uridina modificada é N1- metil-pseudouridina. Em algumas modalidades, a uridina modificada é uma combinação de pseudouridina e N1-metil-pseudouridina. Em algumas modalidades, a uridina modificada é uma combinação de pseudouridina e 5-metoxiuridina. Em algumas modalidades, a uridina modificada é uma combinação de N1-metil pseudouridina e 5- metoxiuridina. Em algumas modalidades, a uridina modificada é uma combinação de 5-iodouridina e N1-metil-pseudouridina. Em algumas modalidades, a uridina modificada é uma combinação de pseudouridina e 5-iodouridina. Em algumas modalidades, a uridina modificada é uma combinação de 5-iodouridina e 5-metoxiuridina.

[00243] Em algumas modalidades, pelo menos 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80% , 85%, 90%, 95%, 98%, 99% ou 100% das posições de uridina em um mRNA de acordo com a divulgação são uridinas modificadas. Em algumas modalidades, 10% -25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são uridinas modificadas, por exemplo, 5-metoxiuridina, 5-iodouridina, N1-metil pseudouridina, pseudouridina ou uma combinação dos mesmos. Em algumas modalidades, 10% -25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são 5-metoxiuridina. Em algumas modalidades, 10% -25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são pseudouridina. Em algumas modalidades, 10% -25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são N1-metil pseudouridina. Em algumas modalidades, 10% -25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são 5-iodouridina. Em algumas modalidades, 10% -25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são 5-metoxiuridina e o restante é N1-metil pseudouridina. Em algumas modalidades, 10% - 25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85- 95%, ou 90-100% das posições de uridina em um mRNA de acordo com a divulgação são 5-iodouridina e o restante é N1-metil pseudouridina.

11. 5’ Cap

[00244] Em algumas modalidades, um mRNA divulgado neste documento compreende um capeamento 5', como um Cap0, Cap1 ou Cap2. Um capeamento 5' é geralmente um ribonucleotídeo de 7- metilguanina (que pode ser adicionalmente modificado, conforme discutido abaixo, por exemplo, com relação ao ARCA) ligado através de um 5'-trifosfato à posição 5' do primeiro nucleotídeo da cadeia 5'-a-3' do mRNA, isto é, o primeiro nucleotídeo cap-proximal. No Cap0, as riboses do primeiro e do segundo nucleotídeos cap-proximais do mRNA compreendem um 2'-hidroxil. No Cap1, as riboses do primeiro e do segundo nucleotídeos transcritos do mRNA compreendem um 2'-metóxi e um 2'-hidroxil, respectivamente. No Cap2, as riboses do primeiro e do segundo nucleotídeos cap-proximais do mRNA compreendem um 2'- metóxi. Ver, por exemplo, Katibah et al. (2014) Proc Natl Acad Sci USA 111(33):12025-30; Abbas et al. (2017) Proc Natl Acad Sci USA 114(11):E2106-E2115. A maioria dos mRNAs eucarióticos endógenos superiores, incluindo os mRNAs de mamíferos, como os mRNAs humanos, compreendem Cap1 ou Cap2. Cap0 e outras estruturas de capeamento diferentes de Cap1 e Cap2 podem ser imunogênicas em mamíferos, como seres humanos, devido ao reconhecimento como "não próprio" por componentes do sistema imunológico inato, como IFIT-1 e IFIT-5, que podem resultar em níveis elevados de citocinas, incluindo interferon tipo I. Os componentes do sistema imunológico inato, como o IFIT-1 e o IFIT-5, também podem competir com o eIF4E pela ligação de um mRNA com um capeamento diferente de Cap1 ou Cap2, potencialmente inibindo a tradução do mRNA.

[00245] Um capeamento pode ser incluído cotranscricionalmente. Por exemplo, ARCA (análogo de capeamento antirreverso; Thermo Fisher Scientific Cat. No. AM8045) é um análogo de capeamento que compreende um 7-metilguanina 3'-metóxi-5'-trifosfato ligado à posição

5' de um ribonucleotídeo de guanina que pode ser incorporado in vitro em um transcrito no início. O ARCA resulta em um capeamento Cap0 em que a posição 2' do primeiro nucleotídeo cap-proximal é hidroxil. Ver, por exemplo, Stepinski et al., (2001) “Synthesis and properties of mRNAs containing the novel ‘anti-reverse’ cap analogs 7-methyl(3'-O- methyl)GpppG and 7-methyl(3'deoxy)GpppG,” RNA 7: 1486–1495. A estrutura do ARCA é mostrada abaixo.

[00246] CleanCapTM AG (m7G(5')ppp(5')(2'OMeA)pG; TriLink Biotechnologies Cat. No. N-7113) or CleanCapTM GG (m7G(5')ppp(5')(2'OMeG)pG; TriLink Biotechnologies Cat. No. N-7133) pode ser usado para fornecer uma estrutura Cap1 cotranscricionalmente. As versões 3'-O-metiladas de CleanCapTM AG and CleanCapTM GG também estão disponíveis na TriLink Biotechnologies como Cat. Nos. N-7413 e N-7433, respectivamente. A estrutura CleanCapTM AG é mostrada abaixo. As estruturas CleanCapTM são algumas vezes referidas aqui usando os três últimos dígitos dos números de catálogo listados acima (por exemplo, “CleanCapTM 113” for TriLink Biotechnologies Cat. No. N-7113).

[00247] Alternativamente, um capeamento pode ser adicionado a um

RNA pós-transcricionalmente. Por exemplo, a enzima de capeamento Vaccinia está disponível comercialmente (New England Biolabs Cat. No. M2080S) e possui atividades de RNA trifosfatase e guanililtransferase, fornecidas por sua subunidade D1, e guanina metiltransferase, fornecidas por sua subunidade D12. Como tal, pode adicionar uma 7- metilguanina a um RNA, de modo a originar Cap0, na presença de S- adenosilmetionina e GTP. Ver, por exemplo, Guo, P. e Moss, B. (1990) Proc. Natl. Acad. Sci. USA 87, 4023-4027; Mao, X. and Shuman, S. (1994) J. Biol. Chem., 269, 24472-24479. Para uma discussão adicional das abordagens de capeamentos, ver, por exemplo, WO2017/053297 e Ishikawa et al., Nucl. Acids. Symp. Ser. (2009) No. 53, 129-130.

12. RNA Guia

[00248] Em algumas modalidades, pelo menos um RNA guia é fornecido em combinação com um mRNA aqui divulgado. Em algumas modalidades, um RNA guia é fornecido como uma molécula separada do mRNA. Em algumas modalidades, um RNA guia é fornecido como uma parte, como uma parte de uma UTR, de um mRNA aqui divulgado. Em algumas modalidades, pelo menos um RNA guia direciona TTR.

[00249] Em algumas modalidades, um RNA guia compreende um sgRNA modificado. Em algumas modalidades, o sgRNA compreende o padrão de modificação mostrado na SEQ ID NO: 74, em que N é qualquer nucleotídeo natural ou não natural e em que a totalidade dos N's compreende uma sequência guia. Por exemplo, aqui incluída está a SEQ ID NO: 74, onde os Ns são substituídos por qualquer uma das sequências guia aqui divulgadas. As modificações são mostradas na SEQ ID NO: 74, apesar da substituição de N pelos nucleotídeos de um guia. Ou seja, embora os nucleotídeos do guia substituam os “Ns”, os três primeiros nucleotídeos são modificados em 2'OMe e há ligações fosforotioato entre o primeiro e o segundo nucleotídeos, o segundo e o terceiro nucleotídeos e o terceiro e quarto nucleotídeos.

13. Lipídeos; formulação; distribuição

[00250] Em algumas modalidades, um mRNA aqui descrito, sozinho ou acompanhado por um ou mais RNAs guia, é formulado ou administrado através de uma nanopartícula lipídica; ver, por exemplo, PCT/US2017/024973, depositado em 30 de março de 2017, reivindicando prioridade ao USSN 62/315.602, depositado em 30 de março de 2016 e intitulado “LIPID NANOPARTICLE FORMULATIONS FOR CRISPR/CAS COMPONENTS,” cujo conteúdo é aqui incorporado por referência na sua totalidade. Qualquer nanopartícula lipídica (LNP) conhecida por aqueles versados na técnica como capaz de fornecer nucleotídeos a sujeitos pode ser utilizada para administrar os RNAs aqui descritos, que em algumas modalidades são acompanhados por um ou mais RNAs guia. Em algumas modalidades, um mRNA aqui descrito, sozinho ou acompanhado por um ou mais RNAs guia, é formulado ou administrado via lipossoma, uma nanopartícula, um exossomo ou uma microvesícula. Emulsões, micelas e suspensões podem ser composições adequadas para distribuição local e/ou tópica.

[00251] Aqui são divulgadas várias modalidades de formulações de LNP para RNAs, incluindo cargas CRISPR/Cas. Tais formulações de LNP podem incluir (i) um lipídeo CCD, como um lipídeo de amina, (ii) um lipídeo neutro, (iii) um lipídeo auxiliar e (iv) um lipídeo furtivo, como um lipídeo PEG. Algumas modalidades das formulações de LNP incluem um "lipídeo de amina", juntamente com um lipídeo auxiliar, um lipídeo neutro e um lipídeo furtivo, como um lipídeo PEG. Por "nanopartícula lipídica" entende-se uma partícula que compreende uma pluralidade de (isto é, mais de uma) moléculas lipídicas fisicamente associadas entre si por forças intermoleculares. Lipídeos CCD

[00252] As composições lipídicas para distribuição de mRNA de CRISPR/Cas e componentes de RNA guia para uma célula hepática compreendem um lipídeo CCD.

[00253] Em algumas modalidades, o lipídeo do CCD é o lipídeo A, que é (9Z,12Z)-3-((4,4-bis(octilóxi)butanoil)óxi)-2-((((3- (dietilamino)propóxi)carbonil)óxi)metil)propil octadeca-9,12-dienoato, também chamado 3-((4,4-bis(octilóxi)butanoil)óxi)-2-((((3- (dietilamino)propóxi)carbonil)óxi)metil)propil (9Z,12Z)-octadeca-9,12- dienoato. O lipídeo A pode ser descrito como: .

[00254] O lipídeo A pode ser sintetizado de acordo com WO2015/095340 (por exemplo, pp. 84-86).

[00255] Em algumas modalidades, o lipídeo CCD é o lipídeo B, que é ((5-((dimetilamino) metil)-1,3-fenileno)bis(óxi))bis(octano-8,1-di- il)bis(decanoato), também chamado ((5-((dimetilamino)metil)-1,3- fenileno)bis(óxi))bis(octano-8,1-di-il)bis(decanoato). O lipídeo B pode ser descrito como: .

[00256] O lipídeo B pode ser sintetizado de acordo com WO2014/136086 (por exemplo, pp. 107-09).

[00257] Em algumas modalidades, o lipídeo CCD é o lipídeo C, que é 2- ((4-(((3- (dimetilamino)propóxi)carbonil)óxi)hexadecanoil)óxi)propano-1,3- di-il (9Z,9'Z,12Z, 12'Z)-bis(octadeca-9,12-dienoato).

[00258] O lipídeo C pode ser descrito como:

.

[00259] Em algumas modalidades, o lipídeo CCD é o lipídeo D, que é 3-(((3-(dimetilamino) propóxi)carbonil)óxi)-13-(octanoilóxi)tridecil 3- octilundecanoato.

[00260] O lipídeo D pode ser descrito como: .

[00261] O lipídeo C e o lipídeo D podem ser sintetizados de acordo com WO2015/095340.

[00262] O lipídeo CCD também pode ser equivalente ao lipídeo A, lipídeo B, lipídeo C ou lipídeo D. Em certas modalidades, o lipídeo CCD é equivalente ao lipídeo A, um equivalente ao lipídeo B, um equivalente ao lipídeo C ou um equivalente ao lipídeo D.

[00263] Lipídeos de amina

[00264] Em algumas modalidades, as composições de LNP para a distribuição de agentes biologicamente ativos compreendem um "lipídeo de amina", que é definido como lipídeo A ou seus equivalentes, incluindo análogos de acetal do lipídeo A.

[00265] Em algumas modalidades, o lipídeo de amina é o lipídeo A, que é (9Z,12Z)-3-((4,4-bis(octilóxi)butanoil)óxi)-2-((((3-

(dietilamino)propóxi)carbonil)óxi)metil)propil octadeca-9,12-dienoato, também chamado 3-((4,4-bis(octilóxi)butanoil)óxi)-2-((((3- (dietilamino)propóxi)carbonil)óxi)metil)propil (9Z,12Z)-octadeca-9,12- dienoato. O lipídeo A pode ser descrito como: .

[00266] O lipídeo A pode ser sintetizado de acordo com WO2015/095340 (por exemplo, pp. 84-86). Em certas modalidades, o lipídeo de amina é equivalente ao lipídeo A.

[00267] Em certas modalidades, um lipídeo de amina é um análogo do lipídeo A. Em certas modalidades, um análogo de lipídeo A é um análogo acetal do lipídeo A. Em determinadas composições de LNP, o análogo acetal é um análogo acetal C4-C12. Em algumas modalidades, o análogo acetal é um análogo acetal C5-C12. Em modalidades adicionais, o análogo acetal é um análogo acetal C5-C10. Em outras modalidades, o análogo acetal é escolhido dentre um análogo acetal de C4, C5, C6, C7, C9, C10, C11 e C12.

[00268] Os lipídeos de amina adequados para utilização nas LNPs aqui descritas são biodegradáveis in vivo. Os lipídeos de aminas têm baixa toxicidade (por exemplo, são tolerados em modelos animais sem efeito adverso em quantidades maiores ou iguais a 10 mg/kg). Em certas modalidades, as LNPs compreendendo um lipídeo de amina incluem aquelas em que pelo menos 75% do lipídeo de amina é removido do plasma dentro de 8, 10, 12, 24 ou 48 horas ou 3, 4, 5, 6, 7 ou 10 dias. Em certas modalidades, as LNPs que compreendem um lipídeo de amina incluem aquelas em que pelo menos 50% do mRNA ou do gRNA são eliminados do plasma dentro de 8, 10, 12, 24 ou 48 horas ou 3, 4, 5, 6, 7, ou 10 dias. Em certas modalidades, as LNPs compreendendo um lipídeo de amina incluem aquelas em que pelo menos 50% da LNP é eliminado do plasma dentro de 8, 10, 12, 24 ou 48 horas ou 3, 4, 5, 6, 7 ou 10 dias, por exemplo, medindo um lipídeo (por exemplo, um lipídeo de amina), RNA (por exemplo, mRNA) ou outro componente. Em certas modalidades, o componente lipídeo encapsulado em lipídeo versus lipídeo livre, RNA ou ácido nucleico do LNP é medido.

[00269] A depuração lipídica pode ser medida como descrito na literatura. Ver Maier, MA, et al. Biodegradable Lipids Enabling Rapidly Eliminated Lipid Nanoparticles for Systemic Delivery of RNAi Therapeutics. Mol. Ther. 2013, 21(8), 1570-78 (“Maier”). Por exemplo, em Maier, os sistemas LNP-siRNA contendo siRNA direcionado às luciferases foram administrados a camundongos machos C57Bl/6 de seis a oito semanas de idade a 0,3 mg/kg por injeção intravenosa em bolus via veia da cauda lateral. Amostras de sangue, fígado e baço foram coletadas em 0,083, 0,25, 0,5, 1, 2, 4, 8, 24, 48, 96 e 168 horas após a dose. Os camundongos foram perfundidos com solução salina antes da coleta de tecido e as amostras de sangue foram processadas para obter plasma. Todas as amostras foram processadas e analisadas por LC-MS. Além disso, Maier descreve um procedimento para avaliar a toxicidade após a administração de formulações de LNP-siRNA. Por exemplo, um siRNA direcionado à luciferase foi administrado a 0, 1, 3, 5 e 10 mg/kg (5 animais/grupo) via injeção intravenosa em bolus intravenosa a um volume de dose de 5 mL/kg em ratos Sprague-Dawley machos. Após 24 horas, cerca de 1 mL de sangue foi obtido da veia jugular de animais conscientes e o soro foi isolado. 72 horas após a dose, todos os animais foram sacrificados para necrópsia. Foi realizada avaliação de sinais clínicos, peso corporal, química sérica, pesos de órgãos e histopatologia. Embora Maier descreva métodos para avaliar formulações de siRNA-LNP, esses métodos podem ser aplicados para avaliar a depuração, farmacocinética e toxicidade da administração de composições de LNP da presente divulgação.

[00270] Os lipídeos de amina levam a um aumento da taxa de depuração. Em algumas modalidades, a taxa de depuração é uma taxa de depuração lipídica, por exemplo, a taxa na qual um lipídeo de amina é eliminado do sangue, soro ou plasma. Em algumas modalidades, a taxa de depuração é uma taxa de depuração de RNA, por exemplo, a taxa na qual um mRNA ou um gRNA é eliminado do sangue, soro ou plasma. Em algumas modalidades, a taxa de depuração é a taxa na qual a LNP é eliminada do sangue, soro ou plasma. Em algumas modalidades, a taxa de depuração é a taxa na qual a LNP é eliminada de um tecido, como tecido do fígado ou tecido do baço. Em certas modalidades, uma alta taxa de depuração leva a um perfil de segurança sem efeitos adversos substanciais. Os lipídeos da amina reduzem o acúmulo de LNP na circulação e nos tecidos. Em algumas modalidades, uma redução no acúmulo de LNP na circulação e nos tecidos leva a um perfil de segurança sem efeitos adversos substanciais.

[00271] Os lipídeos de amina da presente divulgação podem ser ionizáveis dependendo do pH do meio em que estão. Por exemplo, em um meio levemente acídico, os lipídeos de amina podem ser protonados e, assim, carregar uma carga positiva. Por outro lado, em um meio ligeiramente básico, como, por exemplo, sangue onde o pH é de aproximadamente 7,35, os lipídeos de amina podem não ser protonados e, portanto, não têm carga. Em algumas modalidades, os lipídeos de amina da presente divulgação podem ser protonados a um pH de pelo menos cerca de 9. Em algumas modalidades, os lipídeos de amina da presente divulgação podem ser protonados a um pH de pelo menos cerca de 9. Em algumas modalidades, os lipídeos de amina da presente divulgação podem ser protonados a um pH de pelo menos cerca de 10.

[00272] A capacidade de um lipídeo de amina suportar uma carga está relacionada ao seu pKa intrínseco. Por exemplo, os lipídeos de amina da presente divulgação podem cada um, independentemente, ter um pKa na faixa de cerca de 5,8 a cerca de 6,2. Por exemplo, os lipídeos de amina da presente divulgação podem cada um, independentemente, ter um pKa na faixa de cerca de 5,8 a cerca de 6,5. Isto pode ser vantajoso, pois foi descoberto que lipídeos catiônicos com um pKa variando entre 5,1 e 7,4 são eficazes para a distribuição de carga in vivo, por exemplo, para o fígado. Além disso, verificou-se que lipídeos catiônicos com um pKa variando entre cerca de 5,3 e cerca de 6,4 são eficazes para a distribuição in vivo, por exemplo, para tumores. Ver, por exemplo, WO2014/136086. Lipídeos adicionais

[00273] "Lipídeos neutros" adequados para uso em uma composição lipídica da divulgação incluem, por exemplo, uma variedade de lipídeos neutros, não carregados ou zwitteriônicos. Exemplos de fosfolipídeos neutros adequados para uso na presente divulgação incluem, mas não estão limitados a, 5-heptadecilbenzeno-1,3-diol (resorcinol), dipalmitoilfosfatidilcolina (DPPC), distearoilfosfatidilcolina (DSPC), pofosfolina (DOPC), dimiristoilfosfatidilcolina (DMPC), fosfatidilcolina (PLPC), 1,2-distearoil-sn-glicero-3-fosfocolina (DAPC), fosfatidiletanolamina (PE), fosfatidilcolina de ovo (EPC), dilaurililfosfatidilcolina (DLPC), dimiristoilfosfatidilcolina (DMPC), 1- miristoil-2-palmitoilfosfatidilcolina (MPPC), 1-palmitoil-2- miristoilfosfatidilcolina (PMPC), 1-palmitoil-2-estearoilfosfatidilcolina (PSPC), 1,2-diaracidiloil -3-fosfocolina (DBPC), 1-estearoil-2- palmitoilfosfatidilcolina (SPPC), 1,2-dieicosenoil-sn-glicero-3- fosfocololina (DEPC), palmitoiloloilfosfatidilcolina (POPC), lisofosfatidil colina, dioleoil-fosfatidiletanolamina (DOPE), dilinoleoilfosfatidilcolina distearoilfosfatidiletanolamina (DSPE), dimiristoilfosfatidiletanolamina (DMPE), dipalmitoil fosfatidiletanolamina (DPPE), palmitoiloleoil fosfatidiletanolamina (POPE), lisofosfatidiletanolamina e combinações dos mesmos. Em uma modalidade, o fosfolipídeo neutro pode ser selecionado do grupo que consiste em distearoilfosfatidilcolina (DSPC) e dimiristoil fosfatidil etanolamina (DMPE). Em uma outra modalidade, o fosfolipídeo neutro pode ser distearoilfosfatidilcolina (DSPC).

[00274] Os "lipídeos auxiliares" incluem esteroides, esteróis e alquil resorcinóis. Os lipídeos auxiliares adequados para uso na presente divulgação incluem, mas não estão limitados a, colesterol, 5- heptadecilresorcinol e hemisuccinato de colesterol. Em uma modalidade, o lipídeo auxiliar pode ser colesterol. Em uma modalidade, o lipídeo auxiliar pode ser hemissuccinato de colesterol.

[00275] "Lipídeos furtivos" são lipídeos que alteram o período de tempo em que as nanopartículas podem existir in vivo (por exemplo, no sangue). Os lipídeos furtivos podem ajudar no processo de formulação, por exemplo, reduzindo a agregação de partículas e controlando o tamanho das partículas. Os lipídeos furtivos aqui utilizados podem modular as propriedades farmacocinéticas do LNP. Os lipídeos furtivos adequados para uso em uma composição lipídica da divulgação incluem, mas não estão limitados a, lipídeos furtivos com um grupo principal hidrofílico ligado a uma porção lipídica. Lipídeos furtivos adequados para uso em uma composição lipídica da presente divulgação e informações sobre a bioquímica de tais lipídeos podem ser encontrados em Romberg et al., Pharmaceutical Research, Vol. 25, No. 1, 2008, pg. 55-71 e Hoekstra et al., Biochimica et Biophysica Acta 1660 (2004) 41-52. Lipídeos de PEG adequados adicionais são divulgados, por exemplo, em WO 2006/007712.

[00276] Em uma modalidade, o grupo principal hidrofílico de lipídeo furtivo compreende uma porção de polímero selecionada de polímeros baseados em PEG. Os lipídeos furtivos podem compreender uma porção lipídica. Em algumas modalidades, o lipídeo furtivo é um lipídeo

PEG.

[00277] Em uma modalidade, um lipídeo furtivo compreende uma porção de polímero selecionada de polímeros baseados em PEG (às vezes chamado de poli(óxido de etileno)), poli(oxazolina), poli(álcool vinílico), poli(glicerol), poli(N-vinilpirrolidona), poliaminoácidos e poli[N- (2-hidroxipropil)metacrilamida].

[00278] Em uma modalidade, o lipídeo PEG compreende uma porção de polímero à base de PEG (às vezes referido como poli(óxido de etileno)).

[00279] O lipídeo PEG compreende ainda uma porção lipídica. Em algumas modalidades, a porção lipídica pode ser derivada de diacilglicerol ou diacilglicamida, incluindo aqueles que compreendem um grupo dialquilglicerol ou dialquilglicamida com comprimento de cadeia alquil independentemente compreendendo de cerca de C4 a cerca de C40 átomos de carbono saturados ou insaturados, em que a cadeia pode compreender um ou mais átomos de carbono funcionais grupos como, por exemplo, uma amida ou éster. Em algumas modalidades, o comprimento da cadeia alquil compreende cerca de C10 a C20. O grupo dialquilglicerol ou dialquilglicamida pode ainda compreender um ou mais grupos alquil substituídos. Os comprimentos da corrente podem ser simétricos ou assimétricos.

[00280] Salvo indicação em contrário, o termo "PEG", conforme usado aqui, significa qualquer polietileno glicol ou outro polímero de éter polialquileno. Em uma modalidade, o PEG é um polímero linear ou ramificado opcionalmente substituído de etileno glicol ou óxido de etileno. Em uma modalidade, o PEG não é substituído. Em uma modalidade, o PEG é substituído, por exemplo, por um ou mais grupos alquil, alcoxi, acil, hidróxi ou aril. Em uma modalidade, o termo inclui copolímeros de PEG, como PEG-poliuretano ou PEG-polipropileno (ver, por exemplo, J. Milton Harris, Poly(ethylene glycol) chemistry:

biotechnical and biomedical applications (1992)); em outra modalidade, o termo não inclui copolímeros de PEG. Em uma modalidade, o PEG tem um peso molecular de cerca de 130 a cerca de 50.000, em uma submodalidade, cerca de 150 a cerca de 30.000, em uma submodalidade, cerca de 150 a cerca de 20.000, em uma submodalidade de cerca de 150 a cerca de 15.000, em uma submodalidade, cerca de 150 a cerca de 10.000, em uma submodalidade, cerca de 150 a cerca de 6.000, em uma submodalidade, cerca de 150 a cerca de 5.000, em uma submodalidade, cerca de 150 a cerca de 4.000 , em uma submodalidade, cerca de 150 a cerca de 3.000, em uma submodalidade, cerca de 300 a cerca de 3.000, em uma submodalidade, cerca de 1.000 a cerca de 3.000 e em uma submodalidade, cerca de 1.500 a cerca de 2.500.

[00281] Em certas modalidades, o PEG (por exemplo, conjugado a uma porção lipídica ou lipídeo, como um lipídeo furtivo), é um "PEG-2K", também denominado "PEG 2000", que tem um peso molecular médio de cerca de 2.000 daltons. O PEG-2K é representado aqui pela seguinte fórmula (I), em que n é 45, significando que o grau médio de polimerização do número compreende cerca de 45 subunidades. No entanto, outras modalidades de PEG conhecidas na técnica podem ser usadas, incluindo, por exemplo, aquelas em que o grau médio de polimerização compreende cerca de 23 subunidades (n = 23) e/ou 68 subunidades (n = 68). Em algumas modalidades, n pode variar de cerca de 30 a cerca de 60. Em algumas modalidades, n pode variar de cerca de 35 a cerca de 55. Em algumas modalidades, n pode variar de cerca de 40 a cerca de 50. Em algumas modalidades, n pode variar de cerca de 42 a cerca de 48. Em algumas modalidades, n pode ser 45. Em algumas modalidades, R pode ser selecionado de H, alquil substituído e alquil não substituído. Em algumas modalidades, R pode ser alquil não substituído. Em algumas modalidades, R pode ser metil.

[00282] Em qualquer uma das modalidades aqui descritas, o lipídeo PEG pode ser selecionado de PEG-dilauroilglicerol, PEG- dimiristoilglicerol (PEG-DMG) (catálogo # GM-020 de NOF, Tóquio, Japão), PEG-dipalmitoilglicerol, PEG-distearoilglicerol (PEG -DSPE) (catálogo # DSPE-020CN, NOF, Tóquio, Japão), PEG-dilaurilglicamida, PEG-dimiristilglicamida, PEG-dipalmitoilglicamida e PEG- distearoililglicida, PEG-distearoililglicida, PEG-colesterol (1-[8'-(Cholest- 5-en-3[beta]-óxi)carboxamido-3', 6'-dioxaoctanil]carbamoil-[ômega]- metil-poli(etileno glicol), PEG-DMB (3,4-ditetradecoxilbenzil-[ômega]- metil-poli(etileno glicol)éter), 1,2-dimiristoil-sn-glicero-3- fosfoetanolamina-N-[metoxi(polietileno glicol)-2000] (PEG2k-DMG) (cat. # 880150P de Avanti Polar Lipids, Alabaster, Alabama, EUA), 1,2- distearoil-sn-glicero-3-fosfoetanolamina-N-[metoxi(polietileno glicol)- 2000] (PEG2k-DSPE) (cat. # 880120C de Avanti Polar Lipids, Alabaster, Alabama, EUA), 1,2-distearoil-sn-glicerol, metoxipolietilenoglicol (PEG2k-DSG; GS-020, NOF Tóquio, Japão), poli (etileno glicol)-2000- dimetacrilato (PEG2k-DMA) e 1,2-disteariloxipropil-3-amina-N- [metóxi (polietileno glicol)-2000] (PEG2k-DSA). Em uma modalidade, o lipídeo PEG pode ser PEG2k-DMG. Em algumas modalidades, o lipídeo PEG pode ser PEG2k-DSG. Em uma modalidade, o lipídeo PEG pode ser PEG2k-DSPE. Em uma modalidade, o lipídeo PEG pode ser PEG2k- DMA. Em uma modalidade, o lipídeo PEG pode ser PEG2k-C-DMA. Em uma modalidade, o lipídeo PEG pode ser o composto S027, divulgado em WO2016/010840 (parágrafos [00240] a [00244]). Em uma modalidade, o lipídeo PEG pode ser PEG2k-DSA. Em uma modalidade, o lipídeo PEG pode ser PEG2k-C11. Em algumas modalidades, o lipídeo PEG pode ser PEG2k-C14. Em algumas modalidades, o lipídeo PEG pode ser PEG2k-C16. Em algumas modalidades, o lipídeo PEG pode ser PEG2k-C18.

[00283] A LNP pode conter (i) um lipídeo de amina para encapsulamento e escape endossômico, (ii) um lipídeo neutro para estabilização, (iii) um lipídeo auxiliar, também para estabilização e (iv) um lipídeo furtivo, como um lipídeo PEG.

[00284] Em algumas modalidades, uma composição de LNP pode compreender um componente de RNA que inclui um ou mais de um agente de ligação ao DNA guiado a RNA, um mRNA de Cas nuclease, um mRNA de Cas nuclease Classe 2, um mRNA de Cas9 e um gRNA. Em algumas modalidades, uma composição de LNP pode incluir uma Cas nuclease Classe 2 e um gRNA como componente de RNA. Em certas modalidades, uma composição de LNP pode compreender o componente de RNA, um lipídeo de amina, um lipídeo auxiliar, um lipídeo neutro e um lipídeo furtivo. Em certas composições de LNP, o lipídeo auxiliar é o colesterol. Em outras composições, o lipídeo neutro é DSPC. Em modalidades adicionais, o lipídeo furtivo é PEG2k-DMG ou PEG2k-C11. Em certas modalidades, a composição de LNP compreende lipídeo A ou um equivalente de lipídeo A; um lípido auxiliar; um lípido neutro; um lípido furtivo; e um RNA guia. Em certas composições, o lipídeo de amina é o lipídeo A. Em certas composições, o lipídeo de amina é o lipídeo A ou um análogo acetal do mesmo; o lipídeo auxiliar é o colesterol; o lipídeo neutro é DSPC; e o lípido furtivo é o PEG2k-DMG.

[00285] Em certas modalidades, as composições lipídicas são descritas de acordo com as respectivas razões molares dos lipídeos componentes na formulação. Modalidades da presente divulgação fornecem composições lipídicas descritas de acordo com as respectivas razões molares dos lipídeos componentes na formulação. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 30% em mol a cerca de 60% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 40% em mol a cerca de 60% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 45% em mol a cerca de 60% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 50% em mol a cerca de 60% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 55% em mol a cerca de 60% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 50% em mol a cerca de 55% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 50% em mol. Em uma modalidade, a % em mol do lipídeo de amina pode ser de cerca de 55% em mol. Em algumas modalidades, o lipídeo de amina em % em mol do lote de LNP será de ± 30%, ± 25%, ± 20%, ± 15%, ± 10%, ± 5% ou ± 2,5% da % em mol alvo. Em algumas modalidades, o lipídeo de amina em % em mol do lote de LNP será de ± 4% em mol, ± 3% em mol, ± 2% em mol, ± 1,5% em mol, ± 1% em mol, ± 0,5% em mol, ou ± 0,25% em mol da % em mol alvo. Todos os números de % em mol são dados como uma porção do componente lipídico das composições de LNP. Em certas modalidades, a variabilidade entre lotes de LNP do lipídeo de amina em % em mol será menor que 15%, menor que 10% ou menor que 5%.

[00286] Em uma modalidade, a % em mol do lipídeo neutro pode estar entre cerca de 5% em mol e cerca de 15% em mol. Em uma modalidade, a % em mol do lipídeo neutro pode ser de cerca de 7% em mol a cerca de 12% em mol. Em uma modalidade, a % em mol do lipídeo neutro pode ser de cerca de 9% em mol. Em algumas modalidades, o lipídeo neutro em % em mol do lote de LNP será de ± 30%, ± 25%, ± 20%, ± 15%, ± 10%, ± 5% ou ± 2,5% da % em mol de lipídeo neutro alvo. Em certas modalidades, a variabilidade entre lotes de LNP em mol será menor que 15%, menor que 10% ou menor que 5%.

[00287] Em uma modalidade, a % em mol do lipídeo auxiliar pode ser de cerca de 20% em mol a cerca de 60% em mol. Em uma modalidade,

a % em mol do lipídeo auxiliar pode ser de cerca de 25% em mol a cerca de 55% em mol. Em uma modalidade, a % em mol do lipídeo auxiliar pode ser de cerca de 25% em mol a cerca de 50% em mol. Em uma modalidade, a % em mol do lipídeo auxiliar pode ser de cerca de 25% em mol a cerca de 40% em mol. Em uma modalidade, a % em mol do lipídeo auxiliar pode ser de cerca de 30% em mol a cerca de 50% em mol. Em uma modalidade, a % em mol do lipídeo auxiliar pode ser de cerca de 30% em mol a cerca de 40% em mol. Em uma modalidade, a % em mol do lipídeo auxiliar é ajustada com base nas concentrações de lipídeo de amina, lipídeo neutro e lipídeo PEG para levar o componente lipídico a 100% em mol. Em algumas modalidades, o auxiliar em % em mol do lote de LNP será de ± 30%, ± 25%, ± 20%, ± 15%, ± 10%, ± 5% ou ± 2,5% da % em mol alvo. Em certas modalidades, a variabilidade entre lotes de LNP em mol será menor que 15%, menor que 10% ou menor que 5%.

[00288] Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 1% em mol a cerca de 10% em mol. Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 2% em mol a cerca de 10% em mol. Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 2% em mol a cerca de 8% em mol. Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 2% em mol a cerca de 4% em mol. Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 2,5% em mol a cerca de 4% em mol. Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 3% em mol. Em uma modalidade, a % em mol do lipídeo PEG pode ser de cerca de 2,5% em mol. Em algumas modalidades, o lipídeo PEG em % em mol do lote de LNP será de ± 30%, ± 25%, ± 20%, ± 15%, ± 10%, ± 5% ou ± 2,5% da % em mol de lipídeo PEG alvo. Em certas modalidades, a variabilidade entre lotes de LNP em mol será menor que 15%, menor que 10% ou menor que 5%.

[00289] Em certas modalidades, a carga inclui um mRNA que codifica um agente de ligação ao DNA guiado por RNA (por exemplo, uma Cas nuclease, uma Cas nuclease Classe 2 ou Cas9) e um gRNA ou um ácido nucleico que codifica um gRNA ou uma combinação de mRNA e gRNA. Em uma modalidade, uma composição de LNP pode compreender um lipídeo A ou seus equivalentes. Em alguns aspectos, o lipídeo de amina é o lipídeo A. Em alguns aspectos, o lipídeo de amina é um equivalente do lipídeo A, por exemplo, um análogo do lipídeo A. Em certos aspectos, o lipídeo de amina é um análogo acetal do lipídeo A. Em várias modalidades, uma composição de LNP compreende um lipídeo de amina, um lipídeo neutro, um lipídeo auxiliar e um lipídeo PEG. Em certas modalidades, o lipídeo auxiliar é o colesterol. Em certas modalidades, o lipídeo neutro é DSPC. Em modalidades específicas, o lipídeo PEG é PEG2k-DMG. Em algumas modalidades, uma composição de LNP pode compreender um lipídeo A, um lipídeo auxiliar, um lipídeo neutro e um lipídeo PEG. Em algumas modalidades, uma composição de LNP compreende um lipídeo de amina, DSPC, colesterol e um lipídeo PEG. Em algumas modalidades, a composição de LNP compreende um lipídeo PEG compreendendo DMG. Em certas modalidades, o lipídeo de amina é selecionado do lipídeo A e um equivalente do lipídeo A, incluindo um análogo de acetal do lipídeo A. Em modalidades adicionais, uma composição de LNP compreende lipídeo A, colesterol, DSPC e PEG2k-DMG.

[00290] Modalidades da presente divulgação também fornecem composições lipídicas descritas de acordo com a razão molar entre os grupos amina com carga positiva do lipídeo de amina (N) e os grupos fosfato com carga negativa (P) do ácido nucleico a ser encapsulado. Isso pode ser matematicamente representado pela equação N/P. Em algumas modalidades, uma composição de LNP pode compreender um componente lipídico que compreende um lipídeo de amina, um lipídeo auxiliar, um lipídeo neutro e um lipídeo auxiliar; e um componente de ácido nucleico, em que a razão N/P é de cerca de 3 a 10. Em algumas modalidades, uma composição de LNP pode compreender um componente lipídico que compreende um lipídeo de amina, um lipídeo auxiliar, um lipídeo neutro e um lipídeo auxiliar; e um componente de RNA, em que a razão N/P é de cerca de 3 a 10. Em uma modalidade, a razão N/P pode cerca de 5-7. Em uma modalidade, a razão N/P pode cerca de 4,5-8. Em uma modalidade, a razão N/P pode cerca de 6. Em uma modalidade, a razão N/P pode ser 6 ± 1. Em uma modalidade, a razão N/P pode cerca de 6 ± 0.5. Em algumas modalidades, a razão N/P será de ± 30%, ± 25%, ± 20%, ± 15%, ± 10%, ± 5% ou ± 2,5% da razão N/P alvo. Em certas modalidades, a variabilidade entre lotes de LNP em mol será menor que 15%, menor que 10% ou menor que 5%.

[00291] Em algumas modalidades, o componente de RNA pode compreender um mRNA, como um mRNA aqui divulgado, por exemplo, codificando uma Cas nuclease. Em uma modalidade, o componente de RNA pode compreender um mRNA de Cas9. Em algumas composições compreendendo um mRNA que codifica uma Cas nuclease, a LNP compreende ainda um ácido nucleico de gRNA, como um gRNA. Em algumas modalidades, o componente de RNA compreende um mRNA da Cas nuclease e um gRNA. Em algumas modalidades, o componente de RNA compreende um mRNA de Cas nuclease Classe 2 e um gRNA.

[00292] Em certas modalidades, uma composição de LNP pode compreender um mRNA codificando uma Cas nuclease, como uma Cas nuclease Classe 2, um lipídeo de amina, um lipídeo auxiliar, um lipídeo auxiliar, um lipídeo neutro e um lipídeo PEG. Em certas composições de LNP compreendendo um mRNA que codifica uma Cas nuclease, tal como uma Cas nuclease Classe 2, o lipídeo auxiliar é o colesterol. Em outras composições compreendendo um mRNA que codifica uma Cas nuclease, tal como uma Cas nuclease Classe 2, o lípido neutro é DSPC.

Em modalidades adicionais compreendendo um mRNA que codifica uma Cas nuclease, tal como uma Cas nuclease Classe 2, o lipídeo PEG é PEG2k-DMG ou PEG2k-C11. Em composições específicas que compreendem um mRNA que codifica uma Cas nuclease, tal como uma Cas nuclease Classe 2, o lipídeo de amina é selecionado do lipídeo A e seus equivalentes, como um análogo acetal do lipídeo A.

[00293] Em algumas modalidades, uma composição de LNP pode compreender um gRNA. Em certas modalidades, uma composição de LNP pode compreender um lipídeo de amina, um gRNA, um lipídeo auxiliar, um lipídeo neutro e um lipídeo PEG. Em certas composições de LNP compreendendo um gRNA, o lipídeo auxiliar é o colesterol. Em algumas composições compreendendo um gRNA, o lipídeo neutro é DSPC. Em modalidades adicionais compreendendo um gRNA, o lipídeo PEG é PEG2k-DMG ou PEG2k-C11. Em certas modalidades, o lipídeo de amina é selecionado do lipídeo A e seus equivalentes, como um análogo acetal do lipídeo A.

[00294] Em uma modalidade, uma composição de LNP pode compreender um sgRNA. Em uma modalidade, uma composição de LNP pode compreender um sgRNA de Cas9. Em uma modalidade, uma composição de LNP pode compreender um sgRNA de Cpf1. Em algumas composições compreendendo um sgRNA, a LNP inclui um lipídeo de amina, um lipídeo auxiliar, um lipídeo neutro e um lipídeo PEG. Em certas composições compreendendo um sgRNA, o lipídeo auxiliar é o colesterol. Em outras composições compreendendo um sgRNA, o lípido neutro é DSPC. Em modalidades adicionais compreendendo um sgRNA, o lipídeo PEG é PEG2k-DMG ou PEG2k- C11. Em certas modalidades, o lipídeo de amina é selecionado do lipídeo A e seus equivalentes, como análogos acetais do lipídeo A.

[00295] Em certas modalidades, uma composição de LNP compreende um mRNA divulgado aqui, que codifica uma Cas nuclease e um gRNA, que pode ser um sgRNA. Em uma modalidade, uma composição de LNP pode compreender um lipídeo de amina, um mRNA que codifica uma Cas nuclease, um gRNA, um lipídeo auxiliar, um lipídeo neutro e um lipídeo PEG. Em certas composições compreendendo um mRNA que codifica uma nuclease de Cas e um gRNA, o lipídeo auxiliar é o colesterol. Em algumas composições compreendendo um mRNA que codifica uma Cas nuclease e um gRNA, o lipídeo neutro é DSPC. Em modalidades adicionais compreendendo um mRNA que codifica uma Cas nuclease e um gRNA, o lipídeo PEG é PEG2k-DMG ou PEG2k-C11. Em certas modalidades, o lipídeo de amina é selecionado do lipídeo A e seus equivalentes, como análogos acetais do lipídeo A.

[00296] Em certas modalidades, as composições de LNP incluem um mRNA de Cas nuclease, como um mRNA de Cas Classe 2 e pelo menos um gRNA. Em certas modalidades, a composição de LNP inclui uma razão de gRNA para mRNA de Cas nuclease, como mRNA de Cas nuclease Classe 2 de cerca de 25:1 a cerca de 1:25. Em certas modalidades, a formulação de LNP inclui uma razão de gRNA para mRNA de Cas nuclease, como mRNA de Cas nuclease Classe 2 de cerca de 10:1 a cerca de 1:10. Em certas modalidades, a formulação de LNP inclui uma razão de gRNA para mRNA de Cas nuclease, como mRNA de Cas nuclease Classe 2 de cerca de 8:1 a cerca de 1:8. Conforme medido aqui, as razões são em peso. Em algumas modalidades, a formulação de LNP inclui uma razão de gRNA para mRNA de Cas nuclease, como mRNA de Cas Classe 2 de cerca de 5:1 a cerca de 1:5. Em algumas modalidades, a faixa da razão é de cerca de 3:1 a 1:3, cerca de 2:1 a 1:2, cerca de 5:1 a 1:2, cerca de 5:1 a 1:1, cerca de 3:1 a 1:2, cerca de 3:1 a 1:1, cerca de 3:1, cerca de 2:1 a 1:1. Em algumas modalidades, a razão de gRNA para mRNA é de cerca de 3:1 ou cerca de 2:1 Em algumas modalidades, a razão de mRNA de gRNA para Cas nuclease, como a Cas nuclease Classe 2, é de cerca de 1:1. A razão pode ser de cerca de 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, ou 1:25.

[00297] As composições de LNP aqui divulgadas podem incluir um ácido nucleico modelo. O ácido nucleico modelo pode ser coformulado com um mRNA que codifica uma Cas nuclease, tal como um mRNA de Cas nuclease Classe 2. Em algumas modalidades, o ácido nucleico modelo pode ser coformulado com um RNA guia. Em algumas modalidades, o ácido nucleico modelo pode ser co-formulado com um mRNA que codifica uma Cas nuclease e um RNA guia. Em algumas modalidades, o ácido nucleico modelo pode ser formulado separadamente de um mRNA que codifica uma Cas nuclease ou um RNA guia. O ácido nucleico modelo pode ser distribuído com ou separadamente das composições de LNP. Em algumas modalidades, o ácido nucleico modelo pode ser de fita simples ou dupla, dependendo do mecanismo de reparo desejado. O modelo pode ter regiões de homologia para o DNA alvo ou para sequências adjacentes ao DNA alvo.

[00298] Qualquer uma das formulações de LNPs e LNP aqui descritas é adequada para a distribuição de um mRNA que codifica um agente de ligação ao DNA guiado por RNA, como uma nuclease Cas, sozinho ou em conjunto com um ou mais RNAs guia. Em algumas modalidades, uma composição de LNP é englobada compreendendo: um componente de RNA e um componente lipídico, em que o componente lipídico compreende um lipídeo de amina, um lipídeo neutro, um lipídeo auxiliar e um lipídeo furtivo; e em que a razão N/P é de cerca de 1-10.

[00299] Em alguns casos, o componente lipídico compreende o lipídeo A ou seu análogo acetal, colesterol, DSPC e PEG-DMG; e em que a razão N/P é de cerca de 1-10. Em algumas modalidades, o componente lipídico compreende: cerca de 40-60% em peso de lipídeo de amina; cerca de 5-15% em peso de lípido neutro; e cerca de 1,5 a 10% em mol de lipídeo PEG, em que o restante do componente lipídico é lipídeo auxiliar e em que a razão N/P da composição de LNP é de cerca de 3-10. Em algumas modalidades, o componente lipídico compreende: cerca de 50-60% em peso de lipídeo de amina; cerca de 8 a 10% em peso de lípido neutro; e cerca de 2,5-4% em mol de lipídeo PEG, em que o restante do componente lipídico é lipídeo auxiliar e em que a razão N/P da composição de LNP é de cerca de 3-8. Em alguns casos, o componente lipídico compreende: cerca de 50-60% em peso de lipídeo de amina; cerca de 5-15% em mol de DSPC; e cerca de 2,5- 4% em mol de lipídeo PEG, em que o restante do componente lipídico é colesterol e em que a razão N/P da composição de LNP é de cerca de 3-8. Em alguns casos, o componente lipídico compreende: 48-53% em mol de lipídeo A; cerca de 8-10% em mol de DSPC; e 1,5-10% em mol de lipídeo PEG, em que o restante do componente lipídico é colesterol e em que a razão N/P da composição de LNP é 3-8 ± 0,2.

[00300] Em algumas modalidades, os LNPs são formados pela mistura de uma solução aquosa de RNA com uma solução lipídica à base de solvente orgânico, por exemplo, 100% de etanol. Soluções ou solventes adequados incluem ou podem conter: água, PBS, tampão Tris, NaCl, tampão citrato, etanol, clorofórmio, éter dietílico, ciclo- hexano, tetra-hidrofurano, metanol, isopropanol. Um tampão farmaceuticamente aceitável, por exemplo, para administração in vivo de LNPs, pode ser usado. Em certas modalidades, um tampão é usado para manter o pH da composição compreendendo LNPs em pH 6,5 ou acima. Em certas modalidades, um tampão é usado para manter o pH da composição compreendendo LNPs em pH 7,0 ou acima. Em certas modalidades, a composição tem um pH variando de cerca de 7,2 a cerca de 7,7. Em modalidades adicionais, a composição tem um pH variando de cerca de 7,3 a cerca de 7,7 ou variando de cerca de 7,4 a cerca de 7,6. Em outras modalidades, a composição tem um pH de cerca de 7,2, 7,3, 7,4, 7,5, 7,6 ou 7,7. O pH de uma composição pode ser medido com uma sonda de micro pH.

Em certas modalidades, um crioprotetor é incluído na composição.

Exemplos não limitativos de crioprotetores incluem sacarose, trealose, glicerol, DMSO e etileno glicol.

Composições exemplificativas podem incluir até 10% de crioprotetor, como, por exemplo, sacarose.

Em certas modalidades, a composição de LNP pode incluir cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10% de crioprotetor.

Em certas modalidades, a composição de LNP pode incluir cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10% de sacarose.

Em algumas modalidades, a composição de LNP pode incluir um tampão.

Em algumas modalidades, o tampão pode compreender um tampão fosfato (PBS), um tampão Tris, um tampão citrato e misturas dos mesmos.

Em certas modalidades exemplificativas, o tampão compreende NaCl.

Em certas modalidades, o NaCl é omitido.

Quantidades exemplificativas de NaCl podem variar de cerca de 20 mM a cerca de 45 mM.

Quantidades exemplificativas de NaCl podem variar de cerca de 40 mM a cerca de 50 mM.

Em algumas modalidades, a quantidade de NaCl é de cerca de 45 mM.

Em algumas modalidades, o tampão é um tampão Tris.

Quantidades exemplificativas de Tris podem variar de cerca de 20 mM a cerca de 60 mM.

Quantidades exemplificativas de Tris podem variar de cerca de 40 mM a cerca de 60 mM.

Em algumas modalidades, a quantidade de Tris é de cerca de 50 mM.

Em algumas modalidades, o tampão compreende NaCl e Tris.

Certas modalidades exemplificativas das composições de LNP contêm sacarose a 5% e NaCl 45 mM em tampão Tris.

Em outras modalidades exemplificativas, as composições contêm sacarose em uma quantidade de cerca de 5% p/v, cerca de NaCl 45 nM e cerca de Tris 50 nM a pH 7,5. As quantidades de sal, tampão e crioprotetor podem variar de tal modo que a osmolalidade da formulação geral seja mantida. Por exemplo, a osmolaridade final pode ser mantida em menos de 450 mOsm/L. Em outras modalidades, a osmolaridade está entre 350 e 250 mOsm/L. Certas modalidades têm uma osmolalidade final de 300 +/- 20 mOsm/L.

[00301] Em algumas modalidades, mistura microfluídica, mistura T ou mistura cruzada é usada. Em certos aspectos, as taxas de fluxo, tamanho da junção, geometria da junção, forma da junção, diâmetro do tubo, soluções e/ou concentrações de RNA e lipídeos podem variar. As composições de LNP ou LNP podem ser concentradas ou purificadas, por exemplo, via diálise, filtração de fluxo tangencial ou cromatografia. Os LNPs podem ser armazenados como uma suspensão, uma emulsão ou um pó liofilizado, por exemplo. Em algumas modalidades, uma composição de LNP é armazenada a 2-8°C, em certos aspectos, as composições de LNP são armazenadas à temperatura ambiente. Em modalidades adicionais, uma composição de LNP é armazenada congelada, por exemplo, a -20°C ou -80°C. Em outras modalidades, uma composição de LNP é armazenada a uma temperatura variando de cerca de 0°C a cerca de -80°C. As composições de LNP congeladas podem ser descongeladas antes do uso, por exemplo no gelo, a 4°C, à temperatura ambiente ou a 25°C. As composições de LNP congeladas podem ser mantidas a várias temperaturas, por exemplo no gelo, a 4°C, à temperatura ambiente, a 25°C ou a 37°C.

[00302] Em algumas modalidades, uma composição de LNP tem mais de cerca de 80% de encapsulamento. Em algumas modalidades, uma composição de LNP tem um tamanho de partícula menor que cerca de 120 nm. Em algumas modalidades, uma composição de LNP tem um pdi menor que cerca de 0,2. Em algumas modalidades, pelo menos duas dessas características estão presentes. Em algumas modalidades, cada uma dessas três características está presente. Os métodos analíticos para determinar esses parâmetros são discutidos abaixo na seção geral de reagentes e métodos.

[00303] Em algumas modalidades, os LNPs associados a um mRNA divulgado neste documento são para uso na preparação de um medicamento.

[00304] A eletroporação também é um meio bem conhecido para distribuição de carga, e qualquer metodologia de eletroporação pode ser usada para distribuição de qualquer um dos gRNAs aqui divulgados. Em algumas modalidades, a eletroporação pode ser usada para distribuir um mRNA aqui divulgado e um ou mais RNAs guia.

[00305] Em algumas modalidades, é fornecido um método para distribuir um mRNA aqui divulgado a uma célula ex vivo, em que o mRNA está associado a um LNP ou não associado a um LNP. Em algumas modalidades, o mRNA/LNP ou mRNA também está associado a um ou mais RNAs guia.

[00306] Em algumas modalidades, quando um mRNA aqui divulgado é administrado a um mamífero em uma composição farmacêutica, o mamífero exibe uma resposta de citocina pelo menos 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 5,5, 6, 7, 7,5 , 8, 8,5, 9, 9,5 ou 10 vezes menor do que um mamífero administrado com um mRNA que codifica uma Cas 9 nuclease com mais de 150% do teor mínimo de uridina. Uma resposta de citocina pode ser determinada como descrito nos Exemplos. Uma diferença entre as respostas de citocinas pode ser medida como a alteração média em um painel de citocinas, como pelo menos uma, duas, três ou quatro das seguintes citocinas: IFN alfa, IL-6, TNF alfa e MCP-1. Em algumas modalidades, quando um mRNA aqui divulgado é administrado a um mamífero em uma composição farmacêutica, o mamífero exibe uma resposta de citocina pelo menos 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 5,5, 6, 7, 7,5 , 8, 8,5, 9, 9,5 ou 10 vezes menor do que um mamífero administrado com um mRNA com um ORF que codifica uma Cas 9 nuclease, em que a sequência do ORF consiste na SEQ ID NO: 5. Em algumas modalidades, as uridinas no ORF com uma sequência consistindo na SEQ ID NO: 5 não são modificadas. É geralmente entendido que as características da composição comparativa que não o mRNA devem ser mantidas constantes, incluindo a dose, e que a dose deve estar em uma faixa apropriada, como 0,1-5 mpk ou outras faixas descritas aqui (por exemplo, conforme discutido na seção Determinação da Eficácia do mRNA).

[00307] Em algumas modalidades, a sequência nucleotídica que codifica o RNA guia pode estar localizada no mesmo vetor, transcrito ou mRNA compreendendo a sequência nucleotídica que codifica o agente de ligação ao DNA guiado por RNA. Em algumas modalidades, a expressão do RNA guia e do agente de ligação ao DNA guiado por RNA pode ser conduzida por seus próprios promotores correspondentes. Em algumas modalidades, a expressão do RNA guia pode ser conduzida pelo mesmo promotor que aciona a expressão do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, o RNA guia e o ORF que codifica o agente de ligação ao DNA guiado por RNA podem estar contidos em um único transcrito. Por exemplo, o RNA guia pode estar dentro de uma região não traduzida (UTR) do transcrito do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, o RNA guia pode estar dentro da UTR 5' do transcrito do agente de ligação ao DNA guiado por RNA. Em outras modalidades, o RNA guia pode estar dentro da UTR 3' do transcrito do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, a meia-vida intracelular do transcrito do agente de ligação ao DNA guiado por RNA pode ser reduzida contendo o RNA guia dentro de sua UTR 3' e, assim, encurtando o comprimento de sua UTR 3'. Em modalidades adicionais, o RNA guia pode estar dentro de um íntron do transcrito do agente de ligação ao DNA guiado por RNA. Em algumas modalidades, sítios de emenda adequados podem ser adicionados no íntron dentro do qual o RNA guia está localizado, de modo que o RNA guia seja adequadamente emendado do transcrito. Em algumas modalidades, a expressão do agente de ligação ao DNA guiado por RNA e o RNA guia em estreita proximidade com o mesmo vetor pode facilitar a formação mais eficiente de um complexo de ribonucleoproteína do agente de ligação ao DNA guiado por RNA com o RNA guia.

[00308] Em algumas modalidades, é fornecida uma formulação farmacêutica compreendendo um mRNA de acordo com a divulgação. Em algumas modalidades, é fornecida uma formulação farmacêutica compreendendo pelo menos um lipídeo, por exemplo, um LNP que compreende um mRNA de acordo com a divulgação. Qualquer LNP adequado para a distribuição de RNA pode ser usado, como os descritos acima; exemplos de LNPs adicionais são descritos em PCT/US2017/024973, depositado em 30 de março de 3017. Uma formulação farmacêutica pode ainda compreender um transportador farmaceuticamente aceitável, por exemplo, água ou um tampão. Uma formulação farmacêutica pode ainda compreender um ou mais excipientes farmaceuticamente aceitáveis, como um estabilizador, conservante, agente de volume ou semelhante. Uma formulação farmacêutica pode ainda compreender um ou mais sais farmaceuticamente aceitáveis, como cloreto de sódio. Em algumas modalidades, a formulação farmacêutica é formulada para administração intravenosa. Em algumas modalidades, a formulação farmacêutica é formulada para distribuição na circulação hepática. C. Determinação da eficácia do mRNA

[00309] Em algumas modalidades, a eficácia de um mRNA é determinada quando expressa junto com outros componentes de um RNP, por exemplo, pelo menos um gRNA, como um gRNA direcionado a TTR.

[00310] Um agente de ligação ao DNA guiado por RNA com atividade da clivase pode levar a quebras no DNA de fita dupla. A junção de extremidade não homóloga (NHEJ) é um processo pelo qual as quebras de fita dupla (DSBs) no DNA são reparadas por meio de religação das extremidades de ruptura, o que pode produzir erros na forma de mutações de inserção/exclusão (indel). As extremidades de DNA de um DSB são frequentemente sujeitas a processamento enzimático, resultando na adição ou remoção de nucleotídeos em uma ou nas duas fitas antes da junção das extremidades. Essas adições ou remoções antes da reunificação resultam na presença de mutações de inserção ou exclusão (indel) na sequência de DNA no sítio do reparo do NHEJ. Muitas mutações devidas a indels alteram o quadro de leitura ou introduzem códons de parada prematura e, portanto, produzem uma proteína não funcional.

[00311] Em algumas modalidades, a eficácia de um mRNA que codifica uma nuclease é determinada com base em modelos in vitro. Em algumas modalidades, o modelo in vitro são células HEK293. Em algumas modalidades, o modelo in vitro são células de hepatocarcinoma humano HUH7. Em algumas modalidades, o modelo in vitro são hepatócitos primários, como hepatócitos primários humanos ou de camundongo.

[00312] Em algumas modalidades, a eficácia de um RNA é medida pela porcentagem de edição do TTR. Procedimentos exemplificativos para determinar a porcentagem de edição são fornecidos nos Exemplos abaixo. Em algumas modalidades, a porcentagem de edição de TTR é comparada à porcentagem de edição obtida quando o mRNA compreende uma ORF da SEQ ID NO: 5 com uridina não modificada e todo o resto é igual.

[00313] Em algumas modalidades, a eficácia de um mRNA é determinada usando a concentração sérica de TTR em um camundongo após a administração de um LNP compreendendo o mRNA e um gRNA direcionado a TTR, por exemplo, SEQ ID NO: 42. Em algumas modalidades, a eficácia de um mRNA é determinada usando a concentração sérica de TTR em um rato após a administração de um LNP compreendendo o mRNA e um gRNA direcionado a TTR, por exemplo, SEQ ID NO: 69. A concentração sérica de TTR pode ser expressa em termos absolutos ou em % de knockdown em relação a um controle tratado com simulação. Em algumas modalidades, a eficácia de um mRNA é determinada usando edição percentual no fígado em um camundongo após a administração de um LNP compreendendo o mRNA e um gRNA direcionado a TTR, por exemplo, SEQ ID NO: 42. Em algumas modalidades, uma quantidade eficaz é capaz de atingir pelo menos 50% de edição ou 50% de knockdown de TTR sérica. Quantidades eficazes exemplificativas estão na faixa de 0,1 a 10 mg/kg (mpk), por exemplo, 0,1 a 0,3 mpk, 0,3 a 0,5 mpk, 0,5 a 1 mpk, 1 a 2 mpk, 2 a 3 mpk, 3 a 5 mpk, 5 a 10 mpk, ou 0,1, 0,2, 0,3, 0,5, 1, 2, 3, 5 ou 10 mpk.

[00314] Em algumas modalidades, a detecção de eventos de edição de genes, como a formação de mutações de inserção/deleção ("indel") e eventos de reparo direcionado por homologia (HDR) no DNA alvo, utiliza amplificação linear com um iniciador marcado e isolando os produtos de amplificação marcados (aqui após referido como método "LAM-PCR" ou "Linear Amplification (LA)").

[00315] Em algumas modalidades, o método compreende isolar o DNA celular de uma célula que foi induzida a ter uma quebra de fita dupla (DSB) e, opcionalmente, que foi fornecida com um modelo de HDR para reparar o DSB; realizar pelo menos um ciclo de amplificação linear do DNA com um iniciador marcado; isolar os produtos de amplificação linear que compreendem etiqueta, descartando assim qualquer produto de amplificação que foi amplificado com um iniciador não marcado; opcionalmente amplificar ainda mais os produtos isolados; e analisar os produtos de amplificação linear, ou os produtos amplificados adicionais, para determinar a presença ou ausência de um evento de edição, como, por exemplo, uma quebra de fita dupla, uma sequência de inserção, exclusão ou modelo de HDR no DNA alvo. Em alguns casos, o evento de edição pode ser quantificado. A quantificação e semelhantes, conforme aqui utilizados (incluindo no contexto de eventos de edição HDR e não HDR, como indels) incluem a detecção da frequência e/ou tipo(s) de eventos de edição em uma população.

[00316] Em algumas modalidades, apenas um ciclo de amplificação linear é conduzido.

[00317] Em alguns casos, o iniciador marcado compreende um código de barras molecular. Em algumas modalidades, o iniciador marcado compreende um código de barras molecular e apenas um ciclo de amplificação linear é conduzido.

[00318] Em algumas modalidades, a etapa de análise compreende sequenciar os produtos amplificados lineares ou os produtos amplificados adicionais. O sequenciamento pode compreender qualquer método conhecido pelos versados na técnica, incluindo o sequenciamento de próxima geração e a clonagem dos produtos de amplificação linear ou produtos amplificados adicionais em um plasmídeo e o sequenciamento do plasmídeo ou de uma porção do plasmídeo. Em outros aspectos, a etapa de análise compreende realizar PCR digital (dPCR) ou PCR digital de gotículas (ddPCR) nos produtos amplificados lineares ou nos produtos amplificados adicionais. Em outros casos, a etapa de análise compreende contatar os produtos amplificados lineares ou outros produtos amplificados com uma sonda de ácido nucleico projetada para identificar o DNA que compreende a sequência do modelo de HDR e detectar as sondas que se ligaram ao(s) produto(s) amplificado(s) ou produto(s) amplificado(s) adicional(is). Em algumas modalidades, o método compreende ainda determinar a localização do modelo de HDR no DNA alvo.

[00319] Em certas modalidades, o método compreende ainda determinar a sequência de um sítio de inserção no DNA alvo, em que o sítio de inserção é o sítio em que o modelo de HDR se incorpora ao DNA alvo e em que o sítio de inserção pode incluir alguma sequência de DNA alvo e algumas sequências de modelos HDR.

[00320] Em algumas modalidades, a amplificação linear do DNA alvo com um iniciador marcado é realizada por 1-50 ciclos, 1-60 ciclos, 1-70 ciclos, 1-80 ciclos, 1-90 ciclos ou 1-100 ciclos.

[00321] Em algumas modalidades, a amplificação linear do DNA alvo com um iniciador marcado compreende uma etapa de desnaturação para separar duplexes de DNA, uma etapa de recozimento para permitir a ligação do iniciador e uma etapa de alongamento. Em algumas modalidades, a amplificação linear é isotérmica (não requer uma mudança de temperatura). Em algumas modalidades, a amplificação linear isotérmica é uma amplificação isotérmica mediada por alça (LAMP), uma amplificação de deslocamento de fita (SDA), uma amplificação dependente de helicase ou uma reação de amplificação de enzima nicking.

[00322] Em algumas modalidades, o iniciador marcado emparelha com o DNA alvo pelo menos 50, pelo menos 60, pelo menos 70, pelo menos 80, pelo menos 90, pelo menos 100, pelo menos 110, pelo menos 120, pelo menos 130, pelo menos 140, pelo menos 150, pelo menos 160, pelo menos 170, pelo menos 180, pelo menos 190, pelo menos 200, pelo menos 210, pelo menos 220, pelo menos 230, pelo menos 240, pelo menos 250, pelo menos 260, pelo menos 270, pelo menos 280, pelo menos 290, pelo menos 300, pelo menos 1.000, pelo menos 5.000 ou pelo menos 10.000 nucleotídeos de distância do local do evento de edição esperado, por exemplo, o sítio de inserção, deleção ou inserção de modelo.

[00323] Em algumas modalidades, o iniciador marcado compreende um código de barras molecular. Em algumas modalidades, o código de barras molecular compreende uma sequência que não é complementar ao DNA alvo. Em algumas modalidades, o código de barras molecular compreende 6, 8, 10 ou 12 nucleotídeos.

[00324] Em algumas modalidades, o marcador no iniciador é biotina, estreptavidina, digoxigenina, uma sequência de DNA ou isotiocianato de fluoresceína (FITC).

[00325] Em algumas modalidades, os produtos de amplificação linear são isolados usando um reagente de captura específico para a etiqueta no iniciador. Em algumas modalidades, o reagente de captura está em uma esfera, suporte sólido, matriz ou coluna. Em algumas modalidades, a etapa de isolamento compreende contatar o(s) produto(s) de amplificação linear com um reagente de captura específico para a etiqueta no iniciador. Em algumas modalidades, o reagente de captura é biotina, estreptavidina, digoxigenina, uma sequência de DNA ou isotiocianato de fluoresceína (FITC).

[00326] Em algumas modalidades, o marcador é biotina e o reagente de captura é estreptavidina. Em algumas modalidades, o marcador é estreptavidina e o reagente de captura é biotina. Em algumas modalidades, a etiqueta está no terminal 5' do iniciador, no terminal 3' do iniciador, ou interno ao iniciador. Em algumas modalidades, a etiqueta e/ou o reagente de captura são removidos após a etapa de isolamento. Em algumas modalidades, a etiqueta e/ou o reagente de captura não são removidos e as etapas adicionais de amplificação e análise são realizadas na presença de etiqueta e/ou captura.

[00327] Em algumas modalidades, a amplificação adicional é não linear. Em algumas modalidades, a amplificação adicional é PCR digital, qPCR ou RT-PCR. Em algumas modalidades, o sequenciamento é o sequenciamento de próxima geração (NGS).

[00328] Em algumas modalidades, o DNA alvo é genômico ou mitocondrial. Em algumas modalidades, o DNA alvo é o DNA genômico de uma célula procariótica ou eucariótica. Em algumas modalidades, o DNA alvo é mamífero. O DNA alvo pode ser de uma célula que não se divide ou de uma célula que se divide. Em algumas modalidades, o DNA alvo pode ser de uma célula primária. Em algumas modalidades, o DNA alvo é de uma célula replicadora.

[00329] Em alguns casos, o DNA celular é cortado antes da amplificação linear. Em algumas modalidades, o DNA cortado tem um tamanho médio entre 0,5 kb e 20 kb. Em alguns casos, o DNA celular é cortado em um tamanho médio de 0,5, 0,75, 1,0, 1,25, 1,5, 1,75, 2,0, 2,25, 2,5, 2,75, 3,0, 3,25, 3,5, 3,75, 4,0, 4,25, 4,5, 4,75, 5,0, 5,25, 5,5, 5,75, 6,0, 6,25, 6,5, 6,75, 7,0, 7,25, 7,5, 7,75, 8,0, 8,25, 8,5, 8,75, 9,75, 9,25, 9,5, 9,75, 10,0, 10,25, 10,5, 10,75, 11,0, 11,25, 11,5, 11,75, 12,0, 12,25, 12,5, 12,75, 13,0, 13,25, 13,5, 13,75, 14,0, 14,25, 14,5, 14,75, 15,05, 15,25, 15,5, 15,5, 15,75, 16,0, 16,25, 16,5, 16,75, 17,0, 17,25, 17,5, 17,75, 18,0, 18,25, 18,5, 18,75, 19,0, 19,25, 19,5, 19,75 ou 20,0 kb. Em alguns casos, o DNA celular é cortado em um tamanho médio de cerca de 1,5 kb. D. Usos, métodos e tratamentos exemplificativos

[00330] Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é para uso na edição de genoma, por exemplo, na edição de um gene alvo. Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é para uso na modificação de um gene alvo, por exemplo, alteração de sua sequência ou status epigenético. Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é para uso na indução de uma quebra de fita dupla (DSB) dentro de um gene alvo. Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é para uso na indução de um indel dentro de um gene alvo . Em algumas modalidades, o uso de um mRNA, LNP ou composição farmacêutica divulgada neste documento é fornecido para a preparação de um medicamento para edição de genoma, por exemplo, edição de um gene alvo. Em algumas modalidades, o uso de um mRNA, LNP ou composição farmacêutica divulgada neste documento é fornecido para a preparação de um medicamento para modificar um gene alvo, por exemplo, alterar sua sequência ou status epigenético. Em algumas modalidades, o uso de um mRNA, LNP ou composição farmacêutica divulgada neste documento é fornecido para a preparação de um medicamento para induzir uma quebra de fita dupla (DSB) dentro de um gene alvo. Em algumas modalidades, o uso de um mRNA, LNP ou composição farmacêutica divulgada neste documento é fornecido para a preparação de um medicamento para induzir um indel dentro de um gene alvo. Em algumas modalidades, o gene alvo está em um sujeito, como um mamífero, como um humano. Em algumas modalidades, o gene alvo está em um órgão, como um fígado, como um fígado de mamífero, como um fígado humano. Em algumas modalidades, o gene alvo está em uma célula do fígado, como uma célula do fígado de mamífero, como uma célula do fígado humano. Em algumas modalidades, o gene alvo está em um hepatócito, como um hepatócito de mamífero, como um hepatócito humano. Em algumas modalidades, a célula hepática ou hepatócito está in situ. Em algumas modalidades, a célula hepática ou hepatócito é isolada, por exemplo, em uma cultura, como em uma cultura primária. Também são fornecidos métodos correspondentes aos usos aqui divulgados, que compreendem administrar o mRNA, LNP ou composição farmacêutica divulgada aqui a um sujeito ou contatar uma célula como as descritas acima com o mRNA, LNP ou composição farmacêutica aqui divulgada.

[00331] Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é para uso em terapia ou no tratamento de uma doença, por exemplo, amiloidose associada a TTR (ATTR). Em algumas modalidades, o uso de um mRNA aqui divulgado (por exemplo, em uma composição aqui fornecida) é fornecido para a preparação de um medicamento, por exemplo, para o tratamento de um sujeito com amiloidose associada à TTR (ATTR).

[00332] Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é administrado por via intravenosa para qualquer um dos usos discutidos acima a respeito de organismos, órgãos ou células in situ. Em algumas modalidades, um mRNA, LNP ou composição farmacêutica é administrado em uma dose na faixa de 0,01 a 10 mg/kg (mpk), por exemplo, 0,01 a 0,1 mpk, 0,1 a 0,3 mpk, 0,3 a 0,5 mpk, 0,5 a 1 mpk, 1 a 2 mpk, 2 a 3 mpk, 3 a 5 mpk, 5 a 10 mpk ou 0,1, 0,2, 0,3, 0,5, 1, 2, 3, 5 ou 10 mpk.

[00333] Em qualquer uma das modalidades anteriores envolvendo um sujeito, o sujeito pode ser mamífero. Em qualquer uma das modalidades anteriores envolvendo um sujeito, o sujeito pode ser humano. Em qualquer uma das modalidades anteriores envolvendo um sujeito, o sujeito pode ser uma vaca, porco, macaco, ovelha, cachorro, gato, peixe ou ave.

[00334] Em algumas modalidades, um mRNA, LNP ou composição farmacêutica divulgada neste documento é administrado por via intravenosa ou para administração intravenosa. Em algumas modalidades, os RNAs, composições e formulações guia são administrados na circulação hepática ou para administração na circulação hepática.

[00335] Em algumas modalidades, uma única administração de um mRNA, LNP ou composição farmacêutica divulgada neste documento é suficiente para derrubar a expressão do produto do gene alvo. Em algumas modalidades, uma única administração de um mRNA, LNP ou composição farmacêutica divulgada neste documento é suficiente para eliminar a expressão do produto do gene alvo. Em outras modalidades,

mais de uma administração de um mRNA, LNP ou composição farmacêutica divulgada neste documento pode ser benéfica para maximizar a edição, modificação, formação de indel, formação de DSB ou semelhantes via efeitos cumulativos.

[00336] Em algumas modalidades, a eficácia do tratamento com um mRNA, LNP ou composição farmacêutica divulgada aqui é vista em 1 ano, 2 anos, 3 anos, 4 anos, 5 anos ou 10 anos após a distribuição.

[00337] Em algumas modalidades, o tratamento diminui ou interrompe a progressão da doença.

[00338] Em algumas modalidades, o tratamento resulta em melhoria, estabilização ou lentidão da mudança na função do órgão ou nos sintomas da doença de um órgão, como o fígado.

[00339] Em algumas modalidades, a eficácia do tratamento é medida pelo aumento do tempo de sobrevida do sujeito. E. Moléculas de DNA exemplificativas, vetores, construtos de expressão, células hospedeiras e métodos de produção

[00340] Em certas modalidades, a divulgação fornece uma molécula de DNA compreendendo uma sequência que codifica qualquer um dos mRNAs que codificam um agente de ligação ao DNA guiado por RNA aqui descrito. Em algumas modalidades, além das sequências de agentes de ligação ao DNA guiado por RNA, a molécula de DNA compreende ainda ácidos nucleicos que não codificam agentes de ligação ao DNA guiado por RNA. Os ácidos nucleicos que não codificam agentes de ligação ao DNA guiado por RNA incluem, mas não estão limitados a, promotores, intensificadores, sequências regulatórias e ácidos nucleicos que codificam um RNA guia.

[00341] Em algumas modalidades, a molécula de DNA compreende ainda uma sequência de nucleotídeos que codifica um crRNA, um trRNA ou um crRNA e trRNA. Em algumas modalidades, a sequência nucleotídica que codifica o crRNA, trRNA ou crRNA e trRNA compreende ou consiste em uma sequência guia flanqueada por toda ou parte de uma sequência de repetição de um sistema CRISPR/Cas de ocorrência natural. O ácido nucleico compreendendo ou consistindo no crRNA, trRNA ou crRNA e trRNA pode ainda compreender uma sequência de vetores em que a sequência de vetores compreende ou consiste em ácidos nucleicos que não são naturalmente encontrados juntos com o crRNA, trRNA ou crRNA e trRNA. Em algumas modalidades, o crRNA e o trRNA são codificados por ácidos nucleicos não contíguos dentro de um vetor. Em outras modalidades, o crRNA e o trRNA podem ser codificados por um ácido nucleico contíguo. Em algumas modalidades, o crRNA e o trRNA são codificados por fitas opostas de um único ácido nucleico. Em outras modalidades, o crRNA e o trRNA são codificados pela mesma fita de um único ácido nucleico.

[00342] Em algumas modalidades, a molécula de DNA compreende ainda um promotor operacionalmente ligado à sequência que codifica qualquer um dos mRNAs que codificam um agente de ligação ao DNA guiado por RNA aqui descrito. Em algumas modalidades, a molécula de DNA é um construto de expressão adequado para expressão em uma célula de mamífero, por exemplo, uma célula humana ou uma célula de camundongo, como um hepatócito humano ou um hepatócito de roedor (por exemplo, camundongo). Em algumas modalidades, a molécula de DNA é um construto de expressão adequado para expressão em uma célula de um órgão de mamífero, por exemplo, um fígado humano ou um fígado de roedor (por exemplo, camundongo). Em algumas modalidades, a molécula de DNA é um plasmídeo ou um epissoma. Em algumas modalidades, a molécula de DNA está contida em uma célula hospedeira, como uma bactéria ou uma célula eucariótica cultivada. Bactérias exemplificativas incluem proteobactérias como E. coli. Células eucarióticas cultivadas exemplificativa incluem hepatócitos primários, incluindo hepatócitos de roedores (por exemplo, camundongo) ou origem humana; linhagens celulares de hepatócitos, incluindo hepatócitos de roedores (por exemplo, camundongo) ou origem humana; linhagens celulares humanas; linhagens celulares de roedores (por exemplo, camundongo); células CHO; fungos microbianos, como leveduras de fissão ou brotação, por exemplo, Saccharomyces, como S. cerevisiae; e células de insetos.

[00343] Em algumas modalidades, é fornecido um método de produção de um mRNA aqui divulgado. Em algumas modalidades, esse método compreende contatar uma molécula de DNA aqui descrita com uma RNA polimerase em condições permissivas para transcrição. Em algumas modalidades, o contato é realizado in vitro, por exemplo, em um sistema sem células. Em algumas modalidades, a RNA polimerase é uma RNA polimerase de origem bacteriófago, como a T7 RNA polimerase. Em algumas modalidades, são fornecidos NTPs que incluem pelo menos um nucleotídeo modificado como discutido acima. Em algumas modalidades, os NTPs incluem pelo menos um nucleotídeo modificado como discutido acima e não compreendem UTP.

[00344] Em algumas modalidades, um mRNA aqui divulgado isoladamente ou em conjunto com um ou mais RNAs guia, pode ser compreendido dentro ou distribuído por um sistema de vetor de um ou mais vetores. Em algumas modalidades, um ou mais dos vetores, ou todos os vetores, podem ser vetores de DNA. Em algumas modalidades, um ou mais dos vetores, ou todos os vetores, podem ser vetores de RNA. Em algumas modalidades, um ou mais dos vetores, ou todos os vetores, podem ser circulares. Em outras modalidades, um ou mais dos vetores, ou todos os vetores, podem ser lineares. Em algumas modalidades, um ou mais dos vetores, ou todos os vetores, podem ser encerrados em uma nanopartícula lipídica, lipossoma, nanopartícula não lipídica ou capsídeo viral. Os vetores exemplificativos não limitativos incluem plasmídeos, fagomídeos, cosmídeos, cromossomos artificiais,

minicromossomos, transposons, vetores virais e vetores de expressão.

[00345] Os vetores virais exemplificativos não limitativos incluem o vetor de vírus adeno-associado (AAV), vetores de lentivírus, vetores de adenovírus, vetores adenovirais dependentes de auxiliares (HDAd), vetores de vírus herpes simplex (HSV-1), bacteriófago T4, vetores de baculovírus e vetores de retrovírus. Em algumas modalidades, o vetor viral pode ser um vetor AAV. Em outras modalidades, o vetor viral pode um vetor de lentivírus. Em algumas modalidades, o lentivírus pode não ser integrante. Em algumas modalidades, o vetor viral pode ser um vetor adenovírus. Em algumas modalidades, o adenovírus pode ser um adenovírus de capacidade de alta clonagem ou "sem reforço", onde todas as regiões virais codificadoras, além das repetições terminais invertidas 5' e 3' (ITRs) e o sinal de empacotamento ('I'), são excluídas do vírus para aumentar sua capacidade de empacotamento. Em ainda outras modalidades, o vetor viral pode ser um vetor HSV-1. Em algumas modalidades, o vetor baseado em HSV-1 é dependente do auxiliar e, em outras modalidades, é independente do auxiliar. Por exemplo, um vetor de amplicon que retém apenas a sequência de empacotamento requer um vírus auxiliar com componentes estruturais para empacotamento, enquanto um vetor HSV-1 excluído de 30kb que remove funções virais não essenciais não requer vírus auxiliar. Em modalidades adicionais, o vetor viral pode ser o bacteriófago T4. Em algumas modalidades, o bacteriófago T4 pode ser capaz de empacotar quaisquer moléculas lineares ou circulares de DNA ou RNA quando a cabeça do vírus é esvaziada. Em outras modalidades, o vetor viral pode ser um vetor de baculovírus. Em ainda outras modalidades, o vetor viral pode ser um vetor de retrovírus. Em modalidades que usam vetores AAV ou lentivirais, que possuem menor capacidade de clonagem, pode ser necessário usar mais de um vetor para distribuir todos os componentes de um sistema vetorial, conforme divulgado neste documento. Por exemplo, um vetor AAV pode conter sequências que codificam uma proteína Cas, enquanto um segundo vetor AAV pode conter uma ou mais sequências guia.

[00346] Em algumas modalidades, o vetor pode ser capaz de direcionar a expressão de uma ou mais sequências de codificação, como a sequência de codificação de um mRNA divulgado neste documento, em uma célula. Em algumas modalidades, a célula pode ser uma célula procariótica, como, por exemplo, uma célula bacteriana. Em algumas modalidades, a célula pode ser uma célula eucariótica, como, por exemplo, uma célula de levedura, planta, inseto ou mamífero. Em algumas modalidades, a célula eucariótica pode ser uma célula de mamífero. Em algumas modalidades, a célula eucariótica pode ser uma célula de roedor. Em algumas modalidades, a célula eucariótica pode ser uma célula humana. Os promotores adequados para conduzir a expressão em diferentes tipos de células são conhecidos na técnica. Em algumas modalidades, o promotor pode ser do tipo selvagem. Em outras modalidades, o promotor pode ser modificado para expressão mais eficiente ou eficaz. Em ainda outras modalidades, o promotor pode ser truncado e ainda reter sua função. Por exemplo, o promotor pode ter um tamanho normal ou um tamanho reduzido adequado para o empacotamento adequado do vetor em um vírus.

[00347] Em algumas modalidades, o sistema de vetor pode compreender uma cópia de uma sequência de nucleotídeos que codifica um agente de ligação ao DNA guiado por RNA. Em outras modalidades, o sistema de vetor pode compreender mais de uma cópia de uma sequência de nucleotídeos que codifica um agente de ligação ao DNA guiado por RNA. Em algumas modalidades, a sequência nucleotídica que codifica o agente de ligação ao DNA guiado por RNA pode ser operacionalmente ligada a pelo menos uma sequência de controle de transcrição ou tradução. Em algumas modalidades, a sequência nucleotídica que codifica a nuclease pode estar operacionalmente ligada a pelo menos um promotor.

[00348] Em algumas modalidades, o promotor pode ser constitutivo, induzível ou específico de tecido. Em algumas modalidades, o promotor pode ser um promotor constitutivo. Os promotores constitutivos exemplificativos não limitativos incluem o promotor inicial imediato de citomegalovírus (CMV), promotor do vírus símio (SV40), promotor tardio principal de adenovírus (MLP), promotor do vírus do sarcoma Rous (RSV), promotor do vírus do tumor mamário de camundongos (MMTV), promotor de fosfoglicerato quinase (PGK), promotor do fator de alongamento alfa (EF1a), promotores de ubiquitina, promotores de actina, promotores de tubulina, promotores de imunoglobulina, um fragmento funcional do mesmo ou uma combinação de qualquer um dos anteriores. Em algumas modalidades, o promotor pode ser um promotor de CMV. Em algumas modalidades, o promotor pode ser um promotor de CMV truncado. Em outras modalidades, o promotor pode ser um promotor de EF1a. Em algumas modalidades, o promotor pode ser um promotor induzível. Os promotores indutíveis exemplificativos não limitativos incluem aqueles induzíveis por choque térmico, luz, produtos químicos, peptídeos, metais, esteroides, antibióticos ou álcool. Em algumas modalidades, o promotor induzível pode ser aquele que possui um baixo nível de expressão basal (não induzida), como, por exemplo, o promotor Tet-On® (Clontech).

[00349] Em algumas modalidades, o promotor pode ser um promotor específico de tecido, por exemplo, um promotor específico para expressão no fígado.

[00350] O vetor pode ainda compreender uma sequência nucleotídica que codifica pelo menos um RNA guia. Em algumas modalidades, o vetor compreende uma cópia do RNA guia. Em outras modalidades, o vetor compreende mais de uma cópia do RNA guia. Em modalidades com mais de um RNA guia, os RNAs guia podem ser não idênticos, de modo que direcionem sequências alvo diferentes ou podem ser idênticos, pois direcionam a mesma sequência alvo.

Em algumas modalidades em que os vetores compreendem mais de um RNA guia, cada RNA guia pode ter outras propriedades diferentes, como atividade ou estabilidade dentro de um complexo de ribonucleoproteínas com o agente de ligação ao DNA guiado por RNA.

Em algumas modalidades, a sequência nucleotídica que codifica o RNA guia pode ser operacionalmente ligada a pelo menos uma sequência de controle de transcrição ou tradução, como um promotor, um UTR 3' ou um UTR 5'. Em uma modalidade, o promotor pode ser um promotor de tRNA, por exemplo, tRNALys3, ou uma quimera de tRNA.

Ver Mefferd et al., RNA. 2015 21:1683-9; Scherer et al., Nucleic Acids Res. 2007 35: 2620–2628. Em algumas modalidades, o promotor pode ser reconhecido pela RNA polimerase III (Pol III). Exemplos não limitativos de promotores de Pol III incluem promotores U6 e H1. Em algumas modalidades, a sequência nucleotídica que codifica o RNA guia pode ser operacionalmente ligada a um promotor U6 humano ou de camundongo.

Em outras modalidades, a sequência nucleotídica que codifica o RNA guia pode ser operacionalmente ligada a um promotor H1 de camundongo ou humano.

Em modalidades com mais de um RNA guia, os promotores usados para conduzir a expressão podem ser iguais ou diferentes.

Em algumas modalidades, o nucleotídeo que codifica o crRNA do RNA guia e o nucleotídeo que codifica o trRNA do RNA guia podem ser fornecidos no mesmo vetor.

Em algumas modalidades, o nucleotídeo que codifica o crRNA e o nucleotídeo que codifica o trRNA podem ser acionados pelo mesmo promotor.

Em algumas modalidades, o crRNA e o trRNA podem ser transcritos em um único transcrito.

Por exemplo, o crRNA e o trRNA podem ser processados a partir do único transcrito para formar um RNA guia de molécula dupla.

Alternativamente, o crRNA e o trRNA podem ser transcritos para um RNA guia de molécula única. Em outras modalidades, o crRNA e o trRNA podem ser acionados por seus promotores correspondentes no mesmo vetor. Em ainda outras modalidades, o crRNA e o trRNA podem ser codificados por diferentes vetores.

[00351] Em algumas modalidades, as composições compreendem um sistema de vetores, em que o sistema compreende mais de um vetor. Em algumas modalidades, o sistema de vetor pode compreender um único vetor. Em outras modalidades, o sistema de vetores pode compreender dois vetores. Em modalidades adicionais, o sistema de vetor pode compreender três vetores. Quando diferentes RNAs guia são usados para multiplexação, ou quando várias cópias do RNA guia são usadas, o sistema vetorial pode compreender mais de três vetores.

[00352] Em algumas modalidades, o sistema de vetor pode compreender promotores induzíveis para iniciar a expressão somente depois que ele é distribuído a uma célula alvo. Os promotores indutíveis exemplificativos não limitativos incluem aqueles induzíveis por choque térmico, luz, produtos químicos, peptídeos, metais, esteroides, antibióticos ou álcool. Em algumas modalidades, o promotor induzível pode ser aquele que possui um baixo nível de expressão basal (não induzida), como, por exemplo, o promotor Tet-On® (Clontech).

[00353] Em modalidades adicionais, o sistema de vetor pode compreender promotores específicos de tecido para iniciar a expressão somente após ser distribuído em um tecido específico.

EXEMPLOS

[00354] Os exemplos a seguir são fornecidos para ilustrar certas modalidades divulgadas e não devem ser interpretados como limitando o escopo desta divulgação de qualquer forma.

[00355] Reagentes gerais e Métodos. Salvo indicação em contrário, o mRNA foi sintetizado por transcrição in vitro (IVT) usando um modelo de DNA plasmídeo linearizado e polimerase de T7 RNA.

A transcrição foi geralmente realizada a partir de construtos compreendendo um Promotor T7, uma sequência de transcrito aqui divulgada, como a SEQ ID NO: 43 (que compreende a SEQ ID NO: 1 e codifica a ORF de RNA da SEQ ID NO: 4) ou a SEQ ID NO: 48 (que compreende a SEQ ID NO: 2 e codifica o ORF de RNA da SEQ ID NO: 5) e uma cauda poli-A (SEQ ID NO: 63) codificada no plasmídeo.

As experiências nas quais foram testadas várias UTRs utilizaram construtos semelhantes, exceto que foram utilizadas sequências de transcritos, como SEQ ID NOs: 58 e 59. O DNA do plasmídeo contendo um promotor T7 e uma região poli (A/T) de 100 nt foi linearizado por incubação a 37°C por 2 horas com XbaI nas seguintes condições: 200 ng/μL de plasmídeo, 2 U/μL de XbaI (NEB) e 1x tampão de reação.

O XbaI foi inativado por aquecimento da reação a 65°C por 20 min.

O plasmídeo linearizado foi purificado a partir de sais de enzima e tampão usando uma coluna de sílica maxi spin (Epoch Life Sciences) e analisado por gel de agarose para confirmar a linearização.

A reação de IVT para gerar o mRNA modificado por Cas9 foi incubada a 37 C por 4 horas nas seguintes condições: plasmídeo linearizado 50 ng/µL; 2 mM cada de GTP, ATP, CTP e UTP ou, onde indicado, um trifosfato de nucleotídeo modificado (por exemplo, N1-metil pseudo- UTP) no lugar de CTP ou UTP (Trilink); ARCA 10 mM (Trilink); 5 U/mL de T7 RNA polimerase (NEB); 1 U/μL de inibidor da RNase murina (NEB); 0,004 U/μL de E. coli pirofosfatase inorgânica (NEB); e 1x tampão de reação.

Após a incubação de 4 horas, a TURBO DNase (ThermoFisher) foi adicionada a uma concentração final de 0,01 U/μL e a reação foi incubada por mais 30 minutos para remover o modelo de DNA.

O mRNA de Cas9 foi purificado a partir de enzimas e nucleotídeos usando um kit de limpeza de transcrito MegaClear de acordo com o protocolo do fabricante (ThermoFisher). Alternativamente, o mRNA foi purificado através de um protocolo de precipitação, que em alguns casos foi seguido por purificação por HPLC. Resumidamente, após a digestão com DNase, o mRNA foi precipitado adicionando 0,21x vol de uma solução de LiCl 7,5 M e misturando, e o mRNA precipitado foi sedimentado por centrifugação. Uma vez removido o sobrenadante, o mRNA foi reconstituído em água. O mRNA foi precipitado novamente usando acetato de amônio e etanol. Foi adicionado acetato de amônio 5M à solução de mRNA para uma concentração final de 2M juntamente com 2x volume de EtOH a 100%. A solução foi misturada e incubada a -20°C por 15 min. O mRNA precipitado foi novamente sedimentado por centrifugação, o sobrenadante foi removido e o mRNA foi reconstituído em água. Como etapa final, o mRNA foi precipitado usando acetato de sódio e etanol. Foi adicionado à solução 1/10 de acetato de sódio 3 M (pH 5,5), juntamente com 2x volume de EtOH a 100%. A solução foi misturada e incubada a -20°C por 15 min.. O mRNA precipitado foi novamente sedimentado por centrifugação, o sobrenadante foi removido, o sedimento foi lavado com etanol frio a 70% e deixado secar ao ar. O mRNA foi reconstituído em água. Para o mRNA purificado por HPLC, após a precipitação e reconstituição de LiCl, o mRNA foi purificado por HPLC RP-IP (ver, por exemplo, Kariko, et al. Nucleic Acids Research, 2011, Vol. 39, No. 21 e142). As frações escolhidas para a mistura foram combinadas e dessalinizadas por precipitação com acetato de sódio/etanol, conforme descrito acima.

[00356] Para todos os métodos, a concentração do transcrito foi determinada medindo a absorbância da luz a 260 nm (Nanodrop) e o transcrito foi analisado por eletroforese capilar por Bioanlayzer (Agilent).

[00357] Salvo indicação em contrário, foram realizadas experiências de edição in vivo com camundongos CD-1 fêmeas e ratos Sprague- Dawley da Charles River Laboratories. Salvo indicação em contrário, a análise dos níveis séricos de TTR em camundongos foi realizada como se segue. O sangue foi coletado e o soro foi isolado conforme indicado.

[00358] Onde indicado no exemplo aplicável, a indução de citocinas nos ratos tratados também foi medida. Para esta análise, aproximadamente 50-100 μL de sangue foram coletados por corte na veia da cauda para medições de citocinas séricas. Foi permitido que o sangue coagulasse à temperatura ambiente por aproximadamente 2 horas e depois centrifugou-se a 1000xg por 10 minutos antes de coletar o soro. Um ensaio multiplex de esferas magnéticas baseado em Luminex (Affymetrix ProcartaPlus, número de catálogo Exp040-00000- 801) medindo IL-6, TNF-alfa, IFN-alfa e MCP-1 foi usado para análise de citocinas coletadas nas amostras. Os reagentes e padrões do kit foram preparados conforme indicado no protocolo do fabricante. O soro de camundongo foi diluído 4 vezes usando o diluente da amostra fornecido e 50 μL foram adicionados aos poços contendo 50 μL das esferas magnéticas revestidas com anticorpo diluído. A placa foi incubada durante 2 horas à temperatura ambiente e depois lavada. Anticorpo diluído de biotina (50 μL) foi adicionado às esferas e incubado por 1 hora em temperatura ambiente. As esferas foram lavadas novamente antes de adicionar 50 μL de estreptavidina-PE diluída a cada poço, seguidas de incubação por 30 minutos. As esferas foram lavadas mais uma vez e depois suspensas em 100 μL de tampão de lavagem e lidas no instrumento Bio-Plex 200 (Bio-Rad). Os dados foram analisados usando o Bioplex Manager ver. pacote de análise 6.1 com concentrações de citocinas calculadas a partir de uma curva padrão usando um ajuste de curva logística de cinco parâmetros.

[00359] ATP, GTP, CTP e UTP não modificados foram utilizados, salvo indicação em contrário. Todos os mRNAs codificaram um sinal de localização nuclear, a menos que indicado de outra forma.

[00360] As LNPs foram formadas por mistura microfluídica das soluções de lipídeos e RNA usando um Instrumento de bancada Precision Nanosystems NanoAssemblrTM, de acordo com o protocolo do fabricante, ou mistura de fluxo cruzado, conforme descrito abaixo. Salvo indicação em contrário, as LNPs continham 45% de lipídeo A, 9% de DSPC, 44% de colesterol e 2% de PEG2k-DMG e uma razão N:P de 4,5. Formulação LNP - NanoAssemblr

[00361] Em geral, os componentes das nanopartículas lipídicas foram dissolvidos em etanol a 100% com o componente lipídico de várias razões molares. As cargas de RNA foram dissolvidas em citrato 25 mM, NaCl 100 mM, pH 5,0, resultando em uma concentração de carga de RNA de aproximadamente 0,45 mg/mL. As LNPs foram formuladas com uma razão molar de lipídeo de amina para fosfato de RNA (N:P) de cerca de 4,5 ou cerca de 6, com a razão de mRNA para gRNA a 1:1 em peso.

[00362] As LNPs foram formadas por mistura microfluídica das soluções de lipídeos e RNA usando um instrumento de bancada Precision Nanosystems NanoAssemblrTM , de acordo com o protocolo do fabricante. Uma razão de 2:1 de solvente aquoso para orgânico foi mantida durante a mistura usando taxas de fluxo diferenciais. Após a mistura, as LNPs foram coletadas, diluídas em água (aproximadamente 1:1 v/v), mantidas por 1 hora à temperatura ambiente e posteriormente diluídos com água (aproximadamente 1:1 v/v) antes da troca final do tampão. A troca final de tampão em Tris 50 mM, NaCl 45 mM, sacarose a 5% (p/v), pH 7,5 (TSS) foi concluída com colunas de dessalinização PD-10 (GE). Se necessário, as formulações foram concentradas por centrifugação com filtros centrífugos Amicon 100 kDa (Millipore). A mistura resultante foi então filtrada usando um filtro estéril de 0,2 μm. A LNP final foi armazenada a -80°C até uso posterior. Formulação LNP - Fluxo Cruzado

[00363] Para as LNPs preparadas usando a técnica de fluxo cruzado, as LNPs foram formadas por impacto da mistura a jato do lipídeo em etanol com dois volumes de soluções de RNA e um volume de água. O lipídeo em etanol é misturado através de uma mistura cruzada com os dois volumes de solução de RNA. Uma quarta corrente de água é misturada com a corrente de saída da cruz através de um tee em linha. (Ver WO2016010840 Figura 2.) As LNPs foram mantidas por 1 hora à temperatura ambiente e posteriormente diluídas com água (aproximadamente 1:1 v/v). As LNPs diluídas foram concentradas usando filtração de fluxo tangencial em um cartucho de folha plana (Sartorius, 100kD MWCO) e depois trocadas por tampão por diafiltração em Tris 50 mM, NaCl 45 mM, sacarose a 5% (p/v), pH 7,5 (TSS). Alternativamente, a troca final de tampão no TSS foi concluída com as colunas de dessalinização PD-10 (GE). Se necessário, as formulações foram concentradas por centrifugação com filtros centrífugos Amicon 100 kDa (Millipore). A mistura resultante foi então filtrada usando um filtro estéril de 0,2 μm. A LNP final foi armazenada a 4°C ou -80°C até uso posterior. Análise de Formulação

[00364] A Dispersão Dinâmica da Luz ("DLS") é usada para caracterizar o índice de polidispersividade ("pdi") e o tamanho das LNPs da presente divulgação. A DLS mede a dispersão da luz resultante da submissão de uma amostra a uma fonte de luz. PDI, conforme determinado a partir de medições DLS, representa a distribuição do tamanho de partícula (em torno do tamanho médio de partícula) em uma população, com uma população perfeitamente uniforme tendo um PDI de zero. O tamanho médio das partículas e a polidispersidade são medidos por dispersão de luz dinâmica (DLS) usando um instrumento Malvern Zetasizer DLS. As amostras de LNP foram diluídas 30X em PBS antes de serem medidas por DLS. O diâmetro médio Z, que é uma medida baseada na intensidade do tamanho médio das partículas, foi relatado juntamente com o diâmetro médio numérico e a pdi. Um instrumento Malvern Zetasizer também é usado para medir o potencial zeta da LNP. As amostras são diluídas 1:17 (50 uL em 800 uL) em 0,1X PBS, pH 7,4 antes da medição.

[00365] Um ensaio baseado em fluorescência (Ribogreen®, ThermoFisher Scientific) é usado para determinar a concentração total de RNA e o RNA livre. A eficiência da encapsulação é calculada como (RNA total - RNA livre)/RNA total. As amostras de LNP são diluídas adequadamente com 1x tampão TE contendo 0,2% de Triton-X 100 para determinar o RNA total ou 1x tampão TE para determinar o RNA livre. As curvas padrão são preparadas utilizando a solução de RNA inicial usada para fazer as formulações e diluídas em 1x tampão TE +/- 0,2% de Triton-X 100. O corante RiboGreen® diluído (de acordo com as instruções do fabricante) é então adicionado a cada um dos padrões e amostras e deixado incubar por aproximadamente 10 minutos à temperatura ambiente, na ausência de luz. Um leitor de microplacas SpectraMax M5 (Molecular Devices) é usado para ler as amostras com excitação, corte automático e comprimentos de onda de emissão definidos para 488 nm, 515 nm e 525 nm, respectivamente. O RNA total e o RNA livre são determinados a partir das curvas padrão apropriadas.

[00366] A eficiência da encapsulação é calculada como (RNA total - RNA livre)/RNA total. O mesmo procedimento pode ser usado para determinar a eficiência de encapsulamento de um componente de carga baseado em DNA. Para o DNA de fita simples, pode ser utilizado o Oligreen Dye, e para o DNA de fita dupla, o Picogreen Dye.

[00367] Tipicamente, ao preparar LNPs, o encapsulamento era > 80%, o tamanho das partículas era < 120 nm e a pdi era 0,2. Distribuição de LNP in vivo

[00368] Salvo indicação em contrário, camundongos fêmeas CD-1, com idades entre 6 e 10 semanas de idade, foram usadas em cada estudo. Os animais foram pesados e agrupados de acordo com o peso corporal para preparar soluções de dosagem com base no peso médio do grupo. As LNPs foram dosadas pela veia lateral da cauda em um volume de 0,2 mL por animal (aproximadamente 10 mL por quilograma de peso corporal). Os animais foram observados aproximadamente 6 horas após a dose para efeitos adversos. O peso corporal foi medido 24 horas após a administração, e os animais foram sacrificados em vários momentos por exsanguinação por punção cardíaca sob anestesia com isoflurano. O sangue foi coletado em tubos separadores de soro ou em tubos contendo citrato de sódio tamponado para plasma, como aqui descrito. Para estudos envolvendo edição in vivo, o tecido hepático foi coletado do lobo mediano ou de três lobos independentes (por exemplo, lobo mediano direito, mediano esquerdo e lateral esquerdo) de cada animal para extração e análise de DNA.

[00369] As coortes de camundongos foram medidas para edição do fígado por sequenciamento de próxima geração (NGS) e níveis séricos de TTR (dados não mostrados). Análise ELISA de Transtirretina (TTR)

[00370] O sangue foi coletado e o soro foi isolado como indicado. Os níveis séricos totais de TTR de camundongo foram determinados usando um Kit ELISA de Pré-albumina de Camundongo (Transtiretina) (Aviva Systems Biology, Cat. OKIA00111). Os níveis séricos de TTR de rato foram medidos usando um kit ELISA específico de rato (código de catálogo Aviva Systems Biology OKIA00159) de acordo com o protocolo do fabricante. Resumidamente, os soros foram diluídos em série com o diluente da amostra do kit até uma diluição final de 10.000 vezes. Esta amostra diluída foi então adicionada às placas de ELISA e o ensaio foi realizado de acordo com as instruções. Sequenciamento NGS

[00371] Em resumo, para determinar quantitativamente a eficiência da edição no local alvo no genoma, o DNA genômico foi isolado e o sequenciamento profundo foi utilizado para identificar a presença de inserções e deleções introduzidas pela edição de genes.

[00372] Os iniciadores de PCR foram projetados em torno do local alvo (por exemplo, TTR), e a área genômica de interesse foi amplificada. As sequências de iniciadores são fornecidas abaixo. PCR adicional foi realizado de acordo com os protocolos do fabricante (Illumina) para adicionar a química necessária para o sequenciamento. Os amplicons foram sequenciados em um instrumento Illumina MiSeq. As leituras foram alinhadas ao genoma de referência humano (por exemplo, hg38) após a eliminação daqueles com baixos índices de qualidade. Os arquivos resultantes que contêm as leituras foram mapeados para o genoma de referência (arquivos BAM), onde foram selecionadas leituras que se sobrepunham à região de interesse alvo e o número de leituras de tipo selvagem versus o número de leituras que contêm uma inserção, substituição ou deleção foi calculado.

[00373] A porcentagem de edição (por exemplo, "eficiência de edição" ou "porcentagem de edição") é definida como o número total de leituras de sequência com inserções ou deleções sobre o número total de leituras de sequência, incluindo o tipo selvagem.

1. Caracterização in vivo de mRNAs de Cas9 com nucleotídeos modificados

[00374] Os mRNAs compreendendo uma ORF como estabelecido na SEQ ID NO: 5 foram preparados com um teor variável de nucleotídeos modificados, como mostrado na Tabela 5 abaixo. Os mRNAs foram combinados com um RNA guia (G282; SEQ ID NO: 42) direcionando o gene da transtirretina (TTR) e incorporados às LNPs. A citidina não modificada foi usada em todos as LNPs, exceto LNP420. Tabela 5. LNP417-LNP421 para estudos in vivo LNP Cas9 SEQ ID NO Nucleotídeos modificados LNP417 5 N1-metil-pseudouridina LNP418 5 Nenhum

LNP Cas9 SEQ ID NO Nucleotídeos modificados LNP419 5 Pseudouridina LNP420 5 Pseudouridina e 5-metil citidina LNP421 5 60% de N1-metil-pseudouridina (40% de uridina não modificada)

[00375] LNP417-LNP421 foram administrados a camundongos com doses de 0,5 mg/kg (mpk) ou 1 mpk. A indução de citocina (IFN alfa, IL- 6, TNF alfa e MCP-1) foi medida 4 horas após a dose (hpd). Os resultados são mostrados em Figuras 1A-D.

[00376] Na necrópsia, 7 dias após a dose, soro e fígado foram coletados para medição da TTR sérica e análise da eficácia da edição, respectivamente. Os resultados são mostrados em Figuras 2A-B.

[00377] Foi observado que o uso de pseudouridina e 5-metil CTP aboliu quase completamente a indução de citocinas. O uso de N1-metil pseudouridina a 60% (LNP421) ou 100% (LNP417) também desencadeou menos indução de citocinas que o mRNA de Cas9 não modificado, e a extensão da redução em 60% de N1-metil pseudouridina foi semelhante a 100%.

[00378] Todos os construtos Cas9 modificadas foram igualmente eficazes na redução da TTR sérica e foram mais eficazes que o construto não modificado, talvez devido ao aumento da estabilidade. De acordo com os dados de edição do fígado, os construtos usando pseudouridina e N1-metil pseudouridina foram igualmente eficazes. O construto com pseudouridina e 5-metil citidina foi significativamente menos eficaz do que com a pseudouridina isolada. O construto com 60% de N1-metil pseudouridina pode ter sido ligeiramente menos eficaz do que o construto com 100% de N1-metil pseudouridina.

2. Desenvolvimento e caracterização in vitro de mRNAs modificados que codificam Cas9

[00379] Uma sequência Cas9 (SEQ ID NO: 1) foi projetada para melhorar a expressão do fígado e minimizar as uridinas.

Os códons foram escolhidos com base no teor mínimo possível de uridina e na expressão máxima do tRNA correspondente no fígado.

Para expressão do tRNA do fígado, ver Dittmar KA, PLos Genetics 2(12): e221 (2006). A redução do teor de uridina do mRNA de Cas9 visava diminuir a resposta imune inata ao mRNA e/ou fornecer outros benefícios.

A Tabela 6 mostra o códon hepático ideal com base nos níveis de tRNA e um códon com o número mínimo possível de uridinas.

Os casos em que o códon mínimo de uridina difere do códon ideal do fígado estão em negrito e itálico.

A tabela também mostra o número de cada aminoácido na sequência de aminoácidos de S. pyogenes Cas9 (SEQ ID NO: 3). Tabela 6: Parâmetros de otimização de códons Aminoácido Códon de fígado Códon de uridina Frequência de ideal mínima Cas9 A Alanina GCA GCA 73 G Glicina GGA GGA 73 V Valina GTC GTC 74 D Ácido aspártico GAT GAC 100 E ácido Glutamico GAA GAA 111 I Isoleucina ATC ATC 93 T Treonina ACA ACA 66 N Asparagina AAC AAC 70 K Lisina AAG AAG 155 S Serina TCG AGC 79 R Arginina AGA AGA 79 L Leucina CTG CTG 148 P Prolina CCG CCG 36 H Histidina CAC CAC 32 Q Glutamina CAG CAG 52 F Fenilalanina TTC TTC 64 Y Tirosina TAC TAC 55 C Cisteína TGC TGC 2 W Triptofano TGG TGG 7 M Metionina ATG ATG 22

[00380] No caso de ácido aspártico e serina, o códon hepático correspondente ao tRNA de maior expressão compreendia uma timidina, que seria transcrita como uridina no mRNA correspondente. O códon mínimo de uridina foi escolhido para ácido aspártico e serina (GAC e AGC, respectivamente). A sequência de ORF de Cas9 tinha 4140 nt de comprimento, continha 528 Us (12,8% de teor de uridina) e evitou a execução de 3 ou mais uridinas consecutivas na ORF. Houve 63 casos de dinucleotídeos UU na sequência (126/4140 = 3% de conteúdo de dinucleotídeo de uridina). SEQ ID NO: 2 fornece uma sequência Cas9 alternativa que contém 19,6% de uridina como um ORF de RNA.

[00381] A SEQ ID NO: 3 fornece a sequência de aminoácidos de Cas9, que é codificada por SEQ ID Nos: 1 e 2, pois o novo design do ORF de Cas9 não alterou a sequência de aminoácidos codificada. SEQ ID NO: 4 é a versão de RNA do ORF da SEQ ID NO: 1. A SEQ ID NO: 5 é a versão de RNA do ORF de SEQ ID NO: 2.

[00382] Os efeitos de nucleotídeos modificados também foram avaliados. UTPs modificados usados para transcrever o transcrito de Cas9 incluíram N1-metil-pseudo-UTP e 5-metóxi-UTP.

[00383] A estrutura de N1-metil-pseudo-UTP é:

[00384] A estrutura do 5-metóxi-UTP é:

[00385] Os rendimentos do transcrito in vitro (IVT) foram determinados para mRNAs compreendendo ORFs da SEQ ID NO: 4 e

5. Ambos codificaram um sinal de localização nuclear (NLS). A sequência compreendendo SEQ ID NO: 5 foi transcrita na presença de

UTP não modificado ou N1-metil-pseudo-UTP. A sequência compreendendo SEQ ID NO: 4 foi transcrita na presença de UTP não modificado. A IVT também foi realizada com porcentagens crescentes de 5-metóxi-UTP, como mostrado no eixo X da Figura 3, que mostra os rendimentos de cada um desses construtos, determinados espectrofotometricamente.

[00386] Esses resultados mostram que houve uma ligeira diminuição no rendimento à medida que o teor de 5-metoxiuridina do mRNA aumentou, mas o rendimento de mRNA foi aceitável em todas as condições. Assim, o mRNA de Cas9 pode ser gerado para ambas as sequências de Cas9 com rendimentos aceitáveis nas condições testadas.

[00387] A pureza dos mRNAs transcritos in vitro foi calculada usando a análise de área sob a curva (AUC) em traçados de eletroforese capilar (mRNA) de mRNA obtidos usando um Agilent Bioanalyzer 2100 (Figura 4). O mRNA da SEQ ID NO: 5 Cas9 gerado com UTP não modificado geralmente aumentou em pureza com o aumento da substituição de 5- metóxi-UTP, enquanto o mesmo construto feito com N1-metil-pseudo- UTP foi menos afetado pelo aumento da substituição de 5-metóxi-UTP.

[00388] A SEQ ID NO: 4 Cas9 feita com UTP não modificado parecia relativamente não afetada pela substituição de 5-metóxi-UTP, com um ligeiro aumento na pureza entre 0 e 20% de substituição com 5-metóxi- UTP.

[00389] A imunogenicidade de diferentes mRNAs foi avaliada por análise dot-blot com um anticorpo anti-dsRNA como uma medida do caráter de mRNA de fita dupla (ds), um indicador de potencial imunogenicidade (Figuras 5A-D). As Figuras 5B e 5D usaram a sequência de mRNA de Cas9 compreendendo a SEQ ID NO: 5 e a Figura 5C usou a sequência de mRNA de Cas9 compreendendo a SEQ ID NO: 4. Para construtos gerados com UTP não modificado (Figuras

5B-C), houve uma diminuição geral na cadeia dupla aparente com o aumento do teor de 5-metóxi-UTP. O mRNA gerado com N1-metil- pseudo-UTP (Figura 5D) mostrou menos ligação ao anticorpo anti- dsRNA, mas a ligação ao anticorpo também pareceu diminuir com o aumento do teor de 5-metóxi-UTP.

[00390] A eficiência da edição foi avaliada in vitro por transfecção de mRNA juntamente com um guia (G209; SEQ ID NO: 64) direcionado à transtirretina (TTR) em células Neuro 2A e medindo a edição percentual.

[00391] Como mostrado na Figura 6A, o mRNA de Cas9 foi transcrito a partir de um construto compreendendo SEQ ID NO: 2 com N1-metil-pseudo-UTP com 2 sequências de localização nuclear e uma etiqueta de HA (grupo indicado pelo suporte mais à esquerda), mRNA de Cas9 transcrito a partir de um construto compreendendo SEQ ID NO: 2 transcrita com UTP com 2 sequências de localização nuclear e uma etiqueta HA (grupo indicado por meio), e mRNA de Cas9 transcrito a partir de um construto compreendendo SEQ ID NO: 1 com UTP (grupo indicado pelo colchete à direita superior) foram avaliados. Para cada grupo, diferentes concentrações de mRNA de 0,1 ng-100 ng foram avaliadas com transcrição em quantidades crescentes de 5-metóxi-UTP de 0% a 100%, conforme indicado no eixo X. As células não tratadas não mostraram edição mensurável. A Figura 6B mostra os dados de eficiência de edição expressos como valores EC50 (ng).

[00392] O aumento do teor de 5-metóxi-UTP durante a transcrição pareceu ter um efeito negativo na eficiência da edição nas duas condições SEQ ID NO: 5, com transcritos também contendo N1-metil- pseudo-UTP sendo mais robustos que transcritos contendo UTP (por exemplo, a 60% e 80% de 5-metóxi-UTP). Em contraste, a eficiência de edição com a sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 mostrou pouco ou nenhum efeito do aumento do conteúdo de 5- metóxi-UTP. Assim, de acordo com este sistema, a sequência de mRNA de Cas9 compreendendo o mRNA da SEQ ID NO: 4 pode fornecer eficiência de edição semelhante com até 100% de 5-metóxi-uridina como as versões que contêm uridina não modificada.

3. Caracterização in vivo de mRNAs que codificam Cas9

[00393] A eficácia in vivo da sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 versus sequência de mRNA de Cas9 compreendendo SEQ ID NO: 5 e o efeito da transcrição da sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 na presença de UTP não modificado, N1-metil-pseudo-UTP, 40% de 5-metóxi-UTP + 60% de UTP não modificado ou 100% de 5-metóxi-UTP foram avaliados. A Tabela 7 fornece informações sobre esses grupos de estudo in vivo. Cada mRNA foi administrado como uma formulação de nanopartículas lipídicas (LNP). Tabela 7. LNP720-LNP724 para estudos in vivo LNP Cas9 ORF SEQ ID NO Nucleotídeo modificado LNP720 5 N1-metil-pseudouridina LNP721 4 N1-metil-pseudouridina LNP722 4 Não modificado LNP723 4 40% de 5-metoxiuridina/60% não modificado LNP724 4 5-metoxiuridina

[00394] O desenho do estudo in vivo foi o seguinte. Camundongos fêmeas CD-1 eram de Charles River (n = 5 por grupo). Os animais foram dosados por via intravenosa (i.v.) a 1 mg por quilograma (mpk) ou 0,5 mpk juntamente com um único RNA guia direcionado contra transtirretina (TTR) (SEQ ID No: 42). Os animais que receberam 1 dose de mpk foram sangrados 4 horas após a dose (hpd) para análise de citocinas de MCP-1, IL-6, IFN-alfa e TNF-alfa. Os animais foram avaliados em 24 hpd para o bem-estar geral. A necropsia foi realizada 7 dias após a dose, com sangue coletado para análise sérica de TTR e fígado coletado para análise de edição do sequenciamento de nova geração.

[00395] O soro da dose de animais com 1 mpk foi coletado e 4 hpd, e o soro foi preparado e executado no ensaio ProcartaPlex® Mouse 4- plex (Thermo Fisher) seguindo as instruções do fabricante. Os resultados para os níveis séricos de MCP-1, IL-6, IFN-alfa e TNF-alfa são apresentados nas Figuras 7A-D. Esses resultados indicaram que a sequência de mRNA de Cas9 compreendendo a SEQ ID NO: 4 preparada com um UTP modificado (LNP721, LNP723 ou LNP724) mostrou níveis relativamente baixos de produção de citocinas.

[00396] Os níveis de TTR no soro também foram avaliados 7 dias após a dose, como mostra a Figura 8A e a Tabela 8. A amostra do TSS (isto é, 5% de sacarose, NaCl 45 mM, Tris 50 mM a pH 7,5) indica níveis de TTR sem tratamento com LNP. Todas as formulações de LNP estão descritas na Tabela 7. Tabela 8: Resultados dos níveis séricos de TTR após dosagem de LNP720-LNP724 LNP Cas9 ORF SEQ ID NO Nucleotídeo modificado TTR (ug/ml), 0,5 mpk TTR (ug/ml), 1 mpk TSS N/A N/A 1019,0 LNP720 5 N1-metil-pseudouridina 559,4 287,2 LNP721 4 N1-metil-pseudouridina 160,1 35,3 LNP722 4 Não modificado 483,4 247,0 LNP723 4 40% de 5- 525,8 170,1 metoxiuridina/60% não modificado LNP724 4 5-metoxiuridina 774,0 505,4

[00397] A Tabela 9 e a Figura 8B fornecem resultados em termos de porcentagem de edição de TTR no fígado, medida pelo sequenciamento de próxima geração (NGS). Tabela 9: Resultados como edição percentual de TTR no fígado após dosagem de LNP720-LNP724 LNP Cas9 SEQ ID NO Nucleotídeo modificado % Edição, % Edição, 0,5 mpk 1 mpk TSS N/A N1-metil-pseudouridina 0,16

LNP Cas9 SEQ ID NO Nucleotídeo modificado % Edição, % Edição, 0,5 mpk 1 mpk LNP720 5 N1-metil-pseudouridina 34,9 50,3 LNP721 4 Não modificado 63,3 74,8 LNP722 4 40% de 5- 43,6 53,7 metoxiuridina/60% não modificado LNP723 4 5-metoxiuridina 31,8 63,2 LNP724 4 N1-metil-pseudouridina 15,9 35,2

[00398] Em comparação com a amostra de controle TSS, todos os LNPs compreendendo Cas9 mostraram redução nos níveis séricos de TTR e edição acima da linha de base. Ao comparar o mRNA de Cas9 padrão (SEQ ID No: 5, LNP720) à sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 mRNA (SEQ ID No: 4, LNP721), ambos transcritos com N1-metil-pseudo-UTP, a sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 mostrou atividade aprimorada (menor TTR e maior % de edição). Para a sequência de mRNA de Cas9 compreendendo a SEQ ID NO: 4, a atividade foi mais alta com N1-metil- pseudo-UTP e a transcrição com 40% de 5-metóxi-UTP + 60% de UTP não modificado (LNP723) deu uma atividade maior que com 100% de 5 -metóxi-UTP (LNP724).

[00399] Como medida dos efeitos fora do alvo, também foi medida a edição no baço para animais dosados com 1 mpk das formulações LNP descritas acima, como mostrado na Figura 7 e Tabela 10. Para todas as formulações LNP, seja com Cas9 ou Cas9 otimizado, edição superior a 20 vezes maior foi observada no fígado (Figura 6A). Tabela 10: Resultados da edição percentual de TTR no baço após a dosagem de 1mpk de LNPs compreendendo sgRNA e vários Cas9 LNP Cas9 SEQ ID NO Nucleotídeo modificado % Edição, 1 mpk TSS N/A N/A 0,1 LNP720 5 N1-metil-pseudouridina 0,66 LNP721 4 N1-metil-pseudouridina 2,42

LNP Cas9 SEQ ID NO Nucleotídeo modificado % Edição, 1 mpk LNP722 4 Não modificado 0,68 LNP723 4 40% de 5-metoxiuridina/60% não 1,12 modificado LNP724 4 5-metoxiuridina 0,34

4. Caracterização da eficácia de mRNAs que codificam Cas9 em hepatócitos primários de camundongo

[00400] A eficácia de vários LNPs foi avaliada in vitro em hepatócitos primários de camundongo (PMHs).

[00401] A 100 ng, todos os LNPs descritos na Tabela 5 suportaram a edição de TTR, como mostrado na Figura 10. Como esperado, as células não tratadas não mostraram a edição mensurável de TTR.

[00402] A Tabela 11 mostra os valores de EC50 calculados para cada LNP com base nos dados apresentados na Figura 10. Tabela 11: Valores estimados de EC50 (ng) para edição de genes de TTR em PMHs LNP EC50 LNP720 45,65 LNP721 23,04 LNP722 54,00 LNP723 52,40 LNP724 164,1 LNP685 59,88

5. Caracterização in vivo de LNPs contendo mRNA de Cas9 em ratos

[00403] A eficácia in vivo da sequência de mRNA de Cas9 compreendendo SEQ ID NO: 4 versus a sequência de mRNA de Cas9 compreendendo SEQ ID NO: 5 foi avaliada em ratos. A Tabela 12 fornece informações sobre esses grupos de estudo in vivo. O mRNA Cas9 padrão refere-se à SEQ ID No: 5, enquanto o mRNA desprovido de U (U-dep) refere-se à SEQ ID No: 4. Cada mRNA foi administrado como uma formulação de nanopartícula lipídica (LNP).

[00404] Detalhes das formulações de LNP716 (Cas9 padrão) e LNP738 (desprovido de U) são mostrados na Tabela 12. Tabela 12: Caracterização da formulação de LNP Prep de RNA e RNA Concentração Encapsulação Tamanho de Partícula LNP ID N:P processo (mg/mL) (%) partícula (nm) PDI Citrate-NaCl; X- 716 4,5 2,00 98 88,42 0,056 flow_TFF Citrate-NaCl; X- 738 4,5 2,22 97 92,80 0,044 flow_TFF PDI = índice de polidispersividade N:P = N:P razão, como descrito acima

[00405] TTR sérico foi medido como descrito anteriormente.

[00406] O mRNA de Cas9 com um ORF da SEQ ID NO: 5 foi comparado ao mRNA de Cas9 com um ORF da SEQ ID NO: 4 (Figuras 11A-B) em ratos com doses de 2 mpk e 5 mpk, como mostrado na Figura 9A e Tabela 13. Estes dados indicam que o ORF Cas9 da SEQ ID NO: 4 induziu maior redução no TTR sérico em comparação com o ORF Cas9 da SEQ ID NO: 5 em 2mpk e 5mpk. A Figura 9B e a Tabela 13 apresentam esses resultados como porcentagens relativas ao valor do controle tratado com TSS. A dose de 5 mpk de U-dep Cas9 LNP induziu uma redução superior a 90% nos níveis séricos de TTR. Tabela 13: Níveis séricos de TTR após a administração de formulações LNP716 e LNP738 Cas9 % KD =% de knockdown em comparação com a concentração sérica média de amostras de TSS.

[00407] A Figura 10 e a Tabela 14 mostram a edição de fígado de TTR após a administração das formulações LNP716 (padrão) e LNP738 (U-dep) a 2mpk e 5mpk. Enquanto TSS mostrou edição insignificante, ambas as formulações LNP716 e LNP738 induziram edição hepática de TTR. Na comparação das formulações, a formulação LNP738 compreendendo depleção de U induziu mais de duas vezes a edição da formulação LNP716 compreendendo Cas9 padrão. Tabela 14: Edição de fígado de TTR após dosagem com formulações Cas9 desprovidas de U e padrão

[00408] Estes dados indicam que o mRNA de Cas9 desprovido de U melhorou acentuadamente a extensão da edição de TTR no fígado.

6. Caracterização de mRNA com várias UTRs

[00409] Os mRNAs que codificam Cas9 com UTRs e +/- um marcador de hemaglutinina (HA), conforme indicado na Tabela 15, foram formulados como LNPs com um RNA guia direcionado à TTR (G282; SEQ ID NO: 42)). As LNPs foram montadas usando um Nano AssemblrTM, continham 45% de lipídeo A, 9% de DSPC, 44% de colesterol e 2% de PEG2k-DMG, foram purificados usando filtros Amicon PD10 e usados em uma concentração de 0,5 mg/ml (concentração de LNP). Camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados i.v. a 0,5 ou 1,0 mpk. Aos 7 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas. Tabela 15. Descrições e resultados do mRNA de LNP662-LNP669 das análises séricas de TTR e edição de fígado Dose TTR sérica (Avg TTR sérica (% LNP Descrição de mRNA Edição (%) (mpk) ug/mL) média KD) TSS - - 944,52 0,06 1 729,56 22,76 20,08 LNP662 ORF:SEQ ID NO: 5; noHA Tag 0,5 988,75 -4,68 8,26 ORF:SEQ ID NO: 45 com etiqueta 1 488,62 48,27 39,12 LNP663 HA 0,5 842,88 10,76 20,18 ORF: SEQ ID NO: 45 com etiqueta 1 628,35 33,47 32,68 LNP664 HA; HBA UTRs 0,5 1087,10 -15,10 14,68 ORF: SEQ ID NO: 45 com etiqueta 1 524,43 44,48 42,70 LNP665 HA; HBB UTRs 0,5 797,37 15,58 18,72 ORF: SEQ ID NO: 45 com etiqueta 1 233,46 75,28 54,28 LNP666 HA; XBG UTRs 0,5 1011,22 -7,06 17,96 ORF: SEQ ID NO: 4; sem etiqueta 1 197,58 79,08 58,64 LNP667 HA 0,5 689,24 27,03 31,26 ORF: SEQ ID NO: 4; sem etiqueta 1 622,42 34,10 34,44 LNP668 HA; NTPs não modificados 0,5 811,94 14,04 21,30 ORF: SEQ ID NO: 5; sem etiqueta 1 1050,68 -11,24 9,82 LNP669 HA; NTPs não modificados 0,5 1189,70 -25,96 4,04

[00410] UTRs nos mRNAs eram HSD/Alb, a menos que indicado de outra forma. HBA: alfa globina humana; HBB: beta globina humana (HBB); XBG: xenopus beta globina (XBG). Os mRNAs continham 100% de N1-metil pseudouridina no lugar da uridina, a menos que indicado de outra forma.

[00411] As Figuras 13A-E mostram TTR sérica (como µg/ml na Figura 13A e % de TSS na Figura 13B); edição de fígado para todas as LNPs 662-669 (Figura 13C); edição de fígado para LNP663-LNP666, na qual apenas as UTRs variaram (Figura 13D); e edição de fígado para LNP662 e LNP667-LNP669 nos quais apenas a sequência de mRNA e a modificação de UTP variaram (Figura 13E).

[00412] As UTRs de albumina humana, alfa globina humana, beta globina humana e xenopus beta globina foram aproximadamente igualmente eficazes; os valores da alfa globina humana podem ser um pouco mais baixos, mas não ficou claro se a diferença foi significativa.

[00413] O ORF da SEQ ID NO: 4, que contém menos uridinas, aumentou a quantidade de edição no fígado. Os mRNAs de Cas9 feitos com N1-metil pseudouridina foram mais eficazes que os mRNAs de Cas9 feitos com uridina não modificada.

7. Edição In Vitro e In Vivo com razões Guia:Cas9 diferentes

[00414] Os mRNAs que compreendem um ORF de acordo com a SEQ ID NO: 4 ou SEQ ID NO: 5 foram formulados como LNPs com um RNA guia direcionado à TTR, com variadas razões de peso de guia:mRNA de Cas9, como mostrado na Tabela 16. O mRNA de Cas9 foi produzido por síntese da IVT, conforme indicado acima, com trifosfato de N1-metilpseudouridina em vez de trifosfato de uridina, HSD 5' UTR, albumina 3' UTR humana e cauda poli-A. Tabela 16. LNPs 815-824 para estudos in vitro e in vivo LNP Cas9 SEQ ID NO Razão de RNA (Guia:Cas9) LNP815 5 2:1 LNP816 5 1:1 LNP817 5 1:2 LNP818 5 1:4 LNP819 5 1:8 LNP820 4 2:1 LNP821 4 1:1 LNP822 4 1:2 LNP823 4 1:4 LNP824 4 1:8

[00415] Hepatócitos primários de camundongo (PMH) foram semeados em meio de cultura suplementado com soro de macaco cynomolgus a 3% por 24 horas e depois tratados com 0,3, 1, 3 ou 10 ng de um LNP mostrado na Tabela 16. As células foram lisadas após 48 horas e a % de edição foi determinada por NGS. Os resultados são mostrados na Figura 14 e na Tabela 17.

Tabela 17. Edição in vitro em PMHs Razão LNP mRNA 10 ng 3 ng 1 ng 0.3 ng Guia:mRNA LNP815 5 2:1 75,0 41,7 9,3 1,3 LNP816 5 1:1 80,9 51,5 15,5 2,6 LNP817 5 1:2 79,1 49,8 16,3 2,2 LNP819 5 1:8 90,7 67,2 27,8 5,2 LNP820 4 2:1 78,8 44,3 9,8 0,9 LNP821 4 1:1 81,9 49,9 12,3 2,1 LNP823 4 1:4 85,5 58,3 17,8 2,0 LNP824 4 1:8 84,9 47,4 13,1 1,6

[00416] Para caracterização in vivo, as LNPs foram administradas a camundongos a 0,2, 0,5 ou 1 mpk (n = 5 por grupo). Aos 8 dias após a dose, os animais foram sacrificados, o sangue e o fígado e o baço foram coletados e a TTR sérica, a edição do fígado e a edição do baço foram medidas. Os resultados de TTR sérica são mostrados em Figuras 15A- B e Tabela 18. Os resultados da edição do fígado são mostrados em Figuras 16A-B e Tabela 19. Os resultados da edição do baço são mostrados em Figuras 17A-B e Tabela 20. Os camundongos de controle negativo foram dosados com veículo (solução de transformação e armazenamento; "TSS"). Foram realizados controles separados para as experiências com LNP815-LNP819 e para as experiências com LNP820-LNP824. Tabela 18. Níveis séricos de TTR após a administração de LNP815- LNP824 Razão de LNP Dose (mpk) TTR sérica (ug/mL) TTR sérica (%KD) Guia:Cas9 TSS 974,23 - 1 300,32 69,17 LNP815 2:1 0,5 539,37 44,64 0,2 800,85 17,80 1 183,61 81,15 LNP816 1:1 0,5 466,63 52,10 0,2 859,05 11,82 1 117,86 87,90 LNP817 1:2 0,5 487,26 49,99

Razão de LNP Dose (mpk) TTR sérica (ug/mL) TTR sérica (%KD) Guia:Cas9 0,2 715,35 26,57 1 168,44 82,71 LNP818 1:4 0,5 428,89 55,98 0,2 935,14 4,01 1 323,87 72,29 LNP819 1:8 0,5 664,80 31,76 0,2 1039,66 -6,72 TSS 1104,27 - 1 38,12 96,55 LNP820 2:1 0,5 122,59 88,90 0,2 358,88 67,50 1 38,53 96,51 LNP821 1:1 0,5 190,30 82,77 0,2 501,05 54,63 1 25,76 97,67 LNP822 1:2 0,5 123,34 88,83 0,2 520,73 52,84 1 28,00 97,46 LNP823 1:4 0,5 98,99 91,04 0,2 529,35 52,06 1 93,65 91,52 LNP824 1:8 0,5 174,43 84,20 0,2 731,43 33,76

% KD fornece a % de knock down no nível de TTR em relação ao controle TSS.

Tabela 19. Edição do fígado após a administração de LNP815- LNP824 LNP Razão de Guia:Cas9 Dose (MPK) % Edição TSS 0,78 1 57,52 LNP815 2:1 0,5 38,76 0,2 12,28 1 63,46 LNP816 1:1 0,5 40,26 0,2 14,12 1 68,18 LNP817 1:2 0,5 38,38 0,2 17,58 1 61,8 LNP818 1:4 0,5 41,58 0,2 9,44 1 55,88 LNP819 1:8 0,5 31,26 0,2 6,4 TSS 0,22 1 67 LNP820 2:1 0,5 69,58

LNP Razão de Guia:Cas9 Dose (MPK) % Edição 0,2 48,78 1 75,82 LNP821 1:1 0,5 64,02 0,2 41,2 1 73,26 LNP822 1:2 0,5 69,74 0,2 44,16 1 75,48 LNP823 1:4 0,5 66,7 0,2 38,7 1 69,14 LNP824 1:8 0,5 63,16 0,2 20,78

[00417] O LNP820-LNP824 geralmente deu resultados de edição do fígado maiores ou aproximadamente iguais aos seus equivalentes LNP815-LNP819 com a mesma razão. O LNP820-LNP824 mostrou desempenho consistente na faixa de razões testadas em 0,5 e 1 mpk e nas razões de 2:1 a 1:4 em 0,2 mpk. Tabela 20. Edição do baço após a administração de LNP815-824 LNP Razão de Guia:Cas9 Dose (MPK) % Edição TSS 0,12 1 0,6 LNP815 2:1 0,5 0,62 0,2 0,28 1 0,74 LNP816 1:1 0,5 1 0,2 0,28 1 0,74 LNP817 1:2 0,5 0,58 0,2 0,22 1 1,22 LNP818 1:4 0,5 0,44 0,2 0,3 1 0,9 LNP819 1:8 0,5 0,64 0,2 0,36 TSS 0,225 1 0,83 LNP820 2:1 0,5 0,825 0,2 0,525 1 1,425 LNP821 1:1 0,5 0,9 0,2 0,425 1 1,85 LNP822 1:2 0,5 0,625 0,2 1,74

LNP Razão de Guia:Cas9 Dose (MPK) % Edição 1 1,475 LNP823 1:4 0,5 0,8 0,2 0,32 1 1,14 LNP824 1:8 0,5 1,34 0,2 0,56

[00418] Grupos adicionais de camundongos (n = 2) foram dosados a 3 mpk com cada formulação e sacrificados a 6 hpd para determinação da expressão de proteínas no fígado. Um Western blot de proteína do fígado dos camundongos tratados com 3 mpk de formulações de razão 1:1 e 1:4 (LNP816, LNP818, LNP821 e LNP823) é mostrado na Figura

18. O Ab primário para o Western foi o coelho ImmunopreciseTM anti- Cas9 a 1:5.000 e o Ab secundário foi o anti-coelho de cabra DylightTM a 1:12.500. A expressão da proteína Cas9 foi notavelmente mais alta nas LNPs usando o mRNA com um ORF de SEQ ID NO: 4.

8. Caracterização dos efeitos dos nucleotídeos modificados

[00419] Os mRNAs que codificam Cas9 e que contêm nucleotídeos modificados, como indicado na Tabela 21, foram formulados como LNPs com um RNA guia direcionado ao TTR (G282; SEQ ID NO: 42). A LNP1034 continha um mRNA de Cas9 obtido comercialmente da Trilink Biotechnologies, LLC e incluiu uma CleanCapTM (estrutura Cap1 na qual o primeiro nucleotídeo após o capeamento 7-metilguanina é 2'-O- metilado). LNP1027-LNP1033 continha um mRNA compreendendo um ORF de acordo com a SEQ ID NO: 4 e um ARCA (análogo de capeamento antirreverso) Cap0. As LNPs foram montadas usando um Nano AssemblrTM, continham 45% de lipídeo A, 9% de DSPC, 44% de colesterol e 2% de PEG2k-DMG, foram purificados usando filtros Amicon PD10 e foram suspensos em tampão TSS. A razão N:P (nitrogênio para fosfato) nas LNPs foi de 4,5 e a concentração de RNA das formulações foi de 0,4 mg/ml. Camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados i.v. a 0,1 ou 0,3 mpk. Aos 7 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a

TTR sérica e a edição do fígado foram medidas. Tabela 21. LNP1027-LNP1034 para estudos in vivo LNP ID Cas9 ORF Cap Nucleotídeo(s) modificado(s) LNP1027 SEQ ID NO: 4 ARCA N1-metil pseudouridina LNP1028 SEQ ID NO: 4 ARCA 25% 5-iodouridina LNP1029 SEQ ID NO: 4 ARCA 50% 5-iodouridina LNP1030 SEQ ID NO: 4 ARCA 25% 5-iodocitidina 25% 5-iodouridina e 25% 5- LNP1031 SEQ ID NO: 4 ARCA iodocitidina LNP1032 SEQ ID NO: 4 ARCA Pseudouridina LNP1033 SEQ ID NO: 4 ARCA Pseudouridina e 5-metil citidina LNP1034 Trilink Cas9 mRNA CleanCapTM 5-metóxi uridina

[00420] Para as LNPs nos quais os nucleotídeos de uridina e/ou citidina modificados estão listados em 25% ou 50%, os restantes da uridina e/ou citidina, respectivamente, não foram modificados.

[00421] Os resultados de TTR sérica são mostrados na Figura 19A- B (resultados de TTR sérica expressos em µg/mL e % de controle de TSS, respectivamente); Figura 20 (edição do fígado); e Tabela 22. Tabela 22. Resultados de TTR sérico e de edição de fígado para LNPs 1027-1034 Dose Nucleotídeo(s) TTr sérica TTR sérica (% % Média de

LNP ID (mpk) modificado(s) (ug/mL) KD) Edição TSS - 1438,438 - 0,20 0,3 N1-metil 381,474 73,48 51,08 LNP1027 0,1 pseudouridina 979,404 31,91 15,76 0,3 311,738 78,33 54,96 LNP 1028 25% 5-iodouridina 0,1 758,41 47,28 18,82 0,3 714,748 50,31 31,94 LNP1029 50% 5-iodouridina 0,1 1034,69 28,07 8,26 0,3 676,164 52,99 26,28 LNP1030 25% 5-iodocitidina 0,1 973,836 32,30 6,58 LNP1031 0,3 25% 5-iodouridina 546,946 61,98 30,30

Dose Nucleotídeo(s) TTr sérica TTR sérica (% % Média de

LNP ID (mpk) modificado(s) (ug/mL) KD) Edição e 25% 5- 0,1 iodocitidina 969,92 32,57 6,12 0,3 448,582 68,81 42,68 LNP1032 Pseudouridina 0,1 947,602 34,12 9,60 0,3 Pseudouridina e 979,284 31,92 11,36 LNP1033 0,1 5-metil citidina 1031,33 28,30 2,22 0,3 1133,826 21,18 4,82 LNP1034 5-metóxi uridina 0,1 1339,304 6,89 0,78

[00422] O mRNA contendo N1-metil pseudouridina do LNP1027 teve eficiência de edição um pouco maior em comparação com o mRNA contendo pseudouridina do LNP1032. A potência do mRNA contendo pseudouridina e 5-metilcitidina (LNP1033) foi bastante reduzida. O mRNA contendo 25% de 5-iodouridina apresentou eficiência de edição equivalente ao mRNA contendo N1-metil pseudouridina. Com 5% de iodouridina a 50%, houve uma redução na potência. O mRNA da 5- metoxiuridina da Trilink mostrou baixa atividade.

9. Caracterização dos efeitos de mRNAs com diferentes UTRs em ratos

[00423] Este estudo avaliou a eficácia in vivo em ratos de mRNAs de Cas9 capeados com ARCA com HBB (beta-globina humana) 5' e 3' UTRs; UTRs XBG (xenopus beta-globina) 5' e 3'; ou com a UTR humana HSD17B4 (HSD) 5' e a UTR 3' albumina (ALB).

[00424] Formulações contendo RNA guia direcionado ao gene TTR de rato (G534; SEQ ID NO: 72) e mRNA de Cas9 em uma razão molar de 1:1 em LNPs foram preparadas usando o processo de fluxo cruzado descrito acima e filtradas nas membranas VivaFlowTM 50. As LNPs continham lipídeos catiônicos (lipídeo A), colesterol, DSPC e PEG2k- DMG em uma razão molar de 45:9: 43:3 e tinham uma razão N:P de 6,0.

As formulações foram dosadas a 1 mpk e 0,3 mpk. Todos os ratos eram fêmeas Sprague Dawley do rio Charles, n = 5 por grupo. Na necrópsia (7 dias após a dose), o soro foi coletado para análise de TTR e o fígado foi coletado para análise de edição. No LNP1058, o mRNA continha HBB UTRs. No LNP1059, o mRNA continha XBG UTRs. No LNP1060, o mRNA continha HSD e ALB 5' e 3' UTRs, respectivamente. Em todos os casos, a sequência de codificação do mRNA estava de acordo com a SEQ ID NO: 4.

[00425] Os resultados da edição hepática e da TTR sérica são mostrados na Figura 21A-C e na Tabela 23. Tabela 23. Edição de fígado e resultados de TTR sérica em ratos com LNP1058-LNP1060. Edição de TTR sérica TTR sérica (% LNP UTRs Dose (mpk) fígado (%) (µg/ml) KD) TSS 0,0 1366,9 1 66,3 84,4 93,8 1058 HBB (3’ e 5’) 0,3 27,6 881,1 35,5 1 69,1 63,0 95,4 1059 XBG (3’ e 5’) 0,3 31,6 748,7 45,2 1 62,6 115,6 91,5 1060 HSD (5’) e ALB (3’) 0,3 20,9 896,0 34,4

[00426] Os resultados indicam que todos os mRNAs testados no LNP1058-LNP1060 foram capazes de suportar a edição. O nível mais alto de edição e a maior redução na TTR sérica foram observados com o mRNA contendo XBG UTRs no LNP1059.

10. Carga de RNA: coformulações de mRNA e gRNA

[00427] Este estudo avaliou a eficácia in vivo em camundongos de diferentes razões de gRNA para mRNA. Os mRNAs de Cas9 com capeamento CleanCap™ com o ORF da SEQ ID NO: 4, HSD 5' UTR, albumina humana 3' UTR, uma sequência de Kozak e uma cauda de poli-A foram produzidos por síntese de IVT, conforme indicado no

Exemplo 1 com N1-metilpseudouridina trifosfato no lugar de trifosfato de uridina.

[00428] As formulações de LNP foram preparadas a partir do mRNA descrito e sg282 (SEQ ID NO: 42; G282) como descrito no Exemplo 2 com lipídio A, colesterol, DSPC e PEG2k-DMG na proporção molar de 55: 33: 9: 3 e com uma razão N: P de 6. As proporções em peso de gRNA: Cas9 mRNA das formulações foram mostradas na Tabela 24. Tabela 24. Caracterização de LNP1110-LNP1116. Conc de RNA Tamanho de PDI de Média numérica LNP ID EE (%) (mg/mL) partícula (nm) partícula (nm) 1110 0,92 99 69,52 0,022 56,47 1111 0,86 97 76,65 0,065 57,36 1112 0,90 99 76,58 0,036 63,11 1113 0,97 99 76,60 0,071 58,92 1114 1,05 99 76,34 0,018 62,82 1115 0,65 99 82,64 0,018 66,63 1116 0,75 100 82,01 0,039 65,05

[00429] Para caracterização in vivo, as LNPs acima foram administradas a camundongos com 0,1 mg de RNA total (mg de RNA guia + mg de mRNA) por kg (n = 5 por grupo). Aos 7-9 dias após a dose. Os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas como descrito acima. Os resultados de TTR sérica e de edição de fígado são mostrados nas Figura 22A e Figura 22B. Camundongos de controle negativo foram dosados com veículo TSS.

[00430] Além disso, as LNPs acima foram administradas a camundongos com uma dose constante de mRNA de 0,05 mg de mRNA por kg (n = 5 por grupo), enquanto variavam a dose de gRNA de 0,06 mg por kg a 0,4 mg por kg. Aos 7-9 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram colhidos e a TTR sérica e a edição do fígado foram medidas. Os resultados da TTR sérica e da edição do fígado são mostrados na Figura 22C e Figura 22D. Camundongos de controle negativo foram dosados com veículo TSS.

11. Caracterização dos esquemas de códons

[00431] As sequências de Cas9 usando diferentes esquemas de códons foram projetadas para testar a expressão de proteína melhorada. Cada sequência foi projetada para codificar o aminoácido Cas9 da SEQ ID No: 3 usando um conjunto distinto de códons. Em cada sequência de quadro de leitura aberto, um único códon foi usado para codificar cada aminoácido. As sequências variam com base na frequência com que os códons ocorrem em genes completos de codificação de proteínas em Homo sapiens baseado no NCBI-GenBank Flat File Release 160.0 (Nakamura et al. (2000) Nucl. Acids Res. 28, 292; Benson et al. (2006) Nucleic Acids Res. 34(Database issue), D16- 20) e a abundância de um nucleotídeo particular entre os códons. Com base nos esquemas de códons mostrados na Tabela 4, sete quadros de leitura aberto diferentes para Cas9 (SEQ ID No: 52, 54 e 108-112) foram construídos que codificam a proteína Cas9 da SEQ ID NO: 3. Eles foram incorporados em construtos também contendo o HSD 5' UTR (SEQ ID NO: 41), uma albumina 3' UTR, um promotor T7 e uma cauda poliA. Uma sequência exemplificativa contendo a cauda 3'UTR e poliA é SEQ ID NO: 53, na qual a cauda de 3' UTR e poliA segue o HSD 5' UTR e o ORF da SEQ ID NO: 52. Também incluído nessas avaliações foi incluído um construto composto de forma semelhante usando um esquema de códons baseado nos códons ideais para melhorar a meia-vida do mRNA, conforme descrito por Presnyak e colegas (2015) (SEQ ID No: 107, usando o conjunto de códons de meia-vida longa da Tabela 4) para codificar a proteína Cas9 de SEQ ID NO: 3.

[00432] O RNA mensageiro foi produzido para cada construto por IVT usando 100% de N1-metil pseudouridina em vez de uridina. As células HepG2 foram transfectadas com 800 ng de cada RNAm Cas9 usando o Reagente de Transfecção Lipofectamine™ MessengerMAX™ (ThermoFisher). Seis horas após a transfecção, as células foram lisadas por degelo por congelamento e eliminadas por centrifugação. Os níveis de proteína Cas9 foram determinados pelo ensaio ELISA. Resumidamente, a concentração total de proteínas foi determinada pelo ensaio com ácido bicinconínico. Uma placa MSD GOLD Streptavidin SECTOR de 96 poços (Meso Scale Diagnostics, Cat. L15SA-1) foi preparada de acordo com o protocolo do fabricante, utilizando o anticorpo Cas9 (Origene, Cat. CF811179) como anticorpo de captura e mAb Cas9 (7A9-3A3). (Cell Signaling Technology, Cat. 14697) como o anticorpo de detecção. A proteína Cas9 recombinante foi usada como padrão de calibração no Diluent 39 (Meso Scale Diagnostics) com 1X Halt™ Protease Inhibitor Cocktail, EDTA-Free (ThermoFisher, Cat. 78437). As placas ELISA foram lidas usando o instrumento Meso Quickplex SQ120 (Meso Scale Discovery) e os dados foram analisados com o pacote de software Discovery Workbench 4.0 (Meso Scale Discovery).

[00433] A eficiência da edição foi avaliada in vitro por transfecção de mRNA em conjunto com um guia (G502; SEQ ID NO: 70) direcionado à transtirretina (TTR) em células HepG2 e medindo a edição percentual. Os mRNAs de Cas9 compreendendo SEQ ID Nos indicados na Tabela 25 foram avaliados em concentrações de mRNA de 3 ng-100 ng. As células não tratadas não mostraram edição mensurável. As Figuras 23- 24 e Tabela 25 mostram os efeitos dos diferentes conjuntos de códons na expressão e edição da proteína Cas9 in vitro. Tabela 25. Edição e expressão in vitro de ORFs com diferentes conjuntos de códons. ng Cas9/mg ng Cas9/mg % Edição (30 ng Desvio ORF (conjunto de códon) proteína proteína total mRNA padrão de total desvio padrão transfectado) edição SEQ ID No: 50 (Tabela 6 códons 10,99 1,04 35,6 2,11 ng Cas9/mg ng Cas9/mg % Edição (30 ng Desvio ORF (conjunto de códon) proteína proteína total mRNA padrão de total desvio padrão transfectado) edição mínimos de uridina, junções de emenda removidas) SEQ ID No: 107 18,78 2,83 36,5 3,27 (Tabela 4 meia-vida longa) SEQ ID No: 52 (Tabela 4 U1 baixo) 31,23 4,47 22,2 2,83 SEQ ID No: 54 (Tabela 4 U2 baixo) 1,54 0,16 14,7 0,40 SEQ ID No: 108 (Tabela 4 U alto) 1,41 0,12 14,0 2,95 SEQ ID No: 109 (Tabela 4 G baixo) 4,95 0,70 19,6 2,29 SEQ ID No: 110 (Tabela 4 C baixo) 2,26 0,16 23,1 4,07 SEQ ID No: 111 (Tabela 4 A baixo) 74,62 15,53 41,3 3,56 SEQ ID No: 112 77,32 10,60 34,8 7,32 (Tabela 4 A/U baixo) SEQ ID No: 4 (Tabela 6 códons 17,16 1,54 34,7 1,15 mínimos de uridina)

[00434] Para determinar a eficácia dos esquemas de códons in vivo, a expressão da proteína Cas9 foi medida quando expressa in vivo a partir de mRNAs que codificam Cas9 usando esquemas de códons descritos na Tabela 4. Os RNAs mensageiros, conforme indicado na Tabela 26, foram formulados como LNPs com um RNA guia direcionado para TTR ( G282; SEQ ID NO: 42). Os LNPs foram montados usando o procedimento de fluxo cruzado e continham 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG em uma razão molar de 50:38:9:3, respectivamente, e tinham razão de N:P de 6,0. As LNPs foram purificadas usando os filtros Amicon PD-10 (GE Healthcare) e utilizadas a uma concentração de 0,32 mg/ml (concentração de LNP). Camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados i.v. a 1 mpk. 3 horas após a dose, os animais foram sacrificados, o fígado foi coletado e a expressão de Cas9 no fígado foi medida. A expressão da proteína Cas9 foi medida no fígado usando o ensaio ELISA Meso Scale Discovery descrito acima. Aproximadamente 40-50 mg de tecido hepático foram homogeneizados por moinho de esferas em tampão RIPA (Boston Bioproducts BP-115) com 1x comprimido completo de inibidor de protease (Roche, Cat.11836170001). A Figura 25 e a TABELA 26 mostram os resultados da expressão de Cas9 no fígado. Os mRNAs para os esquemas de códons de A baixo e A/U baixo (ORFs das SEQ ID NOs: 111 e 112) mostraram a expressão de Cas9 mais alta dos ORFs testados. A expressão da proteína Cas9 do controle negativo e o ORF da SEQ ID NO: 54 estavam abaixo do limite inferior de quantificação (LLOQ). Tabela 26 ORF Cas9 médio (ng/g de fígado) Desvio padrão TSS < LLOQ 0,0 SEQ ID No: 4 1644 1172 SEQ ID NO: 52 1562 951 SEQ ID NO: 54 < LLOQ 0,0 SEQ ID NO: 111 2630 730 SEQ ID NO: 112 2134 362

[00435] Para determinar a eficácia dos esquemas de códons in vivo, a edição do genoma foi medida in vivo a partir de mRNAs que codificam Cas9 usando diferentes esquemas de códons. Os RNAs mensageiros, como indicado na Tabela 27, foram formulados como LNPs com um RNA guia direcionado à TTR (G282; SEQ ID NO: 42). As LNPs foram montadas usando o procedimento de fluxo cruzado e continham 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG em uma razão molar de 50:38:9:3, respectivamente, e tinham razão N:P de 6,0. As LNPs foram purificadas usando os filtros Amicon PD-10 (GE Healthcare) e utilizados a uma concentração de 0,05 mg/ml (concentração de LNP). Camundongos fêmeas CD-1 (n = 5 por grupo, exceto n = 4 para o grupo tratado com SEQ ID NO: 52) foram dosados i.v. a 0,1 mpk. Aos 6 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas. A TABELA 27 e a Figura 26 mostram os resultados da edição in vivo. A TABELA 27 e as Figuras 27A-B mostram os níveis séricos de TTR. Tabela 27 Desvio % Média TTR sérica Desvio padrão ORF padrão de n de Edição (µg/ml) de TTR sérica edição TSS 0,06 0,05 856 68 5 SEQ ID No: 4 40,96 8,41 329 143 5 SEQ ID No: 107 44,28 11,45 255 97 5 SEQ ID No: 52 60,10 8,07 143 78 4 SEQ ID No: 54 1,50 0,66 822 161 5 SEQ ID No: 108 0,74 0,36 914 182 5 SEQ ID No: 111 57,26 4,15 216 62 5 SEQ ID No: 112 61,44 4,50 100 79 5

[00436] Para determinar a eficácia dos esquemas de códons em diferentes concentrações de mRNA, foi realizada uma experiência de resposta à dose in vivo. Os RNAs mensageiros, conforme indicado na Tabela 28, foram formulados como LNPs com um RNA guia direcionado à TTR (G282; SEQ ID NO: 42). As LNPs foram montadas usando o método de fluxo cruzado e continham 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG. As LNPs foram purificadas usando os filtros Amicon PD-10 (GE Healthcare e utilizados em uma concentração de 0,7 mg/ml (concentração de LNP). Camundongos CD- 1 fêmeas (n = 5 por grupo) foram administrados i.v. em 0,03, 0,1 ou 0,3 mpk. Aos 7 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas. A TABELA 28 e a Figura 28 mostram os resultados da edição in vivo. A TABELA 28 e as Figuras 29A-B mostram os níveis séricos de TTR.

Tabela 28 ORF Dose Edição de fígado TTR sérica TTR sérica (%KD) (mpk) (%) (ug/mL) TSS n/a 0,1 576,8 0,0 SEQ ID No: 4 0,3 51,3 165,6 71,3 0,1 17,3 540,7 6,3 0,03 1,9 761,4 -32,0 SEQ ID No: 52 0,3 57,0 100,8 82,5 0,1 29,6 336,1 41,7 0,03 5,0 636,4 -10,3 SEQ ID NO: 0,3 59,4 93,8 83,7 111 0,1 30,6 373,5 35,2 0,03 5,9 559,6 3,0 SEQ ID NO: 0,3 60,6 92,0 87,2 112 0,1 25,5 397,5 31,1 0,03 7,8 555,3 3,7

[00437] Para determinar a eficácia dos esquemas de códons com diferentes UTRs, a edição do genoma foi medida in vivo após a administração de mRNAs que codificam Cas9. Os RNAs mensageiros, conforme indicado na Tabela 29, foram formulados como LNPs com um RNA guia direcionado à TTR (G282; SEQ ID NO: 42). As LNPs foram montados usando o procedimento de fluxo cruzado e continham 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG em uma razão molar de 50:38:9:3, respectivamente, e tinham uma razão N:P de 6,0. As LNPs foram purificadas usando os filtros Amicon PD-10 (GE Healthcare) e utilizados em uma concentração de 0,05 mg/ml (concentração de LNP). Camundongos fêmeas CD-1 (n = 5 por grupo; n = 4 para edição da SEQ ID No: 43) foram administrados i.v. a 0,1 mpk. Aos 6 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas. A TABELA 29 e as Figuras 30A-B mostram os resultados de edição in vivo (B) e TTR sérica (A).

Tabela 29 Construto de mRNA % Edição Desvio padrão TTR sérica (µg/ml) Desvio padrão TSS 0 0 1274 214 SEQ ID No: 43 28 4 630 152 SEQ ID No: 176 35 8 482 138 SEQ ID No: 177 37 9 316 143 SEQ ID No: 178 42 6 524 192

12. Caracterização de efeitos de estruturas de capeamento

[00438] Os mRNAs que codificam Cas9 e que contêm capeamentos, UTRs e caudas poliA, como indicado na Tabela 30, foram formulados como LNPs com um RNA guia direcionado à TTR (G282; SEQ ID NO: 42). As LNPs foram montadas usando o procedimento de fluxo cruzado, contendo 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG em uma razão molar de 50:38:9:3, respectivamente, e tinham razão N:P 6,0. As LNPs foram purificadas usando os filtros Amicon PD-10 (GE Healthcare) e utilizadas na concentração de 0,06 mg/ml (concentração de LNP). Camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados i.v. a 0,1 ou 0,3 mpk. Aos 7 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas. A Figura 31 e a Tabela 30 mostram que os mRNAs com Cap 1 têm edição média ~ 10% maior que os mRNAs com Cap 0 na dose de 0,1 mpk. Na dose de 0,3 mpk, os mRNAs com XBG UTR têm uma edição média ligeiramente mais alta que o mRNA com HSD UTR, com exceção da tampa enzimática 0. Os resultados séricos de TTR são mostrados na Figura 32 (resultados de TTR sérica expressos em µg/mL e a % de controle TSS, respectivamente); Figura 31 (edição de fígado); e Tabela 30.

Tabela 30. Resultados da TTR sérica e da edição do fígado para estudos de capeamento in vivo Construto de Cap Cap 5’ UTR Dosagem % de edição Desvio mRNA Tipo padrão SEQ ID No. 43 Cap 0 ARCA HSD 0,1 mpk 21,76 11,61 SEQ ID No. 59 Cap 0 ARCA XBG 0,1 mpk 22,9 5,53 SEQ ID No. 59 Cap 0 Cap enzimático 0 XBG 0,1 mpk 17,98 7,04 SEQ ID No. 59 Cap 1 Cap enzimático 1 XBG 0,1 mpk 31,03 6,4 SEQ ID No. 60 Cap 1 Cap limpo 113 XBG 0,1 mpk 31,08 8,67 SEQ ID No. 60 Cap 1 Cap limpo 413 XBG 0,1 mpk 32,78 2,05 SEQ ID No. 43 Cap 0 ARCA HSD 0,3 mpk 52,28 5,14 SEQ ID No. 59 Cap 0 ARCA XBG 0,3 mpk 59,56 4,57 SEQ ID No. 59 Cap 0 Cap enzimático 0 XBG 0,3 mpk 54,93 10,22 SEQ ID No. 59 Cap 1 Cap enzimático 1 XBG 0,3 mpk 63,2 0,28 SEQ ID No. 60 Cap 1 Cap limpo 113 XBG 0,3 mpk 61,28 4,76 SEQ ID No. 60 Cap 1 Cap limpo 413 XBG 0,3 mpk 60,56 3,97

13. Caracterização de sinais de localização nuclear

[00439] As sequências Cas9 usando vários sinais de localização nuclear (NLSs) foram projetadas e testadas para determinar a eficácia. Onze NLSs não canônicos de forças variáveis foram escolhidos dentre os identificados por Kosugi et al. (2009) Journal of Biological Chemistry, 284(1), 478–485, como mostrado na Tabela 31. Estas sequências de aminoácidos foram adicionadas ao terminal carbóxi da sequência de aminoácidos Cas9 (SEQ ID No: 13). A sequência de controle codifica a SEQ ID No. 4.

Tabela 31 SEQ ID Nos. Designação Sequência de (aminoácido NLS, Sequência de codificação NLS (CDS) NLZ aminoácido NLS NLS CDS, ORF CDS) SV40 PKKKRKV CCGAAGAAGAAGAGAAAGGTC 78, 92, 4 NLSl LAAKRSRTT CTGGCAGCAAAGAGAAGCAGA ACAACA 79, 93, 130 NLS2 QAAKRSRTT CAGGCAGCAAAGAGAAGCAGAACAACA 80, 94, 131 NLS3 PAPAKRERTT CCGGCACCGGCAAAGAGAGAAAGAACAACA 81, 95, 132 NLS4 QAAKRPRTT CAGGCAGCAAAGAGACCGAGAACAACA 82, 96, 133 NLS5 RAAKRPRTT AGAGCAGCAAAGAGACCGAGAACAACA 83, 97, 134 NLS6 AAAKRSWSMAA GCAGCAGCAAAGAGAAGCTGG 84, 98, 135

AGCATGGCAGCA NLS7 AAAKRVWSMAF GCAGCAGCAAAGAGAGTCTGGAGCATGGCA 85, 99, 136

TTC NLS8 AAAKRSWSMAF GCAGCAGCAAAGAGAAGCTGGAGCATGGCA 86, 100, 137

TTC NLS9 AAAKRKYFAA GCAGCAGCAAAGAGAAAGTACTTCGCAGCA 87, 101, 138 NLS10 RAAKRKAFAA AGAGCAGCAAAGAGAAAGGCATTCGCAGCA 88, 102, 139 NLS11 RAAKRKYFAV AGAGCAGCAAAGAGAAAGTACTTCGCAGTC 89, 103, 140

[00440] Os mRNAs que codificam Cas9 com NLSs, como indicado na Tabela 31, foram formulados como LNPs com um RNA guia direcionado à TTR (G282; SEQ ID NO: 42). As LNPs foram montadas usando o procedimento de fluxo cruzado e continham 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG em uma razão molar de 50:38:9:3, respectivamente, e tinham razão N:P de 6,0. As LNPs foram purificadas usando filtros Amicon PD-10 (GE Healthcare) e utilizadas em uma concentração de cerca de 0,07 mg/ml (concentração de LNP). Camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados i.v. a 0,1 mpk. Aos 7 dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas. Os resultados são mostrados na Tabela 32 e na Figura

33. Ver Tabela 31 para obter as SEQ ID NOs correspondentes aos NLSs listados na Tabela 32. Tabela 32 - Edição de fígado com diferentes sinais de localização nuclear NLS Classe de NLS Força de NLS 0.1 MPK %Edição DESVIO PADRÃO SV40 n/a n/a 14,67 4,17 NLS1 2 3 3,76 1,61 NLS2 2 4 5,86 1,69 NLS3 2 5 2,50 1,82 NLS4 2 6 27,38 11,98 NLS5 2 9 27,80 2,37 NLS6 3 1 2,20 0,82 NLS7 3 6 7,90 0,42 NLS8 3 10 25,52 15,75 NLS9 4 2 3,26 1,65 NLS10 4 5 0,23 0,04 NLS11 4 8 21,02 4,9

[00441] O NLS5 mostrou um aumento estatisticamente significativo em relação ao SV40 NLS (ANOVA de uma via, p = 0,006). NLS4 e NLS8 exibiram uma possível tendência de aumento de edição em comparação com o SV40 NLS, mas a diferença neste experimento não foi estatisticamente significativa. As Figuras 34A-B mostram os níveis séricos de TTR após a administração de variantes de sinal de localização nuclear. Kosugi et al. (2009), supra, atividade de taxa de NLSs (“Força de NLS” na Tabela 32) quanto ao grau de localização nuclear, com 10 como exclusivamente nuclear e 1 como difuso em toda a célula. A atividade do NLS classificada neste documento está correlacionada positivamente com a eficiência da edição, como mostra a Figura 35.

14. Caracterização de efeitos UTRs in vitro

[00442] A Tabela 33 e a Figura 36 mostram a expressão de Cas9 a partir de transcritos com diferentes UTRs de 5'. Todas os construtos usaram 3' UTR de albumina humana. O RNA mensageiro foi produzido para cada construto por IVT. O RNA mensageiro para SEQ ID No: 179 foi produzido usando plasmídeo linearizado e todos os outros foram gerados usando o produto de PCR como modelo. As células HepG2 foram transfectadas com 100 ng de cada mRNA de Cas9 e guia (G502; SEQ ID NO: 70) direcionado à concentração final de 25nM de transtirretina (TTR) usando Lipofectamine™ MessengerMAX™ Transfection Reagent (ThermoFisher). Seis horas após a transfecção, as células foram lisadas pelo ensaio Nano-Glo® HiBiT Lytic (Promega). Os níveis de proteína Cas9 foram determinados usando o Sistema de Detecção Extracelular Nano-Glo® Nano-Glo HiBiT (Promega, Cat. N2420). A Tabela 33 e a Figura 36 mostram a expressão Cas9 de transcritos com diferentes 5' UTRs. Tabela 33: Expressão de Cas9 Construto de mRNA 5’ UTR Moléculas Cas9 (107) Desvio Padrão (107)

SEQ ID NO 179 HSD 447 61 180 CMV-1 723 39 181 CMV-2 672 158 182 CMV-3 662 117 183 HBA 488 101 184 HBB 595 124 185 XBG 813 62

15. Distribuição de LNPs para primatas não humanos

[00443] Três estudos foram conduzidos com formulações de LNP preparadas como descrito acima, usando o processo X-flow/TFF. As quantidades e cargas molares específicas são fornecidas nas Tabelas 34-36. Cada formulação contendo mRNA de Cas9 e RNA guia (gRNA) tinha uma razão de mRNA:gRNA de 1:1 em peso. As doses de LNP (em mg/kg, teor total de RNA), via de administração e se os animais receberam pré-tratamento com dexametasona estão indicados nas Tabelas. Para os animais que receberam pré-tratamento com dexametasona (Dex), Dex foi administrado a 2 mg/kg por injeção intravenosa em bolus, 1 hora antes da administração de LNP ou do veículo.

[00444] Para análise química do sangue, o sangue foi coletado dos animais às vezes, conforme indicado nas Tabelas para cada fator medido. A indução de citocinas foi medida em NHPs pré e pós- tratamento. Um mínimo de 0,5 mL de sangue total foi coletado de uma veia periférica de animais conscientes e restritos em um tubo separador de soro de 4 mL. Deixou-se coagular o sangue por um período mínimo de 30 minutos em temperatura ambiente, seguido de centrifugação a 2000xg por 15 minutos. O soro foi dividido em alíquotas em 2 microtubos de polipropileno de 120 uL cada e armazenado de -60 a -86°C até a análise. Utilizou-se para análise um kit personalizado de U-Plex Cytokine de primata não humano da Meso Scale Discovery (MSD). Os seguintes parâmetros foram incluídos na análise: INF-g, IL-1b, IL-2, IL- 4, IL-6, IL-8, IL-10, IL-12p40, MCP-1 e TNF-a, com foco em IL-6 e MCP-

1. Os reagentes e os padrões do kit foram preparados conforme indicado no protocolo do fabricante. O soro de NHP foi usado puro. As placas foram executadas em um MSD Sector Imager 6000 com a análise realizada com o software MSD Discovery versão 4012 de bancada de trabalho.

[00445] Os níveis de complemento foram medidos em animais pré e pós-tratamento por imunoensaio enzimático. Um volume de 0,5 mL de sangue total foi coletado de uma veia periférica de animais conscientes e restritos em um tubo de 0,5 mL de k2EDTA. O sangue foi centrifugado a 2000xg por 15 minutos. O plasma foi dividido em alíquotas em 2 microtubos de polipropileno de 120 uL cada e armazenado de -60 a - 86°C até a análise. Um kit Quidel MicroVue Complement Plus EIA (C3a- Cat # A031) ou (Bb-Cat # A027) foi utilizado para análise. Os reagentes e os padrões do kit foram preparados conforme indicado no protocolo do fabricante. As placas foram executadas em um MSD Sector Imager 6000 com densidade óptica a 450 nm. Os resultados foram analisados usando um ajuste de curva de 4 parâmetros.

[00446] Os dados para indução de citocinas e ativação do complemento são fornecidos nas tabelas abaixo. "BLQ" significa abaixo do limite de quantificação. RNA Guia SEQ ID NOs são como segue: G502, SEQ ID NO: 70; G506, SEQ ID NO: 197; G509, SEQ ID NO: 71; G510, SEQ ID NO: 198. Tabela 34: Estudo 1 Razões molares (lipídeo A, Tamanho Nível de dose, Grupo de colesterol, de N:P Carga Via teor total de Dex tratamento DSPC e amostra RNA (mg/kg) PEG2k-DMG, (n) respectivamente (1) TSS IV - n/a n/a n/a 3 n/a não (veículo) infusão Cas9 mRNA (2) (SEQ ID IV - LNP699 45/44/9/2 4,5 3 3 não NO:48); infusão G502 G000502 Cas9 mRNA (3) (SEQ ID IV - LNP688 45/44/9/2 4,5 3 3 não NO:48); infusão G506 G000506 Cas9 mRNA (4) (SEQ ID IV - LNP689 45/44/9/2 4,5 3 3 não NO:48); infusão G509 G000509 Cas9 mRNA (5) (SEQ ID IV - LNP690 45/44/9/2 4,5 3 3 não O:48); infusão G510 G000510 Tabela 35. Estudo 2 Razões molares Nível de Tamanho Grupo de (lipídeo A, dose, teor de trata- colesterol, DSPC N:P Carga Via total de Dex amostra mento e PEG2k-DMG, RNA (n) respectivamente (mg/kg) (1) TSS IV- n/a n/a 1 n/a sim (veículo) bolus (2) TSS IV- n/a n/a 1 n/a não (veículo) bolus (3) 45/44/9/2 4,5 Cas9 mRNA 1 IV - 3 sim

Razões molares Nível de Tamanho Grupo de (lipídeo A, dose, teor de trata- colesterol, DSPC N:P Carga Via total de Dex amostra mento e PEG2k-DMG, RNA (n) respectivamente (mg/kg) LNP898 (SEQ ID NO:48); infusão G502 G000502 (4) Cas9 mRNA IV - LNP898 45/44/9/2 4,5 (SEQ ID NO:48); 1 3 não infusão G502 G000502 (5) Cas9 mRNA IV- LNP897 45/43/9/3 4,5 (SEQ ID NO:48); 1 3 sim bolus G502 G000502 (6) Cas9 mRNA IV- LNP897 45/43/9/3 4,5 (SEQ ID NO:48); 1 3 não bolus G502 G000502 (7) Cas9 mRNA IV - LNP897 45/43/9/3 4,5 (SEQ ID NO:48); 1 3 sim infusão G502 G000502 (8) Cas9 mRNA IV - LNP897 45/43/9/3 4,5 (SEQ ID NO:48); 1 3 não infusão G502 G000502 (9) eGFP mRNA IV - LNP916 45/43/9/3 4,5 1 6 sim (SEQ ID NO:73) infusão

GFP (10) eGFP mRNA IV - LNP916 45/43/9/3 4,5 1 6 não (SEQ ID NO:73 infusão

GFP Tabela 36. Estudo 3 Razões molares Nível de Tamanho (lipídeo A, dose, teor Grupo de de colesterol, DSPC N:P Carga Via total de Dex tratamento amostra e PEG2k-DMG, RNA (n) respectivamente (mg/kg) (1) TSS n/a n/a n/a 3 IV-bolus n/a não (2) Cas9 mRNA (SEQ LNP1021 50/38/9/3 6 ID NO:43); 3 IV-bolus 1 não G502 G000502 (3) Cas9 mRNA (SEQ LNP1021 50/38/9/4 6 ID NO:43); 1 IV-bolus 1 sim G502 G000502 (4) Cas9 mRNA (SEQ LNP1022 55/33/9/3 6 ID NO:43); 3 IV-bolus 1 não G502 G000502 (5) Cas9 mRNA (SEQ LNP1023 45/43/9/3 4,5 ID NO:43); 3 IV-bolus 3 não G502 G000502 (6) Cas9 mRNA (SEQ LNP1024 50/38/9/3 6 ID NO:43); 3 IV-bolus 1 não G509 G000509 (7) Cas9 mRNA (SEQ LNP1024 50/38/9/4 6 ID NO:43); 1 IV-bolus 1 sim G509 G000509 (8) Cas9 mRNA (SEQ 55/33/9/3 6 3 IV-bolus 1 não LNP1025 ID NO:43);

Razões molares Nível de Tamanho (lipídeo A, dose, teor Grupo de de colesterol, DSPC N:P Carga Via total de Dex tratamento amostra e PEG2k-DMG, RNA (n) respectivamente (mg/kg) G509 G000509 (9) Cas9 mRNA (SEQ LNP1021 50/38/9/3 6 ID NO:43); 1 IV-bolus 3 não G502 G000502 (10) Cas9 mRNA (SEQ LNP1022 50/38/9/3 6 ID NO:43); 1 IV-bolus 3 não G502 G000502

Tabela 37. Medições de IL-6 do Estudo 1 Grupo de tratamento Pré-sangramento 6 horas 24 horas (1) TSS (veículo) 5,71±2,70 29,1±20,37 7,05±3,49 (2) LNP699 G502 9,73±8,34 1296,41±664,71 5,43±7,68 (3) LNP688 G506 16,83±4,08 1749,47±1727,22 38,57±39,39 (4) LNP689 G509 18,11±11,51 1353,49±766,66 32,42±18,40 (5) LNP690 G510 13,95±1,85 11838±17161,74 90,07±96,02

Tabela 38. Medições de MCP-1 do Estudo 1 Grupo de tratamento Pré-sangramento 6 horas 24 horas (1) TSS (veículo) 810,49±178,27 1351,16±397,31 745,25±56,49 (2) LNP699 G502 842,31±350,65 19298,49±11981,14 2092,89±171,21 (3) LNP688 G506 1190,79±383,64 13500,17±12691,60 1414,71±422,43 (4) LNP689 G509 838,63±284,42 14427,7±8715,48 1590±813,23 (5) LNP690 G510 785,32±108,97 52557,24±48034,68 6319,77±983,37

Tabela 39. Medições do complemento C3a do Estudo 1 Grupo de tratamento Pré-tratamento 6 horas dia 7 (1) TSS (veículo) 23,9±11,95 25,51±14,79 30,67±18,36 (2) LNP699 G502 32,36±11,29 94,33±58,45 38,50±12,69 (3) LNP688 G506 22,30±1,73 127,00±22,34 37,80±6,86 (4) LNP689 G509 35,83±21,94 174,00±44,51 50,83±21,92 (5) LNP690 G510 36,30±8,21 163,00±40,60 42,50±12,44

Tabela 40. Medições complementares bb do Estudo 1 Grupo de tratamento 04-bb Pré-tratamento 6 horas dia 7 (1) TSS (veículo) Control 1,53±0,19 3,37±2,13 1,43±0,71 (2) LNP699 G502 G502 1,45±0,39 9,01±5,28 1,57±0,54 (3) LNP688 G506 G506 1,45±0,78 11,78±2,33 1,78±0,84 (4) LNP689 G509 G509 1,95±0,99 15,73±2,23 2,83±0,88 (5) LNP690 G510 G510 2,12±0,44 13,57±1,23 2,21±0,72

Tabela 41. Medições de IL-6 do Estudo 2 Grupo de tratamento Pré-tratamento 90 min 6 horas 24 horas Dia 7 (1) TSS (veículo) 1,77 11,46 4,2 2,76 3,01 (2) TSS (veículo) 5,23 18,11 20,36 13,2 6,36 (3) LNP898 G502 2,02 1305,75 1138,22 383,32 16,02 (4) LNP898 G502 2,34 37,19 91,59 14,11 3,07 (5) LNP897 G502 2,1 55,79 6,89 2,26 2,01 (6) LNP897 G502 6,8 10,1 44,72 5,4 2,01 (7) LNP897 G502 1,97 44,87 32,61 2,97 1,11 (8) LNP897 G502 3,14 37,68 73,41 8,58 2,22 (9) LNP916 GFP 1,6 BLQ 95,32 27,58 BLQ (10) LNP916 GFP 2,43 BLQ 883,01 66,71 BLQ

Tabela 42. Medições de MCP-1 do Estudo 2 Grupo de tratamento Pré-tratamento 90 min 6 horas 24 hour Dia 7 (1) TSS (veículo) 312,12 197,24 145,36 177,02 403,82 (2) TSS (veículo) 232,44 175,08 187,72 136,64 325,69 (3) LNP898 G502 249,1 2183,5 1814,64 1887,41 372,38 (4) LNP898 G502 349,51 430,49 5635,55 953,05 236,6 (5) LNP897 G502 492,3 989,98 409,08 302,97 506,82 (6) LNP897 G502 283,79 225,1 1141,08 484,59 259,46 (7) LNP897 G502 223,16 349,79 398,57 172,67 287,09 (8) LNP897 G502 584,42 853,51 3880,81 1588,46 692,99 (9) LNP916 GFP 325,84 BLQ 1189,97 2279,82 BLQ (10) LNP916 GFP 175,47 BLQ 3284,16 2023,53 BLQ

Tabela 43. Medições complementares C3a do Estudo 2 Grupo de tratamento Pré-tratamento 90 min 6 horas 24 hour Dia 7 (1) TSS (veículo) 0,087 0,096 0,048 0,033 0,038 (2) TSS (veículo) 0,369 0,311 0,146 0,1 0,106 (3) LNP898 G502 0,087 0,953 0,647 0,277 0,065 (4) LNP898 G502 0,099 0,262 0,123 0,049 0,044 (5) LNP897 G502 0,067 0,479 0,209 0,036 0,036 (6) LNP897 G502 0,141 0,433 0,34 0,11 0,074 (7) LNP897 G502 0,1 0,345 0,396 0,096 0,127 (8) LNP897 G502 0,261 0,458 0,409 0,244 0,313 (9) LNP916 GFP 0,149 BLQ 0,714 0,382 BLQ (10) LNP916 GFP 0,117 BLQ 0,752 0,723 BLQ

Tabela 44. Medições complementares bb do Estudo 2 Grupo de tratamento Pré-tratamento 90 min 6 horas 24 hour Dia 7 (1) TSS (veículo) 0,087 0,096 0,048 0,033 0,038 (2) TSS (veículo) 0,369 0,311 0,146 0,1 0,106 (3) LNP898 G502 0,087 0,953 0,647 0,277 0,065 (4) LNP898 G502 0,099 0,262 0,123 0,049 0,044 (5) LNP897 G502 0,067 0,479 0,209 0,036 0,036 (6) LNP897 G502 0,141 0,433 0,34 0,11 0,074 (7) LNP897 G502 0,1 0,345 0,396 0,096 0,127 (8) LNP897 G502 0,261 0,458 0,409 0,244 0,313 (9) LNP916 GFP 0,149 BLQ 0,714 0,382 BLQ (10) LNP916 GFP 0,117 BLQ 0,752 0,723 BLQ

Tabela 45. Medições de IL-6 do Estudo 3 Grupo de tratamento Pre-bleed 90 min 6 horas 24 horas Dia 7 (1) TSS 1,89±0,97 2,56±1,41 0,90±0,71 BLQ 0,08 (2) LNP1021 G502 210±0,35 7,44±5,16 6,94±8,45 1,07±1,11 1,76±0,98 (3) LNP1021 G502 0,79 2,96 4,25 0,67 0,27 (4) LNP1022 G502 1,54±1,32 20,42±31,60 13,94±10,10 0,98±0,41 2,04±0,65 (5) LNP1023 G502 2,92±1,68 6,28±7,18 6,06±2,31 3,62±4,68 2,00±1,21 (6) LNP1024 G509 1,43±0,62 2,64±1,92 7,72±11,96 0,45±0,19 0,88±0,79 (7) LNP1024 G509 1,35±0,74 2,64±2,35 1,71±0,41 0,36±0,58 0,51±0,32 (8) LNP1025 G509 1,64 2,68 25,65 0,58 2,00 (9) LNP1021 G502 0,56 6,15 28,80 0,85 0,61 (10) LNP1022 G502 1,76 8,66 2907,86 11,26 1,72

Tabela 46. Medições de MCP-1 do Estudo 3 Grupo de Pré-sangramento 90 min 6 horas 24 horas Dia 7 tratamento (1) TSS 204,01±46,39 197,62±19,54 310,84±45,87 179,07±20,77 234,61±71,79 (2) LNP1021 303,67±36,37 337,63±195,18 755,20±581,45 339,75±206,20 214,82±40,81 G502 (3) LNP1021 229,30 358,10 3182,00 413,56 178,30 G502 (4) LNP1022 393,63±187,81 467,72±221,61 1852,94±2199,66 497,12±412,30 382,19±67,27 G502 (5) LNP1023 213,72±8,85 196,18±62,81 1722,18±1413,90 197,83±74,01 156,16±18,87 G502 (6) LNP1024 237,76±96,36 210,37±95,17 468,53±250,42 22,32±69,06 141,20±71,90 G509 (7) LNP1024 207,36 183,07 1885,66 235,70 163,11 G509 (8) LNP1025 259,57±112,98 299,21±304,89 1193,10±974,04 258,82±88,53 219,86±219,86 G509 (9) LNP1021 199,29 286,04 2001,23 197,57 196,44 G502 (10) LNP1022 305,81 970,65 7039,06 8379,05 203,47 G502

Tabela 47. Medições complementares C3a do Estudo 3 Grupo de tratamento Pré-sangramento 90 min 6 horas 24 horas Dia 7 (1) TSS 42,47±10,30 55,40±13,58 29,30±14,46 41,70±23,65 27,43±12,43 (2) LNP1021 G502 34,37±0,50 86,50±3,66 90,07±4,85 56,60±2,25 32,53±0,93 (3) LNP1021 G502 34,30 128,00 93,30 33,40 28,20 (4) LNP1022 G502 41,55±13,51 151,37±109,98 82,00±31,82 45,57±18,58 32,77±6,45 (5) LNP1023 G502 31,67±3,19 74,40±22,08 74,13±48,61 33,83±9,75 27,70±8,05 (6) LNP1024 G509 56,60±25,61 100,37±77,95 74,73±70,15 55,20±48,34 49,97±39,94 (7) LNP1024 G509 33,80 33,90 33,70 26,10 20,90 (8) LNP1025 G509 39,90±13,01 75,73±1,38 46,13±30,56 25,00±3,80 23,90±7,18 (9) LNP1021 G502 34 85,70 133,00 62,00 25,50 (10) LNP1022 G502 29,8 68,10 113,00 71,70 23,30

Tabela 48. Medições complementares bb do Estudo 3 Grupo de tratamento Pré-sangramento 90 min 6 horas 24 horas Dia 7 (1) TSS 1,46±0,70 2,18±0,78 1,96±0,64 0,945±0,15 1,34±0,50 (2) LNP1021 G502 1,77±0,60 6,51±3,66 11,00±4,85 3,59±2,25 2,07±0,93 (3) LNP1021 G502 1,24 2,90 11,50 2,97 1,24 (4) LNP1022 G502 1,52±0,34 5,67±2,28 10,2±3,36 3,66±1,68 1,84±0,24 (5) LNP1023 G502 1,65±0,94 4,4±1 7,68±4,67 2,64±1,18 2,08±1,32 (6) LNP1024 G509 1,61±0,13 4,52±1,81 4,50±3,22 1,63±0,84 1,63±0,32 (7) LNP1024 G509 0,96 2,99 2,64 1,13 1,07 (8) LNP1025 G509 1,37±0,17 4,9±4,51 3,79±3,84 1,66±1,43 1,35±0,44 (9) LNP1021 G502 1,41 5,67 11,50 4,64 1,38 (10) LNP1022 G502 1,28 5,22 14,10 5,64 1,87

16. Comparação da expressão de Cas9 de mRNA diferente em fígado de camundongo

[00447] A expressão de Cas9 foi medida in vivo após a administração de diferentes mRNAs que codificam Cas9. Os RNAs mensageiros, como indicado na Tabela 49, foram formulados como LNPs com um sgRNA de camundongo direcionado ao gene TTR de camundongo (razão sgRNA:mRNA em peso de 1:2). As LNPs foram montadas usando o procedimento de fluxo cruzado com 50% de lipídeo A, 9% de DSPC, 38% de colesterol e 3% de PEG2k-DMG e uma relação N:P de 6,0. As LNPs foram purificadas usando Sartocon Slice 200 (Sartorius) e utilizados na concentração de 1,53 mg/ml (concentração de RNA). As formulações de LNP foram analisadas quanto ao tamanho médio de partícula, polidispersidade (pdi), teor total de RNA e eficiência de encapsulação do RNA, conforme descrito acima (dados não mostrados).

[00448] Camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados i.v. a 0,3 mpk. Após 1 hora, 3 horas e 6 horas após a dose, os animais foram sacrificados, o tecido hepático foi coletado e os níveis de proteína Cas9 foram medidos por MSD ELISA como descrito no Exemplo 11. A Tabela 49 mostra os níveis de proteína Cas9. Em cada momento, mais proteína Cas9 é detectada em animais tratados com a SEQ ID NO: 177 do que em animais tratados com a SEQ ID NO:43. Tabela 49 mRNA Ponto de tempo ng Cas9/g Desvio Tamanho da (horas) Fígado padrão amostra (n) TSS 0 28 5 SEQ ID NO: 43 1 429 164 5 SEQ ID NO: 177 1 1872 907 5 SEQ ID NO: 43 3 1167 814 5 SEQ ID NO: 177 3 2233 929 5 SEQ ID NO: 43 6 535 297 5 SEQ ID NO: 177 6 1663 443 5 Comparação de resposta de dose de mRNA diferent

[00449] As curvas de resposta à dose de diferentes mRNAs que codificam Cas9 in vivo foram comparadas. As formulações de LNP foram preparadas com os mRNAs da SEQ ID Nº 43 e SEQ ID Nº 177 e sg502 (SEQ ID NO: 70; G502), formulando como descrito no Exemplo

16. Os componentes das nanopartículas lipídicas foram dissolvidos em etanol 100% com a razão molar de componente lipídico de 50/9/38/3 (LP01/DSPC/colesterol/PEG-DMG). As LNPs foram formuladas com uma razão molar de lipídeo de amina para fosfato de RNA (N:P) de cerca de 6 com a razão de gRNA para mRNA a 1:2 em peso. As formulações de LNP foram analisadas quanto ao tamanho médio de partícula, polidispersidade (pdi), teor total de RNA e eficiência de encapsulação do RNA, conforme descrito acima (dados não mostrados).

[00450] Para caracterização in vivo, camundongos fêmeas CD-1 (n = 5 por grupo) foram dosados por via intravenosa a 0,03, 0,1 ou 0,3 mg de RNA total (mg de RNA guia + mg de mRNA) por kg (n = 5 por grupo) . Sete dias após a dose, os animais foram sacrificados, o sangue e o fígado foram coletados e a TTR sérica e a edição do fígado foram medidas como descrito no Exemplo 1. Os animais de controle negativo foram dosados com veículo TSS. A edição de dados é fornecida na Tabela 50, abaixo. Para a SEQ ID NO: 43, é fornecida a média de 8 experiências in vivo, cada uma com 5 animais. Para a SEQ ID NO: 177, é fornecida a média de uma experiência in vivo, com 5 animais em cada dose. Em cada dose, a % de edição é maior nos animais tratados com a SEQ ID NO: 177 do que nos animais tratados com a SEQ ID NO: 43. Tabela 50 % Edição 0,3 mg/kg dose 0.1 mg/kg 0,03 mg/kg mRNA Média Média Média (Faixa) (Faixa) (Faixa) SEQ ID NO: 43 65,8% 40,6% 11,4% (62,2-71,2%) (29,2-55,6%) (6,2-20,1%) SEQ ID NO: 177 71,2% 58,9% 29,3% Tabela de sequências

[00451] A tabela de sequências a seguir fornece uma lista das sequências aqui divulgadas. Entende-se que, se uma sequência de DNA (compreendendo Ts) for referenciada em relação a um RNA, Ts deverá ser substituído por Us (que pode ser modificado ou não, dependendo do contexto) e vice-versa. Descrição Sequência SEQ ID No. Sequência de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGG 1 codificação 2 ATGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGT do DNA Cas9 CCTGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCAC

TGCTGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACA GCAAGAAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAA ATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTG GAAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGAT CTTCGGAAACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAAT CTACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGA GACTGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCC TGATCGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTC

Descrição Sequência SEQ ID No.

ATCCAGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAAC GCAAGCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAG CAGAAGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACG GACTGTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCA AGAGCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGAC ACATACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTA CGCAGACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGA GCGACATCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCA AGCATGATCAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAG GCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGAC CAGAGCAAGAACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGA AGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGA AGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAA CATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTGCAC GCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACAGA GAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCG CTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGA AACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACG AAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACA ACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAA ACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCG AATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAA GCCTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCC TGGACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGA CACTGTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCAC ACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAG GATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAG AGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAG AAACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACAT CCAGAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCG CAAACCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTC AAGGTCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAA CATCGTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAA GAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGG GAAGCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAAC

Descrição Sequência SEQ ID No.

GAAAAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGAC CAGGAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGT CCCGCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTC GTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATC ACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAG CGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGAC AGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGT ACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGA GCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAG AAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCGTCG GAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTACG GAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAG GAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACT TCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGC TGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGA GACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTC AAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGA AGAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTC GTCGCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGA ACTGCTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGAT CGACTTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCAT CAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAAT GCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGA GCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGG GAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAG CACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTC ATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCA CAGAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCAC ACTGACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAAT CGACAGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGAT CCACCAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCT

GGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAG Sequência de ATGGATAAGAAGTACTCAATCGGGCTGGATATCGGAACTAATTCCGTGGGT 2 codificação 1 TGGGCAGTGATCACGGATGAATACAAAGTGCCGTCCAAGAAGTTCAAGGTC do DNA Cas9 CTGGGGAACACCGATAGACACAGCATCAAGAAAAATCTCATCGGAGCCCTG

Descrição Sequência SEQ ID No.

CTGTTTGACTCCGGCGAAACCGCAGAAGCGACCCGGCTCAAACGTACCGC GAGGCGACGCTACACCCGGCGGAAGAATCGCATCTGCTATCTGCAAGAGA TCTTTTCGAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACCGCCTGG AAGAATCTTTCCTGGTGGAGGAGGACAAGAAGCATGAACGGCATCCTATCT TTGGAAACATCGTCGACGAAGTGGCGTACCACGAAAAGTACCCGACCATCT ACCATCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGCCGACCTCAGAT TGATCTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGACACTTCCTGAT CGAAGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTTTTCATTCA ACTGGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAATGCTAG CGGCGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTCGCGG CGCCTCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAAAAGAACGGACT TTTCGGCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGTCC AATTTTGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCTAC GACGACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGGAT CTGTTCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATATC CTGCGCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGATT AAGCGGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTCGT GAGACAGCAACTGCCTGAAAAGTACAAGGAGATCTTCTTCGACCAGTCCAA GAATGGGTACGCAGGGTACATCGATGGAGGCGCTAGCCAGGAAGAGTTCT ATAAGTTCATCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACTGC TGGTCAAGCTGAACAGGGAGGATCTGCTCCGGAAACAGAGAACCTTTGACA ACGGATCCATTCCCCACCAGATCCATCTGGGTGAGCTGCACGCCATCTTGC GGCGCCAGGAGGACTTTTACCCATTCCTCAAGGACAACCGGGAAAAGATC GAGAAAATTCTGACGTTCCGCATCCCGTATTACGTGGGCCCACTGGCGCG CGGCAATTCGCGCTTCGCGTGGATGACTAGAAAATCAGAGGAAACCATCAC TCCTTGGAATTTCGAGGAAGTTGTGGATAAGGGAGCTTCGGCACAAAGCTT CATCGAACGAATGACCAACTTCGACAAGAATCTCCCAAACGAGAAGGTGCT TCCTAAGCACAGCCTCCTTTACGAATACTTCACTGTCTACAACGAACTGACT AAAGTGAAATACGTTACTGAAGGAATGAGGAAGCCGGCCTTTCTGTCCGGA GAACAGAAGAAAGCAATTGTCGATCTGCTGTTCAAGACCAACCGCAAGGTG ACCGTCAAGCAGCTTAAAGAGGACTACTTCAAGAAGATCGAGTGTTTCGAC TCAGTGGAAATCAGCGGGGTGGAGGACAGATTCAACGCTTCGCTGGGAAC CTATCATGATCTCCTGAAGATCATCAAGGACAAGGACTTCCTTGACAACGA GGAGAACGAGGACATCCTGGAAGATATCGTCCTGACCTTGACCCTTTTCGA GGATCGCGAGATGATCGAGGAGAGGCTTAAGACCTACGCTCATCTCTTCGA CGATAAGGTCATGAAACAACTCAAGCGCCGCCGGTACACTGGTTGGGGCC GCCTCTCCCGCAAGCTGATCAACGGTATTCGCGATAAACAGAGCGGTAAAA

Descrição Sequência SEQ ID No.

CTATCCTGGATTTCCTCAAATCGGATGGCTTCGCTAATCGTAACTTCATGCA ATTGATCCACGACGACAGCCTGACCTTTAAGGAGGACATCCAAAAAGCACA AGTGTCCGGACAGGGAGACTCACTCCATGAACACATCGCGAATCTGGCCG GTTCGCCGGCGATTAAGAAGGGAATTCTGCAAACTGTGAAGGTGGTCGAC GAGCTGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATCGTGATTGA AATGGCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAAAACTCCCGCG AAAGGATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCCAGATC CTGAAAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCTCTA CCTGTACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTGGA CATCAATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTTT CTGAAGGATGACTCGATCGATAACAAGGTGTTGACTCGCAGCGACAAGAAC AGAGGGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGAA GAATTACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGTT TGACAATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAGG CTGGATTCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCAC GTGGCGCAGATCTTGGACTCCCGCATGAACACTAAATACGACGAGAACGAT AAGCTCATCCGGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTCG GACTTTCGGAAGGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTACC ATCACGCGCATGACGCATACCTCAACGCTGTGGTCGGTACCGCCCTGATCA AAAAGTACCCTAAACTTGAATCGGAGTTTGTGTACGGAGACTACAAGGTCTA CGACGTGAGGAAGATGATAGCCAAGTCCGAACAGGAAATCGGGAAAGCAA CTGCGAAATACTTCTTTTACTCAAACATCATGAACTTTTTCAAGACTGAAATT ACGCTGGCCAATGGAGAAATCAGGAAGAGGCCACTGATCGAAACTAACGG AGAAACGGGCGAAATCGTGTGGGACAAGGGCAGGGACTTCGCAACTGTTC GCAAAGTGCTCTCTATGCCGCAAGTCAATATTGTGAAGAAAACCGAAGTGC AAACCGGCGGATTTTCAAAGGAATCGATCCTCCCAAAGAGAAATAGCGACA AGCTCATTGCACGCAAGAAAGACTGGGACCCGAAGAAGTACGGAGGATTC GATTCGCCGACTGTCGCATACTCCGTCCTCGTGGTGGCCAAGGTGGAGAA GGGAAAGAGCAAAAAGCTCAAATCCGTCAAAGAGCTGCTGGGGATTACCAT CATGGAACGATCCTCGTTCGAGAAGAACCCGATTGATTTCCTCGAGGCGAA GGGTTACAAGGAGGTGAAGAAGGATCTGATCATCAAACTCCCCAAGTACTC ACTGTTCGAACTGGAAAATGGTCGGAAGCGCATGCTGGCTTCGGCCGGAG AACTCCAAAAAGGAAATGAGCTGGCCTTGCCTAGCAAGTACGTCAACTTCC TCTATCTTGCTTCGCACTACGAAAAACTCAAAGGGTCACCGGAAGATAACG AACAGAAGCAGCTTTTCGTGGAGCAGCACAAGCATTATCTGGATGAAATCA TCGAACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGCCGACGCCAACC TCGACAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAGCCGATCAGAG

Descrição Sequência SEQ ID No.

AACAGGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCTGGGAGCCC CAGCCGCCTTCAAGTACTTCGATACTACTATCGATCGCAAAAGATACACGTC CACCAAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCACTGGACT CTACGAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGATGGCGGTGGAT

CTCCGAAAAAGAAGAGAAAGGTGTAATGA Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 3 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE Cas9 DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR

GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDG

GGSPKKKRKV Quadro de AUGGACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCG 4 leitura aberto GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA de mRNA de GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA Cas9 (ORF) 2 GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA

Descrição Sequência SEQ ID No.

GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA

Descrição Sequência SEQ ID No.

AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC

Descrição Sequência SEQ ID No.

UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAG

GAGGAAGCCCGAAGAAGAAGAGAAAGGUCUAG Cas9 mRNA AUGGAUAAGAAGUACUCAAUCGGGCUGGAUAUCGGAACUAAUUCCGUGG 5 ORF 1 GUUGGGCAGUGAUCACGGAUGAAUACAAAGUGCCGUCCAAGAAGUUCAA

GGUCCUGGGGAACACCGAUAGACACAGCAUCAAGAAAAAUCUCAUCGGA GCCCUGCUGUUUGACUCCGGCGAAACCGCAGAAGCGACCCGGCUCAAAC GUACCGCGAGGCGACGCUACACCCGGCGGAAGAAUCGCAUCUGCUAUCU GCAAGAGAUCUUUUCGAACGAAAUGGCAAAGGUCGACGACAGCUUCUUC CACCGCCUGGAAGAAUCUUUCCUGGUGGAGGAGGACAAGAAGCAUGAAC GGCAUCCUAUCUUUGGAAACAUCGUCGACGAAGUGGCGUACCACGAAAA GUACCCGACCAUCUACCAUCUGCGGAAGAAGUUGGUUGACUCAACUGAC AAGGCCGACCUCAGAUUGAUCUACUUGGCCCUCGCCCAUAUGAUCAAAU UCCGCGGACACUUCCUGAUCGAAGGCGAUCUGAACCCUGAUAACUCCGA CGUGGAUAAGCUUUUCAUUCAACUGGUGCAGACCUACAACCAACUGUUC GAAGAAAACCCAAUCAAUGCUAGCGGCGUCGAUGCCAAGGCCAUCCUGU CCGCCCGGCUGUCGAAGUCGCGGCGCCUCGAAAACCUGAUCGCACAGCU GCCGGGAGAGAAAAAGAACGGACUUUUCGGCAACUUGAUCGCUCUCUCA CUGGGACUCACUCCCAAUUUCAAGUCCAAUUUUGACCUGGCCGAGGACG CGAAGCUGCAACUCUCAAAGGACACCUACGACGACGACUUGGACAAUUU GCUGGCACAAAUUGGCGAUCAGUACGCGGAUCUGUUCCUUGCCGCUAAG AACCUUUCGGACGCAAUCUUGCUGUCCGAUAUCCUGCGCGUGAACACCG AAAUAACCAAAGCGCCGCUUAGCGCCUCGAUGAUUAAGCGGUACGACGA GCAUCACCAGGAUCUCACGCUGCUCAAAGCGCUCGUGAGACAGCAACUG CCUGAAAAGUACAAGGAGAUCUUCUUCGACCAGUCCAAGAAUGGGUACG CAGGGUACAUCGAUGGAGGCGCUAGCCAGGAAGAGUUCUAUAAGUUCAU CAAGCCAAUCCUGGAAAAGAUGGACGGAACCGAAGAACUGCUGGUCAAG CUGAACAGGGAGGAUCUGCUCCGGAAACAGAGAACCUUUGACAACGGAU CCAUUCCCCACCAGAUCCAUCUGGGUGAGCUGCACGCCAUCUUGCGGCG CCAGGAGGACUUUUACCCAUUCCUCAAGGACAACCGGGAAAAGAUCGAG AAAAUUCUGACGUUCCGCAUCCCGUAUUACGUGGGCCCACUGGCGCGCG GCAAUUCGCGCUUCGCGUGGAUGACUAGAAAAUCAGAGGAAACCAUCAC UCCUUGGAAUUUCGAGGAAGUUGUGGAUAAGGGAGCUUCGGCACAAAGC

Descrição Sequência SEQ ID No.

UUCAUCGAACGAAUGACCAACUUCGACAAGAAUCUCCCAAACGAGAAGGU GCUUCCUAAGCACAGCCUCCUUUACGAAUACUUCACUGUCUACAACGAAC UGACUAAAGUGAAAUACGUUACUGAAGGAAUGAGGAAGCCGGCCUUUCU GUCCGGAGAACAGAAGAAAGCAAUUGUCGAUCUGCUGUUCAAGACCAAC CGCAAGGUGACCGUCAAGCAGCUUAAAGAGGACUACUUCAAGAAGAUCG AGUGUUUCGACUCAGUGGAAAUCAGCGGGGUGGAGGACAGAUUCAACGC UUCGCUGGGAACCUAUCAUGAUCUCCUGAAGAUCAUCAAGGACAAGGAC UUCCUUGACAACGAGGAGAACGAGGACAUCCUGGAAGAUAUCGUCCUGA CCUUGACCCUUUUCGAGGAUCGCGAGAUGAUCGAGGAGAGGCUUAAGAC CUACGCUCAUCUCUUCGACGAUAAGGUCAUGAAACAACUCAAGCGCCGC CGGUACACUGGUUGGGGCCGCCUCUCCCGCAAGCUGAUCAACGGUAUUC GCGAUAAACAGAGCGGUAAAACUAUCCUGGAUUUCCUCAAAUCGGAUGG CUUCGCUAAUCGUAACUUCAUGCAAUUGAUCCACGACGACAGCCUGACC UUUAAGGAGGACAUCCAAAAAGCACAAGUGUCCGGACAGGGAGACUCAC UCCAUGAACACAUCGCGAAUCUGGCCGGUUCGCCGGCGAUUAAGAAGGG AAUUCUGCAAACUGUGAAGGUGGUCGACGAGCUGGUGAAGGUCAUGGGA CGGCACAAACCGGAGAAUAUCGUGAUUGAAAUGGCCCGAGAAAACCAGAC UACCCAGAAGGGCCAGAAAAACUCCCGCGAAAGGAUGAAGCGGAUCGAA GAAGGAAUCAAGGAGCUGGGCAGCCAGAUCCUGAAAGAGCACCCGGUGG AAAACACGCAGCUGCAGAACGAGAAGCUCUACCUGUACUAUUUGCAAAAU GGACGGGACAUGUACGUGGACCAAGAGCUGGACAUCAAUCGGUUGUCUG AUUACGACGUGGACCACAUCGUUCCACAGUCCUUUCUGAAGGAUGACUC GAUCGAUAACAAGGUGUUGACUCGCAGCGACAAGAACAGAGGGAAGUCA GAUAAUGUGCCAUCGGAGGAGGUCGUGAAGAAGAUGAAGAAUUACUGGC GGCAGCUCCUGAAUGCGAAGCUGAUUACCCAGAGAAAGUUUGACAAUCU CACUAAAGCCGAGCGCGGCGGACUCUCAGAGCUGGAUAAGGCUGGAUUC AUCAAACGGCAGCUGGUCGAGACUCGGCAGAUUACCAAGCACGUGGCGC AGAUCUUGGACUCCCGCAUGAACACUAAAUACGACGAGAACGAUAAGCUC AUCCGGGAAGUGAAGGUGAUUACCCUGAAAAGCAAACUUGUGUCGGACU UUCGGAAGGACUUUCAGUUUUACAAAGUGAGAGAAAUCAACAACUACCAU CACGCGCAUGACGCAUACCUCAACGCUGUGGUCGGUACCGCCCUGAUCA AAAAGUACCCUAAACUUGAAUCGGAGUUUGUGUACGGAGACUACAAGGU CUACGACGUGAGGAAGAUGAUAGCCAAGUCCGAACAGGAAAUCGGGAAA GCAACUGCGAAAUACUUCUUUUACUCAAACAUCAUGAACUUUUUCAAGAC UGAAAUUACGCUGGCCAAUGGAGAAAUCAGGAAGAGGCCACUGAUCGAA ACUAACGGAGAAACGGGCGAAAUCGUGUGGGACAAGGGCAGGGACUUCG CAACUGUUCGCAAAGUGCUCUCUAUGCCGCAAGUCAAUAUUGUGAAGAAA

Descrição Sequência SEQ ID No.

ACCGAAGUGCAAACCGGCGGAUUUUCAAAGGAAUCGAUCCUCCCAAAGA GAAAUAGCGACAAGCUCAUUGCACGCAAGAAAGACUGGGACCCGAAGAAG UACGGAGGAUUCGAUUCGCCGACUGUCGCAUACUCCGUCCUCGUGGUG GCCAAGGUGGAGAAGGGAAAGAGCAAAAAGCUCAAAUCCGUCAAAGAGCU GCUGGGGAUUACCAUCAUGGAACGAUCCUCGUUCGAGAAGAACCCGAUU GAUUUCCUCGAGGCGAAGGGUUACAAGGAGGUGAAGAAGGAUCUGAUCA UCAAACUCCCCAAGUACUCACUGUUCGAACUGGAAAAUGGUCGGAAGCG CAUGCUGGCUUCGGCCGGAGAACUCCAAAAAGGAAAUGAGCUGGCCUUG CCUAGCAAGUACGUCAACUUCCUCUAUCUUGCUUCGCACUACGAAAAACU CAAAGGGUCACCGGAAGAUAACGAACAGAAGCAGCUUUUCGUGGAGCAG CACAAGCAUUAUCUGGAUGAAAUCAUCGAACAAAUCUCCGAGUUUUCAAA GCGCGUGAUCCUCGCCGACGCCAACCUCGACAAAGUCCUGUCGGCCUAC AAUAAGCAUAGAGAUAAGCCGAUCAGAGAACAGGCCGAGAACAUUAUCCA CUUGUUCACCCUGACUAACCUGGGAGCCCCAGCCGCCUUCAAGUACUUC GAUACUACUAUCGAUCGCAAAAGAUACACGUCCACCAAGGAAGUUCUGGA CGCGACCCUGAUCCACCAAAGCAUCACUGGACUCUACGAAACUAGGAUC GAUCUGUCGCAGCUGGGUGGCGAUGGCGGUGGAUCUCCGAAAAAGAAGA

GAAAGGUGUAAUGA Sequência de MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 6 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE Cas9 nickase DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR (D10A) GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR

RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA

Descrição Sequência SEQ ID No.

HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDG

GGSPKKKRKV ORF de AUGGACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCG 7 mRNA de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA cas9 nickase GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA (D10A) GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA

GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU

Descrição Sequência SEQ ID No.

UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU

Descrição Sequência SEQ ID No.

CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAG

GAGGAAGCCCGAAGAAGAAGAGAAAGGUCUAG Sequência de MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 8 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE dCas9 (D10A DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR H840A) GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR

RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA

Descrição Sequência SEQ ID No.

GGSPKKKRKV ORF de AUGGACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCG 9 mRNA de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA dCas9 (D10A GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA H840A) GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA

Descrição Sequência SEQ ID No.

UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACGCAAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU

Descrição Sequência SEQ ID No.

GAGGAAGCCCGAAGAAGAAGAGAAAGGUCUAG Sequência de GACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCGGAU 10 codificação GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU nua Cas9 CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC

UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA

Descrição Sequência SEQ ID No.

CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU

Descrição Sequência SEQ ID No.

GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAG

GAGGAAGCCCGAAGAAGAAGAGAAAGGUC Sequência de GACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCGGAU 11 codificação GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU nua cas9 CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC nickase UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA

GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG

Descrição Sequência SEQ ID No.

AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU

Descrição Sequência SEQ ID No.

GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA

Descrição Sequência SEQ ID No.

CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAG

GAGGAAGCCCGAAGAAGAAGAGAAAGGUC sequência de GACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCGGAU 12 codificação GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU nua dCas9 CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC

UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG

Descrição Sequência SEQ ID No.

CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACGCAAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA

Descrição Sequência SEQ ID No.

GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAG

GAGGAAGCCCGAAGAAGAAGAGAAAGGUC Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 13 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE de Cas9 (sem DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR NLS) GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR

RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT

Descrição Sequência SEQ ID No.

LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD ORF de AUGGACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCG 14 mRNA de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA Cas9 que GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA codifica SEQ GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA ID NO: 13 GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG usando CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA códons CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC mínimos de ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC uridina, CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC conforme AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA listado na GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG Tabela 3, com ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA códons de AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA início e GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG parada AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA

CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC

Descrição Sequência SEQ ID No.

GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA

Descrição Sequência SEQ ID No.

GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA

GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACUAG Sequência de GACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCGGAU 15 codificação de GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU Cas9 que CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC codifica SEQ UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA ID NO: 13 GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA usando AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC códons UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG mínimos de AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC uridina, AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC conforme UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA listado na CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG Tabela 3 (sem CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC códons de GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG início ou AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA parada; AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC adequado ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG para inclusão CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA na sequência UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA de codificação CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG da proteína CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC de fusão) CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA

AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU

Descrição Sequência SEQ ID No.

CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA

Descrição Sequência SEQ ID No.

AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA

GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGAC Sequência de MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 16 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE da Cas9 DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR nickase (sem GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR NLS) RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL

DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD

Descrição Sequência SEQ ID No.

MYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT

LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD ORF de AUGGACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCG 17 mRNA de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA nickase Cas9 GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA que codifica GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA SEQ ID NO: GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG 16 usando CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA códons CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC mínimos de ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC uridina, CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC conforme AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA listado na GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG Tabela 3, com ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA códons de AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA início e GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG parada AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA

CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU

Descrição Sequência SEQ ID No.

UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA

Descrição Sequência SEQ ID No.

GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA

GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACUAG Sequência de GACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCGGAU 18 codificação de GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU Cs9 Nickase CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC que codifica UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA SEQ ID NO: GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA 16 usando AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC códons UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG mínimos de AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC uridina, AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC conforme UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA listado na CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG Tabela 3 (sem CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC códons de GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG início ou AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA parada; AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC adequado ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG para inclusão CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA

Descrição Sequência SEQ ID No. na sequência UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA de codificação CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG de proteínas CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC de fusão) CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA

AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG

Descrição Sequência SEQ ID No.

AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA

GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGAC Sequência de MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 19 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE de dCas9 DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR (sem NLS) GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR

RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE

Descrição Sequência SEQ ID No.

KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT

LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD ORF de AUGGACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCG 20 dCas9 de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA mRNA que GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA codifica SEQ GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA ID NO: 19 GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG usando CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA códons CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC mínimos de ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC uridina, CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC conforme AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA listado na GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG Tabela 3, com ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA códons de AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA início e GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG parada AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA

CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA

Descrição Sequência SEQ ID No.

AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACGCAAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC

Descrição Sequência SEQ ID No.

AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA

GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACUAG sequência de GACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCGGAU 21 codificação de GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU dCas9 que CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC codifica SEQ UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA ID NO: 19 GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA usando AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC códons UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG mínimos de AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC uridina, AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC conforme UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA

Descrição Sequência SEQ ID No. listado na CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG Tabela 3 (sem CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC códons de GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG início ou AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA parada; AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC adequado ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG para inclusão CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA na sequência UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA de codificação CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG de proteínas CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC de fusão) CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA

AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC

Descrição Sequência SEQ ID No.

AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACGCAAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAG GAGGAAGC

Descrição Sequência SEQ ID No. Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 22 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE de Cas9 com DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR dois sinais de GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR localização RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL nuclear como DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD aminoácidos LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT C-terminais EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE

KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

GSGSPKKKRKVDGSPKKKRKVDSG ORF de AUGGACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCG 23 mRNA Cas9 GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA que codifica GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA SEQ ID NO: GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA 22 usando GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG códons CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA mínimos de CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC uridina, ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC conforme CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC listado na AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA

Descrição Sequência SEQ ID No. Tabela 3, com GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG códons de ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA início e AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA parada GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG

AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA

Descrição Sequência SEQ ID No.

ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAA GCGGAAGCCCGAAGAAGAAGAGAAAGGUCGACGGAAGCCCGAAGAAGAA

Descrição Sequência SEQ ID No.

GAGAAAGGUCGACAGCGGAUAG Sequência de GACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCGGAU 24 codificação GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU Cas9 que CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC codifica SEQ UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA ID NO: 23 GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA usando AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC códons UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG mínimos de AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC uridina, AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC conforme UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA listado na CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG Tabela 3 (sem CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC códons de GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG início ou AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA parada; AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC adequado ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG para inclusão CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA na sequência UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA de codificação CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG da proteína CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC de fusão) CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA

AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG

Descrição Sequência SEQ ID No.

AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA

Descrição Sequência SEQ ID No.

GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAA GCGGAAGCCCGAAGAAGAAGAGAAAGGUCGACGGAAGCCCGAAGAAGAA

GAGAAAGGUCGACAGCGGA Sequência de MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 25 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE de Cas9 DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR nickase com GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR dois sinais de RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL localização DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD nuclear como LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT aminoácidos EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE C-terminais KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM

TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL

Descrição Sequência SEQ ID No.

FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDGS

GSPKKKRKVDGSPKKKRKVDSG ORF de AUGGACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCG 26 mRNA de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA Cas9 nickase GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA que codifica GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA SEQ ID NO: GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG 25 usando CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA códons CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC mínimos de ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC uridina, CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC conforme AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA listado na GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG Tabela 3, com ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA códons de AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA início e GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG parada AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA

CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG

Descrição Sequência SEQ ID No.

AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA

Descrição Sequência SEQ ID No.

GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAA GCGGAAGCCCGAAGAAGAAGAGAAAGGUCGACGGAAGCCCGAAGAAGAA

GAGAAAGGUCGACAGCGGAUAG Sequência de GACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCGGAU 27 codificação de GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU Cas9 nickase CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC que codifica UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA SEQ ID NO: GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA 25 usando AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC códons UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG mínimos de AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC uridina, AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC conforme UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA listado na CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG Tabela 3 (sem CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC códons de GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG início ou AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA parada; AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC adequado ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG para inclusão CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA na sequência UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA de codificação CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG de proteínas CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC de fusão) CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA

AGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGAC

Descrição Sequência SEQ ID No.

GGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGG AAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGAC CUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAU CCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUAC CCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAG AAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCA UGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGA AGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACA AACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCU GCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACG UCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAA GGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAG CAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCG AAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCAC GACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAA CGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGAC AGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGA CAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGA CUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGAC AAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGG CACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCU GGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUC GUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCG UCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAAC AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA

Descrição Sequência SEQ ID No.

GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGAC GGAAGCGGAAGCCCGAAGAAGAAGAGAAAGGUCGACGGAAGCCCGAAGA

AGAAGAGAAAGGUCGACAGCGGA Sequência de MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDS 28 aminoácidos GETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEE de dCas9 DKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFR com dois GHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSR sinais de RLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDL localização DNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQD nuclear como LTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGT aminoácidos EELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIE C-terminais KILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERM

TNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIV DLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKD

Descrição Sequência SEQ ID No.

FLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGW GRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVS GQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQ TTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRD MYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEV VKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITK HVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFF YSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVN IVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLF ELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQL FVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFT LTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDGS

GSPKKKRKVDGSPKKKRKVDSG ORF de AUGGACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCG 29 mRNA de GAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAA dCas9 que GGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGA codifica SEQ GCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGA ID NO: 28 GAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUG usando CAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCA códons CAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGAC mínimos de ACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUAC uridina, CCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGC conforme AGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGA listado na GGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCG Tabela 3, com ACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAA códons de AACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAA início e GACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGG parada AGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGA

CUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCU GCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCA CAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGA GCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACA AAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCA GGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAG

Descrição Sequência SEQ ID No.

UACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAU CGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUC CUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAG AAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCAC CAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACU UCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACA UUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAU UCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUC GAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAA UGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCAC AGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAA GUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAG AAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGU CAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGC GUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAU ACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAA GAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGA AGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCG ACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGG AAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAA AGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUC AUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAA GGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAAC CUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGG UCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAU CGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGA ACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGA AGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGA AAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGAC CAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACGCAAUCG UCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGAC AAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAG UCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCU GAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGAC UGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAAC AAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACA CAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACA

Descrição Sequência SEQ ID No.

CUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACA AGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAAC GCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCG AAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGC AAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACA GCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAA AUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGU CUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUG CCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCA GCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGA AAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAG UCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAA GAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGA AGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGAC GGAAGCGGAAGCCCGAAGAAGAAGAGAAAGGUCGACGGAAGCCCGAAGA

AGAAGAGAAAGGUCGACAGCGGAUAG sequência de GACAAGAAGUACAGCAUCGGACUGGCAAUCGGAACAAACAGCGUCGGAU 30 codificação GGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGU dCas9 que CCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCAC codifica SEQ UGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACA ID NO: 28 GCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGA usando AAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGAC códons UGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCG mínimos de AUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGAC uridina, AAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACC conforme UGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACA

Descrição Sequência SEQ ID No. listado na CUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAG Tabela 3 (sem CUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCC códons de GAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUG início ou AGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAA parada; AGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGAC adequado ACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAG para inclusão CUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGA na sequência UCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGA de codificação CGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGG da proteína CACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGAC de fusão) CUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACA

Descrição Sequência SEQ ID No.

AGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAG CCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAA AGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCA GGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACGCAAUCGUC CCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGU CGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUG AUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACU GAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACA AGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACAC AAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACAC UGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAA GGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACG CAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGA AUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCA AAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAG CAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAA UCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUC UGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGC CGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAG CAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAA AGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGU CGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAG AAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAA GCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAA GGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUC GAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGC AGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUA CCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAU CGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACC UGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGA GAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGC ACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACA CAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACA GGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGAC GGAAGCGGAAGCCCGAAGAAGAAGAGAAAGGUCGACGGAAGCCCGAAGA

Descrição Sequência SEQ ID No.

AGAAGAGAAAGGUCGACAGCGGA Promotor T7 TAATACGACTCACTATA 31 beta-globina ACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACC 32 5’ UTR humana beta-globina GCTCGCTTTCTTGCTGTCCAATTTCTATTAAAGGTTCCTTTGTTCCCTAAGTC 33 3’ UTR CAACTACTAAACTGGGGGATATTATGAAGGGCCTTGAGCATCTGGATTCTG

CCTAATAAAAAACATTTATTTTCATTGC alfa-globina 5’ CATAAACCCTGGCGCGCTCGCGGCCCGGCACTCTTCTGGTCCCCACAGAC 34 UTR humana TCAGAGAGAACCCACC alpha-globin GCTGGAGCCTCGGTGGCCATGCTTCTTGCCCCTTGGGCCTCCCCCCAGCC 35 3’ UTR CCTCCTCCCCTTCCTGCACCCGTACCCCCGTGGTCTTTGAATAAAGTCTGA humana GTGGGCGGC Xenopus AAGCTCAGAATAAACGCTCAACTTTGGCC 36 laevis beta- globina 5’

UTR Xenopus ACCAGCCTCAAGAACACCCGAATGGAGTCTCTAAGCTACATAATACCAACTT 37 laevis beta- ACACTTTACAAAATGTTGTCCCCCAAAATGTAGCCATTCGTATCTGCTCCTA globina 3’ ATAAAAAGAAAGTTTCTTCACATTCT

UTR Hormônio de CAGGGTCCTGTGGACAGCTCACCAGCT 38 crescimento bovino 5’ UTR Hormônio de TTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGA 39 crescimento AGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCA bovino 3’ UTR Hemoglobina GCTGCCTTCTGCGGGGCTTGCCTTCTGGCCATGCCCTTCTTCTCTCCCTTG 40 alfa Mus CACCTGTACCTCTTGGTCTTTGAATAAAGCCTGAGTAGGAAG musculus, cadeia adulta 1 (Hba-a1), 3’UTR HSD17B4 5’ TCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGTTGC 41

UTR AGGCCTTATTC RNA guia mU*mU*mA*CAGCCACGUCUACAGCAGUUUUAGAmGmCmUmAmGmAmAm 42 G282 AmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGm

Descrição Sequência SEQ ID No. direcionado a AmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmC TTR mU*mU*mU*mU Transcrito GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 43 Cas9 com 5' TGCAGGCCTTATTCGGATCCGCCACCATGGACAAGAAGTACAGCATCGGAC UTR de HSD, TGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATAC

ORF AAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAG correspondent CATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAG e à SEQ ID CAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAA NO: 4, AGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGG sequência de TCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAG Kozak e 3' ACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCG UTR de ALB CATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCG

ACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACAC ATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGAC AACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAG CTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAAT CCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCAC AGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGA CGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACC TGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAG AACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAA ATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACA CCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGG AAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGAT ACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGA TCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGA GAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCA CCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACT TCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACAT TCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTC GCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAA GAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGAC AAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCT GCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGT CACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGG

Descrição Sequência SEQ ID No.

CAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGC TGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCA GCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTG CTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGAC ATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATG ATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATG AAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAA GCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTT CCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGA CGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGAC AGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCA ATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAG AAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAG AGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACA CCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCT GCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGAC TGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGAC GACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAA GAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACT GGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAAC CTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATT CATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACA GATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGAT CAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAG AAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGC ACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTA CCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGT CAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAA AGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACT GGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAA CAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAG GTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGAC AGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGC TGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGAC AGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGG AAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCAT

Descrição Sequência SEQ ID No.

GGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGG GATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCC TGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAA CTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCT GTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCA TCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACC TGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGA GAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCA CCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGG ACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAG GAAGCCCGAAGAAGAAGAGAAAGGTCTAGCTAGCCATCACATTTAAAAGCA TCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATT CATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACAT AAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATG

GAAAGAACCTCGAG Transcrito GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 44 Cas9 com 5' TGCAGGCCTTATTCGGATCCATGGACAAGAAGTACAGCATCGGACTGGACA UTR de HSD, TCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATACAAGGTC

ORF CCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAGCATCAA correspondent GAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAGCAGAAG e à SEQ ID CAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAAAGAACA NO: 4 e 3' GAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGGTCGACG UTR de ALB ACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAGACAAGA

AGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCGCATACC ACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCGACAGCA CAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACACATGATCA AGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGACAACAGC GACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAGCTGTTC GAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAATCCTGAG CGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCACAGCTGC CGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTGAGCCTG GGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACGCAAA GCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCTGG CACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG

Descrição Sequência SEQ ID No.

AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACA AAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGT ACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCG ACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGG AAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGAC CTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGAT CCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACC CGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAA TCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGG ATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTC GTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGACAAACTTC GACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTA CGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGTCACAGA AGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGGCAATCG TCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGCTGAAGG AAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCAGCGGAG TCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTGCTGAAGA TCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGACATCCTGG AAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATGATCGAAG AAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATGAAGCAGC TGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAAGCTGATC AACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTTCCTGAA GAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGACGACA GCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGACAGGGA GACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCAATCAA GAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAAGGTCA TGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAAAACC AGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAATC GAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAA CGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCG ACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGA CAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGAC AGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAA AGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAG

Descrição Sequência SEQ ID No.

AGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTG GACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAA GTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGAC TTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGAC GCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAA GCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAA GATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTT CTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACTGGCAAAC GGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACAGGAGA AATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGTCCTGA GCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAGGAGGA TTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTGATCGC AAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGACAGCCCGA CAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAAAGAGC AAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCATGGAAAGA AGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGGGATACAAG GAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCCTGTTCGAA CTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAACTGCAGAA GGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCTGTACCTGG CAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACGAACAGAAG CAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCATCGAACAG ATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTGGACAAG GTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAACAGGC AGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGCAGC ATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAAA GGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACG AAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCC GAAGAAGAAGAGAAAGGTCTAGCTAGCCATCACATTTAAAAGCATCTCAGC CTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCT TTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTC TTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGA

ACCTCGAG ORF de Cas9 ATGGATAAGAAGTACTCGATCGGGCTGGATATCGGAACTAATTCCGTGGGT 45 alternativa TGGGCAGTGATCACGGATGAATACAAAGTGCCGTCCAAGAAGTTCAAGGTC com teor U de CTGGGGAACACCGATAGACACAGCATCAAGAAGAATCTCATCGGAGCCCT 19,36% GCTGTTTGACTCCGGCGAAACCGCAGAAGCGACCCGGCTCAAACGTACCG

Descrição Sequência SEQ ID No.

CGAGGCGACGCTACACCCGGCGGAAGAATCGCATCTGCTATCTGCAAGAA ATCTTTTCGAACGAAATGGCAAAGGTGGACGACAGCTTCTTCCACCGCCTG GAAGAATCTTTCCTGGTGGAGGAGGACAAGAAGCATGAACGGCATCCTATC TTTGGAAACATCGTGGACGAAGTGGCGTACCACGAAAAGTACCCGACCATC TACCATCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGCCGACCTCAGA TTGATCTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGACACTTCCTGA TCGAAGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTGTTCATTC AACTGGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAATGCCA GCGGCGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTCGCG GCGCCTCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAGAAGAACGGAC TTTTCGGCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGTC CAATTTTGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCTA CGACGACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGGA TCTGTTCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATATC CTGCGCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGATT AAGCGGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTCGT GAGACAGCAACTGCCTGAAAAGTACAAGGAGATTTTCTTCGACCAGTCCAA GAATGGGTACGCAGGGTACATCGATGGAGGCGCCAGCCAGGAAGAGTTCT ATAAGTTCATCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACTGC TGGTCAAGCTGAACAGGGAGGATCTGCTCCGCAAACAGAGAACCTTTGACA ACGGAAGCATTCCACACCAGATCCATCTGGGTGAGCTGCACGCCATCTTGC GGCGCCAGGAGGACTTTTACCCATTCCTCAAGGACAACCGGGAAAAGATC GAGAAAATTCTGACGTTCCGCATCCCGTATTACGTGGGCCCACTGGCGCG CGGCAATTCGCGCTTCGCGTGGATGACTAGAAAATCAGAGGAAACCATCAC TCCTTGGAATTTCGAGGAAGTTGTGGATAAGGGAGCTTCGGCACAATCCTT CATCGAACGAATGACCAACTTCGACAAGAATCTCCCAAACGAGAAGGTGCT TCCTAAGCACAGCCTCCTTTACGAATACTTCACTGTCTACAACGAACTGACT AAAGTGAAATACGTTACTGAAGGAATGAGGAAGCCGGCCTTTCTGAGCGGA GAACAGAAGAAAGCGATTGTCGATCTGCTGTTCAAGACCAACCGCAAGGTG ACCGTCAAGCAGCTTAAAGAGGACTACTTCAAGAAGATCGAGTGTTTCGAC TCAGTGGAAATCAGCGGAGTGGAGGACAGATTCAACGCTTCGCTGGGAAC CTATCATGATCTCCTGAAGATCATCAAGGACAAGGACTTCCTTGACAACGA GGAGAACGAGGACATCCTGGAAGATATCGTCCTGACCTTGACCCTTTTCGA GGATCGCGAGATGATCGAGGAGAGGCTTAAGACCTACGCTCATCTCTTCGA CGATAAGGTCATGAAACAACTCAAGCGCCGCCGGTACACTGGTTGGGGCC GCCTCTCCCGCAAGCTGATCAACGGTATTCGCGATAAACAGAGCGGTAAAA CTATCCTGGATTTCCTCAAATCGGATGGCTTCGCTAATCGTAACTTCATGCA

Descrição Sequência SEQ ID No.

GTTGATCCACGACGACAGCCTGACCTTTAAGGAGGACATCCAGAAAGCACA AGTGAGCGGACAGGGAGACTCACTCCATGAACACATCGCGAATCTGGCCG GTTCGCCGGCGATTAAGAAGGGAATCCTGCAAACTGTGAAGGTGGTGGAC GAGCTGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATCGTGATTGA AATGGCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAGAACTCCCGCG AAAGGATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCCAGATC CTGAAAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCTCTA CCTGTACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTGGA CATCAATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTTT CTGAAGGATGACTCCATCGATAACAAGGTGTTGACTCGCAGCGACAAGAAC AGAGGGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGAA GAATTACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGTT TGACAATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAGG CTGGATTCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCAC GTGGCGCAGATCCTGGACTCCCGCATGAACACTAAATACGACGAGAACGAT AAGCTCATCCGGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTCG GACTTTCGGAAGGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTACC ATCACGCGCATGACGCATACCTCAACGCTGTGGTCGGCACCGCCCTGATC AAGAAGTACCCTAAACTTGAATCGGAGTTTGTGTACGGAGACTACAAGGTC TACGACGTGAGGAAGATGATAGCCAAGTCCGAACAGGAAATCGGGAAAGC AACTGCGAAATACTTCTTTTACTCAAACATCATGAACTTCTTCAAGACTGAAA TTACGCTGGCCAATGGAGAAATCAGGAAGAGGCCACTGATCGAAACTAACG GAGAAACGGGCGAAATCGTGTGGGACAAGGGCAGGGACTTCGCAACTGTT CGCAAAGTGCTCTCTATGCCGCAAGTCAATATTGTGAAGAAAACCGAAGTG CAAACCGGCGGATTTTCAAAGGAATCGATCCTCCCAAAGAGAAATAGCGAC AAGCTCATTGCACGCAAGAAAGACTGGGACCCGAAGAAGTACGGAGGATT CGATTCGCCGACTGTCGCATACTCCGTCCTCGTGGTGGCCAAGGTGGAGA AGGGAAAGAGCAAGAAGCTCAAATCCGTCAAAGAGCTGCTGGGGATTACC ATCATGGAACGATCCTCGTTCGAGAAGAACCCGATTGATTTCCTGGAGGCG AAGGGTTACAAGGAGGTGAAGAAGGATCTGATCATCAAACTGCCCAAGTAC TCACTGTTCGAACTGGAAAATGGTCGGAAGCGCATGCTGGCTTCGGCCGG AGAACTCCAGAAAGGAAATGAGCTGGCCTTGCCTAGCAAGTACGTCAACTT CCTCTATCTTGCTTCGCACTACGAGAAACTCAAAGGGTCACCGGAAGATAA CGAACAGAAGCAGCTTTTCGTGGAGCAGCACAAGCATTATCTGGATGAAAT CATCGAACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGCCGACGCCAA CCTCGACAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAGCCGATCAG AGAACAGGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCTGGGAGC

Descrição Sequência SEQ ID No.

TCCAGCCGCCTTCAAGTACTTCGATACTACTATCGACCGCAAAAGATACAC GTCCACCAAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCACTG GACTCTACGAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGATGGTGGC GGTGGATCCTACCCATACGACGTGCCTGACTACGCCTCCGGAGGTGGTGG

CCCCAAGAAGAAACGGAAGGTGTGATAG Cas9 GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 46 transcript with TGCAGGCCTTATTCGGATCTGCCACCATGGATAAGAAGTACTCGATCGGGC 5’ UTR of TGGATATCGGAACTAATTCCGTGGGTTGGGCAGTGATCACGGATGAATACA HSD, ORF AAGTGCCGTCCAAGAAGTTCAAGGTCCTGGGGAACACCGATAGACACAGC corresponding ATCAAGAAGAATCTCATCGGAGCCCTGCTGTTTGACTCCGGCGAAACCGCA to SEQ ID GAAGCGACCCGGCTCAAACGTACCGCGAGGCGACGCTACACCCGGCGGA NO: 45, AGAATCGCATCTGCTATCTGCAAGAAATCTTTTCGAACGAAATGGCAAAGGT Kozak GGACGACAGCTTCTTCCACCGCCTGGAAGAATCTTTCCTGGTGGAGGAGG sequence, ACAAGAAGCATGAACGGCATCCTATCTTTGGAAACATCGTGGACGAAGTGG and 3’ UTR of CGTACCACGAAAAGTACCCGACCATCTACCATCTGCGGAAGAAGTTGGTTG

ALB ACTCAACTGACAAGGCCGACCTCAGATTGATCTACTTGGCCCTCGCCCATA TGATCAAATTCCGCGGACACTTCCTGATCGAAGGCGATCTGAACCCTGATA ACTCCGACGTGGATAAGCTGTTCATTCAACTGGTGCAGACCTACAACCAAC TGTTCGAAGAAAACCCAATCAATGCCAGCGGCGTCGATGCCAAGGCCATCC TGTCCGCCCGGCTGTCGAAGTCGCGGCGCCTCGAAAACCTGATCGCACAG CTGCCGGGAGAGAAGAAGAACGGACTTTTCGGCAACTTGATCGCTCTCTCA CTGGGACTCACTCCCAATTTCAAGTCCAATTTTGACCTGGCCGAGGACGCG AAGCTGCAACTCTCAAAGGACACCTACGACGACGACTTGGACAATTTGCTG GCACAAATTGGCGATCAGTACGCGGATCTGTTCCTTGCCGCTAAGAACCTT TCGGACGCAATCTTGCTGTCCGATATCCTGCGCGTGAACACCGAAATAACC AAAGCGCCGCTTAGCGCCTCGATGATTAAGCGGTACGACGAGCATCACCA GGATCTCACGCTGCTCAAAGCGCTCGTGAGACAGCAACTGCCTGAAAAGTA CAAGGAGATTTTCTTCGACCAGTCCAAGAATGGGTACGCAGGGTACATCGA TGGAGGCGCCAGCCAGGAAGAGTTCTATAAGTTCATCAAGCCAATCCTGGA AAAGATGGACGGAACCGAAGAACTGCTGGTCAAGCTGAACAGGGAGGATC TGCTCCGCAAACAGAGAACCTTTGACAACGGAAGCATTCCACACCAGATCC ATCTGGGTGAGCTGCACGCCATCTTGCGGCGCCAGGAGGACTTTTACCCA TTCCTCAAGGACAACCGGGAAAAGATCGAGAAAATTCTGACGTTCCGCATC CCGTATTACGTGGGCCCACTGGCGCGCGGCAATTCGCGCTTCGCGTGGAT GACTAGAAAATCAGAGGAAACCATCACTCCTTGGAATTTCGAGGAAGTTGT GGATAAGGGAGCTTCGGCACAATCCTTCATCGAACGAATGACCAACTTCGA

Descrição Sequência SEQ ID No.

CAAGAATCTCCCAAACGAGAAGGTGCTTCCTAAGCACAGCCTCCTTTACGA ATACTTCACTGTCTACAACGAACTGACTAAAGTGAAATACGTTACTGAAGGA ATGAGGAAGCCGGCCTTTCTGAGCGGAGAACAGAAGAAAGCGATTGTCGA TCTGCTGTTCAAGACCAACCGCAAGGTGACCGTCAAGCAGCTTAAAGAGGA CTACTTCAAGAAGATCGAGTGTTTCGACTCAGTGGAAATCAGCGGAGTGGA GGACAGATTCAACGCTTCGCTGGGAACCTATCATGATCTCCTGAAGATCAT CAAGGACAAGGACTTCCTTGACAACGAGGAGAACGAGGACATCCTGGAAG ATATCGTCCTGACCTTGACCCTTTTCGAGGATCGCGAGATGATCGAGGAGA GGCTTAAGACCTACGCTCATCTCTTCGACGATAAGGTCATGAAACAACTCAA GCGCCGCCGGTACACTGGTTGGGGCCGCCTCTCCCGCAAGCTGATCAACG GTATTCGCGATAAACAGAGCGGTAAAACTATCCTGGATTTCCTCAAATCGGA TGGCTTCGCTAATCGTAACTTCATGCAGTTGATCCACGACGACAGCCTGAC CTTTAAGGAGGACATCCAGAAAGCACAAGTGAGCGGACAGGGAGACTCAC TCCATGAACACATCGCGAATCTGGCCGGTTCGCCGGCGATTAAGAAGGGA ATCCTGCAAACTGTGAAGGTGGTGGACGAGCTGGTGAAGGTCATGGGACG GCACAAACCGGAGAATATCGTGATTGAAATGGCCCGAGAAAACCAGACTAC CCAGAAGGGCCAGAAGAACTCCCGCGAAAGGATGAAGCGGATCGAAGAAG GAATCAAGGAGCTGGGCAGCCAGATCCTGAAAGAGCACCCGGTGGAAAAC ACGCAGCTGCAGAACGAGAAGCTCTACCTGTACTATTTGCAAAATGGACGG GACATGTACGTGGACCAAGAGCTGGACATCAATCGGTTGTCTGATTACGAC GTGGACCACATCGTTCCACAGTCCTTTCTGAAGGATGACTCCATCGATAAC AAGGTGTTGACTCGCAGCGACAAGAACAGAGGGAAGTCAGATAATGTGCC ATCGGAGGAGGTCGTGAAGAAGATGAAGAATTACTGGCGGCAGCTCCTGA ATGCGAAGCTGATTACCCAGAGAAAGTTTGACAATCTCACTAAAGCCGAGC GCGGCGGACTCTCAGAGCTGGATAAGGCTGGATTCATCAAACGGCAGCTG GTCGAGACTCGGCAGATTACCAAGCACGTGGCGCAGATCCTGGACTCCCG CATGAACACTAAATACGACGAGAACGATAAGCTCATCCGGGAAGTGAAGGT GATTACCCTGAAAAGCAAACTTGTGTCGGACTTTCGGAAGGACTTTCAGTTT TACAAAGTGAGAGAAATCAACAACTACCATCACGCGCATGACGCATACCTC AACGCTGTGGTCGGCACCGCCCTGATCAAGAAGTACCCTAAACTTGAATCG GAGTTTGTGTACGGAGACTACAAGGTCTACGACGTGAGGAAGATGATAGCC AAGTCCGAACAGGAAATCGGGAAAGCAACTGCGAAATACTTCTTTTACTCAA ACATCATGAACTTCTTCAAGACTGAAATTACGCTGGCCAATGGAGAAATCAG GAAGAGGCCACTGATCGAAACTAACGGAGAAACGGGCGAAATCGTGTGGG ACAAGGGCAGGGACTTCGCAACTGTTCGCAAAGTGCTCTCTATGCCGCAAG TCAATATTGTGAAGAAAACCGAAGTGCAAACCGGCGGATTTTCAAAGGAAT CGATCCTCCCAAAGAGAAATAGCGACAAGCTCATTGCACGCAAGAAAGACT

Descrição Sequência SEQ ID No.

GGGACCCGAAGAAGTACGGAGGATTCGATTCGCCGACTGTCGCATACTCC GTCCTCGTGGTGGCCAAGGTGGAGAAGGGAAAGAGCAAGAAGCTCAAATC CGTCAAAGAGCTGCTGGGGATTACCATCATGGAACGATCCTCGTTCGAGAA GAACCCGATTGATTTCCTGGAGGCGAAGGGTTACAAGGAGGTGAAGAAGG ATCTGATCATCAAACTGCCCAAGTACTCACTGTTCGAACTGGAAAATGGTCG GAAGCGCATGCTGGCTTCGGCCGGAGAACTCCAGAAAGGAAATGAGCTGG CCTTGCCTAGCAAGTACGTCAACTTCCTCTATCTTGCTTCGCACTACGAGAA ACTCAAAGGGTCACCGGAAGATAACGAACAGAAGCAGCTTTTCGTGGAGCA GCACAAGCATTATCTGGATGAAATCATCGAACAAATCTCCGAGTTTTCAAAG CGCGTGATCCTCGCCGACGCCAACCTCGACAAAGTCCTGTCGGCCTACAA TAAGCATAGAGATAAGCCGATCAGAGAACAGGCCGAGAACATTATCCACTT GTTCACCCTGACTAACCTGGGAGCTCCAGCCGCCTTCAAGTACTTCGATAC TACTATCGACCGCAAAAGATACACGTCCACCAAGGAAGTTCTGGACGCGAC CCTGATCCACCAAAGCATCACTGGACTCTACGAAACTAGGATCGATCTGTC GCAGCTGGGTGGCGATGGTGGCGGTGGATCCTACCCATACGACGTGCCTG ACTACGCCTCCGGAGGTGGTGGCCCCAAGAAGAAACGGAAGGTGTGATAG CTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGA AAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGC CAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCT

GTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAG Transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 47 Cas9 com 5' TGCAGGCCTTATTCGGATCTATGGATAAGAAGTACTCGATCGGGCTGGATA UTR de HSD, TCGGAACTAATTCCGTGGGTTGGGCAGTGATCACGGATGAATACAAAGTGC

ORF CGTCCAAGAAGTTCAAGGTCCTGGGGAACACCGATAGACACAGCATCAAGA correspondent AGAATCTCATCGGAGCCCTGCTGTTTGACTCCGGCGAAACCGCAGAAGCG e à SEQ ID ACCCGGCTCAAACGTACCGCGAGGCGACGCTACACCCGGCGGAAGAATCG NO: 45 e 3' CATCTGCTATCTGCAAGAAATCTTTTCGAACGAAATGGCAAAGGTGGACGA UTR de ALB CAGCTTCTTCCACCGCCTGGAAGAATCTTTCCTGGTGGAGGAGGACAAGAA

GCATGAACGGCATCCTATCTTTGGAAACATCGTGGACGAAGTGGCGTACCA CGAAAAGTACCCGACCATCTACCATCTGCGGAAGAAGTTGGTTGACTCAAC TGACAAGGCCGACCTCAGATTGATCTACTTGGCCCTCGCCCATATGATCAA ATTCCGCGGACACTTCCTGATCGAAGGCGATCTGAACCCTGATAACTCCGA CGTGGATAAGCTGTTCATTCAACTGGTGCAGACCTACAACCAACTGTTCGA AGAAAACCCAATCAATGCCAGCGGCGTCGATGCCAAGGCCATCCTGTCCG CCCGGCTGTCGAAGTCGCGGCGCCTCGAAAACCTGATCGCACAGCTGCCG GGAGAGAAGAAGAACGGACTTTTCGGCAACTTGATCGCTCTCTCACTGGGA

Descrição Sequência SEQ ID No.

CTCACTCCCAATTTCAAGTCCAATTTTGACCTGGCCGAGGACGCGAAGCTG CAACTCTCAAAGGACACCTACGACGACGACTTGGACAATTTGCTGGCACAA ATTGGCGATCAGTACGCGGATCTGTTCCTTGCCGCTAAGAACCTTTCGGAC GCAATCTTGCTGTCCGATATCCTGCGCGTGAACACCGAAATAACCAAAGCG CCGCTTAGCGCCTCGATGATTAAGCGGTACGACGAGCATCACCAGGATCTC ACGCTGCTCAAAGCGCTCGTGAGACAGCAACTGCCTGAAAAGTACAAGGA GATTTTCTTCGACCAGTCCAAGAATGGGTACGCAGGGTACATCGATGGAGG CGCCAGCCAGGAAGAGTTCTATAAGTTCATCAAGCCAATCCTGGAAAAGAT GGACGGAACCGAAGAACTGCTGGTCAAGCTGAACAGGGAGGATCTGCTCC GCAAACAGAGAACCTTTGACAACGGAAGCATTCCACACCAGATCCATCTGG GTGAGCTGCACGCCATCTTGCGGCGCCAGGAGGACTTTTACCCATTCCTCA AGGACAACCGGGAAAAGATCGAGAAAATTCTGACGTTCCGCATCCCGTATT ACGTGGGCCCACTGGCGCGCGGCAATTCGCGCTTCGCGTGGATGACTAGA AAATCAGAGGAAACCATCACTCCTTGGAATTTCGAGGAAGTTGTGGATAAG GGAGCTTCGGCACAATCCTTCATCGAACGAATGACCAACTTCGACAAGAAT CTCCCAAACGAGAAGGTGCTTCCTAAGCACAGCCTCCTTTACGAATACTTC ACTGTCTACAACGAACTGACTAAAGTGAAATACGTTACTGAAGGAATGAGG AAGCCGGCCTTTCTGAGCGGAGAACAGAAGAAAGCGATTGTCGATCTGCT GTTCAAGACCAACCGCAAGGTGACCGTCAAGCAGCTTAAAGAGGACTACTT CAAGAAGATCGAGTGTTTCGACTCAGTGGAAATCAGCGGAGTGGAGGACA GATTCAACGCTTCGCTGGGAACCTATCATGATCTCCTGAAGATCATCAAGG ACAAGGACTTCCTTGACAACGAGGAGAACGAGGACATCCTGGAAGATATCG TCCTGACCTTGACCCTTTTCGAGGATCGCGAGATGATCGAGGAGAGGCTTA AGACCTACGCTCATCTCTTCGACGATAAGGTCATGAAACAACTCAAGCGCC GCCGGTACACTGGTTGGGGCCGCCTCTCCCGCAAGCTGATCAACGGTATT CGCGATAAACAGAGCGGTAAAACTATCCTGGATTTCCTCAAATCGGATGGC TTCGCTAATCGTAACTTCATGCAGTTGATCCACGACGACAGCCTGACCTTTA AGGAGGACATCCAGAAAGCACAAGTGAGCGGACAGGGAGACTCACTCCAT GAACACATCGCGAATCTGGCCGGTTCGCCGGCGATTAAGAAGGGAATCCT GCAAACTGTGAAGGTGGTGGACGAGCTGGTGAAGGTCATGGGACGGCACA AACCGGAGAATATCGTGATTGAAATGGCCCGAGAAAACCAGACTACCCAGA AGGGCCAGAAGAACTCCCGCGAAAGGATGAAGCGGATCGAAGAAGGAATC AAGGAGCTGGGCAGCCAGATCCTGAAAGAGCACCCGGTGGAAAACACGCA GCTGCAGAACGAGAAGCTCTACCTGTACTATTTGCAAAATGGACGGGACAT GTACGTGGACCAAGAGCTGGACATCAATCGGTTGTCTGATTACGACGTGGA CCACATCGTTCCACAGTCCTTTCTGAAGGATGACTCCATCGATAACAAGGT GTTGACTCGCAGCGACAAGAACAGAGGGAAGTCAGATAATGTGCCATCGG

Descrição Sequência SEQ ID No.

AGGAGGTCGTGAAGAAGATGAAGAATTACTGGCGGCAGCTCCTGAATGCG AAGCTGATTACCCAGAGAAAGTTTGACAATCTCACTAAAGCCGAGCGCGGC GGACTCTCAGAGCTGGATAAGGCTGGATTCATCAAACGGCAGCTGGTCGA GACTCGGCAGATTACCAAGCACGTGGCGCAGATCCTGGACTCCCGCATGA ACACTAAATACGACGAGAACGATAAGCTCATCCGGGAAGTGAAGGTGATTA CCCTGAAAAGCAAACTTGTGTCGGACTTTCGGAAGGACTTTCAGTTTTACAA AGTGAGAGAAATCAACAACTACCATCACGCGCATGACGCATACCTCAACGC TGTGGTCGGCACCGCCCTGATCAAGAAGTACCCTAAACTTGAATCGGAGTT TGTGTACGGAGACTACAAGGTCTACGACGTGAGGAAGATGATAGCCAAGTC CGAACAGGAAATCGGGAAAGCAACTGCGAAATACTTCTTTTACTCAAACATC ATGAACTTCTTCAAGACTGAAATTACGCTGGCCAATGGAGAAATCAGGAAG AGGCCACTGATCGAAACTAACGGAGAAACGGGCGAAATCGTGTGGGACAA GGGCAGGGACTTCGCAACTGTTCGCAAAGTGCTCTCTATGCCGCAAGTCAA TATTGTGAAGAAAACCGAAGTGCAAACCGGCGGATTTTCAAAGGAATCGAT CCTCCCAAAGAGAAATAGCGACAAGCTCATTGCACGCAAGAAAGACTGGGA CCCGAAGAAGTACGGAGGATTCGATTCGCCGACTGTCGCATACTCCGTCCT CGTGGTGGCCAAGGTGGAGAAGGGAAAGAGCAAGAAGCTCAAATCCGTCA AAGAGCTGCTGGGGATTACCATCATGGAACGATCCTCGTTCGAGAAGAACC CGATTGATTTCCTGGAGGCGAAGGGTTACAAGGAGGTGAAGAAGGATCTG ATCATCAAACTGCCCAAGTACTCACTGTTCGAACTGGAAAATGGTCGGAAG CGCATGCTGGCTTCGGCCGGAGAACTCCAGAAAGGAAATGAGCTGGCCTT GCCTAGCAAGTACGTCAACTTCCTCTATCTTGCTTCGCACTACGAGAAACTC AAAGGGTCACCGGAAGATAACGAACAGAAGCAGCTTTTCGTGGAGCAGCA CAAGCATTATCTGGATGAAATCATCGAACAAATCTCCGAGTTTTCAAAGCGC GTGATCCTCGCCGACGCCAACCTCGACAAAGTCCTGTCGGCCTACAATAAG CATAGAGATAAGCCGATCAGAGAACAGGCCGAGAACATTATCCACTTGTTC ACCCTGACTAACCTGGGAGCTCCAGCCGCCTTCAAGTACTTCGATACTACT ATCGACCGCAAAAGATACACGTCCACCAAGGAAGTTCTGGACGCGACCCT GATCCACCAAAGCATCACTGGACTCTACGAAACTAGGATCGATCTGTCGCA GCTGGGTGGCGATGGTGGCGGTGGATCCTACCCATACGACGTGCCTGACT ACGCCTCCGGAGGTGGTGGCCCCAAGAAGAAACGGAAGGTGTGATAGCTA GCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAA TGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAA CACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGT

GCTTCAATTAATAAAAAATGGAAAGAACCTCGAG Transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 48

Descrição Sequência SEQ ID No. Cas9 TGCAGGCCTTATTCGGATCCATGCCTAAGAAAAAGCGGAAGGTCGACGGG compreenden GATAAGAAGTACTCAATCGGGCTGGATATCGGAACTAATTCCGTGGGTTGG do ORF de GCAGTGATCACGGATGAATACAAAGTGCCGTCCAAGAAGTTCAAGGTCCTG Cas9 usando GGGAACACCGATAGACACAGCATCAAGAAAAATCTCATCGGAGCCCTGCTG códons com TTTGACTCCGGCGAAACCGCAGAAGCGACCCGGCTCAAACGTACCGCGAG expressão GCGACGCTACACCCGGCGGAAGAATCGCATCTGCTATCTGCAAGAGATCTT geralmente TTCGAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACCGCCTGGAAGA alta em ATCTTTCCTGGTGGAGGAGGACAAGAAGCATGAACGGCATCCTATCTTTGG humanos AAACATCGTCGACGAAGTGGCGTACCACGAAAAGTACCCGACCATCTACCA

TCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGCCGACCTCAGATTGAT CTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGACACTTCCTGATCGA AGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTTTTCATTCAACT GGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAATGCTAGCGG CGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTCGCGGCGCC TCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAAAAGAACGGACTTTTCG GCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGTCCAATTT TGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCTACGACG ACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGGATCTGT TCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATATCCTGC GCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGATTAAGC GGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTCGTGAGA CAGCAACTGCCTGAAAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAAT GGGTACGCAGGGTACATCGATGGAGGCGCTAGCCAGGAAGAGTTCTATAA GTTCATCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACTGCTGGT CAAGCTGAACAGGGAGGATCTGCTCCGGAAACAGAGAACCTTTGACAACG GATCCATTCCCCACCAGATCCATCTGGGTGAGCTGCACGCCATCTTGCGGC GCCAGGAGGACTTTTACCCATTCCTCAAGGACAACCGGGAAAAGATCGAGA AAATTCTGACGTTCCGCATCCCGTATTACGTGGGCCCACTGGCGCGCGGC AATTCGCGCTTCGCGTGGATGACTAGAAAATCAGAGGAAACCATCACTCCT TGGAATTTCGAGGAAGTTGTGGATAAGGGAGCTTCGGCACAAAGCTTCATC GAACGAATGACCAACTTCGACAAGAATCTCCCAAACGAGAAGGTGCTTCCT AAGCACAGCCTCCTTTACGAATACTTCACTGTCTACAACGAACTGACTAAAG TGAAATACGTTACTGAAGGAATGAGGAAGCCGGCCTTTCTGTCCGGAGAAC AGAAGAAAGCAATTGTCGATCTGCTGTTCAAGACCAACCGCAAGGTGACCG TCAAGCAGCTTAAAGAGGACTACTTCAAGAAGATCGAGTGTTTCGACTCAG TGGAAATCAGCGGGGTGGAGGACAGATTCAACGCTTCGCTGGGAACCTAT CATGATCTCCTGAAGATCATCAAGGACAAGGACTTCCTTGACAACGAGGAG

Descrição Sequência SEQ ID No.

AACGAGGACATCCTGGAAGATATCGTCCTGACCTTGACCCTTTTCGAGGAT CGCGAGATGATCGAGGAGAGGCTTAAGACCTACGCTCATCTCTTCGACGAT AAGGTCATGAAACAACTCAAGCGCCGCCGGTACACTGGTTGGGGCCGCCT CTCCCGCAAGCTGATCAACGGTATTCGCGATAAACAGAGCGGTAAAACTAT CCTGGATTTCCTCAAATCGGATGGCTTCGCTAATCGTAACTTCATGCAATTG ATCCACGACGACAGCCTGACCTTTAAGGAGGACATCCAAAAAGCACAAGTG TCCGGACAGGGAGACTCACTCCATGAACACATCGCGAATCTGGCCGGTTC GCCGGCGATTAAGAAGGGAATTCTGCAAACTGTGAAGGTGGTCGACGAGC TGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATCGTGATTGAAATG GCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAAAACTCCCGCGAAAG GATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCCAGATCCTGA AAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCTCTACCTG TACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTGGACATC AATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTTTCTGA AGGATGACTCGATCGATAACAAGGTGTTGACTCGCAGCGACAAGAACAGAG GGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGAAGAATT ACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGTTTGACA ATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAGGCTGGA TTCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCACGTGGC GCAGATCTTGGACTCCCGCATGAACACTAAATACGACGAGAACGATAAGCT CATCCGGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTCGGACTT TCGGAAGGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTACCATCAC GCGCATGACGCATACCTCAACGCTGTGGTCGGTACCGCCCTGATCAAAAA GTACCCTAAACTTGAATCGGAGTTTGTGTACGGAGACTACAAGGTCTACGA CGTGAGGAAGATGATAGCCAAGTCCGAACAGGAAATCGGGAAAGCAACTG CGAAATACTTCTTTTACTCAAACATCATGAACTTTTTCAAGACTGAAATTACG CTGGCCAATGGAGAAATCAGGAAGAGGCCACTGATCGAAACTAACGGAGA AACGGGCGAAATCGTGTGGGACAAGGGCAGGGACTTCGCAACTGTTCGCA AAGTGCTCTCTATGCCGCAAGTCAATATTGTGAAGAAAACCGAAGTGCAAA CCGGCGGATTTTCAAAGGAATCGATCCTCCCAAAGAGAAATAGCGACAAGC TCATTGCACGCAAGAAAGACTGGGACCCGAAGAAGTACGGAGGATTCGATT CGCCGACTGTCGCATACTCCGTCCTCGTGGTGGCCAAGGTGGAGAAGGGA AAGAGCAAAAAGCTCAAATCCGTCAAAGAGCTGCTGGGGATTACCATCATG GAACGATCCTCGTTCGAGAAGAACCCGATTGATTTCCTCGAGGCGAAGGGT TACAAGGAGGTGAAGAAGGATCTGATCATCAAACTCCCCAAGTACTCACTG TTCGAACTGGAAAATGGTCGGAAGCGCATGCTGGCTTCGGCCGGAGAACT CCAAAAAGGAAATGAGCTGGCCTTGCCTAGCAAGTACGTCAACTTCCTCTA

Descrição Sequência SEQ ID No.

TCTTGCTTCGCACTACGAAAAACTCAAAGGGTCACCGGAAGATAACGAACA GAAGCAGCTTTTCGTGGAGCAGCACAAGCATTATCTGGATGAAATCATCGA ACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGCCGACGCCAACCTCGA CAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAGCCGATCAGAGAACA GGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCTGGGAGCCCCAGC CGCCTTCAAGTACTTCGATACTACTATCGATCGCAAAAGATACACGTCCACC AAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCACTGGACTCTAC GAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGATTGATAGTCTAGCCAT CACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAG ATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCC TGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCA

ATTAATAAAAAATGGAAAGAACCTCGAG Transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 49 Cas9 TGCAGGCCTTATTCGGATCCGCCACCATGCCTAAGAAAAAGCGGAAGGTC compreenden GACGGGGATAAGAAGTACTCAATCGGGCTGGATATCGGAACTAATTCCGTG do a GGTTGGGCAGTGATCACGGATGAATACAAAGTGCCGTCCAAGAAGTTCAAG sequência GTCCTGGGGAACACCGATAGACACAGCATCAAGAAAAATCTCATCGGAGCC Kozak com CTGCTGTTTGACTCCGGCGAAACCGCAGAAGCGACCCGGCTCAAACGTAC ORF de Cas9 CGCGAGGCGACGCTACACCCGGCGGAAGAATCGCATCTGCTATCTGCAAG usando AGATCTTTTCGAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACCGCC códons com TGGAAGAATCTTTCCTGGTGGAGGAGGACAAGAAGCATGAACGGCATCCTA expressão TCTTTGGAAACATCGTCGACGAAGTGGCGTACCACGAAAAGTACCCGACCA geralmente TCTACCATCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGCCGACCTCA alta em GATTGATCTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGACACTTCCT humanos GATCGAAGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTTTTCAT

TCAACTGGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAATGC TAGCGGCGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTCGC GGCGCCTCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAAAAGAACGGA CTTTTCGGCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGT CCAATTTTGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCT ACGACGACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGG ATCTGTTCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATAT CCTGCGCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGA TTAAGCGGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTC GTGAGACAGCAACTGCCTGAAAAGTACAAGGAGATCTTCTTCGACCAGTCC AAGAATGGGTACGCAGGGTACATCGATGGAGGCGCTAGCCAGGAAGAGTT

Descrição Sequência SEQ ID No.

CTATAAGTTCATCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACT GCTGGTCAAGCTGAACAGGGAGGATCTGCTCCGGAAACAGAGAACCTTTG ACAACGGATCCATTCCCCACCAGATCCATCTGGGTGAGCTGCACGCCATCT TGCGGCGCCAGGAGGACTTTTACCCATTCCTCAAGGACAACCGGGAAAAG ATCGAGAAAATTCTGACGTTCCGCATCCCGTATTACGTGGGCCCACTGGCG CGCGGCAATTCGCGCTTCGCGTGGATGACTAGAAAATCAGAGGAAACCATC ACTCCTTGGAATTTCGAGGAAGTTGTGGATAAGGGAGCTTCGGCACAAAGC TTCATCGAACGAATGACCAACTTCGACAAGAATCTCCCAAACGAGAAGGTG CTTCCTAAGCACAGCCTCCTTTACGAATACTTCACTGTCTACAACGAACTGA CTAAAGTGAAATACGTTACTGAAGGAATGAGGAAGCCGGCCTTTCTGTCCG GAGAACAGAAGAAAGCAATTGTCGATCTGCTGTTCAAGACCAACCGCAAGG TGACCGTCAAGCAGCTTAAAGAGGACTACTTCAAGAAGATCGAGTGTTTCG ACTCAGTGGAAATCAGCGGGGTGGAGGACAGATTCAACGCTTCGCTGGGA ACCTATCATGATCTCCTGAAGATCATCAAGGACAAGGACTTCCTTGACAACG AGGAGAACGAGGACATCCTGGAAGATATCGTCCTGACCTTGACCCTTTTCG AGGATCGCGAGATGATCGAGGAGAGGCTTAAGACCTACGCTCATCTCTTCG ACGATAAGGTCATGAAACAACTCAAGCGCCGCCGGTACACTGGTTGGGGC CGCCTCTCCCGCAAGCTGATCAACGGTATTCGCGATAAACAGAGCGGTAAA ACTATCCTGGATTTCCTCAAATCGGATGGCTTCGCTAATCGTAACTTCATGC AATTGATCCACGACGACAGCCTGACCTTTAAGGAGGACATCCAAAAAGCAC AAGTGTCCGGACAGGGAGACTCACTCCATGAACACATCGCGAATCTGGCC GGTTCGCCGGCGATTAAGAAGGGAATTCTGCAAACTGTGAAGGTGGTCGA CGAGCTGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATCGTGATTG AAATGGCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAAAACTCCCGC GAAAGGATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCCAGAT CCTGAAAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCTCT ACCTGTACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTGG ACATCAATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTT TCTGAAGGATGACTCGATCGATAACAAGGTGTTGACTCGCAGCGACAAGAA CAGAGGGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGA AGAATTACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGT TTGACAATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAG GCTGGATTCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCA CGTGGCGCAGATCTTGGACTCCCGCATGAACACTAAATACGACGAGAACGA TAAGCTCATCCGGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTC GGACTTTCGGAAGGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTAC CATCACGCGCATGACGCATACCTCAACGCTGTGGTCGGTACCGCCCTGAT

Descrição Sequência SEQ ID No.

CAAAAAGTACCCTAAACTTGAATCGGAGTTTGTGTACGGAGACTACAAGGT CTACGACGTGAGGAAGATGATAGCCAAGTCCGAACAGGAAATCGGGAAAG CAACTGCGAAATACTTCTTTTACTCAAACATCATGAACTTTTTCAAGACTGAA ATTACGCTGGCCAATGGAGAAATCAGGAAGAGGCCACTGATCGAAACTAAC GGAGAAACGGGCGAAATCGTGTGGGACAAGGGCAGGGACTTCGCAACTGT TCGCAAAGTGCTCTCTATGCCGCAAGTCAATATTGTGAAGAAAACCGAAGT GCAAACCGGCGGATTTTCAAAGGAATCGATCCTCCCAAAGAGAAATAGCGA CAAGCTCATTGCACGCAAGAAAGACTGGGACCCGAAGAAGTACGGAGGAT TCGATTCGCCGACTGTCGCATACTCCGTCCTCGTGGTGGCCAAGGTGGAG AAGGGAAAGAGCAAAAAGCTCAAATCCGTCAAAGAGCTGCTGGGGATTACC ATCATGGAACGATCCTCGTTCGAGAAGAACCCGATTGATTTCCTCGAGGCG AAGGGTTACAAGGAGGTGAAGAAGGATCTGATCATCAAACTCCCCAAGTAC TCACTGTTCGAACTGGAAAATGGTCGGAAGCGCATGCTGGCTTCGGCCGG AGAACTCCAAAAAGGAAATGAGCTGGCCTTGCCTAGCAAGTACGTCAACTT CCTCTATCTTGCTTCGCACTACGAAAAACTCAAAGGGTCACCGGAAGATAA CGAACAGAAGCAGCTTTTCGTGGAGCAGCACAAGCATTATCTGGATGAAAT CATCGAACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGCCGACGCCAA CCTCGACAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAGCCGATCAG AGAACAGGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCTGGGAGC CCCAGCCGCCTTCAAGTACTTCGATACTACTATCGATCGCAAAAGATACAC GTCCACCAAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCACTG GACTCTACGAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGATTGATAGT CTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGA AAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGC CAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCT

GTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAG ORF de Cas9 ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGG 50 com junções ATGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGT de emenda CCTGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCAC removidas; TGCTGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACA 12,75% de GCAAGAAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAA teor de U ATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACcggCTGG

AAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCT TCGGAAACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCT ACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGA CTGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTG

Descrição Sequência SEQ ID No.

ATCGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCAT CCAGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAACGC AAGCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCA GAAGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACGGA CTGTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCAAG AGCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACAC ATACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACG CAGACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGC GACATCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAG CATGATCAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGG CACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACC AGAGCAAGAACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAA GAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAA GAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAAC ATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTGCACG CAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACAGAG AAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCGC TGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGAA ACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGC ACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGA AAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAA CGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATT CCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAA ACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCG AATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAA GCCTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCC TGGACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGA CACTGTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCAC ACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAG GATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAG AGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAG AAACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACAT CCAGAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCG CAAACCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTC AAGGTCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAA CATCGTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAA GAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGG

Descrição Sequência SEQ ID No.

GAAGCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAAC GAAAAGCTGTACCTGTACTACCTGCAaAACGGAAGAGACATGTACGTCGAC

CAGGAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGT CCCGCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAA GAAGCGACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTC GTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATC ACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAG CGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGAC AGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGT ACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGA GCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAG AAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCGTCG GAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTACG GAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAG GAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACT TCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGC TGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGA GACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTC AAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGA AGAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTC GTCGCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGA ACTGCTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGAT CGACTTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCAT CAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAAT GCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGA GCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGG GAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAG CACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTC ATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCA CAGAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCAC ACTGACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAAT CGACAGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGAT CCACCAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCT

GGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAG Transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 51

Descrição Sequência SEQ ID No. Cas9 com 5' TGCAGGCCTTATTCGGATCCGCCACCATGGACAAGAAGTACAGCATCGGAC UTR de HSD, TGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATAC

ORF AAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAG correspondent CATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAG e à SEQ ID CAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAA NO: 50, AGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGG sequência de TCGACGACAGCTTCTTCCACcggCTGGAAGAAAGCTTCCTGGTCGAAGAAGA Kozak e 3' CAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCG UTR de ALB CATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCG

ACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACAC ATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGAC AACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAG CTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAAT CCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCAC AGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGA CGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACC TGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAG AACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAA ATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACA CCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGG AAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGAT ACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGA TCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGA GAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCA CCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACT TCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACAT TCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTC GCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAA GAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGAC AAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCT GCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGT CACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGG CAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGC TGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCA GCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTG CTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGAC

Descrição Sequência SEQ ID No.

ATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATG ATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATG AAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAA GCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTT CCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGA CGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGAC AGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCA ATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAG AAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAG AGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACA

CCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCT GCAaAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACT

GAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACG ACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAG AGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTG GAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCT GACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCA TCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGA TCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCA GAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAA AGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCAC ACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTACC CGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGTCA GAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAAAG TACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACTGG CAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACA GGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGT CCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAG GAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTG ATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGACAG CCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAA AGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCATG GAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGGG ATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCCT GTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAAC TGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCTGT

Descrição Sequência SEQ ID No.

ACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACGAA CAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCATC GAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGA ACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACC GGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAG CACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACT GTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA GCCCGAAGAAGAAGAGAAAGGTCTAGCTAGCCATCACATTTAAAAGCATCT CAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCAT CTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAA TTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAA

AGAACCTCGAG ORF de Cas9 ATGGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGG 52 com códons CTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGG mínimos de TGCTGGGCAACACCGACAGACACAGCATCAAGAAGAACCTGATCGGCGCC uridina CTGCTGTTCGACAGCGGCGAGACCGCCGAGGCCACCAGACTGAAGAGAAC frequentemen CGCCAGAAGAAGATACACCAGAAGAAAGAACAGAATCTGCTACCTGCAGGA te usados em GATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACT humanos em GGAGGAGAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGAGACACCCC geral; 12,75% ATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCAC de teor de U CATCTACCACCTGAGAAAGAAGCTGGTGGACAGCACCGACAAGGCCGACC

TGAGACTGATCTACCTGGCCCTGGCCCACATGATCAAGTTCAGAGGCCACT TCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTG TTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATC AACGCCAGCGGCGTGGACGCCAAGGCCATCCTGAGCGCCAGACTGAGCA AGAGCAGAAGACTGGAGAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAG AACGGCCTGTTCGGCAACCTGATCGCCCTGAGCCTGGGCCTGACCCCCAA CTTCAAGAGCAACTTCGACCTGGCCGAGGACGCCAAGCTGCAGCTGAGCA AGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGAC CAGTACGCCGACCTGTTCCTGGCCGCCAAGAACCTGAGCGACGCCATCCT GCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGA GCGCCAGCATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTG CTGAAGGCCCTGGTGAGACAGCAGCTGCCCGAGAAGTACAAGGAGATCTT CTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATCGACGGCGGCGCCA GCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTGGAGAAGATGGAC

Descrição Sequência SEQ ID No.

GGCACCGAGGAGCTGCTGGTGAAGCTGAACAGAGAGGACCTGCTGAGAAA GCAGAGAACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGCG AGCTGCACGCCATCCTGAGAAGACAGGAGGACTTCTACCCCTTCCTGAAG GACAACAGAGAGAAGATCGAGAAGATCCTGACCTTCAGAATCCCCTACTAC GTGGGCCCCCTGGCCAGAGGCAACAGCAGATTCGCCTGGATGACCAGAAA GAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGACAAGG GCGCCAGCGCCCAGAGCTTCATCGAGAGAATGACCAACTTCGACAAGAAC CTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTT CACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGA GAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTGGACCTG CTGTTCAAGACCAACAGAAAGGTGACCGTGAAGCAGCTGAAGGAGGACTA CTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGGAGG ACAGATTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGAC ATCGTGCTGACCCTGACCCTGTTCGAGGACAGAGAGATGATCGAGGAGAG ACTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAA GAGAAGAAGATACACCGGCTGGGGCAGACTGAGCAGAAAGCTGATCAACG GCATCAGAGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGC GACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCT GACCTTCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGAC AGCCTGCACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAA GGGCATCCTGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATG GGCAGACACAAGCCCGAGAACATCGTGATCGAGATGGCCAGAGAGAACCA GACCACCCAGAAGGGCCAGAAGAACAGCAGAGAGAGAATGAAGAGAATCG AGGAGGGCATCAAGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGT GGAGAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGA ACGGCAGAGACATGTACGTGGACCAGGAGCTGGACATCAACAGACTGAGC GACTACGACGTGGACCACATCGTGCCCCAGAGCTTCCTGAAGGACGACAG CATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACAGAGGCAAGAGCG ACAACGTGCCCAGCGAGGAGGTGGTGAAGAAGATGAAGAACTACTGGAGA CAGCTGCTGAACGCCAAGCTGATCACCCAGAGAAAGTTCGACAACCTGACC AAGGCCGAGAGAGGCGGCCTGAGCGAGCTGGACAAGGCCGGCTTCATCA AGAGACAGCTGGTGGAGACCAGACAGATCACCAAGCACGTGGCCCAGATC CTGGACAGCAGAATGAACACCAAGTACGACGAGAACGACAAGCTGATCAG AGAGGTGAAGGTGATCACCCTGAAGAGCAAGCTGGTGAGCGACTTCAGAA AGGACTTCCAGTTCTACAAGGTGAGAGAGATCAACAACTACCACCACGCCC ACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGATCAAGAAGTAC

Descrição Sequência SEQ ID No.

CCCAAGCTGGAGAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGT GAGAAAGATGATCGCCAAGAGCGAGCAGGAGATCGGCAAGGCCACCGCCA AGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACCGAGATCACCCT GGCCAACGGCGAGATCAGAAAGAGACCCCTGATCGAGACCAACGGCGAGA CCGGCGAGATCGTGTGGGACAAGGGCAGAGACTTCGCCACCGTGAGAAAG GTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGAC CGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGAGAAACAGCGACAAGC TGATCGCCAGAAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGAC AGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGTGGAGAAGG GCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCATCACCATC ATGGAGAGAAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAA GGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACA GCCTGTTCGAGCTGGAGAACGGCAGAAAGAGAATGCTGGCCAGCGCCGG CGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGAC AACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGA GATCATCGAGCAGATCAGCGAGTTCAGCAAGAGAGTGATCCTGGCCGACG CCAACCTGGACAAGGTGCTGAGCGCCTACAACAAGCACAGAGACAAGCCC ATCAGAGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTG GGCGCCCCCGCCGCCTTCAAGTACTTCGACACCACCATCGACAGAAAGAG ATACACCAGCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCA TCACCGGCCTGTACGAGACCAGAATCGACCTGAGCCAGCTGGGCGGCGAC

GGCGGCGGCAGCCCCAAGAAGAAGAGAAAGGTGTGA Transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 53 Cas9 com 5' TGCAGGCCTTATTCGGATCCGCCACCATGGACAAGAAGTACAGCATCGGC UTR de HSD, CTGGACATCGGCACCAACAGCGTGGGCTGGGCCGTGATCACCGACGAGTA

ORF CAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGGGCAACACCGACAGACACA correspondent GCATCAAGAAGAACCTGATCGGCGCCCTGCTGTTCGACAGCGGCGAGACC e à SEQ ID GCCGAGGCCACCAGACTGAAGAGAACCGCCAGAAGAAGATACACCAGAAG NO: 52, AAAGAACAGAATCTGCTACCTGCAGGAGATCTTCAGCAACGAGATGGCCAA sequência de GGTGGACGACAGCTTCTTCCACAGACTGGAGGAGAGCTTCCTGGTGGAGG Kozak e 3' AGGACAAGAAGCACGAGAGACACCCCATCTTCGGCAACATCGTGGACGAG UTR de ALB GTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAGCTG

GTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCCCTGGC CCACATGATCAAGTTCAGAGGCCACTTCCTGATCGAGGGCGACCTGAACCC CGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACA

Descrição Sequência SEQ ID No.

ACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGACGCCAAG GCCATCCTGAGCGCCAGACTGAGCAAGAGCAGAAGACTGGAGAACCTGAT CGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATCG CCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCC GAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGA CAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCG CCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAAC ACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGAGATACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGAGACAGCAGC TGCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTAC GCCGGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCAT CAAGCCCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGC TGAACAGAGAGGACCTGCTGAGAAAGCAGAGAACCTTCGACAACGGCAGC ATCCCCCACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGAGAAGACA GGAGGACTTCTACCCCTTCCTGAAGGACAACAGAGAGAAGATCGAGAAGAT CCTGACCTTCAGAATCCCCTACTACGTGGGCCCCCTGGCCAGAGGCAACA GCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAGACCATCACCCCCTGG AACTTCGAGGAGGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGA GAGAATGACCAACTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCA AGCACAGCCTGCTGTACGAGTACTTCACCGTGTACAACGAGCTGACCAAGG TGAAGTACGTGACCGAGGGCATGAGAAAGCCCGCCTTCCTGAGCGGCGAG CAGAAGAAGGCCATCGTGGACCTGCTGTTCAAGACCAACAGAAAGGTGAC CGTGAAGCAGCTGAAGGAGGACTACTTCAAGAAGATCGAGTGCTTCGACA GCGTGGAGATCAGCGGCGTGGAGGACAGATTCAACGCCAGCCTGGGCAC CTACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA GGAGAACGAGGACATCCTGGAGGACATCGTGCTGACCCTGACCCTGTTCG AGGACAGAGAGATGATCGAGGAGAGACTGAAGACCTACGCCCACCTGTTC GACGACAAGGTGATGAAGCAGCTGAAGAGAAGAAGATACACCGGCTGGGG CAGACTGAGCAGAAAGCTGATCAACGGCATCAGAGACAAGCAGAGCGGCA AGACCATCCTGGACTTCCTGAAGAGCGACGGCTTCGCCAACAGAAACTTCA TGCAGCTGATCCACGACGACAGCCTGACCTTCAAGGAGGACATCCAGAAG GCCCAGGTGAGCGGCCAGGGCGACAGCCTGCACGAGCACATCGCCAACC TGGCCGGCAGCCCCGCCATCAAGAAGGGCATCCTGCAGACCGTGAAGGTG GTGGACGAGCTGGTGAAGGTGATGGGCAGACACAAGCCCGAGAACATCGT GATCGAGATGGCCAGAGAGAACCAGACCACCCAGAAGGGCCAGAAGAACA GCAGAGAGAGAATGAAGAGAATCGAGGAGGGCATCAAGGAGCTGGGCAG CCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGAGA

Descrição Sequência SEQ ID No.

AGCTGTACCTGTACTACCTGCAGAACGGCAGAGACATGTACGTGGACCAG GAGCTGGACATCAACAGACTGAGCGACTACGACGTGGACCACATCGTGCC CCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTGACCAGAA GCGACAAGAACAGAGGCAAGAGCGACAACGTGCCCAGCGAGGAGGTGGT GAAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCCAAGCTGATCAC CCAGAGAAAGTTCGACAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCG AGCTGGACAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAGACCAGACAG ATCACCAAGCACGTGGCCCAGATCCTGGACAGCAGAATGAACACCAAGTAC GACGAGAACGACAAGCTGATCAGAGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTGAGAGA GATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGG GCACCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTAC GGCGACTACAAGGTGTACGACGTGAGAAAGATGATCGCCAAGAGCGAGCA GGAGATCGGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAA CTTCTTCAAGACCGAGATCACCCTGGCCAACGGCGAGATCAGAAAGAGAC CCCTGATCGAGACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGG CAGAGACTTCGCCACCGTGAGAAAGGTGCTGAGCATGCCCCAGGTGAACA TCGTGAAGAAGACCGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATC CTGCCCAAGAGAAACAGCGACAAGCTGATCGCCAGAAAGAAGGACTGGGA CCCCAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGC TGGTGGTGGCCAAGGTGGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGT GAAGGAGCTGCTGGGCATCACCATCATGGAGAGAAGCAGCTTCGAGAAGA ACCCCATCGACTTCCTGGAGGCCAAGGGCTACAAGGAGGTGAAGAAGGAC CTGATCATCAAGCTGCCCAAGTACAGCCTGTTCGAGCTGGAGAACGGCAG AAAGAGAATGCTGGCCAGCGCCGGCGAGCTGCAGAAGGGCAACGAGCTG GCCCTGCCCAGCAAGTACGTGAACTTCCTGTACCTGGCCAGCCACTACGA GAAGCTGAAGGGCAGCCCCGAGGACAACGAGCAGAAGCAGCTGTTCGTG GAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTT CAGCAAGAGAGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCTGAGCG CCTACAACAAGCACAGAGACAAGCCCATCAGAGAGCAGGCCGAGAACATC ATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAGTA CTTCGACACCACCATCGACAGAAAGAGATACACCAGCACCAAGGAGGTGCT GGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACCAGAA TCGACCTGAGCCAGCTGGGCGGCGACGGCGGCGGCAGCCCCAAGAAGAA GAGAAAGGTGTGACTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGA GAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTT CGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATT

Descrição Sequência SEQ ID No.

TTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAG ORF de Cas9 ATGGACAAAAAATACAGCATAGGGCTAGACATAGGGACGAACAGCGTAGG 54 com códons GTGGGCGGTAATAACGGACGAATACAAAGTACCGAGCAAAAAATTCAAAGT mínimos de ACTAGGGAACACGGACCGACACAGCATAAAAAAAAACCTAATAGGGGCGCT uridina ACTATTCGACAGCGGGGAAACGGCGGAAGCGACGCGACTAAAACGAACGG raramente CGCGACGACGATACACGCGACGAAAAAACCGAATATGCTACCTACAAGAAA usados em TATTCAGCAACGAAATGGCGAAAGTAGACGACAGCTTCTTCCACCGACTAG humanos em AAGAAAGCTTCCTAGTAGAAGAAGACAAAAAACACGAACGACACCCGATAT geral; 12,75% TCGGGAACATAGTAGACGAAGTAGCGTACCACGAAAAATACCCGACGATAT de teor de U ACCACCTACGAAAAAAACTAGTAGACAGCACGGACAAAGCGGACCTACGAC

TAATATACCTAGCGCTAGCGCACATGATAAAATTCCGAGGGCACTTCCTAAT AGAAGGGGACCTAAACCCGGACAACAGCGACGTAGACAAACTATTCATACA ACTAGTACAAACGTACAACCAACTATTCGAAGAAAACCCGATAAACGCGAG CGGGGTAGACGCGAAAGCGATACTAAGCGCGCGACTAAGCAAAAGCCGAC GACTAGAAAACCTAATAGCGCAACTACCGGGGGAAAAAAAAAACGGGCTAT TCGGGAACCTAATAGCGCTAAGCCTAGGGCTAACGCCGAACTTCAAAAGCA ACTTCGACCTAGCGGAAGACGCGAAACTACAACTAAGCAAAGACACGTACG ACGACGACCTAGACAACCTACTAGCGCAAATAGGGGACCAATACGCGGAC CTATTCCTAGCGGCGAAAAACCTAAGCGACGCGATACTACTAAGCGACATA CTACGAGTAAACACGGAAATAACGAAAGCGCCGCTAAGCGCGAGCATGATA AAACGATACGACGAACACCACCAAGACCTAACGCTACTAAAAGCGCTAGTA CGACAACAACTACCGGAAAAATACAAAGAAATATTCTTCGACCAAAGCAAAA ACGGGTACGCGGGGTACATAGACGGGGGGGCGAGCCAAGAAGAATTCTAC AAATTCATAAAACCGATACTAGAAAAAATGGACGGGACGGAAGAACTACTA GTAAAACTAAACCGAGAAGACCTACTACGAAAACAACGAACGTTCGACAAC GGGAGCATACCGCACCAAATACACCTAGGGGAACTACACGCGATACTACG ACGACAAGAAGACTTCTACCCGTTCCTAAAAGACAACCGAGAAAAAATAGA AAAAATACTAACGTTCCGAATACCGTACTACGTAGGGCCGCTAGCGCGAGG GAACAGCCGATTCGCGTGGATGACGCGAAAAAGCGAAGAAACGATAACGC CGTGGAACTTCGAAGAAGTAGTAGACAAAGGGGCGAGCGCGCAAAGCTTC ATAGAACGAATGACGAACTTCGACAAAAACCTACCGAACGAAAAAGTACTA CCGAAACACAGCCTACTATACGAATACTTCACGGTATACAACGAACTAACGA AAGTAAAATACGTAACGGAAGGGATGCGAAAACCGGCGTTCCTAAGCGGG GAACAAAAAAAAGCGATAGTAGACCTACTATTCAAAACGAACCGAAAAGTAA CGGTAAAACAACTAAAAGAAGACTACTTCAAAAAAATAGAATGCTTCGACAG CGTAGAAATAAGCGGGGTAGAAGACCGATTCAACGCGAGCCTAGGGACGT

Descrição Sequência SEQ ID No.

ACCACGACCTACTAAAAATAATAAAAGACAAAGACTTCCTAGACAACGAAGA AAACGAAGACATACTAGAAGACATAGTACTAACGCTAACGCTATTCGAAGAC CGAGAAATGATAGAAGAACGACTAAAAACGTACGCGCACCTATTCGACGAC AAAGTAATGAAACAACTAAAACGACGACGATACACGGGGTGGGGGCGACT AAGCCGAAAACTAATAAACGGGATACGAGACAAACAAAGCGGGAAAACGAT ACTAGACTTCCTAAAAAGCGACGGGTTCGCGAACCGAAACTTCATGCAACT AATACACGACGACAGCCTAACGTTCAAAGAAGACATACAAAAAGCGCAAGT AAGCGGGCAAGGGGACAGCCTACACGAACACATAGCGAACCTAGCGGGGA GCCCGGCGATAAAAAAAGGGATACTACAAACGGTAAAAGTAGTAGACGAAC TAGTAAAAGTAATGGGGCGACACAAACCGGAAAACATAGTAATAGAAATGG CGCGAGAAAACCAAACGACGCAAAAAGGGCAAAAAAACAGCCGAGAACGA ATGAAACGAATAGAAGAAGGGATAAAAGAACTAGGGAGCCAAATACTAAAA GAACACCCGGTAGAAAACACGCAACTACAAAACGAAAAACTATACCTATACT ACCTACAAAACGGGCGAGACATGTACGTAGACCAAGAACTAGACATAAACC GACTAAGCGACTACGACGTAGACCACATAGTACCGCAAAGCTTCCTAAAAG ACGACAGCATAGACAACAAAGTACTAACGCGAAGCGACAAAAACCGAGGG AAAAGCGACAACGTACCGAGCGAAGAAGTAGTAAAAAAAATGAAAAACTAC TGGCGACAACTACTAAACGCGAAACTAATAACGCAACGAAAATTCGACAAC CTAACGAAAGCGGAACGAGGGGGGCTAAGCGAACTAGACAAAGCGGGGTT CATAAAACGACAACTAGTAGAAACGCGACAAATAACGAAACACGTAGCGCA AATACTAGACAGCCGAATGAACACGAAATACGACGAAAACGACAAACTAAT ACGAGAAGTAAAAGTAATAACGCTAAAAAGCAAACTAGTAAGCGACTTCCG AAAAGACTTCCAATTCTACAAAGTACGAGAAATAAACAACTACCACCACGCG CACGACGCGTACCTAAACGCGGTAGTAGGGACGGCGCTAATAAAAAAATAC CCGAAACTAGAAAGCGAATTCGTATACGGGGACTACAAAGTATACGACGTA CGAAAAATGATAGCGAAAAGCGAACAAGAAATAGGGAAAGCGACGGCGAA ATACTTCTTCTACAGCAACATAATGAACTTCTTCAAAACGGAAATAACGCTA GCGAACGGGGAAATACGAAAACGACCGCTAATAGAAACGAACGGGGAAAC GGGGGAAATAGTATGGGACAAAGGGCGAGACTTCGCGACGGTACGAAAAG TACTAAGCATGCCGCAAGTAAACATAGTAAAAAAAACGGAAGTACAAACGG GGGGGTTCAGCAAAGAAAGCATACTACCGAAACGAAACAGCGACAAACTAA TAGCGCGAAAAAAAGACTGGGACCCGAAAAAATACGGGGGGTTCGACAGC CCGACGGTAGCGTACAGCGTACTAGTAGTAGCGAAAGTAGAAAAAGGGAA AAGCAAAAAACTAAAAAGCGTAAAAGAACTACTAGGGATAACGATAATGGAA CGAAGCAGCTTCGAAAAAAACCCGATAGACTTCCTAGAAGCGAAAGGGTAC AAAGAAGTAAAAAAAGACCTAATAATAAAACTACCGAAATACAGCCTATTCG AACTAGAAAACGGGCGAAAACGAATGCTAGCGAGCGCGGGGGAACTACAA

Descrição Sequência SEQ ID No.

AAAGGGAACGAACTAGCGCTACCGAGCAAATACGTAAACTTCCTATACCTA GCGAGCCACTACGAAAAACTAAAAGGGAGCCCGGAAGACAACGAACAAAA ACAACTATTCGTAGAACAACACAAACACTACCTAGACGAAATAATAGAACAA ATAAGCGAATTCAGCAAACGAGTAATACTAGCGGACGCGAACCTAGACAAA GTACTAAGCGCGTACAACAAACACCGAGACAAACCGATACGAGAACAAGCG GAAAACATAATACACCTATTCACGCTAACGAACCTAGGGGCGCCGGCGGC GTTCAAATACTTCGACACGACGATAGACCGAAAACGATACACGAGCACGAA AGAAGTACTAGACGCGACGCTAATACACCAAAGCATAACGGGGCTATACGA AACGCGAATAGACCTAAGCCAACTAGGGGGGGACGGGGGGGGGAGCCCG

AAAAAAAAACGAAAAGTATGA Transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 55 Cas9 com 5' TGCAGGCCTTATTCGGATCCGCCACCATGGACAAAAAATACAGCATAGGGC UTR de HSD, TAGACATAGGGACGAACAGCGTAGGGTGGGCGGTAATAACGGACGAATAC

ORF AAAGTACCGAGCAAAAAATTCAAAGTACTAGGGAACACGGACCGACACAGC correspondent ATAAAAAAAAACCTAATAGGGGCGCTACTATTCGACAGCGGGGAAACGGCG e à SEQ ID GAAGCGACGCGACTAAAACGAACGGCGCGACGACGATACACGCGACGAAA NO: 54, AAACCGAATATGCTACCTACAAGAAATATTCAGCAACGAAATGGCGAAAGTA sequência de GACGACAGCTTCTTCCACCGACTAGAAGAAAGCTTCCTAGTAGAAGAAGAC Kozak e 3' AAAAAACACGAACGACACCCGATATTCGGGAACATAGTAGACGAAGTAGCG UTR de ALB TACCACGAAAAATACCCGACGATATACCACCTACGAAAAAAACTAGTAGACA

GCACGGACAAAGCGGACCTACGACTAATATACCTAGCGCTAGCGCACATGA TAAAATTCCGAGGGCACTTCCTAATAGAAGGGGACCTAAACCCGGACAACA GCGACGTAGACAAACTATTCATACAACTAGTACAAACGTACAACCAACTATT CGAAGAAAACCCGATAAACGCGAGCGGGGTAGACGCGAAAGCGATACTAA GCGCGCGACTAAGCAAAAGCCGACGACTAGAAAACCTAATAGCGCAACTAC CGGGGGAAAAAAAAAACGGGCTATTCGGGAACCTAATAGCGCTAAGCCTA GGGCTAACGCCGAACTTCAAAAGCAACTTCGACCTAGCGGAAGACGCGAA ACTACAACTAAGCAAAGACACGTACGACGACGACCTAGACAACCTACTAGC GCAAATAGGGGACCAATACGCGGACCTATTCCTAGCGGCGAAAAACCTAAG CGACGCGATACTACTAAGCGACATACTACGAGTAAACACGGAAATAACGAA AGCGCCGCTAAGCGCGAGCATGATAAAACGATACGACGAACACCACCAAG ACCTAACGCTACTAAAAGCGCTAGTACGACAACAACTACCGGAAAAATACA AAGAAATATTCTTCGACCAAAGCAAAAACGGGTACGCGGGGTACATAGACG GGGGGGCGAGCCAAGAAGAATTCTACAAATTCATAAAACCGATACTAGAAA AAATGGACGGGACGGAAGAACTACTAGTAAAACTAAACCGAGAAGACCTAC TACGAAAACAACGAACGTTCGACAACGGGAGCATACCGCACCAAATACACC

Descrição Sequência SEQ ID No.

TAGGGGAACTACACGCGATACTACGACGACAAGAAGACTTCTACCCGTTCC TAAAAGACAACCGAGAAAAAATAGAAAAAATACTAACGTTCCGAATACCGTA CTACGTAGGGCCGCTAGCGCGAGGGAACAGCCGATTCGCGTGGATGACG CGAAAAAGCGAAGAAACGATAACGCCGTGGAACTTCGAAGAAGTAGTAGAC AAAGGGGCGAGCGCGCAAAGCTTCATAGAACGAATGACGAACTTCGACAA AAACCTACCGAACGAAAAAGTACTACCGAAACACAGCCTACTATACGAATAC TTCACGGTATACAACGAACTAACGAAAGTAAAATACGTAACGGAAGGGATG CGAAAACCGGCGTTCCTAAGCGGGGAACAAAAAAAAGCGATAGTAGACCTA CTATTCAAAACGAACCGAAAAGTAACGGTAAAACAACTAAAAGAAGACTACT TCAAAAAAATAGAATGCTTCGACAGCGTAGAAATAAGCGGGGTAGAAGACC GATTCAACGCGAGCCTAGGGACGTACCACGACCTACTAAAAATAATAAAAG ACAAAGACTTCCTAGACAACGAAGAAAACGAAGACATACTAGAAGACATAG TACTAACGCTAACGCTATTCGAAGACCGAGAAATGATAGAAGAACGACTAA AAACGTACGCGCACCTATTCGACGACAAAGTAATGAAACAACTAAAACGAC GACGATACACGGGGTGGGGGCGACTAAGCCGAAAACTAATAAACGGGATA CGAGACAAACAAAGCGGGAAAACGATACTAGACTTCCTAAAAAGCGACGGG TTCGCGAACCGAAACTTCATGCAACTAATACACGACGACAGCCTAACGTTC AAAGAAGACATACAAAAAGCGCAAGTAAGCGGGCAAGGGGACAGCCTACA CGAACACATAGCGAACCTAGCGGGGAGCCCGGCGATAAAAAAAGGGATAC TACAAACGGTAAAAGTAGTAGACGAACTAGTAAAAGTAATGGGGCGACACA AACCGGAAAACATAGTAATAGAAATGGCGCGAGAAAACCAAACGACGCAAA AAGGGCAAAAAAACAGCCGAGAACGAATGAAACGAATAGAAGAAGGGATAA AAGAACTAGGGAGCCAAATACTAAAAGAACACCCGGTAGAAAACACGCAAC TACAAAACGAAAAACTATACCTATACTACCTACAAAACGGGCGAGACATGTA CGTAGACCAAGAACTAGACATAAACCGACTAAGCGACTACGACGTAGACCA CATAGTACCGCAAAGCTTCCTAAAAGACGACAGCATAGACAACAAAGTACT AACGCGAAGCGACAAAAACCGAGGGAAAAGCGACAACGTACCGAGCGAAG AAGTAGTAAAAAAAATGAAAAACTACTGGCGACAACTACTAAACGCGAAACT AATAACGCAACGAAAATTCGACAACCTAACGAAAGCGGAACGAGGGGGGC TAAGCGAACTAGACAAAGCGGGGTTCATAAAACGACAACTAGTAGAAACGC GACAAATAACGAAACACGTAGCGCAAATACTAGACAGCCGAATGAACACGA AATACGACGAAAACGACAAACTAATACGAGAAGTAAAAGTAATAACGCTAAA AAGCAAACTAGTAAGCGACTTCCGAAAAGACTTCCAATTCTACAAAGTACGA GAAATAAACAACTACCACCACGCGCACGACGCGTACCTAAACGCGGTAGTA GGGACGGCGCTAATAAAAAAATACCCGAAACTAGAAAGCGAATTCGTATAC GGGGACTACAAAGTATACGACGTACGAAAAATGATAGCGAAAAGCGAACAA GAAATAGGGAAAGCGACGGCGAAATACTTCTTCTACAGCAACATAATGAAC

Descrição Sequência SEQ ID No.

TTCTTCAAAACGGAAATAACGCTAGCGAACGGGGAAATACGAAAACGACCG CTAATAGAAACGAACGGGGAAACGGGGGAAATAGTATGGGACAAAGGGCG AGACTTCGCGACGGTACGAAAAGTACTAAGCATGCCGCAAGTAAACATAGT AAAAAAAACGGAAGTACAAACGGGGGGGTTCAGCAAAGAAAGCATACTACC GAAACGAAACAGCGACAAACTAATAGCGCGAAAAAAAGACTGGGACCCGAA AAAATACGGGGGGTTCGACAGCCCGACGGTAGCGTACAGCGTACTAGTAG TAGCGAAAGTAGAAAAAGGGAAAAGCAAAAAACTAAAAAGCGTAAAAGAAC TACTAGGGATAACGATAATGGAACGAAGCAGCTTCGAAAAAAACCCGATAG ACTTCCTAGAAGCGAAAGGGTACAAAGAAGTAAAAAAAGACCTAATAATAAA ACTACCGAAATACAGCCTATTCGAACTAGAAAACGGGCGAAAACGAATGCT AGCGAGCGCGGGGGAACTACAAAAAGGGAACGAACTAGCGCTACCGAGCA AATACGTAAACTTCCTATACCTAGCGAGCCACTACGAAAAACTAAAAGGGA GCCCGGAAGACAACGAACAAAAACAACTATTCGTAGAACAACACAAACACT ACCTAGACGAAATAATAGAACAAATAAGCGAATTCAGCAAACGAGTAATACT AGCGGACGCGAACCTAGACAAAGTACTAAGCGCGTACAACAAACACCGAG ACAAACCGATACGAGAACAAGCGGAAAACATAATACACCTATTCACGCTAA CGAACCTAGGGGCGCCGGCGGCGTTCAAATACTTCGACACGACGATAGAC CGAAAACGATACACGAGCACGAAAGAAGTACTAGACGCGACGCTAATACAC CAAAGCATAACGGGGCTATACGAAACGCGAATAGACCTAAGCCAACTAGGG GGGGACGGGGGGGGGAGCCCGAAAAAAAAACGAAAAGTATGACTAGCCAT CACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAG ATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCC TGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCA

ATTAATAAAAAATGGAAAGAACCTCGAG Transcrito de AGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 56 Cas9 com TGCAGGCCTTATTCGGATCCGCCACCATGGACAAGAAGTACAGCATCGGAC AGG como TGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATAC primeiros três AAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAG nucleotídeos CATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAG para uso com CAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAA CleanCapTM, AGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGG 5' UTR de TCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAG HSD, ORF ACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCG correspondent CATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCG e à SEQ ID ACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACAC NO: 4, ATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGAC

Descrição Sequência SEQ ID No. sequência de AACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAG Kozak e 3' CTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAAT UTR de ALB CCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCAC

AGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGA CGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACC TGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAG AACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAA ATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACA CCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGG AAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGAT ACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGA TCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGA GAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCA CCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACT TCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACAT TCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTC GCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAA GAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGAC AAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCT GCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGT CACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGG CAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGC TGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCA GCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTG CTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGAC ATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATG ATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATG AAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAA GCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTT CCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGA CGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGAC AGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCA ATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAG AAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAG AGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACA

Descrição Sequência SEQ ID No.

CCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCT GCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGAC TGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGAC GACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAA GAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACT GGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAAC CTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATT CATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACA GATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGAT CAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAG AAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGC ACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTA CCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGT CAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAA AGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACT GGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAA CAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAG GTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGAC AGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGC TGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGAC AGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGG AAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCAT GGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGG GATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCC TGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAA CTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCT GTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCA TCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACC TGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGA GAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCA CCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGG ACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAG GAAGCCCGAAGAAGAAGAGAAAGGTCTAGCTAGCCATCACATTTAAAAGCA TCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATT CATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACAT

Descrição Sequência SEQ ID No.

AAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATG

GAAAGAACCTCGAG Transcrito de GGGCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAG 57 Cas9 com 5' ACACCGGGACCGATCCAGCCTCCGCGGCCGGGAACGGTGCATTGGAACG UTR de CMV, CGGATTCCCCGTGCCAAGAGTGACTCACCGTCCTTGACACGGCCACCATG

ORF GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATG correspondent GGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT e à SEQ ID GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGC NO: 4, TGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCA sequência de AGAAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATC Kozak e 3' TTCAGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAA UTR de ALB GAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTC

GGAAACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTAC CACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACT GATCTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGAT CGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCC AGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAA GCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGA AGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACT GTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCAAGA GCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACA TACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGC AGACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCG ACATCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCA TGATCAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGGCA CTGGTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAG AGCAAGAACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAAGA ATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAAGA ACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATT CGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTGCACGCAA TCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAA AGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCGCTGG CAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGAAACAA TCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACAG AGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAG GTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAA

Descrição Sequência SEQ ID No.

CTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAG AAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATG CTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGA CAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACT GTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCT GTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGAT GGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGC GGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAAC TTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAG AAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAA CCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGG TCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATC GTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAA CAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAA GCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAACGAA AAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACCAG GAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGTCCC GCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAAGAA GCGACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTC AAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACA CAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGA ACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGACAGAT CACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGTACGA CGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAA GCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAAT CAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCGTCGGAA CAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAG ACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAA TCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACTTCTT CAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTGAT CGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACT TCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAG AGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAA GTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCG

Descrição Sequência SEQ ID No.

CAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTG CTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGAC TTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAG CTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTG GCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAA GTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAG CCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACT ACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCC TGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGA GACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTG ACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGAC AGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCAC CAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGG AGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAGCTAGCCA TCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAA GATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACC CTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTC

AATTAATAAAAAATGGAAAGAACCTCGAG Transcrito de GGGacatttgcttctgacacaactgtgttcactagcaacctcaaacagacaccggatctgccaccATGGA 58 Cas9 com 5' CAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG UTR de HBB, CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGG

ORF GAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGT correspondent TCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGA e à SEQ ID AGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTC NO: 4, AGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAA sequência de AGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGA Kozak e 3' AACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCAC UTR de HBB CTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGAT

CTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGA AGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGC TGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCG GAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGA CTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTT CGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCAAGAGCA ACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACATAC GACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGCAGA

Descrição Sequência SEQ ID No.

CCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACA TCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGA TCAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGGCACTG GTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGC AAGAACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATT CTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACT GCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCG ACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATC CTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAG ATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCA AGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATC ACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAG CTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAGGT CCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAACT GACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTGA GCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGA AAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGC TTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGA CAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACT GTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCT GTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGAT GGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGC GGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAAC TTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAG AAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAA CCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGG TCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATC GTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAA CAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAA GCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAACGAA AAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACCAG GAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGTCCC GCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAAGAA GCGACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTC AAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACA CAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGA

Descrição Sequência SEQ ID No.

ACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGACAGAT CACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGTACGA CGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAA GCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAAT CAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCGTCGGAA CAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAG ACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAA TCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACTTCTT CAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTGAT CGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACT TCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAG AGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAA GTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCG CAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTG CTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGAC TTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAG CTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTG GCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAA GTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAG CCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACT ACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCC TGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGA GACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTG ACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGAC AGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCAC

CAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGG AGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAGctagcgctcg ctttcttgctgtccaatttctattaaaggttcctttgttccctaagtccaactactaaactgggggatattatgaagggc cttgagcatctggattctgcctaataaaaaacatttattttcattgcctcgag Transcrito de GGGaagctcagaataaacgctcaactttggccggatctgccacCATGGACAAGAAGTACAGCA 59 Cas9 com 5' TCGGACTGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGAC UTR de XBG, GAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAG

ORF ACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAG correspondent AAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAA e à SEQ ID GAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGG

Descrição Sequência SEQ ID No. NO: 4, CAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCG sequência de AAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACG Kozak e 3' AAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGC UTR de XBG TGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTG

GCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAAC CCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATA CAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTG ATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGAT CGCACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGG CAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTG GACAACCTGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGC AGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCA ACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACG ACGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAG CTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATAC GCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATC AAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCT GAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCA TCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAG GAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATC CTGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAG CAGATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAA CTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAA GAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGC ACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCA AGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAG AAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTC AAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTC GAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCA CGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAA CGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAG AGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAA GGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGA GCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATC CTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTG ATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT

Descrição Sequência SEQ ID No.

CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAA GCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAA CTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATG GCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAG AATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAA GGAACACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTA CTACCTGCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAA CAGACTGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGA AGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGA GGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAA CTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGA CAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAG GATTCATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCG CACAGATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGC TGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACT TCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACC ACGCACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAG AAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTAC GACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAAC AGCAAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATC ACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGG AGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCA GAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTC CAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGA CAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGAT TCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAA AAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCAC AATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGC AAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTA CAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAG GAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAAC TTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGA CAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACG CAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCG ATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTG GGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGA

Descrição Sequência SEQ ID No.

TACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATC

ACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGG AGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAGctagcaccagcctcaagaacac ccgaatggagtctctaagctacataataccaacttacactttacaaaatgttgtcccccaaaatgtagccattcgt atctgctcctaataaaaagaaagtttcttcacattctctcgag Transcrito de AGGaagctcagaataaacgctcaactttggccggatctgccacCATGGACAAGAAGTACAGCA 60 Cas9 com TCGGACTGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGAC AGG como GAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAG primeiros três ACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAG nucleotídeos AAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAA para uso com GAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGG CleanCapTM, CAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCG 5' UTR de AAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACG XBG, ORF AAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGC correspondent TGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTG e à SEQ ID GCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAAC NO: 4, CCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATA sequência de CAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA Kozak e 3' AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTG UTR de XBG ATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGAT

CGCACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGG CAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTG GACAACCTGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGC AGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCA ACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACG ACGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAG CTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATAC GCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATC AAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCT GAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCA TCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAG GAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATC CTGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAG CAGATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAA CTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAA GAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGC

Descrição Sequência SEQ ID No.

ACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCA AGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAG AAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTC AAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTC GAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCA CGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAA CGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAG AGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAA GGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGA GCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATC CTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTG ATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAA GCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAA CTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATG GCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAG AATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAA GGAACACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTA CTACCTGCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAA CAGACTGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGA AGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGA GGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAA CTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGA CAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAG GATTCATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCG CACAGATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGC TGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACT TCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACC ACGCACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAG AAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTAC GACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAAC AGCAAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATC ACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGG AGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCA GAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTC CAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGA CAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGAT

Descrição Sequência SEQ ID No.

TCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAA AAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCAC AATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGC AAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTA CAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAG GAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAAC TTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGA CAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACG CAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCG ATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTG GGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGA TACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATC

ACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGG AGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAGctagcaccagcctcaagaacac ccgaatggagtctctaagctacataataccaacttacactttacaaaatgttgtcccccaaaatgtagccattcgt atctgctcctaataaaaagaaagtttcttcacattctctcgag Transcrito de AGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGT 61 Cas9 com TGCAGGCCTTATTCGGATCCGCCACCATGGACAAGAAGTACAGCATCGGAC AGG como TGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATAC primeiros três AAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAG nucleotídeos CATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAG para uso com CAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAA CleanCapTM, AGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGG 5' UTR de TCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAG HSD, ORF ACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCG correspondent CATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCG e a SEQ ID ACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACAC NO: 4, ATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGAC sequência de AACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAG Kozak e 3' CTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAAT UTR de ALB CCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCAC

AGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGA CGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACC TGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAG

Descrição Sequência SEQ ID No.

AACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAA ATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACA CCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGG AAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGAT ACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGA TCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGA GAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCA CCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACT TCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACAT TCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTC GCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAA GAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGAC AAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCT GCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGT CACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGG CAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGC TGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCA GCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTG CTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGAC ATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATG ATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATG AAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAA GCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTT CCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGA CGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGAC AGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCA ATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAG AAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAG AGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACA CCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCT GCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGAC TGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGAC GACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAA GAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACT GGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAAC CTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATT

Descrição Sequência SEQ ID No.

CATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACA GATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGAT CAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAG AAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGC ACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTA CCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGT CAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAA AGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACT GGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAA CAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAG GTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGAC AGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGC TGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGAC AGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGG AAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCAT GGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGG GATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCC TGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAA CTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCT GTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCA TCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACC TGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGA GAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCA CCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGG ACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAG GAAGCCCGAAGAAGAAGAGAAAGGTCTAGCTAGCCATCACATTTAAAAGCA TCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATT CATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACAT AAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATG

GAAAGAACCTCGAG Sequência AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGCGAAAAAAAAAAAAAAAAAAAA 62 30/30/39 poli- AAAAAAAAAACCGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

A sequência AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 63

Descrição Sequência SEQ ID No. poli-A 100 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA RNA guia mC*mC*mA*GUCCAGCGAGGCAAAGGGUUUUAGAGCUAGAAAUAGCAAGU 64 G209 UAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGG UGCmU*mU*mU*U ORF que ATGGCAGCATTCAAGCCGAACTCGATCAACTACATCCTGGGACTGGACATC 65 codifica GGAATCGCATCGGTCGGATGGGCAATGGTCGAAATCGACGAAGAAGAAAA Neisseria CCCGATCAGACTGATCGACCTGGGAGTCAGAGTCTTCGAAAGAGCAGAAG meningitidis TCCCGAAGACAGGAGACTCGCTGGCAATGGCAAGAAGACTGGCAAGATCG Cas9 GTCAGAAGACTGACAAGAAGAAGAGCACACAGACTGCTGAGAACAAGAAG

ACTGCTGAAGAGAGAAGGAGTCCTGCAGGCAGCAAACTTCGACGAAAACG GACTGATCAAGTCGCTGCCGAACACACCGTGGCAGCTGAGAGCAGCAGCA CTGGACAGAAAGCTGACACCGCTGGAATGGTCGGCAGTCCTGCTGCACCT GATCAAGCACAGAGGATACCTGTCGCAGAGAAAGAACGAAGGAGAAACAG CAGACAAGGAACTGGGAGCACTGCTGAAGGGAGTCGCAGGAAACGCACAC GCACTGCAGACAGGAGACTTCAGAACACCGGCAGAACTGGCACTGAACAA GTTCGAAAAGGAATCGGGACACATCAGAAACCAGAGATCGGACTACTCGCA CACATTCTCGAGAAAGGACCTGCAGGCAGAACTGATCCTGCTGTTCGAAAA GCAGAAGGAATTCGGAAACCCGCACGTCTCGGGAGGACTGAAGGAAGGAA TCGAAACACTGCTGATGACACAGAGACCGGCACTGTCGGGAGACGCAGTC CAGAAGATGCTGGGACACTGCACATTCGAACCGGCAGAACCGAAGGCAGC AAAGAACACATACACAGCAGAAAGATTCATCTGGCTGACAAAGCTGAACAA CCTGAGAATCCTGGAACAGGGATCGGAAAGACCGCTGACAGACACAGAAA GAGCAACACTGATGGACGAACCGTACAGAAAGTCGAAGCTGACATACGCA CAGGCAAGAAAGCTGCTGGGACTGGAAGACACAGCATTCTTCAAGGGACT GAGATACGGAAAGGACAACGCAGAAGCATCGACACTGATGGAAATGAAGG CATACCACGCAATCTCGAGAGCACTGGAAAAGGAAGGACTGAAGGACAAG AAGTCGCCGCTGAACCTGTCGCCGGAACTGCAGGACGAAATCGGAACAGC ATTCTCGCTGTTCAAGACAGACGAAGACATCACAGGAAGACTGAAGGACAG AATCCAGCCGGAAATCCTGGAAGCACTGCTGAAGCACATCTCGTTCGACAA GTTCGTCCAGATCTCGCTGAAGGCACTGAGAAGAATCGTCCCGCTGATGGA ACAGGGAAAGAGATACGACGAAGCATGCGCAGAAATCTACGGAGACCACT ACGGAAAGAAGAACACAGAAGAAAAGATCTACCTGCCGCCGATCCCGGCA GACGAAATCAGAAACCCGGTCGTCCTGAGAGCACTGTCGCAGGCAAGAAA GGTCATCAACGGAGTCGTCAGAAGATACGGATCGCCGGCAAGAATCCACA TCGAAACAGCAAGAGAAGTCGGAAAGTCGTTCAAGGACAGAAAGGAAATCG AAAAGAGACAGGAAGAAAACAGAAAGGACAGAGAAAAGGCAGCAGCAAAG TTCAGAGAATACTTCCCGAACTTCGTCGGAGAACCGAAGTCGAAGGACATC

Descrição Sequência SEQ ID No.

CTGAAGCTGAGACTGTACGAACAGCAGCACGGAAAGTGCCTGTACTCGGG AAAGGAAATCAACCTGGGAAGACTGAACGAAAAGGGATACGTCGAAATCGA CCACGCACTGCCGTTCTCGAGAACATGGGACGACTCGTTCAACAACAAGGT CCTGGTCCTGGGATCGGAAAACCAGAACAAGGGAAACCAGACACCGTACG AATACTTCAACGGAAAGGACAACTCGAGAGAATGGCAGGAATTCAAGGCAA GAGTCGAAACATCGAGATTCCCGAGATCGAAGAAGCAGAGAATCCTGCTGC AGAAGTTCGACGAAGACGGATTCAAGGAAAGAAACCTGAACGACACAAGAT ACGTCAACAGATTCCTGTGCCAGTTCGTCGCAGACAGAATGAGACTGACAG GAAAGGGAAAGAAGAGAGTCTTCGCATCGAACGGACAGATCACAAACCTG CTGAGAGGATTCTGGGGACTGAGAAAGGTCAGAGCAGAAAACGACAGACA CCACGCACTGGACGCAGTCGTCGTCGCATGCTCGACAGTCGCAATGCAGC AGAAGATCACAAGATTCGTCAGATACAAGGAAATGAACGCATTCGACGGAA AGACAATCGACAAGGAAACAGGAGAAGTCCTGCACCAGAAGACACACTTCC CGCAGCCGTGGGAATTCTTCGCACAGGAAGTCATGATCAGAGTCTTCGGAA AGCCGGACGGAAAGCCGGAATTCGAAGAAGCAGACACACTGGAAAAGCTG AGAACACTGCTGGCAGAAAAGCTGTCGTCGAGACCGGAAGCAGTCCACGA ATACGTCACACCGCTGTTCGTCTCGAGAGCACCGAACAGAAAGATGTCGG GACAGGGACACATGGAAACAGTCAAGTCGGCAAAGAGACTGGACGAAGGA GTCTCGGTCCTGAGAGTCCCGCTGACACAGCTGAAGCTGAAGGACCTGGA AAAGATGGTCAACAGAGAAAGAGAACCGAAGCTGTACGAAGCACTGAAGG CAAGACTGGAAGCACACAAGGACGACCCGGCAAAGGCATTCGCAGAACCG TTCTACAAGTACGACAAGGCAGGAAACAGAACACAGCAGGTCAAGGCAGTC AGAGTCGAACAGGTCCAGAAGACAGGAGTCTGGGTCAGAAACCACAACGG AATCGCAGACAACGCAACAATGGTCAGAGTAGACGTCTTCGAAAAGGGAGA CAAGTACTACCTGGTCCCGATCTACTCGTGGCAGGTCGCAAAGGGAATCCT GCCGGACAGAGCAGTCGTCCAGGGAAAGGACGAAGAAGACTGGCAGCTG ATCGACGACTCGTTCAACTTCAAGTTCTCGCTGCACCCGAACGACCTGGTC GAAGTCATCACAAAGAAGGCAAGAATGTTCGGATACTTCGCATCGTGCCAC AGAGGAACAGGAAACATCAACATCAGAATCCACGACCTGGACCACAAGATC GGAAAGAACGGAATCCTGGAAGGAATCGGAGTCAAGACAGCACTGTCGTT CCAGAAGTACCAGATCGACGAACTGGGAAAGGAAATCAGACCGTGCAGAC TGAAGAAGAGACCGCCGGTCAGATCCGGAAAGAGAACAGCAGACGGATCG

GAATTCGAATCGCCGAAGAAGAAGAGAAAGGTCGAATGA ORF que GCAGCATTCAAGCCGAACTCGATCAACTACATCCTGGGACTGGACATCGGA 66 codifica ATCGCATCGGTCGGATGGGCAATGGTCGAAATCGACGAAGAAGAAAACCC Neisseria GATCAGACTGATCGACCTGGGAGTCAGAGTCTTCGAAAGAGCAGAAGTCC meningitidis CGAAGACAGGAGACTCGCTGGCAATGGCAAGAAGACTGGCAAGATCGGTC

Descrição Sequência SEQ ID No. Cas9 (sem AGAAGACTGACAAGAAGAAGAGCACACAGACTGCTGAGAACAAGAAGACT códons de GCTGAAGAGAGAAGGAGTCCTGCAGGCAGCAAACTTCGACGAAAACGGAC início ou TGATCAAGTCGCTGCCGAACACACCGTGGCAGCTGAGAGCAGCAGCACTG parada; GACAGAAAGCTGACACCGCTGGAATGGTCGGCAGTCCTGCTGCACCTGAT adequado CAAGCACAGAGGATACCTGTCGCAGAGAAAGAACGAAGGAGAAACAGCAG para inclusão ACAAGGAACTGGGAGCACTGCTGAAGGGAGTCGCAGGAAACGCACACGCA na sequência CTGCAGACAGGAGACTTCAGAACACCGGCAGAACTGGCACTGAACAAGTT de codificação CGAAAAGGAATCGGGACACATCAGAAACCAGAGATCGGACTACTCGCACA das proteínas CATTCTCGAGAAAGGACCTGCAGGCAGAACTGATCCTGCTGTTCGAAAAGC de fusão) AGAAGGAATTCGGAAACCCGCACGTCTCGGGAGGACTGAAGGAAGGAATC

GAAACACTGCTGATGACACAGAGACCGGCACTGTCGGGAGACGCAGTCCA GAAGATGCTGGGACACTGCACATTCGAACCGGCAGAACCGAAGGCAGCAA AGAACACATACACAGCAGAAAGATTCATCTGGCTGACAAAGCTGAACAACC TGAGAATCCTGGAACAGGGATCGGAAAGACCGCTGACAGACACAGAAAGA GCAACACTGATGGACGAACCGTACAGAAAGTCGAAGCTGACATACGCACA GGCAAGAAAGCTGCTGGGACTGGAAGACACAGCATTCTTCAAGGGACTGA GATACGGAAAGGACAACGCAGAAGCATCGACACTGATGGAAATGAAGGCA TACCACGCAATCTCGAGAGCACTGGAAAAGGAAGGACTGAAGGACAAGAA GTCGCCGCTGAACCTGTCGCCGGAACTGCAGGACGAAATCGGAACAGCAT TCTCGCTGTTCAAGACAGACGAAGACATCACAGGAAGACTGAAGGACAGAA TCCAGCCGGAAATCCTGGAAGCACTGCTGAAGCACATCTCGTTCGACAAGT TCGTCCAGATCTCGCTGAAGGCACTGAGAAGAATCGTCCCGCTGATGGAAC AGGGAAAGAGATACGACGAAGCATGCGCAGAAATCTACGGAGACCACTAC GGAAAGAAGAACACAGAAGAAAAGATCTACCTGCCGCCGATCCCGGCAGA CGAAATCAGAAACCCGGTCGTCCTGAGAGCACTGTCGCAGGCAAGAAAGG TCATCAACGGAGTCGTCAGAAGATACGGATCGCCGGCAAGAATCCACATCG AAACAGCAAGAGAAGTCGGAAAGTCGTTCAAGGACAGAAAGGAAATCGAAA AGAGACAGGAAGAAAACAGAAAGGACAGAGAAAAGGCAGCAGCAAAGTTC AGAGAATACTTCCCGAACTTCGTCGGAGAACCGAAGTCGAAGGACATCCTG AAGCTGAGACTGTACGAACAGCAGCACGGAAAGTGCCTGTACTCGGGAAA GGAAATCAACCTGGGAAGACTGAACGAAAAGGGATACGTCGAAATCGACCA CGCACTGCCGTTCTCGAGAACATGGGACGACTCGTTCAACAACAAGGTCCT GGTCCTGGGATCGGAAAACCAGAACAAGGGAAACCAGACACCGTACGAAT ACTTCAACGGAAAGGACAACTCGAGAGAATGGCAGGAATTCAAGGCAAGA GTCGAAACATCGAGATTCCCGAGATCGAAGAAGCAGAGAATCCTGCTGCAG AAGTTCGACGAAGACGGATTCAAGGAAAGAAACCTGAACGACACAAGATAC GTCAACAGATTCCTGTGCCAGTTCGTCGCAGACAGAATGAGACTGACAGGA

Descrição Sequência SEQ ID No.

AAGGGAAAGAAGAGAGTCTTCGCATCGAACGGACAGATCACAAACCTGCTG AGAGGATTCTGGGGACTGAGAAAGGTCAGAGCAGAAAACGACAGACACCA CGCACTGGACGCAGTCGTCGTCGCATGCTCGACAGTCGCAATGCAGCAGA AGATCACAAGATTCGTCAGATACAAGGAAATGAACGCATTCGACGGAAAGA CAATCGACAAGGAAACAGGAGAAGTCCTGCACCAGAAGACACACTTCCCG CAGCCGTGGGAATTCTTCGCACAGGAAGTCATGATCAGAGTCTTCGGAAAG CCGGACGGAAAGCCGGAATTCGAAGAAGCAGACACACTGGAAAAGCTGAG AACACTGCTGGCAGAAAAGCTGTCGTCGAGACCGGAAGCAGTCCACGAAT ACGTCACACCGCTGTTCGTCTCGAGAGCACCGAACAGAAAGATGTCGGGA CAGGGACACATGGAAACAGTCAAGTCGGCAAAGAGACTGGACGAAGGAGT CTCGGTCCTGAGAGTCCCGCTGACACAGCTGAAGCTGAAGGACCTGGAAA AGATGGTCAACAGAGAAAGAGAACCGAAGCTGTACGAAGCACTGAAGGCA AGACTGGAAGCACACAAGGACGACCCGGCAAAGGCATTCGCAGAACCGTT CTACAAGTACGACAAGGCAGGAAACAGAACACAGCAGGTCAAGGCAGTCA GAGTCGAACAGGTCCAGAAGACAGGAGTCTGGGTCAGAAACCACAACGGA ATCGCAGACAACGCAACAATGGTCAGAGTAGACGTCTTCGAAAAGGGAGAC AAGTACTACCTGGTCCCGATCTACTCGTGGCAGGTCGCAAAGGGAATCCTG CCGGACAGAGCAGTCGTCCAGGGAAAGGACGAAGAAGACTGGCAGCTGAT CGACGACTCGTTCAACTTCAAGTTCTCGCTGCACCCGAACGACCTGGTCGA AGTCATCACAAAGAAGGCAAGAATGTTCGGATACTTCGCATCGTGCCACAG AGGAACAGGAAACATCAACATCAGAATCCACGACCTGGACCACAAGATCGG AAAGAACGGAATCCTGGAAGGAATCGGAGTCAAGACAGCACTGTCGTTCCA GAAGTACCAGATCGACGAACTGGGAAAGGAAATCAGACCGTGCAGACTGA AGAAGAGACCGCCGGTCAGATCCGGAAAGAGAACAGCAGACGGATCGGAA

TTCGAATCGCCGAAGAAGAAGAGAAAGGTCGAA Transcrito que GGGAGACCCAAGCTGGCTAGCGTTTAAACTTAAGCTTGGATCCGCCACCAT 67 compreende a GGCAGCATTCAAGCCGAACTCGATCAACTACATCCTGGGACTGGACATCGG SEQ ID NO: AATCGCATCGGTCGGATGGGCAATGGTCGAAATCGACGAAGAAGAAAACC 65 (que CGATCAGACTGATCGACCTGGGAGTCAGAGTCTTCGAAAGAGCAGAAGTC codifica CCGAAGACAGGAGACTCGCTGGCAATGGCAAGAAGACTGGCAAGATCGGT Neisseria CAGAAGACTGACAAGAAGAAGAGCACACAGACTGCTGAGAACAAGAAGACT meningitidis GCTGAAGAGAGAAGGAGTCCTGCAGGCAGCAAACTTCGACGAAAACGGAC Cas9) TGATCAAGTCGCTGCCGAACACACCGTGGCAGCTGAGAGCAGCAGCACTG

GACAGAAAGCTGACACCGCTGGAATGGTCGGCAGTCCTGCTGCACCTGAT CAAGCACAGAGGATACCTGTCGCAGAGAAAGAACGAAGGAGAAACAGCAG ACAAGGAACTGGGAGCACTGCTGAAGGGAGTCGCAGGAAACGCACACGCA CTGCAGACAGGAGACTTCAGAACACCGGCAGAACTGGCACTGAACAAGTT

Descrição Sequência SEQ ID No.

CGAAAAGGAATCGGGACACATCAGAAACCAGAGATCGGACTACTCGCACA CATTCTCGAGAAAGGACCTGCAGGCAGAACTGATCCTGCTGTTCGAAAAGC AGAAGGAATTCGGAAACCCGCACGTCTCGGGAGGACTGAAGGAAGGAATC GAAACACTGCTGATGACACAGAGACCGGCACTGTCGGGAGACGCAGTCCA GAAGATGCTGGGACACTGCACATTCGAACCGGCAGAACCGAAGGCAGCAA AGAACACATACACAGCAGAAAGATTCATCTGGCTGACAAAGCTGAACAACC TGAGAATCCTGGAACAGGGATCGGAAAGACCGCTGACAGACACAGAAAGA GCAACACTGATGGACGAACCGTACAGAAAGTCGAAGCTGACATACGCACA GGCAAGAAAGCTGCTGGGACTGGAAGACACAGCATTCTTCAAGGGACTGA GATACGGAAAGGACAACGCAGAAGCATCGACACTGATGGAAATGAAGGCA TACCACGCAATCTCGAGAGCACTGGAAAAGGAAGGACTGAAGGACAAGAA GTCGCCGCTGAACCTGTCGCCGGAACTGCAGGACGAAATCGGAACAGCAT TCTCGCTGTTCAAGACAGACGAAGACATCACAGGAAGACTGAAGGACAGAA TCCAGCCGGAAATCCTGGAAGCACTGCTGAAGCACATCTCGTTCGACAAGT TCGTCCAGATCTCGCTGAAGGCACTGAGAAGAATCGTCCCGCTGATGGAAC AGGGAAAGAGATACGACGAAGCATGCGCAGAAATCTACGGAGACCACTAC GGAAAGAAGAACACAGAAGAAAAGATCTACCTGCCGCCGATCCCGGCAGA CGAAATCAGAAACCCGGTCGTCCTGAGAGCACTGTCGCAGGCAAGAAAGG TCATCAACGGAGTCGTCAGAAGATACGGATCGCCGGCAAGAATCCACATCG AAACAGCAAGAGAAGTCGGAAAGTCGTTCAAGGACAGAAAGGAAATCGAAA AGAGACAGGAAGAAAACAGAAAGGACAGAGAAAAGGCAGCAGCAAAGTTC AGAGAATACTTCCCGAACTTCGTCGGAGAACCGAAGTCGAAGGACATCCTG AAGCTGAGACTGTACGAACAGCAGCACGGAAAGTGCCTGTACTCGGGAAA GGAAATCAACCTGGGAAGACTGAACGAAAAGGGATACGTCGAAATCGACCA CGCACTGCCGTTCTCGAGAACATGGGACGACTCGTTCAACAACAAGGTCCT GGTCCTGGGATCGGAAAACCAGAACAAGGGAAACCAGACACCGTACGAAT ACTTCAACGGAAAGGACAACTCGAGAGAATGGCAGGAATTCAAGGCAAGA GTCGAAACATCGAGATTCCCGAGATCGAAGAAGCAGAGAATCCTGCTGCAG AAGTTCGACGAAGACGGATTCAAGGAAAGAAACCTGAACGACACAAGATAC GTCAACAGATTCCTGTGCCAGTTCGTCGCAGACAGAATGAGACTGACAGGA AAGGGAAAGAAGAGAGTCTTCGCATCGAACGGACAGATCACAAACCTGCTG AGAGGATTCTGGGGACTGAGAAAGGTCAGAGCAGAAAACGACAGACACCA CGCACTGGACGCAGTCGTCGTCGCATGCTCGACAGTCGCAATGCAGCAGA AGATCACAAGATTCGTCAGATACAAGGAAATGAACGCATTCGACGGAAAGA CAATCGACAAGGAAACAGGAGAAGTCCTGCACCAGAAGACACACTTCCCG CAGCCGTGGGAATTCTTCGCACAGGAAGTCATGATCAGAGTCTTCGGAAAG CCGGACGGAAAGCCGGAATTCGAAGAAGCAGACACACTGGAAAAGCTGAG

Descrição Sequência SEQ ID No.

AACACTGCTGGCAGAAAAGCTGTCGTCGAGACCGGAAGCAGTCCACGAAT ACGTCACACCGCTGTTCGTCTCGAGAGCACCGAACAGAAAGATGTCGGGA CAGGGACACATGGAAACAGTCAAGTCGGCAAAGAGACTGGACGAAGGAGT CTCGGTCCTGAGAGTCCCGCTGACACAGCTGAAGCTGAAGGACCTGGAAA AGATGGTCAACAGAGAAAGAGAACCGAAGCTGTACGAAGCACTGAAGGCA AGACTGGAAGCACACAAGGACGACCCGGCAAAGGCATTCGCAGAACCGTT CTACAAGTACGACAAGGCAGGAAACAGAACACAGCAGGTCAAGGCAGTCA GAGTCGAACAGGTCCAGAAGACAGGAGTCTGGGTCAGAAACCACAACGGA ATCGCAGACAACGCAACAATGGTCAGAGTAGACGTCTTCGAAAAGGGAGAC AAGTACTACCTGGTCCCGATCTACTCGTGGCAGGTCGCAAAGGGAATCCTG CCGGACAGAGCAGTCGTCCAGGGAAAGGACGAAGAAGACTGGCAGCTGAT CGACGACTCGTTCAACTTCAAGTTCTCGCTGCACCCGAACGACCTGGTCGA AGTCATCACAAAGAAGGCAAGAATGTTCGGATACTTCGCATCGTGCCACAG AGGAACAGGAAACATCAACATCAGAATCCACGACCTGGACCACAAGATCGG AAAGAACGGAATCCTGGAAGGAATCGGAGTCAAGACAGCACTGTCGTTCCA GAAGTACCAGATCGACGAACTGGGAAAGGAAATCAGACCGTGCAGACTGA AGAAGAGACCGCCGGTCAGATCCGGAAAGAGAACAGCAGACGGATCGGAA TTCGAATCGCCGAAGAAGAAGAGAAAGGTCGAATGATAGCTAGCTCGAGTC TAGAGGGCCCGTTTAAACCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTG CCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGG TGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGT CTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAA GGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGC

TCTATGG Sequência de MAAFKPNSINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGD 68 aminoácidos SLAMARRLARSVRRLTRRRAHRLLRTRRLLKREGVLQAANFDENGLIKSLPNTP de Neisseria WQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVA meningitidis GNAHALQTGDFRTPAELALNKFEKESGHIRNQRSDYSHTFSRKDLQAELILLFE Cas9 KQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAK

NTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKL LGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPE LQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPL MEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVIN GVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFP NFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTW DDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRS KKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASN

Descrição Sequência SEQ ID No.

GQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMN AFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTLE KLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGV SVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYD KAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLV PIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARM FGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRP

CRLKKRPPVRSGKRTADGSEFESPKKKRKVE RNA guia mG*mC*mC*GAGUCUGGAGAGCUGCAGUUUUAGAmGmCmUmAmGmAmAm 69 G390 AmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGm AmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmC mU*mU*mU*mU RNA guia mA*mC*mA*CAAAUACCAGUCCAGCGGUUUUAGAmGmCmUmAmGmAmAm 70 G502 AmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGm AmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmC mU*mU*mU*mU RNA guia mA*mA*mA*GUUCUAGAUGCCGUCCGGUUUUAGAmGmCmUmAmGmAmAm 71 G509 AmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGm AmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmC mU*mU*mU*mU RNA guia mA*mC*mG*CAAAUAUCAGUCCAGCGGUUUUAGAmGmCmUmAmGmAmAm 72 G534 AmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGm AmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmC mU*mU*mU*mU Sequência de TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCG 73 codificação de GAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCG DNA de eGFP TCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATG

CGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATAC CGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCA GGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTA CGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAAC GCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTCTA ATACGACTCACTATAGGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTT CGTGTGTGTGTCGTTGCAGGCCTTATTCGGATCCATGGTGAGCAAGGGCG AGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGA CGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCC ACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCC

Descrição Sequência SEQ ID No.

CGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCT TCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCA TGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGC AACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAA CCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGG GGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCG ACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCG AGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATC GGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTC CGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGG AGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAG TAATAGGAATTATGCAGTCTAGCCATCACATTTAAAAGCATCTCAGCCTACC ATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCT TTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAAT CATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCTCG AGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAATCTA GACTTAAGCTTGATGAGCTCTAGCTTGGCGTAATCATGGTCATAGCTGTTTC CTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAA GCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAA TTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAG CTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGG GCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCT GCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAG AATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAG GCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCG CCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAA ACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCG TGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTC TCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCA GTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCC GTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAAC CCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATT AGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCC TAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAA GCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAAC CACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAG

Descrição Sequência SEQ ID No.

AAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCT CAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAA GGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAA AGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGG CACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCC CGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTG CTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAA TAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTA TCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTT CGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGG TGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGAT CAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCT TCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCA TGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATG CTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATG CGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCC ACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCG AAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACT CGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGT GAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACA CGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTA TCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATA AACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCT AAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAG

GCCCTTTCGTCG Padrão mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAG 74 sgRNA AmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAA modificado, AUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAm em que N são AmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmC nucleotídeos mGmGmUmGmCmU*mU*mU*mU que codificam uma sequência guia CMV-1 5’ UTR CAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCAT 75 CMV-2 5’ UTR AGAAGACACCGGGACCGATCCAGCCTCCGCGGCCGGGAACGG 76 CMV-3 5’ UTR TGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACTCACCG 77

Descrição Sequência SEQ ID No.

SV40 NLS PKKKRKV 78 NLS 1 exemplificativo LAAKRSRTT 79 NLS 2 exemplificativo QAAKRSRTT 80 NLS 3 exemplificativo PAPAKRERTT 81 NLS 4 exemplificativo QAAKRPRTT 82 NLS 5 exemplificativo RAAKRPRTT 83 NLS 6 exemplificativo AAAKRSWSMAA 84 NLS 7 exemplificativo AAAKRVWSMAF 85 NLS 8 exemplificativo AAAKRSWSMAF 86 NLS 9 exemplificativo AAAKRKYFAA 87 NLS 10 exemplificativo RAAKRKAFAA 88 NLS 11 exemplificativo RAAKRKYFAV 89 SV40 NLS alternativo PKKKRRV 90 Nucleoplasmina NLS KRPAATKKAGQAKKKK 91 Sequência de codificação exemplificativa para SV40 NLS CCGAAGAAGAAGAGAAAGGTC 92 Sequência de codificação exemplificativa para NLS1 CTGGCAGCAAAGAGAAGCAGAACAACA 93

Descrição Sequência SEQ ID No.

Sequência de codificação exemplificativa para NLS2 CAGGCAGCAAAGAGAAGCAGAACAACA 94 Sequência de codificação exemplificativa para NLS3 CCGGCACCGGCAAAGAGAGAAAGAACAACA 95 Sequência de codificação exemplificativa para NLS4 CAGGCAGCAAAGAGACCGAGAACAACA 96 Sequência de codificação exemplificativa para NLS5 AGAGCAGCAAAGAGACCGAGAACAACA 97 Sequência de codificação exemplificativa para NLS6 GCAGCAGCAAAGAGAAGCTGGAGCATGGCAGCA 98 Sequência de codificação exemplificativa para NLS7 GCAGCAGCAAAGAGAGTCTGGAGCATGGCATTC 99 Sequência de codificação exemplificativa para NLS8 GCAGCAGCAAAGAGAAGCTGGAGCATGGCATTC 100 Sequência de codificação exemplificativa para NLS9 GCAGCAGCAAAGAGAAAGTACTTCGCAGCA 101 Sequência de codificação exemplificativa para NLS10 AGAGCAGCAAAGAGAAAGGCATTCGCAGCA 102

Descrição Sequência SEQ ID No. Sequência de codificação exemplificativa para NLS11 AGAGCAGCAAAGAGAAAGTACTTCGCAGTC 103 Sequência de codificação exemplificativa para SV40 NLS alternativo CCGAAGAAGAAGAGAAGAGTC 104 sequência exemplificativa de Kozak gccgccRccAUGG 105 Não utilizado 106 ORF de Cas9 ATGGACAAGAAGTACTCTATCGGTTTGGACATCGGTACCAACTCTGTCGGTTG usando códons GGCCGTCATCACCGACGAATACAAGGTCCCATCTAAGAAGTTCAAGGTCTTG de meia-vida GGTAACACCGACAGACACTCTATCAAGAAGAACTTGATCGGTGCCTTGTTGTT longos da CGACTCTGGTGAAACCGCCGAAGCCACCAGATTGAAGAGAACCGCCAGAAGA Tabela 4, com AGATACACCAGAAGAAAGAACAGAATCTGCTACTTGCAAGAAATCTTCTCTAA códons de início CGAAATGGCCAAGGTCGACGACTCTTTCTTCCACAGATTGGAAGAATCTTTCT e parada TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCAATCTTCGGTAACATCGT

CGACGAAGTCGCCTACCACGAAAAGTACCCAACCATCTACCACTTGAGAAAGA AGTTGGTCGACTCTACCGACAAGGCCGACTTGAGATTGATCTACTTGGCCTTG GCCCACATGATCAAGTTCAGAGGTCACTTCTTGATCGAAGGTGACTTGAACCC AGACAACTCTGACGTCGACAAGTTGTTCATCCAATTGGTCCAAACCTACAACC AATTGTTCGAAGAAAACCCAATCAACGCCTCTGGTGTCGACGCCAAGGCCATC TTGTCTGCCAGATTGTCTAAGAGCAGAAGATTGGAAAACTTGATCGCCCAATT GCCAGGTGAAAAGAAGAACGGTTTGTTCGGTAACTTGATCGCCTTGTCTTTGG GTTTGACCCCAAACTTCAAGTCTAACTTCGACTTGGCCGAAGACGCCAAGTTG CAATTGTCTAAGGACACCTACGACGACGACTTGGACAACTTGTTGGCCCAAAT CGGTGACCAATACGCCGACTTGTTCTTGGCCGCCAAGAACTTGTCTGACGCC ATCTTGTTGTCTGACATCTTGAGAGTCAACACCGAAATCACCAAGGCCCCATT GTCTGCCTCTATGATCAAGAGATACGACGAACACCACCAAGACTTGACCTTGT

TGAAGGCCTTGGTCAGACAACAATTGCCAGAAAAGTACAAGGAAATCTTCTTC GACCAATCTAAGAACGGTTACGCCGGTTACATCGACGGTGGTGCCTCTCAAG 107

Descrição Sequência SEQ ID No.

AAGAATTCTACAAGTTCATCAAGCCAATCTTGGAAAAGATGGACGGTACCGAA GAATTGTTGGTCAAGTTGAACAGAGAAGACTTGTTGAGAAAGCAAAGAACCTT CGACAACGGTTCTATCCCACACCAAATCCACTTGGGTGAATTGCACGCCATCT TGAGAAGACAAGAAGACTTCTACCCATTCTTGAAGGACAACAGAGAAAAGATC GAAAAGATCTTGACCTTCAGAATCCCATACTACGTCGGTCCATTGGCCAGAGG TAACAGCAGATTCGCCTGGATGACCAGAAAGTCTGAAGAAACCATCACCCCAT GGAACTTCGAAGAAGTCGTCGACAAGGGTGCCTCTGCCCAATCTTTCATCGAA AGAATGACCAACTTCGACAAGAACTTGCCAAACGAAAAGGTCTTGCCAAAGCA CTCTTTGTTGTACGAATACTTCACCGTCTACAACGAATTGACCAAGGTCAAGTA CGTCACCGAAGGTATGAGAAAGCCAGCCTTCTTGTCTGGTGAACAAAAGAAG GCCATCGTCGACTTGTTGTTCAAGACCAACAGAAAGGTCACCGTCAAGCAATT GAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACTCTGTCGAAATCTCTG GTGTCGAAGACAGATTCAACGCCTCTTTGGGTACCTACCACGACTTGTTGAAG ATCATCAAGGACAAGGACTTCTTGGACAACGAAGAAAACGAAGACATCTTGGA AGACATCGTCTTGACCTTGACCTTGTTCGAAGACAGAGAAATGATCGAAGAAA GATTGAAGACCTACGCCCACTTGTTCGACGACAAGGTCATGAAGCAATTGAAG AGAAGAAGATACACCGGTTGGGGTAGATTGAGCAGAAAGTTGATCAACGGTA TCAGAGACAAGCAATCTGGTAAGACCATCTTGGACTTCTTGAAGTCTGACGGT TTCGCCAACAGAAACTTCATGCAATTGATCCACGACGACTCTTTGACCTTCAA GGAAGACATCCAAAAGGCCCAAGTCTCTGGTCAAGGTGACTCTTTGCACGAA CACATCGCCAACTTGGCCGGTTCTCCAGCCATCAAGAAGGGTATCTTGCAAAC CGTCAAGGTCGTCGACGAATTGGTCAAGGTCATGGGTAGACACAAGCCAGAA AACATCGTCATCGAAATGGCCAGAGAAAACCAAACCACCCAAAAGGGTCAAAA GAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGTATCAAGGAATTGGGT TCTCAAATCTTGAAGGAACACCCAGTCGAAAACACCCAATTGCAAAACGAAAA GTTGTACTTGTACTACTTGCAAAACGGTAGAGACATGTACGTCGACCAAGAAT TGGACATCAACAGATTGTCTGACTACGACGTCGACCACATCGTCCCACAATCT TTCTTGAAGGACGACTCTATCGACAACAAGGTCTTGACCAGATCTGACAAGAA CAGAGGTAAGTCTGACAACGTCCCATCTGAAGAAGTCGTCAAGAAGATGAAG AACTACTGGAGACAATTGTTGAACGCCAAGTTGATCACCCAAAGAAAGTTCGA CAACTTGACCAAGGCCGAAAGAGGTGGTTTGTCTGAATTGGACAAGGCCGGT TTCATCAAGAGACAATTGGTCGAAACCAGACAAATCACCAAGCACGTCGCCCA AATCTTGGACAGCAGAATGAACACCAAGTACGACGAAAACGACAAGTTGATCA GAGAAGTCAAGGTCATCACCTTGAAGTCTAAGTTGGTCTCTGACTTCAGAAAG GACTTCCAATTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCCCACGA CGCCTACTTGAACGCCGTCGTCGGTACCGCCTTGATCAAGAAGTACCCAAAG TTGGAATCTGAATTCGTCTACGGTGACTACAAGGTCTACGACGTCAGAAAGAT

Descrição Sequência SEQ ID No.

GATCGCCAAGTCTGAACAAGAAATCGGTAAGGCCACCGCCAAGTACTTCTTCT ACTCTAACATCATGAACTTCTTCAAGACCGAAATCACCTTGGCCAACGGTGAA ATCAGAAAGAGACCATTGATCGAAACCAACGGTGAAACCGGTGAAATCGTCTG GGACAAGGGTAGAGACTTCGCCACCGTCAGAAAGGTCTTGTCTATGCCACAA GTCAACATCGTCAAGAAGACCGAAGTCCAAACCGGTGGTTTCTCTAAGGAATC TATCTTGCCAAAGAGAAACTCTGACAAGTTGATCGCCAGAAAGAAGGACTGGG ACCCAAAGAAGTACGGTGGTTTCGACTCTCCAACCGTCGCCTACTCTGTCTTG GTCGTCGCCAAGGTCGAAAAGGGTAAGTCTAAGAAGTTGAAGTCTGTCAAGG AATTGTTGGGTATCACCATCATGGAAAGATCTTCTTTCGAAAAGAACCCAATCG ACTTCTTGGAAGCCAAGGGTTACAAGGAAGTCAAGAAGGACTTGATCATCAAG TTGCCAAAGTACTCTTTGTTCGAATTGGAAAACGGTAGAAAGAGAATGTTGGC CTCTGCCGGTGAATTGCAAAAGGGTAACGAATTGGCCTTGCCATCTAAGTACG TCAACTTCTTGTACTTGGCCTCTCACTACGAAAAGTTGAAGGGTTCTCCAGAA GACAACGAACAAAAGCAATTGTTCGTCGAACAACACAAGCACTACTTGGACGA AATCATCGAACAAATCTCTGAATTCTCTAAGAGAGTCATCTTGGCCGACGCCA ACTTGGACAAGGTCTTGTCTGCCTACAACAAGCACAGAGACAAGCCAATCAGA GAACAAGCCGAAAACATCATCCACTTGTTCACCTTGACCAACTTGGGTGCCCC AGCCGCCTTCAAGTACTTCGACACCACCATCGACAGAAAGAGATACACCTCTA CCAAGGAAGTCTTGGACGCCACCTTGATCCACCAATCTATCACCGGTTTGTAC GAAACCAGAATCGACTTGTCTCAATTGGGTGGTGACGGTGGTGGTTCTCCAAA

GAAGAAGAGAAAGGTCTAA ORF de Cas9 ATGGATAAAAAATATTCTATTGGTTTAGATATTGGTACTAATTCTGTTGGTTGG usando códons GCTGTTATTACTGATGAATATAAAGTTCCTTCTAAAAAATTTAAAGTTTTAGGTA ricos em U da ATACTGATCGTCATTCTATTAAAAAAAATTTAATTGGTGCTTTATTATTTGATTCT Tabela 4, com GGTGAAACTGCTGAAGCTACTCGTTTAAAACGTACTGCTCGTCGTCGTTATAC códons de início TCGTCGTAAAAATCGTATTTGTTATTTACAAGAAATTTTTTCTAATGAAATGGCT e parada AAAGTTGATGATTCTTTTTTTCATCGTTTAGAAGAATCTTTTTTAGTTGAAGAAG

ATAAAAAACATGAACGTCATCCTATTTTTGGTAATATTGTTGATGAAGTTGCTTA TCATGAAAAATATCCTACTATTTATCATTTACGTAAAAAATTAGTTGATTCTACT GATAAAGCTGATTTACGTTTAATTTATTTAGCTTTAGCTCATATGATTAAATTTC GTGGTCATTTTTTAATTGAAGGTGATTTAAATCCTGATAATTCTGATGTTGATAA ATTATTTATTCAATTAGTTCAAACTTATAATCAATTATTTGAAGAAAATCCTATTA ATGCTTCTGGTGTTGATGCTAAAGCTATTTTATCTGCTCGTTTATCTAAATCTC GTCGTTTAGAAAATTTAATTGCTCAATTACCTGGTGAAAAAAAAAATGGTTTATT TGGTAATTTAATTGCTTTATCTTTAGGTTTAACTCCTAATTTTAAATCTAATTTTG

ATTTAGCTGAAGATGCTAAATTACAATTATCTAAAGATACTTATGATGATGATTT AGATAATTTATTAGCTCAAATTGGTGATCAATATGCTGATTTATTTTTAGCTGCT 108

Descrição Sequência SEQ ID No.

AAAAATTTATCTGATGCTATTTTATTATCTGATATTTTACGTGTTAATACTGAAAT TACTAAAGCTCCTTTATCTGCTTCTATGATTAAACGTTATGATGAACATCATCAA GATTTAACTTTATTAAAAGCTTTAGTTCGTCAACAATTACCTGAAAAATATAAAG AAATTTTTTTTGATCAATCTAAAAATGGTTATGCTGGTTATATTGATGGTGGTGC TTCTCAAGAAGAATTTTATAAATTTATTAAACCTATTTTAGAAAAAATGGATGGT ACTGAAGAATTATTAGTTAAATTAAATCGTGAAGATTTATTACGTAAACAACGTA CTTTTGATAATGGTTCTATTCCTCATCAAATTCATTTAGGTGAATTACATGCTAT TTTACGTCGTCAAGAAGATTTTTATCCTTTTTTAAAAGATAATCGTGAAAAAATT GAAAAAATTTTAACTTTTCGTATTCCTTATTATGTTGGTCCTTTAGCTCGTGGTA ATTCTCGTTTTGCTTGGATGACTCGTAAATCTGAAGAAACTATTACTCCTTGGA ATTTTGAAGAAGTTGTTGATAAAGGTGCTTCTGCTCAATCTTTTATTGAACGTA TGACTAATTTTGATAAAAATTTACCTAATGAAAAAGTTTTACCTAAACATTCTTT ATTATATGAATATTTTACTGTTTATAATGAATTAACTAAAGTTAAATATGTTACTG AAGGTATGCGTAAACCTGCTTTTTTATCTGGTGAACAAAAAAAAGCTATTGTTG ATTTATTATTTAAAACTAATCGTAAAGTTACTGTTAAACAATTAAAAGAAGATTA TTTTAAAAAAATTGAATGTTTTGATTCTGTTGAAATTTCTGGTGTTGAAGATCGT TTTAATGCTTCTTTAGGTACTTATCATGATTTATTAAAAATTATTAAAGATAAAGA TTTTTTAGATAATGAAGAAAATGAAGATATTTTAGAAGATATTGTTTTAACTTTA ACTTTATTTGAAGATCGTGAAATGATTGAAGAACGTTTAAAAACTTATGCTCATT TATTTGATGATAAAGTTATGAAACAATTAAAACGTCGTCGTTATACTGGTTGGG GTCGTTTATCTCGTAAATTAATTAATGGTATTCGTGATAAACAATCTGGTAAAA CTATTTTAGATTTTTTAAAATCTGATGGTTTTGCTAATCGTAATTTTATGCAATTA ATTCATGATGATTCTTTAACTTTTAAAGAAGATATTCAAAAAGCTCAAGTTTCTG GTCAAGGTGATTCTTTACATGAACATATTGCTAATTTAGCTGGTTCTCCTGCTA TTAAAAAAGGTATTTTACAAACTGTTAAAGTTGTTGATGAATTAGTTAAAGTTAT GGGTCGTCATAAACCTGAAAATATTGTTATTGAAATGGCTCGTGAAAATCAAAC TACTCAAAAAGGTCAAAAAAATTCTCGTGAACGTATGAAACGTATTGAAGAAG GTATTAAAGAATTAGGTTCTCAAATTTTAAAAGAACATCCTGTTGAAAATACTCA ATTACAAAATGAAAAATTATATTTATATTATTTACAAAATGGTCGTGATATGTAT GTTGATCAAGAATTAGATATTAATCGTTTATCTGATTATGATGTTGATCATATTG TTCCTCAATCTTTTTTAAAAGATGATTCTATTGATAATAAAGTTTTAACTCGTTCT GATAAAAATCGTGGTAAATCTGATAATGTTCCTTCTGAAGAAGTTGTTAAAAAA ATGAAAAATTATTGGCGTCAATTATTAAATGCTAAATTAATTACTCAACGTAAAT TTGATAATTTAACTAAAGCTGAACGTGGTGGTTTATCTGAATTAGATAAAGCTG GTTTTATTAAACGTCAATTAGTTGAAACTCGTCAAATTACTAAACATGTTGCTCA AATTTTAGATTCTCGTATGAATACTAAATATGATGAAAATGATAAATTAATTCGT GAAGTTAAAGTTATTACTTTAAAATCTAAATTAGTTTCTGATTTTCGTAAAGATT

Descrição Sequência SEQ ID No.

TTCAATTTTATAAAGTTCGTGAAATTAATAATTATCATCATGCTCATGATGCTTA TTTAAATGCTGTTGTTGGTACTGCTTTAATTAAAAAATATCCTAAATTAGAATCT GAATTTGTTTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAAT CTGAACAAGAAATTGGTAAAGCTACTGCTAAATATTTTTTTTATTCTAATATTAT GAATTTTTTTAAAACTGAAATTACTTTAGCTAATGGTGAAATTCGTAAACGTCCT TTAATTGAAACTAATGGTGAAACTGGTGAAATTGTTTGGGATAAAGGTCGTGAT TTTGCTACTGTTCGTAAAGTTTTATCTATGCCTCAAGTTAATATTGTTAAAAAAA CTGAAGTTCAAACTGGTGGTTTTTCTAAAGAATCTATTTTACCTAAACGTAATTC TGATAAATTAATTGCTCGTAAAAAAGATTGGGATCCTAAAAAATATGGTGGTTT TGATTCTCCTACTGTTGCTTATTCTGTTTTAGTTGTTGCTAAAGTTGAAAAAGGT AAATCTAAAAAATTAAAATCTGTTAAAGAATTATTAGGTATTACTATTATGGAAC GTTCTTCTTTTGAAAAAAATCCTATTGATTTTTTAGAAGCTAAAGGTTATAAAGA AGTTAAAAAAGATTTAATTATTAAATTACCTAAATATTCTTTATTTGAATTAGAAA ATGGTCGTAAACGTATGTTAGCTTCTGCTGGTGAATTACAAAAAGGTAATGAAT TAGCTTTACCTTCTAAATATGTTAATTTTTTATATTTAGCTTCTCATTATGAAAAA TTAAAAGGTTCTCCTGAAGATAATGAACAAAAACAATTATTTGTTGAACAACAT AAACATTATTTAGATGAAATTATTGAACAAATTTCTGAATTTTCTAAACGTGTTA TTTTAGCTGATGCTAATTTAGATAAAGTTTTATCTGCTTATAATAAACATCGTGA TAAACCTATTCGTGAACAAGCTGAAAATATTATTCATTTATTTACTTTAACTAAT TTAGGTGCTCCTGCTGCTTTTAAATATTTTGATACTACTATTGATCGTAAACGTT ATACTTCTACTAAAGAAGTTTTAGATGCTACTTTAATTCATCAATCTATTACTGG TTTATATGAAACTCGTATTGATTTATCTCAATTAGGTGGTGATGGTGGTGGTTC

TCCTAAAAAAAAACGTAAAGTTTGA ORF de Cas9 ATGGACAAAAAATACTCCATCGGCCTCGACATCGGCACCAACTCCGTCGGCT usando códons GGGCCGTCATCACCGACGAATACAAAGTCCCCTCCAAAAAATTCAAAGTCCTC de G baixo da GGCAACACCGACAGACACTCCATCAAAAAAAACCTCATCGGCGCCCTCCTCTT Tabela 4, com CGACTCCGGCGAAACCGCCGAAGCCACCAGACTCAAAAGAACCGCCAGAAG códons de início AAGATACACCAGAAGAAAAAACAGAATCTGCTACCTCCAAGAAATCTTCTCCA e parada ACGAAATGGCCAAAGTCGACGACTCCTTCTTCCACAGACTCGAAGAATCCTTC

CTCGTCGAAGAAGACAAAAAACACGAAAGACACCCCATCTTCGGCAACATCGT CGACGAAGTCGCCTACCACGAAAAATACCCCACCATCTACCACCTCAGAAAAA AACTCGTCGACTCCACCGACAAAGCCGACCTCAGACTCATCTACCTCGCCCTC GCCCACATGATCAAATTCAGAGGCCACTTCCTCATCGAAGGCGACCTCAACC CCGACAACTCCGACGTCGACAAACTCTTCATCCAACTCGTCCAAACCTACAAC CAACTCTTCGAAGAAAACCCCATCAACGCCTCCGGCGTCGACGCCAAAGCCA

TCCTCTCCGCCAGACTCTCCAAATCCAGAAGACTCGAAAACCTCATCGCCCAA CTCCCCGGCGAAAAAAAAAACGGCCTCTTCGGCAACCTCATCGCCCTCTCCC 109

Descrição Sequência SEQ ID No.

TCGGCCTCACCCCCAACTTCAAATCCAACTTCGACCTCGCCGAAGACGCCAAA CTCCAACTCTCCAAAGACACCTACGACGACGACCTCGACAACCTCCTCGCCC AAATCGGCGACCAATACGCCGACCTCTTCCTCGCCGCCAAAAACCTCTCCGA CGCCATCCTCCTCTCCGACATCCTCAGAGTCAACACCGAAATCACCAAAGCCC CCCTCTCCGCCTCCATGATCAAAAGATACGACGAACACCACCAAGACCTCACC CTCCTCAAAGCCCTCGTCAGACAACAACTCCCCGAAAAATACAAAGAAATCTT CTTCGACCAATCCAAAAACGGCTACGCCGGCTACATCGACGGCGGCGCCTCC CAAGAAGAATTCTACAAATTCATCAAACCCATCCTCGAAAAAATGGACGGCAC CGAAGAACTCCTCGTCAAACTCAACAGAGAAGACCTCCTCAGAAAACAAAGAA CCTTCGACAACGGCTCCATCCCCCACCAAATCCACCTCGGCGAACTCCACGC CATCCTCAGAAGACAAGAAGACTTCTACCCCTTCCTCAAAGACAACAGAGAAA AAATCGAAAAAATCCTCACCTTCAGAATCCCCTACTACGTCGGCCCCCTCGCC AGAGGCAACTCCAGATTCGCCTGGATGACCAGAAAATCCGAAGAAACCATCA CCCCCTGGAACTTCGAAGAAGTCGTCGACAAAGGCGCCTCCGCCCAATCCTT CATCGAAAGAATGACCAACTTCGACAAAAACCTCCCCAACGAAAAAGTCCTCC CCAAACACTCCCTCCTCTACGAATACTTCACCGTCTACAACGAACTCACCAAA GTCAAATACGTCACCGAAGGCATGAGAAAACCCGCCTTCCTCTCCGGCGAAC AAAAAAAAGCCATCGTCGACCTCCTCTTCAAAACCAACAGAAAAGTCACCGTC AAACAACTCAAAGAAGACTACTTCAAAAAAATCGAATGCTTCGACTCCGTCGA AATCTCCGGCGTCGAAGACAGATTCAACGCCTCCCTCGGCACCTACCACGAC CTCCTCAAAATCATCAAAGACAAAGACTTCCTCGACAACGAAGAAAACGAAGA CATCCTCGAAGACATCGTCCTCACCCTCACCCTCTTCGAAGACAGAGAAATGA TCGAAGAAAGACTCAAAACCTACGCCCACCTCTTCGACGACAAAGTCATGAAA CAACTCAAAAGAAGAAGATACACCGGCTGGGGCAGACTCTCCAGAAAACTCA TCAACGGCATCAGAGACAAACAATCCGGCAAAACCATCCTCGACTTCCTCAAA TCCGACGGCTTCGCCAACAGAAACTTCATGCAACTCATCCACGACGACTCCCT CACCTTCAAAGAAGACATCCAAAAAGCCCAAGTCTCCGGCCAAGGCGACTCC CTCCACGAACACATCGCCAACCTCGCCGGCTCCCCCGCCATCAAAAAAGGCA TCCTCCAAACCGTCAAAGTCGTCGACGAACTCGTCAAAGTCATGGGCAGACA CAAACCCGAAAACATCGTCATCGAAATGGCCAGAGAAAACCAAACCACCCAAA AAGGCCAAAAAAACTCCAGAGAAAGAATGAAAAGAATCGAAGAAGGCATCAAA GAACTCGGCTCCCAAATCCTCAAAGAACACCCCGTCGAAAACACCCAACTCCA AAACGAAAAACTCTACCTCTACTACCTCCAAAACGGCAGAGACATGTACGTCG ACCAAGAACTCGACATCAACAGACTCTCCGACTACGACGTCGACCACATCGTC CCCCAATCCTTCCTCAAAGACGACTCCATCGACAACAAAGTCCTCACCAGATC CGACAAAAACAGAGGCAAATCCGACAACGTCCCCTCCGAAGAAGTCGTCAAA AAAATGAAAAACTACTGGAGACAACTCCTCAACGCCAAACTCATCACCCAAAG

Descrição Sequência SEQ ID No.

AAAATTCGACAACCTCACCAAAGCCGAAAGAGGCGGCCTCTCCGAACTCGAC AAAGCCGGCTTCATCAAAAGACAACTCGTCGAAACCAGACAAATCACCAAACA CGTCGCCCAAATCCTCGACTCCAGAATGAACACCAAATACGACGAAAACGACA AACTCATCAGAGAAGTCAAAGTCATCACCCTCAAATCCAAACTCGTCTCCGAC TTCAGAAAAGACTTCCAATTCTACAAAGTCAGAGAAATCAACAACTACCACCAC GCCCACGACGCCTACCTCAACGCCGTCGTCGGCACCGCCCTCATCAAAAAAT ACCCCAAACTCGAATCCGAATTCGTCTACGGCGACTACAAAGTCTACGACGTC AGAAAAATGATCGCCAAATCCGAACAAGAAATCGGCAAAGCCACCGCCAAATA CTTCTTCTACTCCAACATCATGAACTTCTTCAAAACCGAAATCACCCTCGCCAA CGGCGAAATCAGAAAAAGACCCCTCATCGAAACCAACGGCGAAACCGGCGAA ATCGTCTGGGACAAAGGCAGAGACTTCGCCACCGTCAGAAAAGTCCTCTCCA TGCCCCAAGTCAACATCGTCAAAAAAACCGAAGTCCAAACCGGCGGCTTCTC CAAAGAATCCATCCTCCCCAAAAGAAACTCCGACAAACTCATCGCCAGAAAAA AAGACTGGGACCCCAAAAAATACGGCGGCTTCGACTCCCCCACCGTCGCCTA CTCCGTCCTCGTCGTCGCCAAAGTCGAAAAAGGCAAATCCAAAAAACTCAAAT CCGTCAAAGAACTCCTCGGCATCACCATCATGGAAAGATCCTCCTTCGAAAAA AACCCCATCGACTTCCTCGAAGCCAAAGGCTACAAAGAAGTCAAAAAAGACCT CATCATCAAACTCCCCAAATACTCCCTCTTCGAACTCGAAAACGGCAGAAAAA GAATGCTCGCCTCCGCCGGCGAACTCCAAAAAGGCAACGAACTCGCCCTCCC CTCCAAATACGTCAACTTCCTCTACCTCGCCTCCCACTACGAAAAACTCAAAG GCTCCCCCGAAGACAACGAACAAAAACAACTCTTCGTCGAACAACACAAACAC TACCTCGACGAAATCATCGAACAAATCTCCGAATTCTCCAAAAGAGTCATCCT CGCCGACGCCAACCTCGACAAAGTCCTCTCCGCCTACAACAAACACAGAGAC AAACCCATCAGAGAACAAGCCGAAAACATCATCCACCTCTTCACCCTCACCAA CCTCGGCGCCCCCGCCGCCTTCAAATACTTCGACACCACCATCGACAGAAAA AGATACACCTCCACCAAAGAAGTCCTCGACGCCACCCTCATCCACCAATCCAT CACCGGCCTCTACGAAACCAGAATCGACCTCTCCCAACTCGGCGGCGACGGC

GGCGGCTCCCCCAAAAAAAAAAGAAAAGTCTGA ORF de Cas9 ATGGATAAGAAGTATAGTATTGGATTGGATATTGGAACAAATAGTGTGGGATG usando códons GGCTGTGATTACAGATGAGTATAAGGTGCCTAGTAAGAAGTTTAAGGTGTTGG C baixo da GAAATACAGATAGACATAGTATTAAGAAGAATTTGATTGGAGCTTTGTTGTTTG Tabela 4, com ATAGTGGAGAGACAGCTGAGGCTACAAGATTGAAGAGAACAGCTAGAAGAAG códons de início ATATACAAGAAGAAAGAATAGAATTTGTTATTTGCAGGAGATTTTTAGTAATGA e parada GATGGCTAAGGTGGATGATAGTTTTTTTCATAGATTGGAGGAGAGTTTTTTGGT

GGAGGAGGATAAGAAGCATGAGAGACATCCTATTTTTGGAAATATTGTGGATG

AGGTGGCTTATCATGAGAAGTATCCTACAATTTATCATTTGAGAAAGAAGTTGG TGGATAGTACAGATAAGGCTGATTTGAGATTGATTTATTTGGCTTTGGCTCATA 110

Descrição Sequência SEQ ID No.

TGATTAAGTTTAGAGGACATTTTTTGATTGAGGGAGATTTGAATCCTGATAATA GTGATGTGGATAAGTTGTTTATTCAGTTGGTGCAGACATATAATCAGTTGTTTG AGGAGAATCCTATTAATGCTAGTGGAGTGGATGCTAAGGCTATTTTGAGTGCT AGATTGAGTAAGAGTAGAAGATTGGAGAATTTGATTGCTCAGTTGCCTGGAGA GAAGAAGAATGGATTGTTTGGAAATTTGATTGCTTTGAGTTTGGGATTGACAC CTAATTTTAAGAGTAATTTTGATTTGGCTGAGGATGCTAAGTTGCAGTTGAGTA AGGATACATATGATGATGATTTGGATAATTTGTTGGCTCAGATTGGAGATCAGT ATGCTGATTTGTTTTTGGCTGCTAAGAATTTGAGTGATGCTATTTTGTTGAGTG ATATTTTGAGAGTGAATACAGAGATTACAAAGGCTCCTTTGAGTGCTAGTATGA TTAAGAGATATGATGAGCATCATCAGGATTTGACATTGTTGAAGGCTTTGGTG AGACAGCAGTTGCCTGAGAAGTATAAGGAGATTTTTTTTGATCAGAGTAAGAA TGGATATGCTGGATATATTGATGGAGGAGCTAGTCAGGAGGAGTTTTATAAGT TTATTAAGCCTATTTTGGAGAAGATGGATGGAACAGAGGAGTTGTTGGTGAAG TTGAATAGAGAGGATTTGTTGAGAAAGCAGAGAACATTTGATAATGGAAGTATT CCTCATCAGATTCATTTGGGAGAGTTGCATGCTATTTTGAGAAGACAGGAGGA TTTTTATCCTTTTTTGAAGGATAATAGAGAGAAGATTGAGAAGATTTTGACATTT AGAATTCCTTATTATGTGGGACCTTTGGCTAGAGGAAATAGTAGATTTGCTTG GATGACAAGAAAGAGTGAGGAGACAATTACACCTTGGAATTTTGAGGAGGTG GTGGATAAGGGAGCTAGTGCTCAGAGTTTTATTGAGAGAATGACAAATTTTGA TAAGAATTTGCCTAATGAGAAGGTGTTGCCTAAGCATAGTTTGTTGTATGAGTA TTTTACAGTGTATAATGAGTTGACAAAGGTGAAGTATGTGACAGAGGGAATGA GAAAGCCTGCTTTTTTGAGTGGAGAGCAGAAGAAGGCTATTGTGGATTTGTTG TTTAAGACAAATAGAAAGGTGACAGTGAAGCAGTTGAAGGAGGATTATTTTAA GAAGATTGAGTGTTTTGATAGTGTGGAGATTAGTGGAGTGGAGGATAGATTTA ATGCTAGTTTGGGAACATATCATGATTTGTTGAAGATTATTAAGGATAAGGATT TTTTGGATAATGAGGAGAATGAGGATATTTTGGAGGATATTGTGTTGACATTGA CATTGTTTGAGGATAGAGAGATGATTGAGGAGAGATTGAAGACATATGCTCAT TTGTTTGATGATAAGGTGATGAAGCAGTTGAAGAGAAGAAGATATACAGGATG GGGAAGATTGAGTAGAAAGTTGATTAATGGAATTAGAGATAAGCAGAGTGGAA AGACAATTTTGGATTTTTTGAAGAGTGATGGATTTGCTAATAGAAATTTTATGC AGTTGATTCATGATGATAGTTTGACATTTAAGGAGGATATTCAGAAGGCTCAG GTGAGTGGACAGGGAGATAGTTTGCATGAGCATATTGCTAATTTGGCTGGAAG TCCTGCTATTAAGAAGGGAATTTTGCAGACAGTGAAGGTGGTGGATGAGTTGG TGAAGGTGATGGGAAGACATAAGCCTGAGAATATTGTGATTGAGATGGCTAGA GAGAATCAGACAACACAGAAGGGACAGAAGAATAGTAGAGAGAGAATGAAGA GAATTGAGGAGGGAATTAAGGAGTTGGGAAGTCAGATTTTGAAGGAGCATCC TGTGGAGAATACACAGTTGCAGAATGAGAAGTTGTATTTGTATTATTTGCAGAA

Descrição Sequência SEQ ID No.

TGGAAGAGATATGTATGTGGATCAGGAGTTGGATATTAATAGATTGAGTGATT ATGATGTGGATCATATTGTGCCTCAGAGTTTTTTGAAGGATGATAGTATTGATA ATAAGGTGTTGACAAGAAGTGATAAGAATAGAGGAAAGAGTGATAATGTGCCT AGTGAGGAGGTGGTGAAGAAGATGAAGAATTATTGGAGACAGTTGTTGAATG CTAAGTTGATTACACAGAGAAAGTTTGATAATTTGACAAAGGCTGAGAGAGGA GGATTGAGTGAGTTGGATAAGGCTGGATTTATTAAGAGACAGTTGGTGGAGAC AAGACAGATTACAAAGCATGTGGCTCAGATTTTGGATAGTAGAATGAATACAA AGTATGATGAGAATGATAAGTTGATTAGAGAGGTGAAGGTGATTACATTGAAG AGTAAGTTGGTGAGTGATTTTAGAAAGGATTTTCAGTTTTATAAGGTGAGAGAG ATTAATAATTATCATCATGCTCATGATGCTTATTTGAATGCTGTGGTGGGAACA GCTTTGATTAAGAAGTATCCTAAGTTGGAGAGTGAGTTTGTGTATGGAGATTAT AAGGTGTATGATGTGAGAAAGATGATTGCTAAGAGTGAGCAGGAGATTGGAAA GGCTACAGCTAAGTATTTTTTTTATAGTAATATTATGAATTTTTTTAAGACAGAG ATTACATTGGCTAATGGAGAGATTAGAAAGAGACCTTTGATTGAGACAAATGG AGAGACAGGAGAGATTGTGTGGGATAAGGGAAGAGATTTTGCTACAGTGAGA AAGGTGTTGAGTATGCCTCAGGTGAATATTGTGAAGAAGACAGAGGTGCAGA CAGGAGGATTTAGTAAGGAGAGTATTTTGCCTAAGAGAAATAGTGATAAGTTG ATTGCTAGAAAGAAGGATTGGGATCCTAAGAAGTATGGAGGATTTGATAGTCC TACAGTGGCTTATAGTGTGTTGGTGGTGGCTAAGGTGGAGAAGGGAAAGAGT AAGAAGTTGAAGAGTGTGAAGGAGTTGTTGGGAATTACAATTATGGAGAGAAG TAGTTTTGAGAAGAATCCTATTGATTTTTTGGAGGCTAAGGGATATAAGGAGGT GAAGAAGGATTTGATTATTAAGTTGCCTAAGTATAGTTTGTTTGAGTTGGAGAA TGGAAGAAAGAGAATGTTGGCTAGTGCTGGAGAGTTGCAGAAGGGAAATGAG TTGGCTTTGCCTAGTAAGTATGTGAATTTTTTGTATTTGGCTAGTCATTATGAG AAGTTGAAGGGAAGTCCTGAGGATAATGAGCAGAAGCAGTTGTTTGTGGAGC AGCATAAGCATTATTTGGATGAGATTATTGAGCAGATTAGTGAGTTTAGTAAGA GAGTGATTTTGGCTGATGCTAATTTGGATAAGGTGTTGAGTGCTTATAATAAGC ATAGAGATAAGCCTATTAGAGAGCAGGCTGAGAATATTATTCATTTGTTTACAT TGACAAATTTGGGAGCTCCTGCTGCTTTTAAGTATTTTGATACAACAATTGATA GAAAGAGATATACAAGTACAAAGGAGGTGTTGGATGCTACATTGATTCATCAG AGTATTACAGGATTGTATGAGACAAGAATTGATTTGAGTCAGTTGGGAGGAGA

TGGAGGAGGAAGTCCTAAGAAGAAGAGAAAGGTGTGA ORF de Cas9 ATGGACAAGAAGTACTCCATCGGCCTGGACATCGGCACCAACTCCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT de A baixo da GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC códons de início GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT 111

Descrição Sequência SEQ ID No. e parada TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA

GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA

Descrição Sequência SEQ ID No.

GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCG TGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCG GTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGT GAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACC CAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAG CTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATC ACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACG AGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCT GGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAAC AACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCC CTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACA AGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCA AGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACC GAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACC AACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACC GTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAG GTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCC GACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGC TTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGA AGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCAT CATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAG GGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCC TGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGC TGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTA CCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCA GAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAG CAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACA AGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGG CCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGC CTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAG GAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGA

Descrição Sequência SEQ ID No.

CCCGGATCGACCTGTCCCAGCTGGGCGGCGACGGCGGCGGCTCCCCCAAGA

AGAAGCGGAAGGTGTGA ORF de Cas9 ATGGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT de A/U baixo da GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC códons de início GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT e parada TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA

GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA

GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA 112

Descrição Sequência SEQ ID No.

TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT

Descrição Sequência SEQ ID No.

TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCGGCGGC

AGCCCCAAGAAGAAGCGGAAGGTGTGA ORF de Cas9 ATGGACAAGAAGTACTCCATCGGCCTGGACATCGGCACCAACTCCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT de A baixo da GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC duas sequências GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT NLS do terminal TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA C e códons de GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG início e parada CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC

CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC

GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG 113

Descrição Sequência SEQ ID No.

TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCG TGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCG GTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGT GAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACC CAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAG CTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATC ACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACG AGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCT GGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAAC AACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCC CTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACA AGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCA AGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACC GAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACC AACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACC GTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAG GTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCC

Descrição Sequência SEQ ID No.

GACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGC TTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGA AGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCAT CATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAG GGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCC TGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGC TGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTA CCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCA GAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAG CAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACA AGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGG CCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGC CTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAG GAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGA CCCGGATCGACCTGTCCCAGCTGGGCGGCGACGGCTCCGGCTCCCCCAAGA AGAAGCGGAAGGTGGACGGCTCCCCCAAGAAGAAGCGGAAGGTGGACTCCG

GCTGA OR9 de Cas9 ATGGACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCT nickase usando GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT códons de A GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT baixo da Tabela GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC 4, com códons GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT de início e TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA parada GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG

CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC

ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC 114

Descrição Sequência SEQ ID No.

CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCG TGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCG GTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGT GAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACC CAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAG CTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATC ACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACG AGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCT GGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAAC

Descrição Sequência SEQ ID No.

AACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCC CTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACA AGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCA AGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACC GAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACC AACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACC GTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAG GTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCC GACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGC TTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGA AGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCAT CATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAG GGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCC TGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGC TGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTA CCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCA GAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAG CAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACA AGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGG CCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGC CTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAG GAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGA CCCGGATCGACCTGTCCCAGCTGGGCGGCGACGGCGGCGGCTCCCCCAAGA

AGAAGCGGAAGGTGTGA OR9 de Cas9 ATGGACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCT nickase usando GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT códons de A GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT baixo da Tabela GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC 4, com códons GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT de início e TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA parada e sem GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG

NLS CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT

GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG 115

Descrição Sequência SEQ ID No.

AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCG TGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCG

Descrição Sequência SEQ ID No.

GTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGT GAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACC CAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAG CTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATC ACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACG AGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCT GGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAAC AACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCC CTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACA AGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCA AGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACC GAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACC AACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACC GTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAG GTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCC GACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGC TTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGA AGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCAT CATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAG GGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCC TGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGC TGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTA CCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCA GAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAG CAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACA AGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGG CCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGC CTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAG GAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGA

CCCGGATCGACCTGTCCCAGCTGGGCGGCGACTGA ORF de Cas9 ATGGACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCT nickase usando GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT códons de A GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT baixo da Tabela GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC 4, com duas GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT sequências NLS TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA C-terminais e GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG 116

Descrição Sequência SEQ ID No. códons de início CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC e parada CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC

TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC

Descrição Sequência SEQ ID No.

CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCG TGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCG GTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGT GAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACC CAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAG CTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATC ACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACG AGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCT GGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAAC AACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCC CTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACA AGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCA AGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACC GAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACC AACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACC GTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAG GTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCC GACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGC TTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGA AGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCAT CATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAG GGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCC TGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGC TGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTA CCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCA GAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAG CAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACA AGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGG CCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGC CTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAG GAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGA CCCGGATCGACCTGTCCCAGCTGGGCGGCGACGGCTCCGGCTCCCCCAAGA AGAAGCGGAAGGTGGACGGCTCCCCCAAGAAGAAGCGGAAGGTGGACTCCG

Descrição Sequência SEQ ID No.

GCTGA ORF de dCas9 ATGGACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT de A baixo da GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC códons de início GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT e parada TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA

GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA

CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA 117

Descrição Sequência SEQ ID No.

AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACGCCATC GTGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCC GGTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGG TGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCAC CCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGA GCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGAT CACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGAC GAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGC TGGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAA CAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGC CCTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTAC AAGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGC AAGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGAC CGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGAC CAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCAC CGTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGA GGTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTC CGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGG CTTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGA GAAGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCAC CATCATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCC AAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACT CCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCG AGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCT

Descrição Sequência SEQ ID No.

GTACCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGA GCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATC GAGCAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGG ACAAGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGC AGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGC CGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACC AAGGAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACG AGACCCGGATCGACCTGTCCCAGCTGGGCGGCGACGGCGGCGGCTCCCCCA

AGAAGAAGCGGAAGGTGTGA ORF de dCas9 ATGGACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT de A baixo da GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC códons de início GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT e parada e sem TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA

NLS GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC

GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG 118

Descrição Sequência SEQ ID No.

TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACGCCATC GTGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCC GGTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGG TGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCAC CCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGA GCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGAT CACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGAC GAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGC TGGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAA CAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGC CCTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTAC AAGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGC AAGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGAC CGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGAC CAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCAC CGTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGA GGTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTC

Descrição Sequência SEQ ID No.

CGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGG CTTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGA GAAGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCAC CATCATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCC AAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACT CCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCG AGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCT GTACCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGA GCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATC GAGCAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGG ACAAGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGC AGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGC CGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACC AAGGAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACG

AGACCCGGATCGACCTGTCCCAGCTGGGCGGCGACTGA ORF de dCas9 ATGGACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCT de A baixo da GGGCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC duas sequências GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT NLS C-terminais TCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGA e códons de GTCCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG início e parada CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC

CTGCGGAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTG GACGCCAAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAG AACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAAC CTGATCGCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCT GGCCGAGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCT GGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGC CGCCAAGAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAAC ACCGAGATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC

CCGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCC 119

Descrição Sequência SEQ ID No.

ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCT GGATGACCCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTT CGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTAC GAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGG GCATGCGGAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGG ACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGA CTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAG GACCGGTTCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCA AGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACAT CGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCT GAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGG CGGCGGTACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATC CGGGACAAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCT TCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAA GGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGA GCACATCGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCA GACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCC CGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGG CCAGAAGAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGA GCTGGGCTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCA GAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTG GACCAGGAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACGCCATC GTGCCCCAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCC GGTCCGACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGG TGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCAC CCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGA GCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGAT CACCAAGCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGAC GAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGC TGGTGTCCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAA CAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGC CCTGATCAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTAC

Descrição Sequência SEQ ID No.

AAGGTGTACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGC AAGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGAC CGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGAC CAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCAC CGTGCGGAAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGA GGTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTC CGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGG CTTCGACTCCCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGA GAAGGGCAAGTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCAC CATCATGGAGCGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCC AAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACT CCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCG AGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCT GTACCTGGCCTCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGA GCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATC GAGCAGATCTCCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGG ACAAGGTGCTGTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGC AGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGC CGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACC AAGGAGGTGCTGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACG AGACCCGGATCGACCTGTCCCAGCTGGGCGGCGACGGCTCCGGCTCCCCCA AGAAGAAGCGGAAGGTGGACGGCTCCCCCAAGAAGAAGCGGAAGGTGGACT

CCGGCTGA ORF de Cas9 ATGGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT de A/U baixo da GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC duas sequências GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT NLS C-terminais TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA e códons de GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG início e parada CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC

CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG

GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA 120

Descrição Sequência SEQ ID No.

CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG

Descrição Sequência SEQ ID No.

GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCAGCGGCA GCCCCAAGAAGAAGCGGAAGGTGGACGGCAGCCCCAAGAAGAAGCGGAAGG

TGGACAGCGGCTGA ORF de Cas9 ATGGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT de A/U baixos GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT da Tabela 4, GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC com códons de GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT início e parada e TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA 121

Descrição Sequência SEQ ID No. sem NLS GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG

CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC

Descrição Sequência SEQ ID No.

TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACTGA

Descrição Sequência SEQ ID No. ORF de Cas9 ATGGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACAGCGTGGGCT nickase usando GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT códons de A/U GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT baixo da Tabela GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC 4, com códons GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT de início e TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA parada GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG

CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA

TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG 122

Descrição Sequência SEQ ID No.

GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT

Descrição Sequência SEQ ID No.

CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCGGCGGC

AGCCCCAAGAAGAAGCGGAAGGTGTGA ORF de Cas 9 ATGGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACAGCGTGGGCT nickase usando GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT códons de A/U GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT baixo da Tabela GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC 4, com duas GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT sequências NLS TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA C-terminal e GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG códons de início CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC e parada CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC

TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA

GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG 123

Descrição Sequência SEQ ID No.

TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT

Descrição Sequência SEQ ID No.

GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCAGCGGCA GCCCCAAGAAGAAGCGGAAGGTGGACGGCAGCCCCAAGAAGAAGCGGAAGG

TGGACAGCGGCTGA ORF de Cas9 ATGGACAAGAAGTACAGCATCGGCCTGGcCATCGGCACCAACAGCGTGGGCT nickase usando GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT códons de A/U GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT baixo da Tabela GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC 4, com códons GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT de início e TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA parada e sem GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG

NLS CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT

GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC 124

Descrição Sequência SEQ ID No.

CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA

Descrição Sequência SEQ ID No.

CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC

TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACTGA ORF de dCas9 ATGGACAAGAAGTACAGCATCGGCCTGGcCATCGGCACCAACAGCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT de A/U baixo da GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC códons de início GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT e parada TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA

GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA

CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC 125

Descrição Sequência SEQ ID No.

CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC

TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACgcC

ATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTGA CCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA

Descrição Sequência SEQ ID No.

GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCGGCGGC

AGCCCCAAGAAGAAGCGGAAGGTGTGA ORF de dCas9 ATGGACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACAGCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT de A/U baixo da GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC duas sequências GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT NLS C-terminal TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA e códons de GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG início e parada CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC 126

Descrição Sequência SEQ ID No.

TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA

Descrição Sequência SEQ ID No.

AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACGC CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCAGCGGCA GCCCCAAGAAGAAGCGGAAGGTGGACGGCAGCCCCAAGAAGAAGCGGAAGG TGGACAGCGGCTGA

Descrição Sequência SEQ ID No. ORF de dCas9 ATGGACAAGAAGTACAGCATCGGCCTGGcCATCGGCACCAACAGCGTGGGCT usando códons GGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCT de A/U baixo da GGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCT Tabela 4, com GTTCGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCC códons de início GGCGGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCT e parada e sem TCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGA

NLS GAGCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGG CAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCAC CTGCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATC TACCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGG GCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGT GCAGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTG GACGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGA GAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAA CCTGATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGAC CTGGCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGAC CTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGG CCGCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGA ACACCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGA CGAGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCT GCCCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCC GGCTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGC CCATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACC GGGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCC ACCAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACT TCTACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTT CCGGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGC CTGGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGA GGTGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAA CTTCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTG TACGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCG AGGGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCG TGGACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGA GGACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTG GAGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCA

TCAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG 127

Descrição Sequência SEQ ID No.

GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC

ATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTGA CCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT

Descrição Sequência SEQ ID No.

CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC

TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACTGA ORF de Nme ATGGCCGCCTTCAAGCCCAACTCCATCAACTACATCCTGGGCCTGGACATCG Cas9 usando GCATCGCCTCCGTGGGCTGGGCCATGGTGGAGATCGACGAGGAGGAGAACC códons de A CCATCCGGCTGATCGACCTGGGCGTGCGGGTGTTCGAGCGGGCCGAGGTGC baixo da Tabela CCAAGACCGGCGACTCCCTGGCCATGGCCCGGCGGCTGGCCCGGTCCGTGC 4, com códons GGCGGCTGACCCGGCGGCGGGCCCACCGGCTGCTGCGGACCCGGCGGCTG de início e CTGAAGCGGGAGGGCGTGCTGCAGGCCGCCAACTTCGACGAGAACGGCCTG parada ATCAAGTCCCTGCCCAACACCCCCTGGCAGCTGCGGGCCGCCGCCCTGGAC

CGGAAGCTGACCCCCCTGGAGTGGTCCGCCGTGCTGCTGCACCTGATCAAG CACCGGGGCTACCTGTCCCAGCGGAAGAACGAGGGCGAGACCGCCGACAAG GAGCTGGGCGCCCTGCTGAAGGGCGTGGCCGGCAACGCCCACGCCCTGCA GACCGGCGACTTCCGGACCCCCGCCGAGCTGGCCCTGAACAAGTTCGAGAA GGAGTCCGGCCACATCCGGAACCAGCGGTCCGACTACTCCCACACCTTCTCC CGGAAGGACCTGCAGGCCGAGCTGATCCTGCTGTTCGAGAAGCAGAAGGAG TTCGGCAACCCCCACGTGTCCGGCGGCCTGAAGGAGGGCATCGAGACCCTG CTGATGACCCAGCGGCCCGCCCTGTCCGGCGACGCCGTGCAGAAGATGCTG GGCCACTGCACCTTCGAGCCCGCCGAGCCCAAGGCCGCCAAGAACACCTAC ACCGCCGAGCGGTTCATCTGGCTGACCAAGCTGAACAACCTGCGGATCCTGG AGCAGGGCTCCGAGCGGCCCCTGACCGACACCGAGCGGGCCACCCTGATGG ACGAGCCCTACCGGAAGTCCAAGCTGACCTACGCCCAGGCCCGGAAGCTGC TGGGCCTGGAGGACACCGCCTTCTTCAAGGGCCTGCGGTACGGCAAGGACA ACGCCGAGGCCTCCACCCTGATGGAGATGAAGGCCTACCACGCCATCTCCCG GGCCCTGGAGAAGGAGGGCCTGAAGGACAAGAAGTCCCCCCTGAACCTGTC CCCCGAGCTGCAGGACGAGATCGGCACCGCCTTCTCCCTGTTCAAGACCGAC GAGGACATCACCGGCCGGCTGAAGGACCGGATCCAGCCCGAGATCCTGGAG GCCCTGCTGAAGCACATCTCCTTCGACAAGTTCGTGCAGATCTCCCTGAAGG CCCTGCGGCGGATCGTGCCCCTGATGGAGCAGGGCAAGCGGTACGACGAGG CCTGCGCCGAGATCTACGGCGACCACTACGGCAAGAAGAACACCGAGGAGA AGATCTACCTGCCCCCCATCCCCGCCGACGAGATCCGGAACCCCGTGGTGCT GCGGGCCCTGTCCCAGGCCCGGAAGGTGATCAACGGCGTGGTGCGGCGGTA

CGGCTCCCCCGCCCGGATCCACATCGAGACCGCCCGGGAGGTGGGCAAGTC CTTCAAGGACCGGAAGGAGATCGAGAAGCGGCAGGAGGAGAACCGGAAGGA 128

Descrição Sequência SEQ ID No.

CCGGGAGAAGGCCGCCGCCAAGTTCCGGGAGTACTTCCCCAACTTCGTGGG CGAGCCCAAGTCCAAGGACATCCTGAAGCTGCGGCTGTACGAGCAGCAGCA CGGCAAGTGCCTGTACTCCGGCAAGGAGATCAACCTGGGCCGGCTGAACGA GAAGGGCTACGTGGAGATCGACCACGCCCTGCCCTTCTCCCGGACCTGGGA CGACTCCTTCAACAACAAGGTGCTGGTGCTGGGCTCCGAGAACCAGAACAAG GGCAACCAGACCCCCTACGAGTACTTCAACGGCAAGGACAACTCCCGGGAGT GGCAGGAGTTCAAGGCCCGGGTGGAGACCTCCCGGTTCCCCCGGTCCAAGA AGCAGCGGATCCTGCTGCAGAAGTTCGACGAGGACGGCTTCAAGGAGCGGA ACCTGAACGACACCCGGTACGTGAACCGGTTCCTGTGCCAGTTCGTGGCCGA CCGGATGCGGCTGACCGGCAAGGGCAAGAAGCGGGTGTTCGCCTCCAACGG CCAGATCACCAACCTGCTGCGGGGCTTCTGGGGCCTGCGGAAGGTGCGGGC CGAGAACGACCGGCACCACGCCCTGGACGCCGTGGTGGTGGCCTGCTCCAC CGTGGCCATGCAGCAGAAGATCACCCGGTTCGTGCGGTACAAGGAGATGAAC GCCTTCGACGGCAAGACCATCGACAAGGAGACCGGCGAGGTGCTGCACCAG AAGACCCACTTCCCCCAGCCCTGGGAGTTCTTCGCCCAGGAGGTGATGATCC GGGTGTTCGGCAAGCCCGACGGCAAGCCCGAGTTCGAGGAGGCCGACACCC TGGAGAAGCTGCGGACCCTGCTGGCCGAGAAGCTGTCCTCCCGGCCCGAGG CCGTGCACGAGTACGTGACCCCCCTGTTCGTGTCCCGGGCCCCCAACCGGA AGATGTCCGGCCAGGGCCACATGGAGACCGTGAAGTCCGCCAAGCGGCTGG ACGAGGGCGTGTCCGTGCTGCGGGTGCCCCTGACCCAGCTGAAGCTGAAGG ACCTGGAGAAGATGGTGAACCGGGAGCGGGAGCCCAAGCTGTACGAGGCCC TGAAGGCCCGGCTGGAGGCCCACAAGGACGACCCCGCCAAGGCCTTCGCCG AGCCCTTCTACAAGTACGACAAGGCCGGCAACCGGACCCAGCAGGTGAAGG CCGTGCGGGTGGAGCAGGTGCAGAAGACCGGCGTGTGGGTGCGGAACCACA ACGGCATCGCCGACAACGCCACCATGGTGCGGGTGGACGTGTTCGAGAAGG GCGACAAGTACTACCTGGTGCCCATCTACTCCTGGCAGGTGGCCAAGGGCAT CCTGCCCGACCGGGCCGTGGTGCAGGGCAAGGACGAGGAGGACTGGCAGC TGATCGACGACTCCTTCAACTTCAAGTTCTCCCTGCACCCCAACGACCTGGTG GAGGTGATCACCAAGAAGGCCCGGATGTTCGGCTACTTCGCCTCCTGCCACC GGGGCACCGGCAACATCAACATCCGGATCCACGACCTGGACCACAAGATCG GCAAGAACGGCATCCTGGAGGGCATCGGCGTGAAGACCGCCCTGTCCTTCC AGAAGTACCAGATCGACGAGCTGGGCAAGGAGATCCGGCCCTGCCGGCTGA AGAAGCGGCCCCCCGTGCGGTCCGGCAAGCGGACCGCCGACGGCTCCGAG TTCGAGTCCCCCAAGAAGAAGCGGAAGGTGGAGTGA

Descrição Sequência SEQ ID No. ORF de Nme ATGGCCGCCTTCAAGCCCAACAGCATCAACTACATCCTGGGCCTGGACATCG Cas9 usando GCATCGCCAGCGTGGGCTGGGCCATGGTGGAGATCGACGAGGAGGAGAACC códons de A/U CCATCCGGCTGATCGACCTGGGCGTGCGGGTGTTCGAGCGGGCCGAGGTGC baixo da Tabela CCAAGACCGGCGACAGCCTGGCCATGGCCCGGCGGCTGGCCCGGAGCGTG 4, com códons CGGCGGCTGACCCGGCGGCGGGCCCACCGGCTGCTGCGGACCCGGCGGCT de início e GCTGAAGCGGGAGGGCGTGCTGCAGGCCGCCAACTTCGACGAGAACGGCCT parada GATCAAGAGCCTGCCCAACACCCCCTGGCAGCTGCGGGCCGCCGCCCTGGA

CCGGAAGCTGACCCCCCTGGAGTGGAGCGCCGTGCTGCTGCACCTGATCAA GCACCGGGGCTACCTGAGCCAGCGGAAGAACGAGGGCGAGACCGCCGACAA GGAGCTGGGCGCCCTGCTGAAGGGCGTGGCCGGCAACGCCCACGCCCTGC AGACCGGCGACTTCCGGACCCCCGCCGAGCTGGCCCTGAACAAGTTCGAGA AGGAGAGCGGCCACATCCGGAACCAGCGGAGCGACTACAGCCACACCTTCA GCCGGAAGGACCTGCAGGCCGAGCTGATCCTGCTGTTCGAGAAGCAGAAGG AGTTCGGCAACCCCCACGTGAGCGGCGGCCTGAAGGAGGGCATCGAGACCC TGCTGATGACCCAGCGGCCCGCCCTGAGCGGCGACGCCGTGCAGAAGATGC TGGGCCACTGCACCTTCGAGCCCGCCGAGCCCAAGGCCGCCAAGAACACCT ACACCGCCGAGCGGTTCATCTGGCTGACCAAGCTGAACAACCTGCGGATCCT GGAGCAGGGCAGCGAGCGGCCCCTGACCGACACCGAGCGGGCCACCCTGA TGGACGAGCCCTACCGGAAGAGCAAGCTGACCTACGCCCAGGCCCGGAAGC TGCTGGGCCTGGAGGACACCGCCTTCTTCAAGGGCCTGCGGTACGGCAAGG ACAACGCCGAGGCCAGCACCCTGATGGAGATGAAGGCCTACCACGCCATCA GCCGGGCCCTGGAGAAGGAGGGCCTGAAGGACAAGAAGAGCCCCCTGAACC TGAGCCCCGAGCTGCAGGACGAGATCGGCACCGCCTTCAGCCTGTTCAAGAC CGACGAGGACATCACCGGCCGGCTGAAGGACCGGATCCAGCCCGAGATCCT GGAGGCCCTGCTGAAGCACATCAGCTTCGACAAGTTCGTGCAGATCAGCCTG AAGGCCCTGCGGCGGATCGTGCCCCTGATGGAGCAGGGCAAGCGGTACGAC GAGGCCTGCGCCGAGATCTACGGCGACCACTACGGCAAGAAGAACACCGAG GAGAAGATCTACCTGCCCCCCATCCCCGCCGACGAGATCCGGAACCCCGTG GTGCTGCGGGCCCTGAGCCAGGCCCGGAAGGTGATCAACGGCGTGGTGCG GCGGTACGGCAGCCCCGCCCGGATCCACATCGAGACCGCCCGGGAGGTGG GCAAGAGCTTCAAGGACCGGAAGGAGATCGAGAAGCGGCAGGAGGAGAACC GGAAGGACCGGGAGAAGGCCGCCGCCAAGTTCCGGGAGTACTTCCCCAACT TCGTGGGCGAGCCCAAGAGCAAGGACATCCTGAAGCTGCGGCTGTACGAGC AGCAGCACGGCAAGTGCCTGTACAGCGGCAAGGAGATCAACCTGGGCCGGC TGAACGAGAAGGGCTACGTGGAGATCGACCACGCCCTGCCCTTCAGCCGGA

CCTGGGACGACAGCTTCAACAACAAGGTGCTGGTGCTGGGCAGCGAGAACC AGAACAAGGGCAACCAGACCCCCTACGAGTACTTCAACGGCAAGGACAACAG 129

Descrição Sequência SEQ ID No.

CCGGGAGTGGCAGGAGTTCAAGGCCCGGGTGGAGACCAGCCGGTTCCCCCG GAGCAAGAAGCAGCGGATCCTGCTGCAGAAGTTCGACGAGGACGGCTTCAA GGAGCGGAACCTGAACGACACCCGGTACGTGAACCGGTTCCTGTGCCAGTTC GTGGCCGACCGGATGCGGCTGACCGGCAAGGGCAAGAAGCGGGTGTTCGCC AGCAACGGCCAGATCACCAACCTGCTGCGGGGCTTCTGGGGCCTGCGGAAG GTGCGGGCCGAGAACGACCGGCACCACGCCCTGGACGCCGTGGTGGTGGC CTGCAGCACCGTGGCCATGCAGCAGAAGATCACCCGGTTCGTGCGGTACAAG GAGATGAACGCCTTCGACGGCAAGACCATCGACAAGGAGACCGGCGAGGTG CTGCACCAGAAGACCCACTTCCCCCAGCCCTGGGAGTTCTTCGCCCAGGAGG TGATGATCCGGGTGTTCGGCAAGCCCGACGGCAAGCCCGAGTTCGAGGAGG CCGACACCCTGGAGAAGCTGCGGACCCTGCTGGCCGAGAAGCTGAGCAGCC GGCCCGAGGCCGTGCACGAGTACGTGACCCCCCTGTTCGTGAGCCGGGCCC CCAACCGGAAGATGAGCGGCCAGGGCCACATGGAGACCGTGAAGAGCGCCA AGCGGCTGGACGAGGGCGTGAGCGTGCTGCGGGTGCCCCTGACCCAGCTGA AGCTGAAGGACCTGGAGAAGATGGTGAACCGGGAGCGGGAGCCCAAGCTGT ACGAGGCCCTGAAGGCCCGGCTGGAGGCCCACAAGGACGACCCCGCCAAG GCCTTCGCCGAGCCCTTCTACAAGTACGACAAGGCCGGCAACCGGACCCAG CAGGTGAAGGCCGTGCGGGTGGAGCAGGTGCAGAAGACCGGCGTGTGGGT GCGGAACCACAACGGCATCGCCGACAACGCCACCATGGTGCGGGTGGACGT GTTCGAGAAGGGCGACAAGTACTACCTGGTGCCCATCTACAGCTGGCAGGTG GCCAAGGGCATCCTGCCCGACCGGGCCGTGGTGCAGGGCAAGGACGAGGA GGACTGGCAGCTGATCGACGACAGCTTCAACTTCAAGTTCAGCCTGCACCCC AACGACCTGGTGGAGGTGATCACCAAGAAGGCCCGGATGTTCGGCTACTTCG CCAGCTGCCACCGGGGCACCGGCAACATCAACATCCGGATCCACGACCTGG ACCACAAGATCGGCAAGAACGGCATCCTGGAGGGCATCGGCGTGAAGACCG CCCTGAGCTTCCAGAAGTACCAGATCGACGAGCTGGGCAAGGAGATCCGGC CCTGCCGGCTGAAGAAGCGGCCCCCCGTGCGGAGCGGCAAGCGGACCGCC

GACGGCAGCGAGTTCGAGAGCCCCAAGAAGAAGCGGAAGGTGGAGTGA Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS1, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT

CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG 130

Descrição Sequência SEQ ID No.

CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC

Descrição Sequência SEQ ID No.

CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA GCCTGGCAGCAAAGAGAAGCAGAACAACATAG

Descrição Sequência SEQ ID No. Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS2, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC

AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC 131

Descrição Sequência SEQ ID No.

GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC

Descrição Sequência SEQ ID No.

AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA

GCCAGGCAGCAAAGAGAAGCAGAACAACATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS3, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA

ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT 132

Descrição Sequência SEQ ID No.

TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC

Descrição Sequência SEQ ID No.

CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA

GCCCGGCACCGGCAAAGAGAGAAAGAACAACATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS4, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG

AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA 133

Descrição Sequência SEQ ID No.

GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA

Descrição Sequência SEQ ID No.

AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA

GCCAGGCAGCAAAGAGACCGAGAACAACATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS5, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC

CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA 134

Descrição Sequência SEQ ID No.

GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT

Descrição Sequência SEQ ID No.

ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA

GCAGAGCAGCAAAGAGACCGAGAACAACATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS6, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA

TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT 135

Descrição Sequência SEQ ID No.

CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA

Descrição Sequência SEQ ID No.

ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA

GCGCAGCAGCAAAGAGAAGCTGGAGCATGGCAGCATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS7, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT 136

Descrição Sequência SEQ ID No.

CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA

Descrição Sequência SEQ ID No.

GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA GCGCAGCAGCAAAGAGAGTCTGGAGCATGGCATTCTAG

Descrição Sequência SEQ ID No. Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS8, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC 137

Descrição Sequência SEQ ID No.

GCGCAGCAGCAAAGAGAAGCTGGAGCATGGCATTCTAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS9, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT 138

Descrição Sequência SEQ ID No.

GCGCAGCAGCAAAGAGAAAGTACTTCGCAGCATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS10, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA 139

Descrição Sequência SEQ ID No.

GCAGAGCAGCAAAGAGAAAGGCATTCGCAGCATAG Quadro de ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT leitura aberto GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT para Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG NLS11, com TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA códons de início GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC e parada AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT

CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA 140

Descrição Sequência SEQ ID No.

GCAGAGCAGCAAAGAGAAAGTACTTCGCAGTCTAG ORF de Cas9 CCTAAGAAAAAGCGGAAGGTCGACGGGGATAAGAAGTACTCAATCGGGCTGG usando códons ATATCGGAACTAATTCCGTGGGTTGGGCAGTGATCACGGATGAATACAAAGTG com expressão CCGTCCAAGAAGTTCAAGGTCCTGGGGAACACCGATAGACACAGCATCAAGA geralmente alta AAAATCTCATCGGAGCCCTGCTGTTTGACTCCGGCGAAACCGCAGAAGCGAC em humanos CCGGCTCAAACGTACCGCGAGGCGACGCTACACCCGGCGGAAGAATCGCAT (sem códons de CTGCTATCTGCAAGAGATCTTTTCGAACGAAATGGCAAAGGTCGACGACAGCT início ou parada; TCTTCCACCGCCTGGAAGAATCTTTCCTGGTGGAGGAGGACAAGAAGCATGA adequado para ACGGCATCCTATCTTTGGAAACATCGTCGACGAAGTGGCGTACCACGAAAAGT inclusão na ACCCGACCATCTACCATCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGC sequência de CGACCTCAGATTGATCTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGAC codificação das ACTTCCTGATCGAAGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTT proteínas de TTCATTCAACTGGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAA fusão) TGCTAGCGGCGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTC 141

Descrição Sequência SEQ ID No.

GCGGCGCCTCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAAAAGAACGG ACTTTTCGGCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGT CCAATTTTGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCTA CGACGACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGGAT CTGTTCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATATCCT GCGCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGATTAAG CGGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTCGTGAGAC AGCAACTGCCTGAAAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAATGGG TACGCAGGGTACATCGATGGAGGCGCTAGCCAGGAAGAGTTCTATAAGTTCA TCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACTGCTGGTCAAGCT GAACAGGGAGGATCTGCTCCGGAAACAGAGAACCTTTGACAACGGATCCATT CCCCACCAGATCCATCTGGGTGAGCTGCACGCCATCTTGCGGCGCCAGGAG GACTTTTACCCATTCCTCAAGGACAACCGGGAAAAGATCGAGAAAATTCTGAC GTTCCGCATCCCGTATTACGTGGGCCCACTGGCGCGCGGCAATTCGCGCTTC GCGTGGATGACTAGAAAATCAGAGGAAACCATCACTCCTTGGAATTTCGAGGA AGTTGTGGATAAGGGAGCTTCGGCACAAAGCTTCATCGAACGAATGACCAACT TCGACAAGAATCTCCCAAACGAGAAGGTGCTTCCTAAGCACAGCCTCCTTTAC GAATACTTCACTGTCTACAACGAACTGACTAAAGTGAAATACGTTACTGAAGG AATGAGGAAGCCGGCCTTTCTGTCCGGAGAACAGAAGAAAGCAATTGTCGAT CTGCTGTTCAAGACCAACCGCAAGGTGACCGTCAAGCAGCTTAAAGAGGACT ACTTCAAGAAGATCGAGTGTTTCGACTCAGTGGAAATCAGCGGGGTGGAGGA CAGATTCAACGCTTCGCTGGGAACCTATCATGATCTCCTGAAGATCATCAAGG ACAAGGACTTCCTTGACAACGAGGAGAACGAGGACATCCTGGAAGATATCGT CCTGACCTTGACCCTTTTCGAGGATCGCGAGATGATCGAGGAGAGGCTTAAG ACCTACGCTCATCTCTTCGACGATAAGGTCATGAAACAACTCAAGCGCCGCCG GTACACTGGTTGGGGCCGCCTCTCCCGCAAGCTGATCAACGGTATTCGCGAT AAACAGAGCGGTAAAACTATCCTGGATTTCCTCAAATCGGATGGCTTCGCTAA TCGTAACTTCATGCAATTGATCCACGACGACAGCCTGACCTTTAAGGAGGACA TCCAAAAAGCACAAGTGTCCGGACAGGGAGACTCACTCCATGAACACATCGC GAATCTGGCCGGTTCGCCGGCGATTAAGAAGGGAATTCTGCAAACTGTGAAG GTGGTCGACGAGCTGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATC GTGATTGAAATGGCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAAAACT CCCGCGAAAGGATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCC AGATCCTGAAAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCT CTACCTGTACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTG GACATCAATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTT TCTGAAGGATGACTCGATCGATAACAAGGTGTTGACTCGCAGCGACAAGAAC

Descrição Sequência SEQ ID No.

AGAGGGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGAAGA ATTACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGTTTGAC AATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAGGCTGGAT TCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCACGTGGCGCA GATCTTGGACTCCCGCATGAACACTAAATACGACGAGAACGATAAGCTCATCC GGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTCGGACTTTCGGAA GGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTACCATCACGCGCATG ACGCATACCTCAACGCTGTGGTCGGTACCGCCCTGATCAAAAAGTACCCTAAA CTTGAATCGGAGTTTGTGTACGGAGACTACAAGGTCTACGACGTGAGGAAGA TGATAGCCAAGTCCGAACAGGAAATCGGGAAAGCAACTGCGAAATACTTCTTT TACTCAAACATCATGAACTTTTTCAAGACTGAAATTACGCTGGCCAATGGAGAA ATCAGGAAGAGGCCACTGATCGAAACTAACGGAGAAACGGGCGAAATCGTGT GGGACAAGGGCAGGGACTTCGCAACTGTTCGCAAAGTGCTCTCTATGCCGCA AGTCAATATTGTGAAGAAAACCGAAGTGCAAACCGGCGGATTTTCAAAGGAAT CGATCCTCCCAAAGAGAAATAGCGACAAGCTCATTGCACGCAAGAAAGACTG GGACCCGAAGAAGTACGGAGGATTCGATTCGCCGACTGTCGCATACTCCGTC CTCGTGGTGGCCAAGGTGGAGAAGGGAAAGAGCAAAAAGCTCAAATCCGTCA AAGAGCTGCTGGGGATTACCATCATGGAACGATCCTCGTTCGAGAAGAACCC GATTGATTTCCTCGAGGCGAAGGGTTACAAGGAGGTGAAGAAGGATCTGATC ATCAAACTCCCCAAGTACTCACTGTTCGAACTGGAAAATGGTCGGAAGCGCAT GCTGGCTTCGGCCGGAGAACTCCAAAAAGGAAATGAGCTGGCCTTGCCTAGC AAGTACGTCAACTTCCTCTATCTTGCTTCGCACTACGAAAAACTCAAAGGGTC ACCGGAAGATAACGAACAGAAGCAGCTTTTCGTGGAGCAGCACAAGCATTAT CTGGATGAAATCATCGAACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGC CGACGCCAACCTCGACAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAG CCGATCAGAGAACAGGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCT GGGAGCCCCAGCCGCCTTCAAGTACTTCGATACTACTATCGATCGCAAAAGAT ACACGTCCACCAAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCAC

TGGACTCTACGAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGAT ORF de Cas9 GACAAGAAGTACTCTATCGGTTTGGACATCGGTACCAACTCTGTCGGTTGGGC usando códons CGTCATCACCGACGAATACAAGGTCCCATCTAAGAAGTTCAAGGTCTTGGGTA de meia-vida ACACCGACAGACACTCTATCAAGAAGAACTTGATCGGTGCCTTGTTGTTCGAC longos da TCTGGTGAAACCGCCGAAGCCACCAGATTGAAGAGAACCGCCAGAAGAAGAT Tabela 4 (sem ACACCAGAAGAAAGAACAGAATCTGCTACTTGCAAGAAATCTTCTCTAACGAA códons de início ATGGCCAAGGTCGACGACTCTTTCTTCCACAGATTGGAAGAATCTTTCTTGGT ou parada; CGAAGAAGACAAGAAGCACGAAAGACACCCAATCTTCGGTAACATCGTCGAC adequado para GAAGTCGCCTACCACGAAAAGTACCCAACCATCTACCACTTGAGAAAGAAGTT 142

Descrição Sequência SEQ ID No. inclusão na GGTCGACTCTACCGACAAGGCCGACTTGAGATTGATCTACTTGGCCTTGGCC sequência de CACATGATCAAGTTCAGAGGTCACTTCTTGATCGAAGGTGACTTGAACCCAGA codificação das CAACTCTGACGTCGACAAGTTGTTCATCCAATTGGTCCAAACCTACAACCAATT proteínas de GTTCGAAGAAAACCCAATCAACGCCTCTGGTGTCGACGCCAAGGCCATCTTG fusão) TCTGCCAGATTGTCTAAGAGCAGAAGATTGGAAAACTTGATCGCCCAATTGCC

AGGTGAAAAGAAGAACGGTTTGTTCGGTAACTTGATCGCCTTGTCTTTGGGTT TGACCCCAAACTTCAAGTCTAACTTCGACTTGGCCGAAGACGCCAAGTTGCAA TTGTCTAAGGACACCTACGACGACGACTTGGACAACTTGTTGGCCCAAATCGG TGACCAATACGCCGACTTGTTCTTGGCCGCCAAGAACTTGTCTGACGCCATCT TGTTGTCTGACATCTTGAGAGTCAACACCGAAATCACCAAGGCCCCATTGTCT GCCTCTATGATCAAGAGATACGACGAACACCACCAAGACTTGACCTTGTTGAA GGCCTTGGTCAGACAACAATTGCCAGAAAAGTACAAGGAAATCTTCTTCGACC AATCTAAGAACGGTTACGCCGGTTACATCGACGGTGGTGCCTCTCAAGAAGA ATTCTACAAGTTCATCAAGCCAATCTTGGAAAAGATGGACGGTACCGAAGAAT TGTTGGTCAAGTTGAACAGAGAAGACTTGTTGAGAAAGCAAAGAACCTTCGAC AACGGTTCTATCCCACACCAAATCCACTTGGGTGAATTGCACGCCATCTTGAG AAGACAAGAAGACTTCTACCCATTCTTGAAGGACAACAGAGAAAAGATCGAAA AGATCTTGACCTTCAGAATCCCATACTACGTCGGTCCATTGGCCAGAGGTAAC AGCAGATTCGCCTGGATGACCAGAAAGTCTGAAGAAACCATCACCCCATGGA ACTTCGAAGAAGTCGTCGACAAGGGTGCCTCTGCCCAATCTTTCATCGAAAGA ATGACCAACTTCGACAAGAACTTGCCAAACGAAAAGGTCTTGCCAAAGCACTC TTTGTTGTACGAATACTTCACCGTCTACAACGAATTGACCAAGGTCAAGTACGT CACCGAAGGTATGAGAAAGCCAGCCTTCTTGTCTGGTGAACAAAAGAAGGCC ATCGTCGACTTGTTGTTCAAGACCAACAGAAAGGTCACCGTCAAGCAATTGAA GGAAGACTACTTCAAGAAGATCGAATGCTTCGACTCTGTCGAAATCTCTGGTG TCGAAGACAGATTCAACGCCTCTTTGGGTACCTACCACGACTTGTTGAAGATC ATCAAGGACAAGGACTTCTTGGACAACGAAGAAAACGAAGACATCTTGGAAGA CATCGTCTTGACCTTGACCTTGTTCGAAGACAGAGAAATGATCGAAGAAAGAT TGAAGACCTACGCCCACTTGTTCGACGACAAGGTCATGAAGCAATTGAAGAGA AGAAGATACACCGGTTGGGGTAGATTGAGCAGAAAGTTGATCAACGGTATCA GAGACAAGCAATCTGGTAAGACCATCTTGGACTTCTTGAAGTCTGACGGTTTC GCCAACAGAAACTTCATGCAATTGATCCACGACGACTCTTTGACCTTCAAGGA AGACATCCAAAAGGCCCAAGTCTCTGGTCAAGGTGACTCTTTGCACGAACACA TCGCCAACTTGGCCGGTTCTCCAGCCATCAAGAAGGGTATCTTGCAAACCGT CAAGGTCGTCGACGAATTGGTCAAGGTCATGGGTAGACACAAGCCAGAAAAC ATCGTCATCGAAATGGCCAGAGAAAACCAAACCACCCAAAAGGGTCAAAAGAA CAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGTATCAAGGAATTGGGTTCT

Descrição Sequência SEQ ID No.

CAAATCTTGAAGGAACACCCAGTCGAAAACACCCAATTGCAAAACGAAAAGTT GTACTTGTACTACTTGCAAAACGGTAGAGACATGTACGTCGACCAAGAATTGG ACATCAACAGATTGTCTGACTACGACGTCGACCACATCGTCCCACAATCTTTC TTGAAGGACGACTCTATCGACAACAAGGTCTTGACCAGATCTGACAAGAACAG AGGTAAGTCTGACAACGTCCCATCTGAAGAAGTCGTCAAGAAGATGAAGAACT ACTGGAGACAATTGTTGAACGCCAAGTTGATCACCCAAAGAAAGTTCGACAAC TTGACCAAGGCCGAAAGAGGTGGTTTGTCTGAATTGGACAAGGCCGGTTTCA TCAAGAGACAATTGGTCGAAACCAGACAAATCACCAAGCACGTCGCCCAAATC TTGGACAGCAGAATGAACACCAAGTACGACGAAAACGACAAGTTGATCAGAG AAGTCAAGGTCATCACCTTGAAGTCTAAGTTGGTCTCTGACTTCAGAAAGGAC TTCCAATTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCCCACGACGC CTACTTGAACGCCGTCGTCGGTACCGCCTTGATCAAGAAGTACCCAAAGTTG GAATCTGAATTCGTCTACGGTGACTACAAGGTCTACGACGTCAGAAAGATGAT CGCCAAGTCTGAACAAGAAATCGGTAAGGCCACCGCCAAGTACTTCTTCTACT CTAACATCATGAACTTCTTCAAGACCGAAATCACCTTGGCCAACGGTGAAATC AGAAAGAGACCATTGATCGAAACCAACGGTGAAACCGGTGAAATCGTCTGGG ACAAGGGTAGAGACTTCGCCACCGTCAGAAAGGTCTTGTCTATGCCACAAGT CAACATCGTCAAGAAGACCGAAGTCCAAACCGGTGGTTTCTCTAAGGAATCTA TCTTGCCAAAGAGAAACTCTGACAAGTTGATCGCCAGAAAGAAGGACTGGGA CCCAAAGAAGTACGGTGGTTTCGACTCTCCAACCGTCGCCTACTCTGTCTTGG TCGTCGCCAAGGTCGAAAAGGGTAAGTCTAAGAAGTTGAAGTCTGTCAAGGA ATTGTTGGGTATCACCATCATGGAAAGATCTTCTTTCGAAAAGAACCCAATCGA CTTCTTGGAAGCCAAGGGTTACAAGGAAGTCAAGAAGGACTTGATCATCAAGT TGCCAAAGTACTCTTTGTTCGAATTGGAAAACGGTAGAAAGAGAATGTTGGCC TCTGCCGGTGAATTGCAAAAGGGTAACGAATTGGCCTTGCCATCTAAGTACGT CAACTTCTTGTACTTGGCCTCTCACTACGAAAAGTTGAAGGGTTCTCCAGAAG ACAACGAACAAAAGCAATTGTTCGTCGAACAACACAAGCACTACTTGGACGAA ATCATCGAACAAATCTCTGAATTCTCTAAGAGAGTCATCTTGGCCGACGCCAA CTTGGACAAGGTCTTGTCTGCCTACAACAAGCACAGAGACAAGCCAATCAGA GAACAAGCCGAAAACATCATCCACTTGTTCACCTTGACCAACTTGGGTGCCCC AGCCGCCTTCAAGTACTTCGACACCACCATCGACAGAAAGAGATACACCTCTA CCAAGGAAGTCTTGGACGCCACCTTGATCCACCAATCTATCACCGGTTTGTAC GAAACCAGAATCGACTTGTCTCAATTGGGTGGTGACGGTGGTGGTTCTCCAAA GAAGAAGAGAAAGGTC

Descrição Sequência SEQ ID No. ORF de Cas9 GATAAAAAATATTCTATTGGTTTAGATATTGGTACTAATTCTGTTGGTTGGGCT usando códons GTTATTACTGATGAATATAAAGTTCCTTCTAAAAAATTTAAAGTTTTAGGTAATA ricos em U da CTGATCGTCATTCTATTAAAAAAAATTTAATTGGTGCTTTATTATTTGATTCTGG Tabela 4 (sem TGAAACTGCTGAAGCTACTCGTTTAAAACGTACTGCTCGTCGTCGTTATACTC códons de início GTCGTAAAAATCGTATTTGTTATTTACAAGAAATTTTTTCTAATGAAATGGCTAA ou parada; AGTTGATGATTCTTTTTTTCATCGTTTAGAAGAATCTTTTTTAGTTGAAGAAGAT adequado para AAAAAACATGAACGTCATCCTATTTTTGGTAATATTGTTGATGAAGTTGCTTATC inclusão na ATGAAAAATATCCTACTATTTATCATTTACGTAAAAAATTAGTTGATTCTACTGA sequência de TAAAGCTGATTTACGTTTAATTTATTTAGCTTTAGCTCATATGATTAAATTTCGT codificação das GGTCATTTTTTAATTGAAGGTGATTTAAATCCTGATAATTCTGATGTTGATAAAT proteínas de TATTTATTCAATTAGTTCAAACTTATAATCAATTATTTGAAGAAAATCCTATTAAT fusão) GCTTCTGGTGTTGATGCTAAAGCTATTTTATCTGCTCGTTTATCTAAATCTCGT

CGTTTAGAAAATTTAATTGCTCAATTACCTGGTGAAAAAAAAAATGGTTTATTTG GTAATTTAATTGCTTTATCTTTAGGTTTAACTCCTAATTTTAAATCTAATTTTGAT TTAGCTGAAGATGCTAAATTACAATTATCTAAAGATACTTATGATGATGATTTAG ATAATTTATTAGCTCAAATTGGTGATCAATATGCTGATTTATTTTTAGCTGCTAA AAATTTATCTGATGCTATTTTATTATCTGATATTTTACGTGTTAATACTGAAATTA CTAAAGCTCCTTTATCTGCTTCTATGATTAAACGTTATGATGAACATCATCAAG ATTTAACTTTATTAAAAGCTTTAGTTCGTCAACAATTACCTGAAAAATATAAAGA AATTTTTTTTGATCAATCTAAAAATGGTTATGCTGGTTATATTGATGGTGGTGCT TCTCAAGAAGAATTTTATAAATTTATTAAACCTATTTTAGAAAAAATGGATGGTA CTGAAGAATTATTAGTTAAATTAAATCGTGAAGATTTATTACGTAAACAACGTAC TTTTGATAATGGTTCTATTCCTCATCAAATTCATTTAGGTGAATTACATGCTATT TTACGTCGTCAAGAAGATTTTTATCCTTTTTTAAAAGATAATCGTGAAAAAATTG AAAAAATTTTAACTTTTCGTATTCCTTATTATGTTGGTCCTTTAGCTCGTGGTAA TTCTCGTTTTGCTTGGATGACTCGTAAATCTGAAGAAACTATTACTCCTTGGAA TTTTGAAGAAGTTGTTGATAAAGGTGCTTCTGCTCAATCTTTTATTGAACGTAT GACTAATTTTGATAAAAATTTACCTAATGAAAAAGTTTTACCTAAACATTCTTTA TTATATGAATATTTTACTGTTTATAATGAATTAACTAAAGTTAAATATGTTACTGA AGGTATGCGTAAACCTGCTTTTTTATCTGGTGAACAAAAAAAAGCTATTGTTGA TTTATTATTTAAAACTAATCGTAAAGTTACTGTTAAACAATTAAAAGAAGATTATT TTAAAAAAATTGAATGTTTTGATTCTGTTGAAATTTCTGGTGTTGAAGATCGTTT TAATGCTTCTTTAGGTACTTATCATGATTTATTAAAAATTATTAAAGATAAAGATT TTTTAGATAATGAAGAAAATGAAGATATTTTAGAAGATATTGTTTTAACTTTAAC TTTATTTGAAGATCGTGAAATGATTGAAGAACGTTTAAAAACTTATGCTCATTTA

TTTGATGATAAAGTTATGAAACAATTAAAACGTCGTCGTTATACTGGTTGGGGT CGTTTATCTCGTAAATTAATTAATGGTATTCGTGATAAACAATCTGGTAAAACTA 143

Descrição Sequência SEQ ID No.

TTTTAGATTTTTTAAAATCTGATGGTTTTGCTAATCGTAATTTTATGCAATTAATT CATGATGATTCTTTAACTTTTAAAGAAGATATTCAAAAAGCTCAAGTTTCTGGTC AAGGTGATTCTTTACATGAACATATTGCTAATTTAGCTGGTTCTCCTGCTATTA AAAAAGGTATTTTACAAACTGTTAAAGTTGTTGATGAATTAGTTAAAGTTATGG GTCGTCATAAACCTGAAAATATTGTTATTGAAATGGCTCGTGAAAATCAAACTA CTCAAAAAGGTCAAAAAAATTCTCGTGAACGTATGAAACGTATTGAAGAAGGT ATTAAAGAATTAGGTTCTCAAATTTTAAAAGAACATCCTGTTGAAAATACTCAAT TACAAAATGAAAAATTATATTTATATTATTTACAAAATGGTCGTGATATGTATGT TGATCAAGAATTAGATATTAATCGTTTATCTGATTATGATGTTGATCATATTGTT CCTCAATCTTTTTTAAAAGATGATTCTATTGATAATAAAGTTTTAACTCGTTCTG ATAAAAATCGTGGTAAATCTGATAATGTTCCTTCTGAAGAAGTTGTTAAAAAAA TGAAAAATTATTGGCGTCAATTATTAAATGCTAAATTAATTACTCAACGTAAATT TGATAATTTAACTAAAGCTGAACGTGGTGGTTTATCTGAATTAGATAAAGCTGG TTTTATTAAACGTCAATTAGTTGAAACTCGTCAAATTACTAAACATGTTGCTCAA ATTTTAGATTCTCGTATGAATACTAAATATGATGAAAATGATAAATTAATTCGTG AAGTTAAAGTTATTACTTTAAAATCTAAATTAGTTTCTGATTTTCGTAAAGATTTT CAATTTTATAAAGTTCGTGAAATTAATAATTATCATCATGCTCATGATGCTTATT TAAATGCTGTTGTTGGTACTGCTTTAATTAAAAAATATCCTAAATTAGAATCTGA ATTTGTTTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAATCT GAACAAGAAATTGGTAAAGCTACTGCTAAATATTTTTTTTATTCTAATATTATGA ATTTTTTTAAAACTGAAATTACTTTAGCTAATGGTGAAATTCGTAAACGTCCTTT AATTGAAACTAATGGTGAAACTGGTGAAATTGTTTGGGATAAAGGTCGTGATTT TGCTACTGTTCGTAAAGTTTTATCTATGCCTCAAGTTAATATTGTTAAAAAAACT GAAGTTCAAACTGGTGGTTTTTCTAAAGAATCTATTTTACCTAAACGTAATTCT GATAAATTAATTGCTCGTAAAAAAGATTGGGATCCTAAAAAATATGGTGGTTTT GATTCTCCTACTGTTGCTTATTCTGTTTTAGTTGTTGCTAAAGTTGAAAAAGGT AAATCTAAAAAATTAAAATCTGTTAAAGAATTATTAGGTATTACTATTATGGAAC GTTCTTCTTTTGAAAAAAATCCTATTGATTTTTTAGAAGCTAAAGGTTATAAAGA AGTTAAAAAAGATTTAATTATTAAATTACCTAAATATTCTTTATTTGAATTAGAAA ATGGTCGTAAACGTATGTTAGCTTCTGCTGGTGAATTACAAAAAGGTAATGAAT TAGCTTTACCTTCTAAATATGTTAATTTTTTATATTTAGCTTCTCATTATGAAAAA TTAAAAGGTTCTCCTGAAGATAATGAACAAAAACAATTATTTGTTGAACAACAT AAACATTATTTAGATGAAATTATTGAACAAATTTCTGAATTTTCTAAACGTGTTA TTTTAGCTGATGCTAATTTAGATAAAGTTTTATCTGCTTATAATAAACATCGTGA TAAACCTATTCGTGAACAAGCTGAAAATATTATTCATTTATTTACTTTAACTAAT TTAGGTGCTCCTGCTGCTTTTAAATATTTTGATACTACTATTGATCGTAAACGTT ATACTTCTACTAAAGAAGTTTTAGATGCTACTTTAATTCATCAATCTATTACTGG

Descrição Sequência SEQ ID No.

TTTATATGAAACTCGTATTGATTTATCTCAATTAGGTGGTGATGGTGGTGGTTC

TCCTAAAAAAAAACGTAAAGTT ORF de Cas9 GACAAAAAATACTCCATCGGCCTCGACATCGGCACCAACTCCGTCGGCTGGG usando códons CCGTCATCACCGACGAATACAAAGTCCCCTCCAAAAAATTCAAAGTCCTCGGC de G baixo da AACACCGACAGACACTCCATCAAAAAAAACCTCATCGGCGCCCTCCTCTTCGA Tabela 4 (sem CTCCGGCGAAACCGCCGAAGCCACCAGACTCAAAAGAACCGCCAGAAGAAGA códons de início TACACCAGAAGAAAAAACAGAATCTGCTACCTCCAAGAAATCTTCTCCAACGA ou parada; AATGGCCAAAGTCGACGACTCCTTCTTCCACAGACTCGAAGAATCCTTCCTCG adequado para TCGAAGAAGACAAAAAACACGAAAGACACCCCATCTTCGGCAACATCGTCGAC inclusão na GAAGTCGCCTACCACGAAAAATACCCCACCATCTACCACCTCAGAAAAAAACT sequência de CGTCGACTCCACCGACAAAGCCGACCTCAGACTCATCTACCTCGCCCTCGCC codificação das CACATGATCAAATTCAGAGGCCACTTCCTCATCGAAGGCGACCTCAACCCCGA proteínas de CAACTCCGACGTCGACAAACTCTTCATCCAACTCGTCCAAACCTACAACCAAC fusão) TCTTCGAAGAAAACCCCATCAACGCCTCCGGCGTCGACGCCAAAGCCATCCT

CTCCGCCAGACTCTCCAAATCCAGAAGACTCGAAAACCTCATCGCCCAACTCC CCGGCGAAAAAAAAAACGGCCTCTTCGGCAACCTCATCGCCCTCTCCCTCGG CCTCACCCCCAACTTCAAATCCAACTTCGACCTCGCCGAAGACGCCAAACTCC AACTCTCCAAAGACACCTACGACGACGACCTCGACAACCTCCTCGCCCAAATC GGCGACCAATACGCCGACCTCTTCCTCGCCGCCAAAAACCTCTCCGACGCCA TCCTCCTCTCCGACATCCTCAGAGTCAACACCGAAATCACCAAAGCCCCCCTC TCCGCCTCCATGATCAAAAGATACGACGAACACCACCAAGACCTCACCCTCCT CAAAGCCCTCGTCAGACAACAACTCCCCGAAAAATACAAAGAAATCTTCTTCG ACCAATCCAAAAACGGCTACGCCGGCTACATCGACGGCGGCGCCTCCCAAGA AGAATTCTACAAATTCATCAAACCCATCCTCGAAAAAATGGACGGCACCGAAG AACTCCTCGTCAAACTCAACAGAGAAGACCTCCTCAGAAAACAAAGAACCTTC GACAACGGCTCCATCCCCCACCAAATCCACCTCGGCGAACTCCACGCCATCC TCAGAAGACAAGAAGACTTCTACCCCTTCCTCAAAGACAACAGAGAAAAAATC GAAAAAATCCTCACCTTCAGAATCCCCTACTACGTCGGCCCCCTCGCCAGAG GCAACTCCAGATTCGCCTGGATGACCAGAAAATCCGAAGAAACCATCACCCC CTGGAACTTCGAAGAAGTCGTCGACAAAGGCGCCTCCGCCCAATCCTTCATC GAAAGAATGACCAACTTCGACAAAAACCTCCCCAACGAAAAAGTCCTCCCCAA ACACTCCCTCCTCTACGAATACTTCACCGTCTACAACGAACTCACCAAAGTCA

AATACGTCACCGAAGGCATGAGAAAACCCGCCTTCCTCTCCGGCGAACAAAA AAAAGCCATCGTCGACCTCCTCTTCAAAACCAACAGAAAAGTCACCGTCAAAC 144

Descrição Sequência SEQ ID No.

AACTCAAAGAAGACTACTTCAAAAAAATCGAATGCTTCGACTCCGTCGAAATCT CCGGCGTCGAAGACAGATTCAACGCCTCCCTCGGCACCTACCACGACCTCCT CAAAATCATCAAAGACAAAGACTTCCTCGACAACGAAGAAAACGAAGACATCC TCGAAGACATCGTCCTCACCCTCACCCTCTTCGAAGACAGAGAAATGATCGAA GAAAGACTCAAAACCTACGCCCACCTCTTCGACGACAAAGTCATGAAACAACT CAAAAGAAGAAGATACACCGGCTGGGGCAGACTCTCCAGAAAACTCATCAAC GGCATCAGAGACAAACAATCCGGCAAAACCATCCTCGACTTCCTCAAATCCGA CGGCTTCGCCAACAGAAACTTCATGCAACTCATCCACGACGACTCCCTCACCT TCAAAGAAGACATCCAAAAAGCCCAAGTCTCCGGCCAAGGCGACTCCCTCCA CGAACACATCGCCAACCTCGCCGGCTCCCCCGCCATCAAAAAAGGCATCCTC CAAACCGTCAAAGTCGTCGACGAACTCGTCAAAGTCATGGGCAGACACAAAC CCGAAAACATCGTCATCGAAATGGCCAGAGAAAACCAAACCACCCAAAAAGG CCAAAAAAACTCCAGAGAAAGAATGAAAAGAATCGAAGAAGGCATCAAAGAAC TCGGCTCCCAAATCCTCAAAGAACACCCCGTCGAAAACACCCAACTCCAAAAC GAAAAACTCTACCTCTACTACCTCCAAAACGGCAGAGACATGTACGTCGACCA AGAACTCGACATCAACAGACTCTCCGACTACGACGTCGACCACATCGTCCCC CAATCCTTCCTCAAAGACGACTCCATCGACAACAAAGTCCTCACCAGATCCGA CAAAAACAGAGGCAAATCCGACAACGTCCCCTCCGAAGAAGTCGTCAAAAAAA TGAAAAACTACTGGAGACAACTCCTCAACGCCAAACTCATCACCCAAAGAAAA TTCGACAACCTCACCAAAGCCGAAAGAGGCGGCCTCTCCGAACTCGACAAAG CCGGCTTCATCAAAAGACAACTCGTCGAAACCAGACAAATCACCAAACACGTC GCCCAAATCCTCGACTCCAGAATGAACACCAAATACGACGAAAACGACAAACT CATCAGAGAAGTCAAAGTCATCACCCTCAAATCCAAACTCGTCTCCGACTTCA GAAAAGACTTCCAATTCTACAAAGTCAGAGAAATCAACAACTACCACCACGCC CACGACGCCTACCTCAACGCCGTCGTCGGCACCGCCCTCATCAAAAAATACC CCAAACTCGAATCCGAATTCGTCTACGGCGACTACAAAGTCTACGACGTCAGA AAAATGATCGCCAAATCCGAACAAGAAATCGGCAAAGCCACCGCCAAATACTT CTTCTACTCCAACATCATGAACTTCTTCAAAACCGAAATCACCCTCGCCAACG GCGAAATCAGAAAAAGACCCCTCATCGAAACCAACGGCGAAACCGGCGAAAT CGTCTGGGACAAAGGCAGAGACTTCGCCACCGTCAGAAAAGTCCTCTCCATG CCCCAAGTCAACATCGTCAAAAAAACCGAAGTCCAAACCGGCGGCTTCTCCAA AGAATCCATCCTCCCCAAAAGAAACTCCGACAAACTCATCGCCAGAAAAAAAG ACTGGGACCCCAAAAAATACGGCGGCTTCGACTCCCCCACCGTCGCCTACTC CGTCCTCGTCGTCGCCAAAGTCGAAAAAGGCAAATCCAAAAAACTCAAATCCG TCAAAGAACTCCTCGGCATCACCATCATGGAAAGATCCTCCTTCGAAAAAAAC CCCATCGACTTCCTCGAAGCCAAAGGCTACAAAGAAGTCAAAAAAGACCTCAT CATCAAACTCCCCAAATACTCCCTCTTCGAACTCGAAAACGGCAGAAAAAGAA

Descrição Sequência SEQ ID No.

TGCTCGCCTCCGCCGGCGAACTCCAAAAAGGCAACGAACTCGCCCTCCCCTC CAAATACGTCAACTTCCTCTACCTCGCCTCCCACTACGAAAAACTCAAAGGCT CCCCCGAAGACAACGAACAAAAACAACTCTTCGTCGAACAACACAAACACTAC CTCGACGAAATCATCGAACAAATCTCCGAATTCTCCAAAAGAGTCATCCTCGC CGACGCCAACCTCGACAAAGTCCTCTCCGCCTACAACAAACACAGAGACAAA CCCATCAGAGAACAAGCCGAAAACATCATCCACCTCTTCACCCTCACCAACCT CGGCGCCCCCGCCGCCTTCAAATACTTCGACACCACCATCGACAGAAAAAGA TACACCTCCACCAAAGAAGTCCTCGACGCCACCCTCATCCACCAATCCATCAC CGGCCTCTACGAAACCAGAATCGACCTCTCCCAACTCGGCGGCGACGGCGG

CGGCTCCCCCAAAAAAAAAAGAAAAGTC ORF de Cas9 GATAAGAAGTATAGTATTGGATTGGATATTGGAACAAATAGTGTGGGATGGGC usando códons TGTGATTACAGATGAGTATAAGGTGCCTAGTAAGAAGTTTAAGGTGTTGGGAA de C baixo da ATACAGATAGACATAGTATTAAGAAGAATTTGATTGGAGCTTTGTTGTTTGATA Tabela 4 (sem GTGGAGAGACAGCTGAGGCTACAAGATTGAAGAGAACAGCTAGAAGAAGATA códons de início TACAAGAAGAAAGAATAGAATTTGTTATTTGCAGGAGATTTTTAGTAATGAGAT ou parada; GGCTAAGGTGGATGATAGTTTTTTTCATAGATTGGAGGAGAGTTTTTTGGTGG adequado para AGGAGGATAAGAAGCATGAGAGACATCCTATTTTTGGAAATATTGTGGATGAG inclusão na GTGGCTTATCATGAGAAGTATCCTACAATTTATCATTTGAGAAAGAAGTTGGTG sequência de GATAGTACAGATAAGGCTGATTTGAGATTGATTTATTTGGCTTTGGCTCATATG codificação das ATTAAGTTTAGAGGACATTTTTTGATTGAGGGAGATTTGAATCCTGATAATAGT proteínas de GATGTGGATAAGTTGTTTATTCAGTTGGTGCAGACATATAATCAGTTGTTTGAG fusão) GAGAATCCTATTAATGCTAGTGGAGTGGATGCTAAGGCTATTTTGAGTGCTAG

ATTGAGTAAGAGTAGAAGATTGGAGAATTTGATTGCTCAGTTGCCTGGAGAGA AGAAGAATGGATTGTTTGGAAATTTGATTGCTTTGAGTTTGGGATTGACACCTA ATTTTAAGAGTAATTTTGATTTGGCTGAGGATGCTAAGTTGCAGTTGAGTAAGG ATACATATGATGATGATTTGGATAATTTGTTGGCTCAGATTGGAGATCAGTATG CTGATTTGTTTTTGGCTGCTAAGAATTTGAGTGATGCTATTTTGTTGAGTGATA TTTTGAGAGTGAATACAGAGATTACAAAGGCTCCTTTGAGTGCTAGTATGATTA AGAGATATGATGAGCATCATCAGGATTTGACATTGTTGAAGGCTTTGGTGAGA CAGCAGTTGCCTGAGAAGTATAAGGAGATTTTTTTTGATCAGAGTAAGAATGG ATATGCTGGATATATTGATGGAGGAGCTAGTCAGGAGGAGTTTTATAAGTTTAT TAAGCCTATTTTGGAGAAGATGGATGGAACAGAGGAGTTGTTGGTGAAGTTGA ATAGAGAGGATTTGTTGAGAAAGCAGAGAACATTTGATAATGGAAGTATTCCT CATCAGATTCATTTGGGAGAGTTGCATGCTATTTTGAGAAGACAGGAGGATTT TTATCCTTTTTTGAAGGATAATAGAGAGAAGATTGAGAAGATTTTGACATTTAG

AATTCCTTATTATGTGGGACCTTTGGCTAGAGGAAATAGTAGATTTGCTTGGAT GACAAGAAAGAGTGAGGAGACAATTACACCTTGGAATTTTGAGGAGGTGGTG 145

Descrição Sequência SEQ ID No.

GATAAGGGAGCTAGTGCTCAGAGTTTTATTGAGAGAATGACAAATTTTGATAA GAATTTGCCTAATGAGAAGGTGTTGCCTAAGCATAGTTTGTTGTATGAGTATTT TACAGTGTATAATGAGTTGACAAAGGTGAAGTATGTGACAGAGGGAATGAGAA AGCCTGCTTTTTTGAGTGGAGAGCAGAAGAAGGCTATTGTGGATTTGTTGTTT AAGACAAATAGAAAGGTGACAGTGAAGCAGTTGAAGGAGGATTATTTTAAGAA GATTGAGTGTTTTGATAGTGTGGAGATTAGTGGAGTGGAGGATAGATTTAATG CTAGTTTGGGAACATATCATGATTTGTTGAAGATTATTAAGGATAAGGATTTTTT GGATAATGAGGAGAATGAGGATATTTTGGAGGATATTGTGTTGACATTGACAT TGTTTGAGGATAGAGAGATGATTGAGGAGAGATTGAAGACATATGCTCATTTG TTTGATGATAAGGTGATGAAGCAGTTGAAGAGAAGAAGATATACAGGATGGGG AAGATTGAGTAGAAAGTTGATTAATGGAATTAGAGATAAGCAGAGTGGAAAGA CAATTTTGGATTTTTTGAAGAGTGATGGATTTGCTAATAGAAATTTTATGCAGTT GATTCATGATGATAGTTTGACATTTAAGGAGGATATTCAGAAGGCTCAGGTGA GTGGACAGGGAGATAGTTTGCATGAGCATATTGCTAATTTGGCTGGAAGTCCT GCTATTAAGAAGGGAATTTTGCAGACAGTGAAGGTGGTGGATGAGTTGGTGA AGGTGATGGGAAGACATAAGCCTGAGAATATTGTGATTGAGATGGCTAGAGA GAATCAGACAACACAGAAGGGACAGAAGAATAGTAGAGAGAGAATGAAGAGA ATTGAGGAGGGAATTAAGGAGTTGGGAAGTCAGATTTTGAAGGAGCATCCTGT GGAGAATACACAGTTGCAGAATGAGAAGTTGTATTTGTATTATTTGCAGAATG GAAGAGATATGTATGTGGATCAGGAGTTGGATATTAATAGATTGAGTGATTAT GATGTGGATCATATTGTGCCTCAGAGTTTTTTGAAGGATGATAGTATTGATAAT AAGGTGTTGACAAGAAGTGATAAGAATAGAGGAAAGAGTGATAATGTGCCTAG TGAGGAGGTGGTGAAGAAGATGAAGAATTATTGGAGACAGTTGTTGAATGCTA AGTTGATTACACAGAGAAAGTTTGATAATTTGACAAAGGCTGAGAGAGGAGGA TTGAGTGAGTTGGATAAGGCTGGATTTATTAAGAGACAGTTGGTGGAGACAAG ACAGATTACAAAGCATGTGGCTCAGATTTTGGATAGTAGAATGAATACAAAGTA TGATGAGAATGATAAGTTGATTAGAGAGGTGAAGGTGATTACATTGAAGAGTA AGTTGGTGAGTGATTTTAGAAAGGATTTTCAGTTTTATAAGGTGAGAGAGATTA ATAATTATCATCATGCTCATGATGCTTATTTGAATGCTGTGGTGGGAACAGCTT TGATTAAGAAGTATCCTAAGTTGGAGAGTGAGTTTGTGTATGGAGATTATAAG GTGTATGATGTGAGAAAGATGATTGCTAAGAGTGAGCAGGAGATTGGAAAGG CTACAGCTAAGTATTTTTTTTATAGTAATATTATGAATTTTTTTAAGACAGAGATT ACATTGGCTAATGGAGAGATTAGAAAGAGACCTTTGATTGAGACAAATGGAGA GACAGGAGAGATTGTGTGGGATAAGGGAAGAGATTTTGCTACAGTGAGAAAG GTGTTGAGTATGCCTCAGGTGAATATTGTGAAGAAGACAGAGGTGCAGACAG GAGGATTTAGTAAGGAGAGTATTTTGCCTAAGAGAAATAGTGATAAGTTGATT GCTAGAAAGAAGGATTGGGATCCTAAGAAGTATGGAGGATTTGATAGTCCTAC

Descrição Sequência SEQ ID No.

AGTGGCTTATAGTGTGTTGGTGGTGGCTAAGGTGGAGAAGGGAAAGAGTAAG AAGTTGAAGAGTGTGAAGGAGTTGTTGGGAATTACAATTATGGAGAGAAGTAG TTTTGAGAAGAATCCTATTGATTTTTTGGAGGCTAAGGGATATAAGGAGGTGA AGAAGGATTTGATTATTAAGTTGCCTAAGTATAGTTTGTTTGAGTTGGAGAATG GAAGAAAGAGAATGTTGGCTAGTGCTGGAGAGTTGCAGAAGGGAAATGAGTT GGCTTTGCCTAGTAAGTATGTGAATTTTTTGTATTTGGCTAGTCATTATGAGAA GTTGAAGGGAAGTCCTGAGGATAATGAGCAGAAGCAGTTGTTTGTGGAGCAG CATAAGCATTATTTGGATGAGATTATTGAGCAGATTAGTGAGTTTAGTAAGAGA GTGATTTTGGCTGATGCTAATTTGGATAAGGTGTTGAGTGCTTATAATAAGCAT AGAGATAAGCCTATTAGAGAGCAGGCTGAGAATATTATTCATTTGTTTACATTG ACAAATTTGGGAGCTCCTGCTGCTTTTAAGTATTTTGATACAACAATTGATAGA AAGAGATATACAAGTACAAAGGAGGTGTTGGATGCTACATTGATTCATCAGAG TATTACAGGATTGTATGAGACAAGAATTGATTTGAGTCAGTTGGGAGGAGATG

GAGGAGGAAGTCCTAAGAAGAAGAGAAAGGTG ORF de Cas9 GACAAGAAGTACTCCATCGGCCTGGACATCGGCACCAACTCCGTGGGCTGGG usando códons CCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGGG de A baixo da CAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTTC Tabela 4 (sem GACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGCG códons de início GCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTCC ou parada; AACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCCT adequado para TCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACAT inclusão na CGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCGG sequência de AAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTGG codificação da CCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCT proteína de GAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACC fusão) TACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCCA

AGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTGA TCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATCG CCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCGA GGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT

CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC 146

Descrição Sequência SEQ ID No.

CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCGTGCCCC AGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCGA CAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGAA GATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCGG AAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGAC AAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAAG CACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAACG ACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGTC CGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTAC CACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGATC AAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTGT ACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCCA

Descrição Sequência SEQ ID No.

CCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATCA CCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGCG AGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGGA AGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGAC CGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCTG ATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTCC CCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAAG TCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAGC GGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACAA GGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGAG CTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAAG GGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCCT CCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAGC TGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCTC CGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT CGACCTGTCCCAGCTGGGCGGCGACGGCGGCGGCTCCCCCAAGAAGAAGC

GGAAGGTG ORF de Cas9 GACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG de A/U baixo da GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4 (sem CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC códons de início GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA ou parada; GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA adequado para GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA inclusão na ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT sequência de GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA codificação das CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC proteínas de GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC fusão) AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA

CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT

GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG 147

Descrição Sequência SEQ ID No.

GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA

Descrição Sequência SEQ ID No.

AGCCCCAAGAAGAAGCGGAAGGTG ORF de Cas9 GACAAGAAGTACTCCATCGGCCTGGACATCGGCACCAACTCCGTGGGCTGGG usando códons CCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGGG de A baixo da CAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTTC Tabela 4, com GACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGCG duas sequências GCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTCC NLS C-terminais AACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCCT (sem códons de TCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACAT início ou parada; CGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCGG adequado para AAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTGG 148

Descrição Sequência SEQ ID No. inclusão na CCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCT sequência de GAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACC codificação da TACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCCA proteína de AGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTGA fusão) TCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATCG

CCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCGA GGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG

Descrição Sequência SEQ ID No.

CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCGTGCCCC AGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCGA CAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGAA GATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCGG AAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGAC AAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAAG CACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAACG ACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGTC CGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTAC CACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGATC AAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTGT ACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCCA CCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATCA CCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGCG AGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGGA AGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGAC CGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCTG ATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTCC CCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAAG TCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAGC GGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACAA GGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGAG CTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAAG GGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCCT CCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAGC TGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCTC CGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT CGACCTGTCCCAGCTGGGCGGCGACGGCTCCGGCTCCCCCAAGAAGAAGCG GAAGGTGGACGGCTCCCCCAAGAAGAAGCGGAAGGTGGACTCCGGC

Descrição Sequência SEQ ID No. ORF de Cas9 GACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGG de A baixo da GCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4, com CGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC duas sequências GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTC NLS C-terminais CAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCC (sem códons de TTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACA início ou parada; TCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCG adequado para GAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTG inclusão na GCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC sequência de TGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC codificação da CTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCC proteína de AAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTG fusão) ATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATC

GCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCG AGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA

GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC 149

Descrição Sequência SEQ ID No.

TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCGTGCCCC AGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCGA CAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGAA GATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCGG AAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGAC AAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAAG CACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAACG ACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGTC CGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTAC CACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGATC AAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTGT ACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCCA CCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATCA CCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGCG AGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGGA AGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGAC CGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCTG ATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTCC CCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAAG TCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAGC GGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACAA GGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGAG CTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAAG GGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCCT CCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAGC TGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCTC

Descrição Sequência SEQ ID No.

CGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT CGACCTGTCCCAGCTGGGCGGCGACGGCGGCGGCTCCCCCAAGAAGAAGC

GGAAGGTG ORF de Cas9 GACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCTGG nickase usando GCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGG códons de A GCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT baixo da Tabela CGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC 4 (sem NLS e GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTC sem códons de CAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCC início ou parada; TTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACA adequado para TCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCG inclusão na GAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTG sequência de GCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC codificação da TGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC proteína de CTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCC fusão) AAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTG

ATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATC GCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCG AGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA

CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT 150

Descrição Sequência SEQ ID No.

TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCGTGCCCC AGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCGA CAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGAA GATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCGG AAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGAC AAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAAG CACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAACG ACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGTC CGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTAC CACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGATC AAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTGT ACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCCA CCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATCA CCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGCG AGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGGA AGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGAC CGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCTG ATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTCC CCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAAG

Descrição Sequência SEQ ID No.

TCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAGC GGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACAA GGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGAG CTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAAG GGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCCT CCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAGC TGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCTC CGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT

CGACCTGTCCCAGCTGGGCGGCGAC ORF de Cas9 GACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCTGG nickase usando GCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGG códons de A GCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT baixo da Tabela CGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC 4, com duas GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTC sequências NLS CAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCC C-terminais TTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACA (sem códons de TCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCG início ou parada; GAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTG adequado para GCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC inclusão na TGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC sequência de CTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCC codificação da AAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTG proteína de ATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATC fusão) GCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCG

AGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG

GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC 151

Descrição Sequência SEQ ID No.

ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACCACATCGTGCCCC AGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCGA CAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGAA GATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCGG AAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGAC AAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAAG CACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAACG ACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGTC CGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTAC CACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGATC AAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTGT ACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCCA CCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATCA

Descrição Sequência SEQ ID No.

CCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGCG AGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGGA AGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGAC CGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCTG ATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTCC CCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAAG TCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAGC GGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACAA GGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGAG CTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAAG GGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCCT CCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAGC TGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCTC CGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT CGACCTGTCCCAGCTGGGCGGCGACGGCTCCGGCTCCCCCAAGAAGAAGCG

GAAGGTGGACGGCTCCCCCAAGAAGAAGCGGAAGGTGGACTCCGGC ORF de dCas9 GACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGG de A baixo da GCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4 (sem CGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC códons de início GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTC ou parada; CAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCC adequado para TTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACA inclusão na TCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCG sequência de GAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTG codificação das GCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC proteínas de TGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC fusão) CTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCC

AAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTG ATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATC GCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCG

AGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA 152

Descrição Sequência SEQ ID No.

GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACGCCATCGTGCCC CAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCG ACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGA AGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCG GAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGA CAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAA

Descrição Sequência SEQ ID No.

GCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAAC GACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGT CCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTA CCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGAT CAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTG TACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCC ACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATC ACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGC GAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGG AAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGA CCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCT GATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTC CCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAA GTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAG CGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACA AGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGA GCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAA GGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCC TCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAG CTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCT CCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT CGACCTGTCCCAGCTGGGCGGCGACGGCGGCGGCTCCCCCAAGAAGAAGC

GGAAGGTG ORF de dCas9 GACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGG de A baixo da GCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4 (sem CGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC NLS e sem GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTC códons de início CAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCC ou parada; TTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACA adequado para TCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCG inclusão na GAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTG sequência de GCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC 153

Descrição Sequência SEQ ID No. codificação da TGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC proteína de CTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCC fusão) AAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTG

ATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATC GCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCG AGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA

Descrição Sequência SEQ ID No.

GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACGCCATCGTGCCC CAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCG ACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGA AGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCG GAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGA CAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAA GCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAAC GACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGT CCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTA CCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGAT CAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTG TACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCC ACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATC ACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGC GAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGG AAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGA CCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCT GATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTC CCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAA GTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAG CGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACA AGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGA GCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAA GGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCC TCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAG CTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCT CCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT

CGACCTGTCCCAGCTGGGCGGCGAC ORF de dCas9 GACAAGAAGTACTCCATCGGCCTGGCCATCGGCACCAACTCCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCTCCAAGAAGTTCAAGGTGCTGG de A baixo da GCAACACCGACCGGCACTCCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4, com CGACTCCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC 154

Descrição Sequência SEQ ID No. duas sequências GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCTC NLS C-terminais CAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGGCTGGAGGAGTCC (sem códons de TTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACA início ou parada; TCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGCG adequado para GAAGAAGCTGGTGGACTCCACCGACAAGGCCGACCTGCGGCTGATCTACCTG inclusão na GCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACC sequência de TGAACCCCGACAACTCCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGAC codificação da CTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCTCCGGCGTGGACGCC proteína de AAGGCCATCCTGTCCGCCCGGCTGTCCAAGTCCCGGCGGCTGGAGAACCTG fusão) ATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTGATC

GCCCTGTCCCTGGGCCTGACCCCCAACTTCAAGTCCAACTTCGACCTGGCCG AGGACGCCAAGCTGCAGCTGTCCAAGGACACCTACGACGACGACCTGGACAA CCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCCGCCAA GAACCTGTCCGACGCCATCCTGCTGTCCGACATCCTGCGGGTGAACACCGAG ATCACCAAGGCCCCCCTGTCCGCCTCCATGATCAAGCGGTACGACGAGCACC ACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGCCCGAGA AGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACAT CGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCCATCCTG GAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGGGAGGAC CTGCTGCGGAAGCAGCGGACCTTCGACAACGGCTCCATCCCCCACCAGATCC ACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTCTACCCCT TCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCCGGATCCC CTACTACGTGGGCCCCCTGGCCCGGGGCAACTCCCGGTTCGCCTGGATGAC CCGGAAGTCCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGGTGGTGGA CAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGGATGACCAACTTCGACAAG AACCTGCCCAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTACGAGTACT TCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAGGGCATGCG GAAGCCCGCCTTCCTGTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTGCT GTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAGGACTACTTC AAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGGT TCAACGCCTCCCTGGGCACCTACCACGACCTGCTGAAGATCATCAAGGACAA GGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGACATCGTGCTG ACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCGGCTGAAGACC TACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAGCGGCGGCGG TACACCGGCTGGGGCCGGCTGTCCCGGAAGCTGATCAACGGCATCCGGGAC AAGCAGTCCGGCAAGACCATCCTGGACTTCCTGAAGTCCGACGGCTTCGCCA ACCGGAACTTCATGCAGCTGATCCACGACGACTCCCTGACCTTCAAGGAGGA

Descrição Sequência SEQ ID No.

CATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTGCACGAGCACAT CGCCAACCTGGCCGGCTCCCCCGCCATCAAGAAGGGCATCCTGCAGACCGT GAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACAAGCCCGAGAA CATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGAA GAACTCCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCAAGGAGCTGGG CTCCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGCTGCAGAACGA GAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTACGTGGACCAG GAGCTGGACATCAACCGGCTGTCCGACTACGACGTGGACGCCATCGTGCCC CAGTCCTTCCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCCGGTCCG ACAAGAACCGGGGCAAGTCCGACAACGTGCCCTCCGAGGAGGTGGTGAAGA AGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATCACCCAGCG GAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGTCCGAGCTGGA CAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGCAGATCACCAA GCACGTGGCCCAGATCCTGGACTCCCGGATGAACACCAAGTACGACGAGAAC GACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGTCCAAGCTGGTGT CCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAGATCAACAACTA CCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCACCGCCCTGAT CAAGAAGTACCCCAAGCTGGAGTCCGAGTTCGTGTACGGCGACTACAAGGTG TACGACGTGCGGAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCC ACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATC ACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGAGACCAACGGC GAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGCCACCGTGCGG AAGGTGCTGTCCATGCCCCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGA CCGGCGGCTTCTCCAAGGAGTCCATCCTGCCCAAGCGGAACTCCGACAAGCT GATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGGCGGCTTCGACTC CCCCACCGTGGCCTACTCCGTGCTGGTGGTGGCCAAGGTGGAGAAGGGCAA GTCCAAGAAGCTGAAGTCCGTGAAGGAGCTGCTGGGCATCACCATCATGGAG CGGTCCTCCTTCGAGAAGAACCCCATCGACTTCCTGGAGGCCAAGGGCTACA AGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGTACTCCCTGTTCGA GCTGGAGAACGGCCGGAAGCGGATGCTGGCCTCCGCCGGCGAGCTGCAGAA GGGCAACGAGCTGGCCCTGCCCTCCAAGTACGTGAACTTCCTGTACCTGGCC TCCCACTACGAGAAGCTGAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAG CTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCT CCGAGTTCTCCAAGCGGGTGATCCTGGCCGACGCCAACCTGGACAAGGTGCT GTCCGCCTACAACAAGCACCGGGACAAGCCCATCCGGGAGCAGGCCGAGAA CATCATCCACCTGTTCACCCTGACCAACCTGGGCGCCCCCGCCGCCTTCAAG TACTTCGACACCACCATCGACCGGAAGCGGTACACCTCCACCAAGGAGGTGC

Descrição Sequência SEQ ID No.

TGGACGCCACCCTGATCCACCAGTCCATCACCGGCCTGTACGAGACCCGGAT CGACCTGTCCCAGCTGGGCGGCGACGGCTCCGGCTCCCCCAAGAAGAAGCG

GAAGGTGGACGGCTCCCCCAAGAAGAAGCGGAAGGTGGACTCCGGC ORF de Cas9 GACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG de A/U baixo da GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4, com CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC duas sequências GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA NLS C-terminais GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA (sem códons de GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA início ou parada; ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT adequado para GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA inclusão na CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC sequência de GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC codificação da AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA proteína de CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA fusão) CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT

GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG

GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG 155

Descrição Sequência SEQ ID No.

GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT

Descrição Sequência SEQ ID No.

ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCAGCGGCA GCCCCAAGAAGAAGCGGAAGGTGGACGGCAGCCCCAAGAAGAAGCGGAAGG

TGGACAGCGGC ORF de Cas9 GACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACAGCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG de A/U baixo da GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4 (sem CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC NLS e sem GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA códons de início GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA ou parada; GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA adequado para ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT inclusão na GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA sequência de CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC codificação da GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC proteína de AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA fusão) CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA

CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG

GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC 156

Descrição Sequência SEQ ID No.

TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA

Descrição Sequência SEQ ID No.

GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC

TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGAC ORF de Cas9 GACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACAGCGTGGGCTGG nickase usando GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG códons de A/U GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT baixo da Tabela CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC 4 (sem códons GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA de início ou GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA parada; GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA adequado para ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT inclusão na GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA sequência de CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC codificação das GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC proteínas de AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA fusão) CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA

CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC

GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG 157

Descrição Sequência SEQ ID No.

AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG

Descrição Sequência SEQ ID No.

CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCGGCGGC

AGCCCCAAGAAGAAGCGGAAGGTG ORF de Cas9 GACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACAGCGTGGGCTGG nickase usando GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG códons de A/U GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT baixo da Tabela CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC 4, com duas GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA sequências NLS GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA C-terminais GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA (sem códons de ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT início ou parada; GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA adequado para CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC inclusão na GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC sequência de AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA 158

Descrição Sequência SEQ ID No. codificação das CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA proteínas de CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT fusão) GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG

GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA

Descrição Sequência SEQ ID No.

CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCAGCGGCA GCCCCAAGAAGAAGCGGAAGGTGGACGGCAGCCCCAAGAAGAAGCGGAAGG

TGGACAGCGGC ORF de Cas9 GACAAGAAGTACAGCATCGGCCTGGcCATCGGCACCAACAGCGTGGGCTGG nickase usando GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG códons de A/U GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT baixo da Tabela CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC 159

Descrição Sequência SEQ ID No. 4 (sem NLS e GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA sem códons de GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA início ou parada; GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA adequado para ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT inclusão na GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA sequência de CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC codificação da GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC proteína de AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA fusão) CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA

CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT

Descrição Sequência SEQ ID No.

TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACCA CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA

Descrição Sequência SEQ ID No.

GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC

TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGAC ORF de dCas9 GACAAGAAGTACAGCATCGGCCTGGcCATCGGCACCAACAGCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG de A/U baixo da GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4 (sem CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC códons de início GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA ou parada; GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA adequado para GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA inclusão na ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT sequência de GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA codificação das CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC proteínas de GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC fusão) AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA

CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG

GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT 160

Descrição Sequência SEQ ID No.

CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC

ATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTGA CCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT

Descrição Sequência SEQ ID No.

AGCCCCAAGAAGAAGCGGAAGGTG ORF de dCas9 GACAAGAAGTACAGCATCGGCCTGGCCATCGGCACCAACAGCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG de A/U baixo da GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4, com CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC duas sequências GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA NLS do terminal GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA C (sem códons GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA de início ou ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT parada; GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA adequado para CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC inclusão na GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC sequência de AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA codificação das CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA proteínas de CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT fusão) GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG

GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC

GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG 161

Descrição Sequência SEQ ID No.

TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC TGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAACGGCCGGGACATGTA CGTGGACCAGGAGCTGGACATCAACCGGCTGAGCGACTACGACGTGGACGC CATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTG ACCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA

Descrição Sequência SEQ ID No.

CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGACGGCAGCGGCA GCCCCAAGAAGAAGCGGAAGGTGGACGGCAGCCCCAAGAAGAAGCGGAAGG

TGGACAGCGGC ORF de dCas9 GACAAGAAGTACAGCATCGGCCTGGcCATCGGCACCAACAGCGTGGGCTGG usando códons GCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAGTTCAAGGTGCTGG de A/U baixo da GCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGCGCCCTGCTGTT Tabela 4 (sem CGACAGCGGCGAGACCGCCGAGGCCACCCGGCTGAAGCGGACCGCCCGGC NLS e sem GGCGGTACACCCGGCGGAAGAACCGGATCTGCTACCTGCAGGAGATCTTCA códons de início GCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACCGGCTGGAGGAGA ou parada; GCTTCCTGGTGGAGGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCA adequado para ACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCT inclusão na GCGGAAGAAGCTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTA sequência de CCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGC codificação das GACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGC proteínas de AGACCTACAACCAGCTGTTCGAGGAGAACCCCATCAACGCCAGCGGCGTGGA fusão) CGCCAAGGCCATCCTGAGCGCCCGGCTGAGCAAGAGCCGGCGGCTGGAGAA

CCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCT GATCGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTG GCCGAGGACGCCAAGCTGCAGCTGAGCAAGGACACCTACGACGACGACCTG GACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTGGCC GCCAAGAACCTGAGCGACGCCATCCTGCTGAGCGACATCCTGCGGGTGAACA

CCGAGATCACCAAGGCCCCCCTGAGCGCCAGCATGATCAAGCGGTACGACG AGCACCACCAGGACCTGACCCTGCTGAAGGCCCTGGTGCGGCAGCAGCTGC 162

Descrição Sequência SEQ ID No.

CCGAGAAGTACAAGGAGATCTTCTTCGACCAGAGCAAGAACGGCTACGCCGG CTACATCGACGGCGGCGCCAGCCAGGAGGAGTTCTACAAGTTCATCAAGCCC ATCCTGGAGAAGATGGACGGCACCGAGGAGCTGCTGGTGAAGCTGAACCGG GAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCAC CAGATCCACCTGGGCGAGCTGCACGCCATCCTGCGGCGGCAGGAGGACTTC TACCCCTTCCTGAAGGACAACCGGGAGAAGATCGAGAAGATCCTGACCTTCC GGATCCCCTACTACGTGGGCCCCCTGGCCCGGGGCAACAGCCGGTTCGCCT GGATGACCCGGAAGAGCGAGGAGACCATCACCCCCTGGAACTTCGAGGAGG TGGTGGACAAGGGCGCCAGCGCCCAGAGCTTCATCGAGCGGATGACCAACT TCGACAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTA CGAGTACTTCACCGTGTACAACGAGCTGACCAAGGTGAAGTACGTGACCGAG GGCATGCGGAAGCCCGCCTTCCTGAGCGGCGAGCAGAAGAAGGCCATCGTG GACCTGCTGTTCAAGACCAACCGGAAGGTGACCGTGAAGCAGCTGAAGGAG GACTACTTCAAGAAGATCGAGTGCTTCGACAGCGTGGAGATCAGCGGCGTGG AGGACCGGTTCAACGCCAGCCTGGGCACCTACCACGACCTGCTGAAGATCAT CAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTGGAGGA CATCGTGCTGACCCTGACCCTGTTCGAGGACCGGGAGATGATCGAGGAGCG GCTGAAGACCTACGCCCACCTGTTCGACGACAAGGTGATGAAGCAGCTGAAG CGGCGGCGGTACACCGGCTGGGGCCGGCTGAGCCGGAAGCTGATCAACGG CATCCGGGACAAGCAGAGCGGCAAGACCATCCTGGACTTCCTGAAGAGCGAC GGCTTCGCCAACCGGAACTTCATGCAGCTGATCCACGACGACAGCCTGACCT TCAAGGAGGACATCCAGAAGGCCCAGGTGAGCGGCCAGGGCGACAGCCTGC ACGAGCACATCGCCAACCTGGCCGGCAGCCCCGCCATCAAGAAGGGCATCC TGCAGACCGTGAAGGTGGTGGACGAGCTGGTGAAGGTGATGGGCCGGCACA AGCCCGAGAACATCGTGATCGAGATGGCCCGGGAGAACCAGACCACCCAGA AGGGCCAGAAGAACAGCCGGGAGCGGATGAAGCGGATCGAGGAGGGCATCA AGGAGCTGGGCAGCCAGATCCTGAAGGAGCACCCCGTGGAGAACACCCAGC

ATCGTGCCCCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTGCTGA CCCGGAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCAGCGAGGAG GTGGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGA TCACCCAGCGGAAGTTCGACAACCTGACCAAGGCCGAGCGGGGCGGCCTGA GCGAGCTGGACAAGGCCGGCTTCATCAAGCGGCAGCTGGTGGAGACCCGGC AGATCACCAAGCACGTGGCCCAGATCCTGGACAGCCGGATGAACACCAAGTA CGACGAGAACGACAAGCTGATCCGGGAGGTGAAGGTGATCACCCTGAAGAG CAAGCTGGTGAGCGACTTCCGGAAGGACTTCCAGTTCTACAAGGTGCGGGAG

Descrição Sequência SEQ ID No.

ATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTGGTGGGCA CCGCCCTGATCAAGAAGTACCCCAAGCTGGAGAGCGAGTTCGTGTACGGCGA CTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAGATC GGCAAGGCCACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAA GACCGAGATCACCCTGGCCAACGGCGAGATCCGGAAGCGGCCCCTGATCGA GACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGGGACTTCGC CACCGTGCGGAAGGTGCTGAGCATGCCCCAGGTGAACATCGTGAAGAAGAC CGAGGTGCAGACCGGCGGCTTCAGCAAGGAGAGCATCCTGCCCAAGCGGAA CAGCGACAAGCTGATCGCCCGGAAGAAGGACTGGGACCCCAAGAAGTACGG CGGCTTCGACAGCCCCACCGTGGCCTACAGCGTGCTGGTGGTGGCCAAGGT GGAGAAGGGCAAGAGCAAGAAGCTGAAGAGCGTGAAGGAGCTGCTGGGCAT CACCATCATGGAGCGGAGCAGCTTCGAGAAGAACCCCATCGACTTCCTGGAG GCCAAGGGCTACAAGGAGGTGAAGAAGGACCTGATCATCAAGCTGCCCAAGT ACAGCCTGTTCGAGCTGGAGAACGGCCGGAAGCGGATGCTGGCCAGCGCCG GCGAGCTGCAGAAGGGCAACGAGCTGGCCCTGCCCAGCAAGTACGTGAACT TCCTGTACCTGGCCAGCCACTACGAGAAGCTGAAGGGCAGCCCCGAGGACA ACGAGCAGAAGCAGCTGTTCGTGGAGCAGCACAAGCACTACCTGGACGAGAT CATCGAGCAGATCAGCGAGTTCAGCAAGCGGGTGATCCTGGCCGACGCCAA CCTGGACAAGGTGCTGAGCGCCTACAACAAGCACCGGGACAAGCCCATCCG GGAGCAGGCCGAGAACATCATCCACCTGTTCACCCTGACCAACCTGGGCGCC CCCGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGCGGTACACCA GCACCAAGGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCC

TGTACGAGACCCGGATCGACCTGAGCCAGCTGGGCGGCGAC ORF de Nme GCCGCCTTCAAGCCCAACTCCATCAACTACATCCTGGGCCTGGACATCGGCA Cas9 usando TCGCCTCCGTGGGCTGGGCCATGGTGGAGATCGACGAGGAGGAGAACCCCA códons de A TCCGGCTGATCGACCTGGGCGTGCGGGTGTTCGAGCGGGCCGAGGTGCCCA baixo da Tabela AGACCGGCGACTCCCTGGCCATGGCCCGGCGGCTGGCCCGGTCCGTGCGG 4 (sem códons CGGCTGACCCGGCGGCGGGCCCACCGGCTGCTGCGGACCCGGCGGCTGCT de início ou GAAGCGGGAGGGCGTGCTGCAGGCCGCCAACTTCGACGAGAACGGCCTGAT parada; CAAGTCCCTGCCCAACACCCCCTGGCAGCTGCGGGCCGCCGCCCTGGACCG adequado para GAAGCTGACCCCCCTGGAGTGGTCCGCCGTGCTGCTGCACCTGATCAAGCAC inclusão na CGGGGCTACCTGTCCCAGCGGAAGAACGAGGGCGAGACCGCCGACAAGGAG sequência de CTGGGCGCCCTGCTGAAGGGCGTGGCCGGCAACGCCCACGCCCTGCAGACC codificação da GGCGACTTCCGGACCCCCGCCGAGCTGGCCCTGAACAAGTTCGAGAAGGAG proteína de TCCGGCCACATCCGGAACCAGCGGTCCGACTACTCCCACACCTTCTCCCGGA fusão) AGGACCTGCAGGCCGAGCTGATCCTGCTGTTCGAGAAGCAGAAGGAGTTCG GCAACCCCCACGTGTCCGGCGGCCTGAAGGAGGGCATCGAGACCCTGCTGA 163

Descrição Sequência SEQ ID No.

TGACCCAGCGGCCCGCCCTGTCCGGCGACGCCGTGCAGAAGATGCTGGGCC ACTGCACCTTCGAGCCCGCCGAGCCCAAGGCCGCCAAGAACACCTACACCG CCGAGCGGTTCATCTGGCTGACCAAGCTGAACAACCTGCGGATCCTGGAGCA GGGCTCCGAGCGGCCCCTGACCGACACCGAGCGGGCCACCCTGATGGACGA GCCCTACCGGAAGTCCAAGCTGACCTACGCCCAGGCCCGGAAGCTGCTGGG CCTGGAGGACACCGCCTTCTTCAAGGGCCTGCGGTACGGCAAGGACAACGC CGAGGCCTCCACCCTGATGGAGATGAAGGCCTACCACGCCATCTCCCGGGC CCTGGAGAAGGAGGGCCTGAAGGACAAGAAGTCCCCCCTGAACCTGTCCCC CGAGCTGCAGGACGAGATCGGCACCGCCTTCTCCCTGTTCAAGACCGACGAG GACATCACCGGCCGGCTGAAGGACCGGATCCAGCCCGAGATCCTGGAGGCC CTGCTGAAGCACATCTCCTTCGACAAGTTCGTGCAGATCTCCCTGAAGGCCCT GCGGCGGATCGTGCCCCTGATGGAGCAGGGCAAGCGGTACGACGAGGCCTG CGCCGAGATCTACGGCGACCACTACGGCAAGAAGAACACCGAGGAGAAGAT CTACCTGCCCCCCATCCCCGCCGACGAGATCCGGAACCCCGTGGTGCTGCG GGCCCTGTCCCAGGCCCGGAAGGTGATCAACGGCGTGGTGCGGCGGTACGG CTCCCCCGCCCGGATCCACATCGAGACCGCCCGGGAGGTGGGCAAGTCCTT CAAGGACCGGAAGGAGATCGAGAAGCGGCAGGAGGAGAACCGGAAGGACC GGGAGAAGGCCGCCGCCAAGTTCCGGGAGTACTTCCCCAACTTCGTGGGCG AGCCCAAGTCCAAGGACATCCTGAAGCTGCGGCTGTACGAGCAGCAGCACG GCAAGTGCCTGTACTCCGGCAAGGAGATCAACCTGGGCCGGCTGAACGAGA AGGGCTACGTGGAGATCGACCACGCCCTGCCCTTCTCCCGGACCTGGGACG ACTCCTTCAACAACAAGGTGCTGGTGCTGGGCTCCGAGAACCAGAACAAGGG CAACCAGACCCCCTACGAGTACTTCAACGGCAAGGACAACTCCCGGGAGTGG CAGGAGTTCAAGGCCCGGGTGGAGACCTCCCGGTTCCCCCGGTCCAAGAAG CAGCGGATCCTGCTGCAGAAGTTCGACGAGGACGGCTTCAAGGAGCGGAAC CTGAACGACACCCGGTACGTGAACCGGTTCCTGTGCCAGTTCGTGGCCGACC GGATGCGGCTGACCGGCAAGGGCAAGAAGCGGGTGTTCGCCTCCAACGGCC AGATCACCAACCTGCTGCGGGGCTTCTGGGGCCTGCGGAAGGTGCGGGCCG AGAACGACCGGCACCACGCCCTGGACGCCGTGGTGGTGGCCTGCTCCACCG TGGCCATGCAGCAGAAGATCACCCGGTTCGTGCGGTACAAGGAGATGAACGC CTTCGACGGCAAGACCATCGACAAGGAGACCGGCGAGGTGCTGCACCAGAA GACCCACTTCCCCCAGCCCTGGGAGTTCTTCGCCCAGGAGGTGATGATCCGG GTGTTCGGCAAGCCCGACGGCAAGCCCGAGTTCGAGGAGGCCGACACCCTG GAGAAGCTGCGGACCCTGCTGGCCGAGAAGCTGTCCTCCCGGCCCGAGGCC GTGCACGAGTACGTGACCCCCCTGTTCGTGTCCCGGGCCCCCAACCGGAAG ATGTCCGGCCAGGGCCACATGGAGACCGTGAAGTCCGCCAAGCGGCTGGAC GAGGGCGTGTCCGTGCTGCGGGTGCCCCTGACCCAGCTGAAGCTGAAGGAC

Descrição Sequência SEQ ID No.

CTGGAGAAGATGGTGAACCGGGAGCGGGAGCCCAAGCTGTACGAGGCCCTG AAGGCCCGGCTGGAGGCCCACAAGGACGACCCCGCCAAGGCCTTCGCCGAG CCCTTCTACAAGTACGACAAGGCCGGCAACCGGACCCAGCAGGTGAAGGCC GTGCGGGTGGAGCAGGTGCAGAAGACCGGCGTGTGGGTGCGGAACCACAAC GGCATCGCCGACAACGCCACCATGGTGCGGGTGGACGTGTTCGAGAAGGGC GACAAGTACTACCTGGTGCCCATCTACTCCTGGCAGGTGGCCAAGGGCATCC TGCCCGACCGGGCCGTGGTGCAGGGCAAGGACGAGGAGGACTGGCAGCTG ATCGACGACTCCTTCAACTTCAAGTTCTCCCTGCACCCCAACGACCTGGTGGA GGTGATCACCAAGAAGGCCCGGATGTTCGGCTACTTCGCCTCCTGCCACCGG GGCACCGGCAACATCAACATCCGGATCCACGACCTGGACCACAAGATCGGCA AGAACGGCATCCTGGAGGGCATCGGCGTGAAGACCGCCCTGTCCTTCCAGAA GTACCAGATCGACGAGCTGGGCAAGGAGATCCGGCCCTGCCGGCTGAAGAA GCGGCCCCCCGTGCGGTCCGGCAAGCGGACCGCCGACGGCTCCGAGTTCG

AGTCCCCCAAGAAGAAGCGGAAGGTGGAG ORF de Nme GCCGCCTTCAAGCCCAACAGCATCAACTACATCCTGGGCCTGGACATCGGCA Cas9 usando TCGCCAGCGTGGGCTGGGCCATGGTGGAGATCGACGAGGAGGAGAACCCCA códons de A/U TCCGGCTGATCGACCTGGGCGTGCGGGTGTTCGAGCGGGCCGAGGTGCCCA baixo da Tabela AGACCGGCGACAGCCTGGCCATGGCCCGGCGGCTGGCCCGGAGCGTGCGG 4 (sem códons CGGCTGACCCGGCGGCGGGCCCACCGGCTGCTGCGGACCCGGCGGCTGCT de início ou GAAGCGGGAGGGCGTGCTGCAGGCCGCCAACTTCGACGAGAACGGCCTGAT parada; CAAGAGCCTGCCCAACACCCCCTGGCAGCTGCGGGCCGCCGCCCTGGACCG adequados para GAAGCTGACCCCCCTGGAGTGGAGCGCCGTGCTGCTGCACCTGATCAAGCA inclusão na CCGGGGCTACCTGAGCCAGCGGAAGAACGAGGGCGAGACCGCCGACAAGG sequência de AGCTGGGCGCCCTGCTGAAGGGCGTGGCCGGCAACGCCCACGCCCTGCAGA codificação das CCGGCGACTTCCGGACCCCCGCCGAGCTGGCCCTGAACAAGTTCGAGAAGG proteínas de AGAGCGGCCACATCCGGAACCAGCGGAGCGACTACAGCCACACCTTCAGCC fusão) GGAAGGACCTGCAGGCCGAGCTGATCCTGCTGTTCGAGAAGCAGAAGGAGTT

CGGCAACCCCCACGTGAGCGGCGGCCTGAAGGAGGGCATCGAGACCCTGCT GATGACCCAGCGGCCCGCCCTGAGCGGCGACGCCGTGCAGAAGATGCTGGG CCACTGCACCTTCGAGCCCGCCGAGCCCAAGGCCGCCAAGAACACCTACAC CGCCGAGCGGTTCATCTGGCTGACCAAGCTGAACAACCTGCGGATCCTGGAG CAGGGCAGCGAGCGGCCCCTGACCGACACCGAGCGGGCCACCCTGATGGA CGAGCCCTACCGGAAGAGCAAGCTGACCTACGCCCAGGCCCGGAAGCTGCT GGGCCTGGAGGACACCGCCTTCTTCAAGGGCCTGCGGTACGGCAAGGACAA CGCCGAGGCCAGCACCCTGATGGAGATGAAGGCCTACCACGCCATCAGCCG

GGCCCTGGAGAAGGAGGGCCTGAAGGACAAGAAGAGCCCCCTGAACCTGAG CCCCGAGCTGCAGGACGAGATCGGCACCGCCTTCAGCCTGTTCAAGACCGA 164

Descrição Sequência SEQ ID No.

CGAGGACATCACCGGCCGGCTGAAGGACCGGATCCAGCCCGAGATCCTGGA GGCCCTGCTGAAGCACATCAGCTTCGACAAGTTCGTGCAGATCAGCCTGAAG GCCCTGCGGCGGATCGTGCCCCTGATGGAGCAGGGCAAGCGGTACGACGAG GCCTGCGCCGAGATCTACGGCGACCACTACGGCAAGAAGAACACCGAGGAG AAGATCTACCTGCCCCCCATCCCCGCCGACGAGATCCGGAACCCCGTGGTGC TGCGGGCCCTGAGCCAGGCCCGGAAGGTGATCAACGGCGTGGTGCGGCGG TACGGCAGCCCCGCCCGGATCCACATCGAGACCGCCCGGGAGGTGGGCAAG AGCTTCAAGGACCGGAAGGAGATCGAGAAGCGGCAGGAGGAGAACCGGAAG GACCGGGAGAAGGCCGCCGCCAAGTTCCGGGAGTACTTCCCCAACTTCGTG GGCGAGCCCAAGAGCAAGGACATCCTGAAGCTGCGGCTGTACGAGCAGCAG CACGGCAAGTGCCTGTACAGCGGCAAGGAGATCAACCTGGGCCGGCTGAAC GAGAAGGGCTACGTGGAGATCGACCACGCCCTGCCCTTCAGCCGGACCTGG GACGACAGCTTCAACAACAAGGTGCTGGTGCTGGGCAGCGAGAACCAGAACA AGGGCAACCAGACCCCCTACGAGTACTTCAACGGCAAGGACAACAGCCGGG AGTGGCAGGAGTTCAAGGCCCGGGTGGAGACCAGCCGGTTCCCCCGGAGCA AGAAGCAGCGGATCCTGCTGCAGAAGTTCGACGAGGACGGCTTCAAGGAGC GGAACCTGAACGACACCCGGTACGTGAACCGGTTCCTGTGCCAGTTCGTGGC CGACCGGATGCGGCTGACCGGCAAGGGCAAGAAGCGGGTGTTCGCCAGCAA CGGCCAGATCACCAACCTGCTGCGGGGCTTCTGGGGCCTGCGGAAGGTGCG GGCCGAGAACGACCGGCACCACGCCCTGGACGCCGTGGTGGTGGCCTGCA GCACCGTGGCCATGCAGCAGAAGATCACCCGGTTCGTGCGGTACAAGGAGAT GAACGCCTTCGACGGCAAGACCATCGACAAGGAGACCGGCGAGGTGCTGCA CCAGAAGACCCACTTCCCCCAGCCCTGGGAGTTCTTCGCCCAGGAGGTGATG ATCCGGGTGTTCGGCAAGCCCGACGGCAAGCCCGAGTTCGAGGAGGCCGAC ACCCTGGAGAAGCTGCGGACCCTGCTGGCCGAGAAGCTGAGCAGCCGGCCC GAGGCCGTGCACGAGTACGTGACCCCCCTGTTCGTGAGCCGGGCCCCCAAC CGGAAGATGAGCGGCCAGGGCCACATGGAGACCGTGAAGAGCGCCAAGCGG CTGGACGAGGGCGTGAGCGTGCTGCGGGTGCCCCTGACCCAGCTGAAGCTG AAGGACCTGGAGAAGATGGTGAACCGGGAGCGGGAGCCCAAGCTGTACGAG GCCCTGAAGGCCCGGCTGGAGGCCCACAAGGACGACCCCGCCAAGGCCTTC GCCGAGCCCTTCTACAAGTACGACAAGGCCGGCAACCGGACCCAGCAGGTG AAGGCCGTGCGGGTGGAGCAGGTGCAGAAGACCGGCGTGTGGGTGCGGAA CCACAACGGCATCGCCGACAACGCCACCATGGTGCGGGTGGACGTGTTCGA GAAGGGCGACAAGTACTACCTGGTGCCCATCTACAGCTGGCAGGTGGCCAAG GGCATCCTGCCCGACCGGGCCGTGGTGCAGGGCAAGGACGAGGAGGACTG GCAGCTGATCGACGACAGCTTCAACTTCAAGTTCAGCCTGCACCCCAACGAC CTGGTGGAGGTGATCACCAAGAAGGCCCGGATGTTCGGCTACTTCGCCAGCT

Descrição Sequência SEQ ID No.

GCCACCGGGGCACCGGCAACATCAACATCCGGATCCACGACCTGGACCACA AGATCGGCAAGAACGGCATCCTGGAGGGCATCGGCGTGAAGACCGCCCTGA GCTTCCAGAAGTACCAGATCGACGAGCTGGGCAAGGAGATCCGGCCCTGCC GGCTGAAGAAGCGGCCCCCCGTGCGGAGCGGCAAGCGGACCGCCGACGGC

AGCGAGTTCGAGAGCCCCAAGAAGAAGCGGAAGGTGGAG Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS1 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA

ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA 165

Descrição Sequência SEQ ID No.

AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT

Descrição Sequência SEQ ID No.

ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCTGGC

AGCAAAGAGAAGCAGAACAACA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS2 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA

ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG 166

Descrição Sequência SEQ ID No.

ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA

Descrição Sequência SEQ ID No.

AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCAGGC

AGCAAAGAGAAGCAGAACAACA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS3 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA

AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG 167

Descrição Sequência SEQ ID No.

GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT

Descrição Sequência SEQ ID No.

CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCCGGC

ACCGGCAAAGAGAGAAAGAACAACA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS4 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG 168

Descrição Sequência SEQ ID No.

AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA

Descrição Sequência SEQ ID No.

ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCAGGC

AGCAAAGAGACCGAGAACAACA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS5 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG 169

Descrição Sequência SEQ ID No. sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA

Descrição Sequência SEQ ID No.

TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCAGAGC

AGCAAAGAGACCGAGAACAACA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG 170

Descrição Sequência SEQ ID No. para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS6 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC

Descrição Sequência SEQ ID No.

TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC

Descrição Sequência SEQ ID No.

AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCGCAGC

AGCAAAGAGAAGCTGGAGCATGGCAGCA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS7 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG

AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC 171

Descrição Sequência SEQ ID No.

GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG

Descrição Sequência SEQ ID No.

AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCGCAGC

AGCAAAGAGAGTCTGGAGCATGGCATTC Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS8 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC

AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA 172

Descrição Sequência SEQ ID No.

GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG

Descrição Sequência SEQ ID No.

AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCGCAGC

AGCAAAGAGAAGCTGGAGCATGGCATTC Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS9 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA

CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG 173

Descrição Sequência SEQ ID No.

GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC

Descrição Sequência SEQ ID No.

TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCGCAGC

AGCAAAGAGAAAGTACTTCGCAGCA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS10 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC

ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG 174

Descrição Sequência SEQ ID No.

CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG

Descrição Sequência SEQ ID No.

AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCAGAGC

AGCAAAGAGAAAGGCATTCGCAGCA Quadro de GACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGG leitura aberto CAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGG para Cas9 com AAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTC NLS12 (sem GACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAA códons de início GATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAAC ou parada; GAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCC adequado para TGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGT inclusão na CGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAG sequência de AAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCAC 175

Descrição Sequência SEQ ID No. codificação de TGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAA proteínas de CCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATAC fusão) AACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGG

CAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGC ACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTG AGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACG CAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCT GGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTG AGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAA AGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGA CCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAG GAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAG GAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATG GACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAA AGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGA ACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGAC AACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGG ACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAA GAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCG CACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAA AAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGA ACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTG AGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAA AGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTC GACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAA CATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGA AGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAG ACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGA CAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTG AGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCC TGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATC CACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCG GACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGG CAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAA GGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAA AACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAA TCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGT

Descrição Sequência SEQ ID No.

CGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAAC GGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACT ACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGA CAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTC CCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGA ACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAG AGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTC GAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGA ACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACA CTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGG TCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGT CGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTC TACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAAC AGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAAC TTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCT GATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGAC TTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGA AGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAG AAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTAC GGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAG GTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAA TCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAA GCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGT ACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGG AGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTC CTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACG AACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCAT CGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTG GACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAAC AGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGC AGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAA AGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGA AACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCAGAGC

AGCAAAGAGAAAGTACTTCGCAGTC Transcrito de GGGAAGCUCAGAAUAAACGCUCAACUUUGGCCGGAUCUGCCACCAUGGACA mRNA com XBG AGAAGUACAGCAUCGGCCUGGACAUCGGCACCAACAGCGUGGGCUGGGCC UTRs e ORF de GUGAUCACCGACGAGUACAAGGUGCCCAGCAAGAAGUUCAAGGUGCUGGG 176

Descrição Sequência SEQ ID No. Cas9 com CAACACCGACAGACACAGCAUCAAGAAGAACCUGAUCGGCGCCCUGCUGUU códons de U CGACAGCGGCGAGACCGCCGAGGCCACCAGACUGAAGAGAACCGCCAGAAG baixo 1 da AAGAUACACCAGAAGAAAGAACAGAAUCUGCUACCUGCAGGAGAUCUUCAG Tabela 4 CAACGAGAUGGCCAAGGUGGACGACAGCUUCUUCCACAGACUGGAGGAGA

GCUUCCUGGUGGAGGAGGACAAGAAGCACGAGAGACACCCCAUCUUCGGC AACAUCGUGGACGAGGUGGCCUACCACGAGAAGUACCCCACCAUCUACCAC CUGAGAAAGAAGCUGGUGGACAGCACCGACAAGGCCGACCUGAGACUGAUC UACCUGGCCCUGGCCCACAUGAUCAAGUUCAGAGGCCACUUCCUGAUCGAG GGCGACCUGAACCCCGACAACAGCGACGUGGACAAGCUGUUCAUCCAGCUG GUGCAGACCUACAACCAGCUGUUCGAGGAGAACCCCAUCAACGCCAGCGGC GUGGACGCCAAGGCCAUCCUGAGCGCCAGACUGAGCAAGAGCAGAAGACU GGAGAACCUGAUCGCCCAGCUGCCCGGCGAGAAGAAGAACGGCCUGUUCG GCAACCUGAUCGCCCUGAGCCUGGGCCUGACCCCCAACUUCAAGAGCAACU UCGACCUGGCCGAGGACGCCAAGCUGCAGCUGAGCAAGGACACCUACGAC GACGACCUGGACAACCUGCUGGCCCAGAUCGGCGACCAGUACGCCGACCU GUUCCUGGCCGCCAAGAACCUGAGCGACGCCAUCCUGCUGAGCGACAUCC UGAGAGUGAACACCGAGAUCACCAAGGCCCCCCUGAGCGCCAGCAUGAUCA AGAGAUACGACGAGCACCACCAGGACCUGACCCUGCUGAAGGCCCUGGUGA GACAGCAGCUGCCCGAGAAGUACAAGGAGAUCUUCUUCGACCAGAGCAAGA ACGGCUACGCCGGCUACAUCGACGGCGGCGCCAGCCAGGAGGAGUUCUAC AAGUUCAUCAAGCCCAUCCUGGAGAAGAUGGACGGCACCGAGGAGCUGCU GGUGAAGCUGAACAGAGAGGACCUGCUGAGAAAGCAGAGAACCUUCGACAA CGGCAGCAUCCCCCACCAGAUCCACCUGGGCGAGCUGCACGCCAUCCUGA GAAGACAGGAGGACUUCUACCCCUUCCUGAAGGACAACAGAGAGAAGAUCG AGAAGAUCCUGACCUUCAGAAUCCCCUACUACGUGGGCCCCCUGGCCAGAG GCAACAGCAGAUUCGCCUGGAUGACCAGAAAGAGCGAGGAGACCAUCACCC CCUGGAACUUCGAGGAGGUGGUGGACAAGGGCGCCAGCGCCCAGAGCUUC AUCGAGAGAAUGACCAACUUCGACAAGAACCUGCCCAACGAGAAGGUGCUG CCCAAGCACAGCCUGCUGUACGAGUACUUCACCGUGUACAACGAGCUGACC AAGGUGAAGUACGUGACCGAGGGCAUGAGAAAGCCCGCCUUCCUGAGCGG CGAGCAGAAGAAGGCCAUCGUGGACCUGCUGUUCAAGACCAACAGAAAGGU GACCGUGAAGCAGCUGAAGGAGGACUACUUCAAGAAGAUCGAGUGCUUCGA CAGCGUGGAGAUCAGCGGCGUGGAGGACAGAUUCAACGCCAGCCUGGGCA CCUACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACG AGGAGAACGAGGACAUCCUGGAGGACAUCGUGCUGACCCUGACCCUGUUC GAGGACAGAGAGAUGAUCGAGGAGAGACUGAAGACCUACGCCCACCUGUUC GACGACAAGGUGAUGAAGCAGCUGAAGAGAAGAAGAUACACCGGCUGGGGC

Descrição Sequência SEQ ID No.

AGACUGAGCAGAAAGCUGAUCAACGGCAUCAGAGACAAGCAGAGCGGCAAG ACCAUCCUGGACUUCCUGAAGAGCGACGGCUUCGCCAACAGAAACUUCAUG CAGCUGAUCCACGACGACAGCCUGACCUUCAAGGAGGACAUCCAGAAGGCC CAGGUGAGCGGCCAGGGCGACAGCCUGCACGAGCACAUCGCCAACCUGGC CGGCAGCCCCGCCAUCAAGAAGGGCAUCCUGCAGACCGUGAAGGUGGUGG ACGAGCUGGUGAAGGUGAUGGGCAGACACAAGCCCGAGAACAUCGUGAUC GAGAUGGCCAGAGAGAACCAGACCACCCAGAAGGGCCAGAAGAACAGCAGA GAGAGAAUGAAGAGAAUCGAGGAGGGCAUCAAGGAGCUGGGCAGCCAGAU CCUGAAGGAGCACCCCGUGGAGAACACCCAGCUGCAGAACGAGAAGCUGUA CCUGUACUACCUGCAGAACGGCAGAGACAUGUACGUGGACCAGGAGCUGG ACAUCAACAGACUGAGCGACUACGACGUGGACCACAUCGUGCCCCAGAGCU UCCUGAAGGACGACAGCAUCGACAACAAGGUGCUGACCAGAAGCGACAAGA ACAGAGGCAAGAGCGACAACGUGCCCAGCGAGGAGGUGGUGAAGAAGAUG AAGAACUACUGGAGACAGCUGCUGAACGCCAAGCUGAUCACCCAGAGAAAG UUCGACAACCUGACCAAGGCCGAGAGAGGCGGCCUGAGCGAGCUGGACAA GGCCGGCUUCAUCAAGAGACAGCUGGUGGAGACCAGACAGAUCACCAAGCA CGUGGCCCAGAUCCUGGACAGCAGAAUGAACACCAAGUACGACGAGAACGA CAAGCUGAUCAGAGAGGUGAAGGUGAUCACCCUGAAGAGCAAGCUGGUGA GCGACUUCAGAAAGGACUUCCAGUUCUACAAGGUGAGAGAGAUCAACAACU ACCACCACGCCCACGACGCCUACCUGAACGCCGUGGUGGGCACCGCCCUG AUCAAGAAGUACCCCAAGCUGGAGAGCGAGUUCGUGUACGGCGACUACAAG GUGUACGACGUGAGAAAGAUGAUCGCCAAGAGCGAGCAGGAGAUCGGCAA GGCCACCGCCAAGUACUUCUUCUACAGCAACAUCAUGAACUUCUUCAAGAC CGAGAUCACCCUGGCCAACGGCGAGAUCAGAAAGAGACCCCUGAUCGAGAC CAACGGCGAGACCGGCGAGAUCGUGUGGGACAAGGGCAGAGACUUCGCCA CCGUGAGAAAGGUGCUGAGCAUGCCCCAGGUGAACAUCGUGAAGAAGACC GAGGUGCAGACCGGCGGCUUCAGCAAGGAGAGCAUCCUGCCCAAGAGAAA CAGCGACAAGCUGAUCGCCAGAAAGAAGGACUGGGACCCCAAGAAGUACGG CGGCUUCGACAGCCCCACCGUGGCCUACAGCGUGCUGGUGGUGGCCAAGG UGGAGAAGGGCAAGAGCAAGAAGCUGAAGAGCGUGAAGGAGCUGCUGGGC AUCACCAUCAUGGAGAGAAGCAGCUUCGAGAAGAACCCCAUCGACUUCCUG GAGGCCAAGGGCUACAAGGAGGUGAAGAAGGACCUGAUCAUCAAGCUGCCC AAGUACAGCCUGUUCGAGCUGGAGAACGGCAGAAAGAGAAUGCUGGCCAGC GCCGGCGAGCUGCAGAAGGGCAACGAGCUGGCCCUGCCCAGCAAGUACGU GAACUUCCUGUACCUGGCCAGCCACUACGAGAAGCUGAAGGGCAGCCCCGA GGACAACGAGCAGAAGCAGCUGUUCGUGGAGCAGCACAAGCACUACCUGGA CGAGAUCAUCGAGCAGAUCAGCGAGUUCAGCAAGAGAGUGAUCCUGGCCGA

Descrição Sequência SEQ ID No.

CGCCAACCUGGACAAGGUGCUGAGCGCCUACAACAAGCACAGAGACAAGCC CAUCAGAGAGCAGGCCGAGAACAUCAUCCACCUGUUCACCCUGACCAACCU GGGCGCCCCCGCCGCCUUCAAGUACUUCGACACCACCAUCGACAGAAAGAG AUACACCAGCACCAAGGAGGUGCUGGACGCCACCCUGAUCCACCAGAGCAU CACCGGCCUGUACGAGACCAGAAUCGACCUGAGCCAGCUGGGCGGCGACG GCGGCGGCAGCCCCAAGAAGAAGAGAAAGGUGUGACUAGCACCAGCCUCAA GAACACCCGAAUGGAGUCUCUAAGCUACAUAAUACCAACUUACACUUUACAA AAUGUUGUCCCCCAAAAUGUAGCCAUUCGUAUCUGCUCCUAAUAAAAAGAAA GUUUCUUCACAUUCUCUCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAUCUAG Transcrito de GGGAAGCUCAGAAUAAACGCUCAACUUUGGCCGGAUCUGCCACCAUGGACA mRNA com XBG AGAAGUACUCCAUCGGCCUGGACAUCGGCACCAACUCCGUGGGCUGGGCC UTRs e ORF de GUGAUCACCGACGAGUACAAGGUGCCCUCCAAGAAGUUCAAGGUGCUGGG Cas9 com CAACACCGACCGGCACUCCAUCAAGAAGAACCUGAUCGGCGCCCUGCUGUU códons de A CGACUCCGGCGAGACCGCCGAGGCCACCCGGCUGAAGCGGACCGCCCGGC baixo 1 da GGCGGUACACCCGGCGGAAGAACCGGAUCUGCUACCUGCAGGAGAUCUUC Tabela 4 UCCAACGAGAUGGCCAAGGUGGACGACUCCUUCUUCCACCGGCUGGAGGA

GUCCUUCCUGGUGGAGGAGGACAAGAAGCACGAGCGGCACCCCAUCUUCG GCAACAUCGUGGACGAGGUGGCCUACCACGAGAAGUACCCCACCAUCUACC ACCUGCGGAAGAAGCUGGUGGACUCCACCGACAAGGCCGACCUGCGGCUG AUCUACCUGGCCCUGGCCCACAUGAUCAAGUUCCGGGGCCACUUCCUGAUC GAGGGCGACCUGAACCCCGACAACUCCGACGUGGACAAGCUGUUCAUCCAG CUGGUGCAGACCUACAACCAGCUGUUCGAGGAGAACCCCAUCAACGCCUCC GGCGUGGACGCCAAGGCCAUCCUGUCCGCCCGGCUGUCCAAGUCCCGGCG GCUGGAGAACCUGAUCGCCCAGCUGCCCGGCGAGAAGAAGAACGGCCUGU UCGGCAACCUGAUCGCCCUGUCCCUGGGCCUGACCCCCAACUUCAAGUCCA ACUUCGACCUGGCCGAGGACGCCAAGCUGCAGCUGUCCAAGGACACCUAC GACGACGACCUGGACAACCUGCUGGCCCAGAUCGGCGACCAGUACGCCGA CCUGUUCCUGGCCGCCAAGAACCUGUCCGACGCCAUCCUGCUGUCCGACA UCCUGCGGGUGAACACCGAGAUCACCAAGGCCCCCCUGUCCGCCUCCAUGA UCAAGCGGUACGACGAGCACCACCAGGACCUGACCCUGCUGAAGGCCCUG GUGCGGCAGCAGCUGCCCGAGAAGUACAAGGAGAUCUUCUUCGACCAGUC CAAGAACGGCUACGCCGGCUACAUCGACGGCGGCGCCUCCCAGGAGGAGU UCUACAAGUUCAUCAAGCCCAUCCUGGAGAAGAUGGACGGCACCGAGGAGC

UGCUGGUGAAGCUGAACCGGGAGGACCUGCUGCGGAAGCAGCGGACCUUC GACAACGGCUCCAUCCCCCACCAGAUCCACCUGGGCGAGCUGCACGCCAUC 177

Descrição Sequência SEQ ID No.

CUGCGGCGGCAGGAGGACUUCUACCCCUUCCUGAAGGACAACCGGGAGAA GAUCGAGAAGAUCCUGACCUUCCGGAUCCCCUACUACGUGGGCCCCCUGG CCCGGGGCAACUCCCGGUUCGCCUGGAUGACCCGGAAGUCCGAGGAGACC AUCACCCCCUGGAACUUCGAGGAGGUGGUGGACAAGGGCGCCUCCGCCCA GUCCUUCAUCGAGCGGAUGACCAACUUCGACAAGAACCUGCCCAACGAGAA GGUGCUGCCCAAGCACUCCCUGCUGUACGAGUACUUCACCGUGUACAACGA GCUGACCAAGGUGAAGUACGUGACCGAGGGCAUGCGGAAGCCCGCCUUCC UGUCCGGCGAGCAGAAGAAGGCCAUCGUGGACCUGCUGUUCAAGACCAAC CGGAAGGUGACCGUGAAGCAGCUGAAGGAGGACUACUUCAAGAAGAUCGAG UGCUUCGACUCCGUGGAGAUCUCCGGCGUGGAGGACCGGUUCAACGCCUC CCUGGGCACCUACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCU GGACAACGAGGAGAACGAGGACAUCCUGGAGGACAUCGUGCUGACCCUGA CCCUGUUCGAGGACCGGGAGAUGAUCGAGGAGCGGCUGAAGACCUACGCC CACCUGUUCGACGACAAGGUGAUGAAGCAGCUGAAGCGGCGGCGGUACAC CGGCUGGGGCCGGCUGUCCCGGAAGCUGAUCAACGGCAUCCGGGACAAGC AGUCCGGCAAGACCAUCCUGGACUUCCUGAAGUCCGACGGCUUCGCCAACC GGAACUUCAUGCAGCUGAUCCACGACGACUCCCUGACCUUCAAGGAGGACA UCCAGAAGGCCCAGGUGUCCGGCCAGGGCGACUCCCUGCACGAGCACAUC GCCAACCUGGCCGGCUCCCCCGCCAUCAAGAAGGGCAUCCUGCAGACCGU GAAGGUGGUGGACGAGCUGGUGAAGGUGAUGGGCCGGCACAAGCCCGAGA ACAUCGUGAUCGAGAUGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGA AGAACUCCCGGGAGCGGAUGAAGCGGAUCGAGGAGGGCAUCAAGGAGCUG GGCUCCCAGAUCCUGAAGGAGCACCCCGUGGAGAACACCCAGCUGCAGAAC GAGAAGCUGUACCUGUACUACCUGCAGAACGGCCGGGACAUGUACGUGGA CCAGGAGCUGGACAUCAACCGGCUGUCCGACUACGACGUGGACCACAUCG UGCCCCAGUCCUUCCUGAAGGACGACUCCAUCGACAACAAGGUGCUGACCC GGUCCGACAAGAACCGGGGCAAGUCCGACAACGUGCCCUCCGAGGAGGUG GUGAAGAAGAUGAAGAACUACUGGCGGCAGCUGCUGAACGCCAAGCUGAUC ACCCAGCGGAAGUUCGACAACCUGACCAAGGCCGAGCGGGGCGGCCUGUC CGAGCUGGACAAGGCCGGCUUCAUCAAGCGGCAGCUGGUGGAGACCCGGC AGAUCACCAAGCACGUGGCCCAGAUCCUGGACUCCCGGAUGAACACCAAGU ACGACGAGAACGACAAGCUGAUCCGGGAGGUGAAGGUGAUCACCCUGAAGU CCAAGCUGGUGUCCGACUUCCGGAAGGACUUCCAGUUCUACAAGGUGCGG GAGAUCAACAACUACCACCACGCCCACGACGCCUACCUGAACGCCGUGGUG GGCACCGCCCUGAUCAAGAAGUACCCCAAGCUGGAGUCCGAGUUCGUGUA CGGCGACUACAAGGUGUACGACGUGCGGAAGAUGAUCGCCAAGUCCGAGC AGGAGAUCGGCAAGGCCACCGCCAAGUACUUCUUCUACUCCAACAUCAUGA

Descrição Sequência SEQ ID No.

ACUUCUUCAAGACCGAGAUCACCCUGGCCAACGGCGAGAUCCGGAAGCGGC CCCUGAUCGAGACCAACGGCGAGACCGGCGAGAUCGUGUGGGACAAGGGC CGGGACUUCGCCACCGUGCGGAAGGUGCUGUCCAUGCCCCAGGUGAACAU CGUGAAGAAGACCGAGGUGCAGACCGGCGGCUUCUCCAAGGAGUCCAUCC UGCCCAAGCGGAACUCCGACAAGCUGAUCGCCCGGAAGAAGGACUGGGAC CCCAAGAAGUACGGCGGCUUCGACUCCCCCACCGUGGCCUACUCCGUGCU GGUGGUGGCCAAGGUGGAGAAGGGCAAGUCCAAGAAGCUGAAGUCCGUGA AGGAGCUGCUGGGCAUCACCAUCAUGGAGCGGUCCUCCUUCGAGAAGAAC CCCAUCGACUUCCUGGAGGCCAAGGGCUACAAGGAGGUGAAGAAGGACCU GAUCAUCAAGCUGCCCAAGUACUCCCUGUUCGAGCUGGAGAACGGCCGGAA GCGGAUGCUGGCCUCCGCCGGCGAGCUGCAGAAGGGCAACGAGCUGGCCC UGCCCUCCAAGUACGUGAACUUCCUGUACCUGGCCUCCCACUACGAGAAGC UGAAGGGCUCCCCCGAGGACAACGAGCAGAAGCAGCUGUUCGUGGAGCAG CACAAGCACUACCUGGACGAGAUCAUCGAGCAGAUCUCCGAGUUCUCCAAG CGGGUGAUCCUGGCCGACGCCAACCUGGACAAGGUGCUGUCCGCCUACAA CAAGCACCGGGACAAGCCCAUCCGGGAGCAGGCCGAGAACAUCAUCCACCU GUUCACCCUGACCAACCUGGGCGCCCCCGCCGCCUUCAAGUACUUCGACAC CACCAUCGACCGGAAGCGGUACACCUCCACCAAGGAGGUGCUGGACGCCAC CCUGAUCCACCAGUCCAUCACCGGCCUGUACGAGACCCGGAUCGACCUGUC CCAGCUGGGCGGCGACGGCGGCGGCUCCCCCAAGAAGAAGCGGAAGGUGU GACUAGCACCAGCCUCAAGAACACCCGAAUGGAGUCUCUAAGCUACAUAAU ACCAACUUACACUUUACAAAAUGUUGUCCCCCAAAAUGUAGCCAUUCGUAUC UGCUCCUAAUAAAAAGAAAGUUUCUUCACAUUCUCUCGAGAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAUCUAG Transcrito de GGGAAGCUCAGAAUAAACGCUCAACUUUGGCCGGAUCUGCCACCAUGGACA mRNA com XBG AGAAGUACAGCAUCGGCCUGGACAUCGGCACCAACAGCGUGGGCUGGGCC UTRs e ORF de GUGAUCACCGACGAGUACAAGGUGCCCAGCAAGAAGUUCAAGGUGCUGGG Cas9 com CAACACCGACCGGCACAGCAUCAAGAAGAACCUGAUCGGCGCCCUGCUGUU códons de U/A CGACAGCGGCGAGACCGCCGAGGCCACCCGGCUGAAGCGGACCGCCCGGC baixo 1 da GGCGGUACACCCGGCGGAAGAACCGGAUCUGCUACCUGCAGGAGAUCUUC Tabela 4 AGCAACGAGAUGGCCAAGGUGGACGACAGCUUCUUCCACCGGCUGGAGGA

GAGCUUCCUGGUGGAGGAGGACAAGAAGCACGAGCGGCACCCCAUCUUCG GCAACAUCGUGGACGAGGUGGCCUACCACGAGAAGUACCCCACCAUCUACC ACCUGCGGAAGAAGCUGGUGGACAGCACCGACAAGGCCGACCUGCGGCUG

AUCUACCUGGCCCUGGCCCACAUGAUCAAGUUCCGGGGCCACUUCCUGAUC GAGGGCGACCUGAACCCCGACAACAGCGACGUGGACAAGCUGUUCAUCCAG 178

Descrição Sequência SEQ ID No.

CUGGUGCAGACCUACAACCAGCUGUUCGAGGAGAACCCCAUCAACGCCAGC GGCGUGGACGCCAAGGCCAUCCUGAGCGCCCGGCUGAGCAAGAGCCGGCG GCUGGAGAACCUGAUCGCCCAGCUGCCCGGCGAGAAGAAGAACGGCCUGU UCGGCAACCUGAUCGCCCUGAGCCUGGGCCUGACCCCCAACUUCAAGAGCA ACUUCGACCUGGCCGAGGACGCCAAGCUGCAGCUGAGCAAGGACACCUAC GACGACGACCUGGACAACCUGCUGGCCCAGAUCGGCGACCAGUACGCCGA CCUGUUCCUGGCCGCCAAGAACCUGAGCGACGCCAUCCUGCUGAGCGACA UCCUGCGGGUGAACACCGAGAUCACCAAGGCCCCCCUGAGCGCCAGCAUG AUCAAGCGGUACGACGAGCACCACCAGGACCUGACCCUGCUGAAGGCCCUG GUGCGGCAGCAGCUGCCCGAGAAGUACAAGGAGAUCUUCUUCGACCAGAG CAAGAACGGCUACGCCGGCUACAUCGACGGCGGCGCCAGCCAGGAGGAGU UCUACAAGUUCAUCAAGCCCAUCCUGGAGAAGAUGGACGGCACCGAGGAGC UGCUGGUGAAGCUGAACCGGGAGGACCUGCUGCGGAAGCAGCGGACCUUC GACAACGGCAGCAUCCCCCACCAGAUCCACCUGGGCGAGCUGCACGCCAUC CUGCGGCGGCAGGAGGACUUCUACCCCUUCCUGAAGGACAACCGGGAGAA GAUCGAGAAGAUCCUGACCUUCCGGAUCCCCUACUACGUGGGCCCCCUGG CCCGGGGCAACAGCCGGUUCGCCUGGAUGACCCGGAAGAGCGAGGAGACC AUCACCCCCUGGAACUUCGAGGAGGUGGUGGACAAGGGCGCCAGCGCCCA GAGCUUCAUCGAGCGGAUGACCAACUUCGACAAGAACCUGCCCAACGAGAA GGUGCUGCCCAAGCACAGCCUGCUGUACGAGUACUUCACCGUGUACAACGA GCUGACCAAGGUGAAGUACGUGACCGAGGGCAUGCGGAAGCCCGCCUUCC UGAGCGGCGAGCAGAAGAAGGCCAUCGUGGACCUGCUGUUCAAGACCAAC CGGAAGGUGACCGUGAAGCAGCUGAAGGAGGACUACUUCAAGAAGAUCGAG UGCUUCGACAGCGUGGAGAUCAGCGGCGUGGAGGACCGGUUCAACGCCAG CCUGGGCACCUACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCU GGACAACGAGGAGAACGAGGACAUCCUGGAGGACAUCGUGCUGACCCUGA CCCUGUUCGAGGACCGGGAGAUGAUCGAGGAGCGGCUGAAGACCUACGCC CACCUGUUCGACGACAAGGUGAUGAAGCAGCUGAAGCGGCGGCGGUACAC CGGCUGGGGCCGGCUGAGCCGGAAGCUGAUCAACGGCAUCCGGGACAAGC AGAGCGGCAAGACCAUCCUGGACUUCCUGAAGAGCGACGGCUUCGCCAACC GGAACUUCAUGCAGCUGAUCCACGACGACAGCCUGACCUUCAAGGAGGACA UCCAGAAGGCCCAGGUGAGCGGCCAGGGCGACAGCCUGCACGAGCACAUC GCCAACCUGGCCGGCAGCCCCGCCAUCAAGAAGGGCAUCCUGCAGACCGU GAAGGUGGUGGACGAGCUGGUGAAGGUGAUGGGCCGGCACAAGCCCGAGA ACAUCGUGAUCGAGAUGGCCCGGGAGAACCAGACCACCCAGAAGGGCCAGA AGAACAGCCGGGAGCGGAUGAAGCGGAUCGAGGAGGGCAUCAAGGAGCUG GGCAGCCAGAUCCUGAAGGAGCACCCCGUGGAGAACACCCAGCUGCAGAAC

Descrição Sequência SEQ ID No.

GAGAAGCUGUACCUGUACUACCUGCAGAACGGCCGGGACAUGUACGUGGA CCAGGAGCUGGACAUCAACCGGCUGAGCGACUACGACGUGGACCACAUCG UGCCCCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUGCUGACCC GGAGCGACAAGAACCGGGGCAAGAGCGACAACGUGCCCAGCGAGGAGGUG GUGAAGAAGAUGAAGAACUACUGGCGGCAGCUGCUGAACGCCAAGCUGAUC ACCCAGCGGAAGUUCGACAACCUGACCAAGGCCGAGCGGGGCGGCCUGAG CGAGCUGGACAAGGCCGGCUUCAUCAAGCGGCAGCUGGUGGAGACCCGGC AGAUCACCAAGCACGUGGCCCAGAUCCUGGACAGCCGGAUGAACACCAAGU ACGACGAGAACGACAAGCUGAUCCGGGAGGUGAAGGUGAUCACCCUGAAGA GCAAGCUGGUGAGCGACUUCCGGAAGGACUUCCAGUUCUACAAGGUGCGG GAGAUCAACAACUACCACCACGCCCACGACGCCUACCUGAACGCCGUGGUG GGCACCGCCCUGAUCAAGAAGUACCCCAAGCUGGAGAGCGAGUUCGUGUA CGGCGACUACAAGGUGUACGACGUGCGGAAGAUGAUCGCCAAGAGCGAGC AGGAGAUCGGCAAGGCCACCGCCAAGUACUUCUUCUACAGCAACAUCAUGA ACUUCUUCAAGACCGAGAUCACCCUGGCCAACGGCGAGAUCCGGAAGCGGC CCCUGAUCGAGACCAACGGCGAGACCGGCGAGAUCGUGUGGGACAAGGGC CGGGACUUCGCCACCGUGCGGAAGGUGCUGAGCAUGCCCCAGGUGAACAU CGUGAAGAAGACCGAGGUGCAGACCGGCGGCUUCAGCAAGGAGAGCAUCC UGCCCAAGCGGAACAGCGACAAGCUGAUCGCCCGGAAGAAGGACUGGGAC CCCAAGAAGUACGGCGGCUUCGACAGCCCCACCGUGGCCUACAGCGUGCU GGUGGUGGCCAAGGUGGAGAAGGGCAAGAGCAAGAAGCUGAAGAGCGUGA AGGAGCUGCUGGGCAUCACCAUCAUGGAGCGGAGCAGCUUCGAGAAGAAC CCCAUCGACUUCCUGGAGGCCAAGGGCUACAAGGAGGUGAAGAAGGACCU GAUCAUCAAGCUGCCCAAGUACAGCCUGUUCGAGCUGGAGAACGGCCGGAA GCGGAUGCUGGCCAGCGCCGGCGAGCUGCAGAAGGGCAACGAGCUGGCCC UGCCCAGCAAGUACGUGAACUUCCUGUACCUGGCCAGCCACUACGAGAAGC UGAAGGGCAGCCCCGAGGACAACGAGCAGAAGCAGCUGUUCGUGGAGCAG CACAAGCACUACCUGGACGAGAUCAUCGAGCAGAUCAGCGAGUUCAGCAAG CGGGUGAUCCUGGCCGACGCCAACCUGGACAAGGUGCUGAGCGCCUACAA CAAGCACCGGGACAAGCCCAUCCGGGAGCAGGCCGAGAACAUCAUCCACCU GUUCACCCUGACCAACCUGGGCGCCCCCGCCGCCUUCAAGUACUUCGACAC CACCAUCGACCGGAAGCGGUACACCAGCACCAAGGAGGUGCUGGACGCCAC CCUGAUCCACCAGAGCAUCACCGGCCUGUACGAGACCCGGAUCGACCUGAG CCAGCUGGGCGGCGACGGCGGCGGCAGCCCCAAGAAGAAGCGGAAGGUGU GACUAGCACCAGCCUCAAGAACACCCGAAUGGAGUCUCUAAGCUACAUAAU ACCAACUUACACUUUACAAAAUGUUGUCCCCCAAAAUGUAGCCAUUCGUAUC UGCUCCUAAUAAAAAGAAAGUUUCUUCACAUUCUCUCGAGAAAAAAAAAAAA

Descrição Sequência SEQ ID No.

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAUCUAG transcrito de GGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGTTG mRNA com ORF CAGGCCTTATTCGGATCCGCCACCATGGACAAGAAGTACAGCATCGGACTGG que codifica ACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATACAAGGT Cas9 com CCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAGCATCAAG etiqueta HiBiT, AAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAGCAGAAGCAA HSD 5' UTR e CAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAAAGAACAGAAT ALB 3' UTR CTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGC humana TTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACG

AAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCGCATACCACGAAAA GTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAG GCAGACCTGAGACTGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAG GACACTTCCTGATCGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAA GCTGTTCATCCAGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGA TCAACGCAAGCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAA GAGCAGAAGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAAC GGACTGTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCA AGAGCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACAC ATACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGCA GACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACA TCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGAT CAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTC AGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGA ACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAA GTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTC AAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAA GCATCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACA GGAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCC TGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAG ATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTC GAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGA CAAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCT GCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGTCA CAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGGCAAT

CGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGCTGAAG GAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCAGCGGAG 179

Descrição Sequência SEQ ID No.

TCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTGCTGAAGAT CATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGACATCCTGGAA GACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATGATCGAAGAAAG ACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAG AGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAA TCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGG ATTCGCAAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCA AGGAAGACATCCAGAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACG AACACATCGCAAACCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCA GACAGTCAAGGTCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCG GAAAACATCGTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGAC AGAAGAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACT GGGAAGCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAAC GAAAAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACC AGGAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGTCCC GCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGC GACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGA AGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAG AAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGAC AAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGC ACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGA CAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGC GACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCA CCACGCACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAG AAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACG ACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGC AAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACT GGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACA GGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGTCC TGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAGGAGG ATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTGATCGCA AGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGACAGCCCGACA GTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAAAGAGCAAGA AGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCATGGAAAGAAGCAG CTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGGGATACAAGGAAGTC AAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAA ACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACG

Descrição Sequência SEQ ID No.

AACTGGCACTGCCGAGCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTA CGAAAAGCTGAAGGGAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTC GAACAGCACAAGCACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCA GCAAGAGAGTCATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATA CAACAAGCACAGAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCAC CTGTTCACACTGACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACA CAACAATCGACAGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAAC ACTGATCCACCAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGC CAGCTGGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCAGC GAAAGCGCAACACCGGAAAGCGTCAGCGGATGGAGACTGTTCAAGAAGATCA GCTAGCTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGA AAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAA GCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTC TGTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAGAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAATCTAG transcrito de GGGCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATCGCCACC mRNA com ORF ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGAT que codifica GGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCT Cas9 com GGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTG etiqueta HiBiT, TTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAA CMV-1 5' UTR e GAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGC ALB 3' UTR AACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCT humana TCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACAT

CGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGA AAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGG CACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCT GAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACA TACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAA AGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGAT CGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCA CTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAG ACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCT GCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAAC CTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCA

CAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCA GGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTAC 180

Descrição Sequência SEQ ID No.

AAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACG GAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAA GATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTG AGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGG GAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAA GGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACG TCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAG CGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCA AGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGA ACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTAC AACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCAT TCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAA CAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAAT GCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCT GGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGAC AACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTT CGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTC GACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAA GACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGAC AATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGC TGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGT CAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAG CCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTG GTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAA GAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAA GAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACAC CCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGC AGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAG CGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGC ATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACA ACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCT GCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCA GAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAG CTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCA GAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGT CATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCT ACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA

Descrição Sequência SEQ ID No.

CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA GCCCGAAGAAGAAGAGAAAGGTCAGCGAAAGCGCAACACCGGAAAGCGTCA GCGGATGGAGACTGTTCAAGAAGATCAGCTAGCTAGCCATCACATTTAAAAGC ATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTC ATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAA TTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAA GAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

A transcrito de GGGAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCGGGAACGGCGCCA mRNA com ORF CCATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGG que codifica ATGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTC Cas9 com CTGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGC etiqueta HiBiT, TGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAG CMV-2 5' UTR e AAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCA ALB 3' UTR GCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAG 181

Descrição Sequência SEQ ID No. humana CTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAAC

ATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGA GAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCT GGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGAC CTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGA CATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGC AAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTG ATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCG CACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGA AGACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAAC CTGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGA ACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAAT CACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCAC CAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGT ACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGA CGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAA AAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGC TGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCT GGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTG AAGGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTA CGTCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAG AGCGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAG CAAGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCC GAACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTC TACAACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGG CATTCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGAC AAACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATC GAATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAA GCCTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCT GGACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACA CTGTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCT GTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGG GGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAA AGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATG CAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCAC AGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAG GAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGA

Descrição Sequência SEQ ID No.

ACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATG GCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAA TGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGA ACACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTAC CTGCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGAC TGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGA CAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGC GACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGAC AGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAA GGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAG ACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGAC AGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCA AGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCA GTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACC TGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAG CGAATTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAA AGAGCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAA CATCATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAA AGAGACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAA GGGAAGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAAC ATCGTCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCC TGCCGAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCC GAAGAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTC GTCGCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAAC TGCTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGA CTTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAG CTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGG CAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGT ACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCC GGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTG GACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAG ACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCC GATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGG GAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATA CACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACA GGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGA GGAAGCCCGAAGAAGAAGAGAAAGGTCAGCGAAAGCGCAACACCGGAAAGC

Descrição Sequência SEQ ID No.

GTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAGCTAGCCATCACATTTAA AAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCT TATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAAC ATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATG GAAAGAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAA transcrito de GGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACTCACCGCGCCAC mRNA com ORF CATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGA que codifica TGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCC Cas9 com TGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCT etiqueta HiBiT, GTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGA CMV-3 5' UTR e AGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAG ALB 3' UTR CAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGC humana TTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACA

TCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAG AAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTG GCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACC TGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGAC ATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCA AAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGA TCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGC ACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAA GACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACC TGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAA CCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATC ACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACC AGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTA CAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGAC GGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAA AGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCT GAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTG GGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGA AGGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTAC GTCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGA

GCGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGC AAGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCG 182

Descrição Sequência SEQ ID No.

AACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTA CAACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCA TTCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAA ACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGA ATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGC CTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGG ACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACT GTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGT TCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGG AAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAG ACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCA GCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAG GTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGA AGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAAC TGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGC AAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATG AAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAAC ACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCT GCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTG AGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACA GCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGA CAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAG CTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGG CAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACA GCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGC AGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGG TCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTC TACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAA CGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAA TTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGA GCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATC ATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAG ACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGA AGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCG TCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCC GAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAA GAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTC

Descrição Sequência SEQ ID No.

GCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGC TGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTC CTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGC CGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAG CGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGT CAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAA GACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACG AAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGC AAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATC AGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAG CACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACA AGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGAC TGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAA GCCCGAAGAAGAAGAGAAAGGTCAGCGAAAGCGCAACACCGGAAAGCGTCA GCGGATGGAGACTGTTCAAGAAGATCAGCTAGCTAGCCATCACATTTAAAAGC ATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTC ATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAA TTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAA GAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

A transcrito de GGGCATAAACCCTGGCGCGCTCGCGGCCCGGCACTCTTCTGGTCCCCACAG mRNA com ORF ACTCAGAGAGAACCCACCCGCCACCATGGACAAGAAGTACAGCATCGGACTG que codifica GACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATACAAGG Cas9 com TCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAGCATCAA etiqueta HiBiT, GAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAGCAGAAGCA HBA 5' UTR e ACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAAAGAACAGAAT ALB 3' UTR CTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGC humana TTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACG

AAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCGCATACCACGAAAA GTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAG GCAGACCTGAGACTGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAG GACACTTCCTGATCGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAA GCTGTTCATCCAGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGA TCAACGCAAGCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAA

GAGCAGAAGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAAC GGACTGTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCA 183

Descrição Sequência SEQ ID No.

AGAGCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACAC ATACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGCA GACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACA TCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGAT CAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTC AGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGA ACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAA GTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTC AAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAA GCATCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACA GGAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCC TGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAG ATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTC GAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGA CAAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCT GCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGTCA CAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGGCAAT CGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGCTGAAG GAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCAGCGGAG TCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTGCTGAAGAT CATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGACATCCTGGAA GACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATGATCGAAGAAAG ACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAG AGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAA TCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGG ATTCGCAAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCA AGGAAGACATCCAGAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACG AACACATCGCAAACCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCA GACAGTCAAGGTCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCG GAAAACATCGTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGAC AGAAGAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACT GGGAAGCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAAC GAAAAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACC AGGAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGTCCC GCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGC GACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGA AGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAG

Descrição Sequência SEQ ID No.

AAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGAC AAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGC ACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGA CAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGC GACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCA CCACGCACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAG AAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACG ACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGC AAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACT GGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACA GGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGTCC TGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAGGAGG ATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTGATCGCA AGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGACAGCCCGACA GTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAAAGAGCAAGA AGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCATGGAAAGAAGCAG CTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGGGATACAAGGAAGTC AAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAA ACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACG AACTGGCACTGCCGAGCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTA CGAAAAGCTGAAGGGAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTC GAACAGCACAAGCACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCA GCAAGAGAGTCATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATA CAACAAGCACAGAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCAC CTGTTCACACTGACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACA CAACAATCGACAGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAAC ACTGATCCACCAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGC CAGCTGGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCAGC GAAAGCGCAACACCGGAAAGCGTCAGCGGATGGAGACTGTTCAAGAAGATCA GCTAGCTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGA AAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAA GCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTC TGTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAGAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA transcrito de GGGACATTTGCTTCTGACACAACTGTGTTCACTAGCAACCTCAAACAGACACC mRNA com ORF GGATCTCGCCACCATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACA 184

Descrição Sequência SEQ ID No. que codifica AACAGCGTCGGATGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGA Cas9 com AGTTCAAGGTCCTGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGAT etiqueta HiBiT, CGGAGCACTGCTGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAG HBB 5' UTR e AGAACAGCAAGAAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCA ALB 3' UTR GGAAATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGA humana CTGGAAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGA

TCTTCGGAAACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATC TACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGAC TGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATC GAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGC TGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGG AGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTG GAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAA ACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGA CCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGA CCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTG GCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCA ACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGA CGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTG CCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAG GATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCC GATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGA GAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACC AGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTA CCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAA TCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGAT GACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTC GACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACA AGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATA CTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGA GAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCT GTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCA AGAAGATCGAATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATT CAACGCAAGCCTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAG GACTTCCTGGACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGA CACTGACACTGTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATAC GCACACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACA

Descrição Sequência SEQ ID No.

CAGGATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCA GAGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGA AACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCA GAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAA CCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTC GTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCA TCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAG AGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATC CTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACC TGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACAT CAACAGACTGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTG AAGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAG GAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTA CTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAAC CTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTC ATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGA TCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAG AGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAG GACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGA CGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAG CTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGA TGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTT CTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAG AAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGT CTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCG CAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGG AAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGA CTGGGACCCGAAGAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAG CGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGC GTCAAGGAACTGCTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGA ACCCGATCGACTTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCT GATCATCAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAG AGAATGCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTG CCGAGCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGA AGGGAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAA GCACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTC ATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACA

Descrição Sequência SEQ ID No.

GAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACT GACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGAC AGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCACC AGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGG AGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCAGCGAAAGCGCAAC ACCGGAAAGCGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAGCTAGCC ATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAA GATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCT GTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAAT TAATAAAAAATGGAAAGAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAA transcrito de GGGAAGCTCAGAATAAACGCTCAACTTTGGCCGGATCTCGCCACCATGGACA mRNA com ORF AGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGGCAGT que codifica CATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAAC Cas9 com ACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACA etiqueta HiBiT, GCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATA XBG 5' UTR e CACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAA ALB 3' UTR TGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGT humana CGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGAC

GAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCT GGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCA CACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGG ACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCA GCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAATC CTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCACAGC TGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTGAGCCT GGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACGCAAAG CTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCTGGCAC AGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTGAGCGA CGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAAAGGCA CCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGACCTGA CACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAAT CTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAGGAGCA AGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACG

GAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCA GAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTG 185

Descrição Sequência SEQ ID No.

CACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACA GAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCG CTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGAAA CAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACA GAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAG GTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAACT GACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTGAGC GGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGG TCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGAC AGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACAT ACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGA AAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACA GAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAA GGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGC AGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGG ACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCAC GACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGAC AGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCAA TCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAAGGT CATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAAAAC CAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAATCG AAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGTCGA AAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAACGGA AGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACTACG ACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGACAA CAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTCCCG AGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACG CAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGG AGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAA ACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACA CAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACT GAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTC AGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCG TCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTA CGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAG GAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACTT CTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTG

Descrição Sequência SEQ ID No.

ATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACT TCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAA GACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGA AACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACG GAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGT CGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATC ACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAG CAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTA CAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGA GAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCC TGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACGA ACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCATC GAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTGG ACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAACA GGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGCA GCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAAA GGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGAA ACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCCGAAG AAGAAGAGAAAGGTCAGCGAAAGCGCAACACCGGAAAGCGTCAGCGGATGG AGACTGTTCAAGAAGATCAGCTAGCTAGCCATCACATTTAAAAGCATCTCAGC CTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTT TTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTA ATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCTC GAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS1 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK

EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL 186

Descrição Sequência SEQ ID No.

DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSLAAKRSRTT Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS2 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH

YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE 187

Descrição Sequência SEQ ID No.

TRIDLSQLGGDGGGSQAAKRSRTT Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS3 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR

DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE TRIDLSQLGGDGGGSPAPAKRERTT 188 Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS4 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP

KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT 189

Descrição Sequência SEQ ID No.

LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSQAAKRPRTT Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS5 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK

GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR 190

Descrição Sequência SEQ ID No.

DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSRAAKRPRTT Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS6 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE TRIDLSQLGGDGGGSAAAKRSWSMAA 191 Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS7 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL

ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK 192

Descrição Sequência SEQ ID No.

EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSAAAKRVWSMAF Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS8 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK

KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH 193

Descrição Sequência SEQ ID No.

YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSAAAKRSWSMAF Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS9 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE TRIDLSQLGGDGGGSAAAKRKYFAA 194 Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS10 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED

LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP 195

Descrição Sequência SEQ ID No.

KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSRAAKRKAFAA Sequência de MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGE aminoácidos TAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKH para Cas9 com ERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIE NLS11 GDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQ

LPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGD QYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQ QLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNRED LLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPL ARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLP KHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLK EDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLT LFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTIL DFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKG ILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLK DDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKA ERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVY DVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVW

DKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPK KYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAK 196

Descrição Sequência SEQ ID No.

GYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASH YEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHR DKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE

TRIDLSQLGGDGGGSRAAKRKYFAV RNA guia G506 mA*mU*mA*CCAGUCCAGCGAGGCAGGUUUUAGAmGmCmUmAmGmAmAmA direcionado a mUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmA TTR mAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU* mU*mU 197 RNA guia G510 mA*mC*mU*UGUCUUCUCUAUACCCAGUUUUAGAmGmCmUmAmGmAmAmAm direcionado a UmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAm TTR AmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*m U*mU 198 * = Ligação PS; 'm' = nucleotídeo 2'-O-Me

Claims

REIVINDICAÇÕES

1. Ácido ribonucleico mensageiro (mRNA), caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de uridina que varia de seu teor mínimo de uridina a 150% do teor mínimo de uridina.

2. Ácido ribonucleico mensageiro (mRNA), caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de dinucleotídeo de uridina que varia de seu teor mínimo de dinucleotídeo de uridina a 150% do teor mínimo de dinucleotídeo de uridina.

3. Ácido ribonucleico mensageiro (mRNA), caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de adenina que varia de seu teor mínimo de uridina a 150% do teor mínimo de adenina.

4. Ácido ribonucleico mensageiro (mRNA), caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA, em que o quadro de leitura aberto tem um teor de dinucleotídeo de adenina que varia de seu teor mínimo de dinucleotídeo de adenina a 150% do teor mínimo de dinucleotídeo de adenina.

5. Ácido ribonucleico mensageiro (mRNA), caracterizado pelo fato de que compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175, em que o mRNA compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA.

6. Ácido ribonucleico mensageiro (mRNA), caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA, em que o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos seus primeiros 30, 50, 70, 100, 150, 200, 250 ou 300 nucleotídeos.

7. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são (i) códons listados na Tabela 1, Tabela 2 ou Tabela 3, ou (ii) um conjunto de códons listados na Tabela

4.

8. Ácido ribonucleico mensageiro (mRNA) que codifica um agente de ligação a DNA guiado por RNA, caracterizado pelo fato de que compreende um quadro de leitura aberto que codifica um agente de ligação a DNA guiado por RNA, em que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons listados na Tabela 1, Tabela 2, Tabela 3 ou (ii) um conjunto de códons listados na Tabela 4.

9. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto U 1 baixo definido na Tabela 4.

10. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto A baixo definido na Tabela 4.

11. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75%

dos códons são códons do conjunto A/U baixo definido na Tabela 4.

12. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que o quadro de leitura aberto consiste em um conjunto de códons dos quais pelo menos 75% dos códons são códons do conjunto de meia-vida longa definido na Tabela 4.

13. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 7 a 12, caracterizado pelo fato de que pelo menos 80%, 85%, 90%, 95%, 98%, 99% ou 100% dos códons são (i) códons listados na Tabela 1, Tabela 2 ou Tabela 3 ou (ii) um conjunto de códons listados na Tabela 4.

14. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 1 a 5 ou 7 a 13, caracterizado pelo fato de que o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos seus primeiros 30, 50, 70, 100, 150, 200, 250 ou 300 nucleotídeos.

15. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto tem pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175 durante pelo menos os primeiros 10%, 12%, 15%, 20%, 25%, 30% ou 35% de sua sequência.

16. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 1 a 4 ou 6 a 15, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NO: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65 ou 66, ou 107-

175.

17. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto tem um teor de dinucleotídeo de uridina que varia de seu teor mínimo de dinucleotídeo de uridina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125 %, 130%, 135%, 140%, 145% ou 150% do teor mínimo de dinucleotídeo de uridina.

18. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto tem um teor de uridina que varia de seu teor mínimo de uridina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% ou 150% do teor mínimo de uridina.

19. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto tem um teor de adenina que varia de seu teor mínimo de uridina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% ou 150% do teor mínimo de adenina.

20. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto tem um teor de dinucleotídeo adenina que varia de seu teor mínimo de dinucleotídeo de adenina a 101%, 102%, 103%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145% ou 150% do teor mínimo de dinucleotídeo de adenina.

21. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que compreende uma UTR 5' com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 32, 34, 36, 38, 41 ou 75-77.

22. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que uma UTR 3' com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 33, 35, 37, 39 ou 40.

23. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 21 ou 22, caracterizado pelo fato de que o mRNA compreende uma UTR 5' e uma UTR 3' da mesma fonte.

24. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que compreende um capeamento 5' selecionado de Cap0, Cap1 e Cap2.

25. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro de leitura aberto possui códons que aumentam a tradução do mRNA em um mamífero.

26. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 25, caracterizado pelo fato de que o quadro de leitura aberto possui códons que aumentam a tradução do mRNA em um órgão específico de um mamífero.

27. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 26, caracterizado pelo fato de que o órgão é fígado.

28. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 25 a 27, caracterizado pelo fato de que o mamífero é um ser humano.

29. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 25 a 28, caracterizado pelo fato de que os códons aumentam a tradução do mRNA no mamífero em relação à tradução de um mRNA compreendendo um ORF com uma sequência que consiste na SEQ ID NO: 5.

30. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que, quando o mRNA é administrado a um mamífero em uma composição farmacêutica, o mamífero exibe uma resposta de citocina pelo menos 5 vezes menor que um mamífero que foi administrado com um mRNA compreendendo um ORF que codifica uma nuclease Cas9 com mais de 150% do teor mínimo de uridina.

31. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 30, caracterizado pelo fato de que o mRNA que compreende o ORF que codifica a Cas9 nuclease com mais de 150% do teor mínimo de uridina tem uma sequência que consiste em SEQ ID NO: 5.

32. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o agente de ligação ao DNA guiado por RNA possui atividade de endonuclease de fita dupla.

33. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 32, caracterizado pelo fato de que o agente de ligação ao DNA guiado por RNA compreende uma Cas cleavase.

34. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o agente de ligação ao DNA guiado por RNA tem atividade de nickase.

35. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 34, caracterizado pelo fato de que o agente de ligação ao DNA guiado por RNA compreende uma Cas nickase.

36. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 1 a 31, caracterizado pelo fato de que o agente de ligação ao DNA guiado por RNA compreende um domínio de ligação a dCas DNA.

37. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 33 ou 35 e 36, caracterizado pelo fato de que o domínio de ligação a Cas cleavase, Cas nickase, ou dCas DNA é um domínio de ligação a Cas9 cleavase, Cas9 nickase, ou dCas9 DNA.

38. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o agente de ligação a DNA guiado por RNA codificado compreende um sinal de localização nuclear (NLS).

39. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 38, caracterizado pelo fato de que o NLS está ligado ao C-terminal do agente de ligação a DNA guiado por RNA.

40. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 38, caracterizado pelo fato de que o NLS está ligado ao N-terminal do agente de ligação a DNA guiado por RNA.

41. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 38 a 40, caracterizado pelo fato de que o NLS compreende uma sequência com pelo menos 80%, 85%, 90% ou 95% de identidade com qualquer uma das SEQ ID NOs: 78-91.

42. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 38 a 40, caracterizado pelo fato de que o NLS compreende a sequência de qualquer uma das SEQ ID NOs: 78-

91.

43. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 38 a 42, caracterizado pelo fato de que o NLS é codificado por uma sequência com pelo menos 80%, 85%, 90%, 95%, 98% ou 100% de identidade com a sequência de qualquer uma das SEQ ID NOs : 92-104.

44. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 4, 7 ou 9.

45. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 4, 7 ou 9.

46. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 98% de identidade com a SEQ ID NO: 4, 7 ou 9.

47. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência 100% idêntica à SEQ ID NO: 4, 7 ou 9.

48. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 111, 114 ou 117.

49. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 111, 114 ou 117.

50. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 98% de identidade com a SEQ ID NO: 111, 114 ou 117.

51. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência 100% idêntica à SEQ ID NO: 112, 122 ou 125.

52. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 90% de identidade com a SEQ ID NO: 112, 122 ou 125.

53. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 112, 122 ou 125.

54. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 90% de identidade com as SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175.

55. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 95% de identidade com a SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66 ou 107-175.

56. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 98% de identidade com as SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175.

57. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 43, caracterizado pelo fato de que o mRNA compreende uma sequência 100% idêntica às SEQ ID NO: 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 66, ou 107-175.

58. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 37 a 57, caracterizado pelo fato de que o mRNA codifica um polipeptídeo compreendendo a sequência de aminoácidos da SEQ ID NO: 3, 6, 8 ou 186-196.

59. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o agente de ligação a DNA guiado por RNA compreende ainda um domínio funcional heterólogo.

60. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 59, caracterizado pelo fato de que o domínio funcional heterólogo é uma FokI nuclease.

61. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 59, caracterizado pelo fato de que o domínio funcional heterólogo é um domínio regulador da transcrição.

62. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que, quando uma quantidade eficaz do mRNA é administrada a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, um indel é formado no locus TTR em pelo menos 50% do DNA genômico obtido a partir de hepatócitos do mamífero.

63. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que, quando uma quantidade eficaz do mRNA é administrada a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, a concentração de TTR no soro do mamífero é reduzida em pelo menos 50%.

64. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que pelo menos 10% da uridina é substituída por uma uridina modificada.

65. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 64, caracterizado pelo fato de que a uridina modificada é um ou mais de N1-metil-pseudouridina, pseudouridina, 5- metoxiuridina ou 5-iodouridina.

66. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 64, caracterizado pelo fato de que a uridina modificada é uma ou ambas de N1-metil-pseudouridina ou 5-metoxiuridina.

67. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 64, caracterizado pelo fato de que a uridina modificada é N1-metil-pseudouridina.

68. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 64, caracterizado pelo fato de que a uridina modificada é 5-metoxiuridina.

69. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 64 a 68, caracterizado pelo fato de que 15% a 45% da uridina são substituídos pela uridina modificada.

70. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 64 a 68, caracterizado pelo fato de que pelo menos 20% ou pelo menos 30% da uridina são substituídos pela uridina modificada.

71. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 70, caracterizado pelo fato de que pelo menos 80% ou pelo menos 90% da uridina é substituída pela uridina modificada.

72. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 70, caracterizado pelo fato de que 100% de uridina são substituídos pela uridina modificada.

73. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 64 a 72, caracterizado pelo fato de que, quando uma quantidade eficaz do mRNA é administrada a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, um indel é formado no locus TTR em pelo menos 70% ou pelo menos 90% do DNA genômico obtido a partir de hepatócitos do mamífero.

74. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações 64 a 73, caracterizado pelo fato de que, quando o mRNA é administrado a um mamífero juntamente com um RNA guia que direciona o gene TTR do mamífero em uma composição farmacêutica compreendendo nanopartículas lipídicas, a concentração de TTR no soro do mamífero é reduzida em pelo menos 70% ou pelo menos 90%.

75. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 62, 63, 71 ou 72, caracterizado pelo fato de que o animal é um camundongo e o RNA guia tem uma sequência que consiste na SEQ ID NO: 42.

76. Ácido ribonucleico mensageiro (mRNA), de acordo com a reivindicação 62, 63, 71 ou 72, caracterizado pelo fato de que o animal é um rato e o RNA guia tem uma sequência que consiste na SEQ ID NO: 69.

77. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 90% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

78. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 95% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

79. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 98% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

80. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o mRNA compreende uma sequência com pelo menos 99% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

81. Ácido ribonucleico mensageiro (mRNA), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o mRNA compreende uma sequência com 100% de identidade com qualquer uma das SEQ ID NOs: 43, 44, 51, 53, 55-61 ou 176-185.

82. Construto de expressão, caracterizado pelo fato de que compreende um promotor operacionalmente ligado a uma sequência que codifica um mRNA como definido em qualquer uma das reivindicações anteriores.

83. Plasmídeo, caracterizado pelo fato de que compreende o construto de expressão como definido na reivindicação 82.

84. Célula hospedeira, caracterizada pelo fato de que compreende o construto de expressão como definido na reivindicação 82, ou o plasmídeo como definido na reivindicação 83.

85. Método para preparar um mRNA, caracterizado pelo fato de que compreende contatar o construto de expressão como definido na reivindicação 82, ou o plasmídeo como definido na reivindicação 83, com uma RNA polimerase em condições permissivas para a transcrição do mRNA.

86. Método, de acordo com a reivindicação 85, caracterizado pelo fato de que a etapa de contato é realizada in vitro.

87. Composição, caracterizada pelo fato de que compreende um mRNA como definido em qualquer uma das reivindicações 1 a 81, e pelo menos um RNA guia.

88. Nanopartícula lipídica, caracterizada pelo fato de que compreende um mRNA como definido em qualquer uma das reivindicações 1 a 81.

89. Composição farmacêutica, caracterizada pelo fato de que compreende um mRNA como definido em qualquer uma das reivindicações 1 a 81, e um transportador farmaceuticamente aceitável.

90. Nanopartícula lipídica, de acordo com a reivindicação 88, ou composição farmacêutica, de acordo com a reivindicação 89, caracterizada pelo fato de que compreende ainda pelo menos um RNA guia.

91. Composição ou nanopartícula lipídica, de acordo com qualquer uma das reivindicações 87 a 90, caracterizada pelo fato de que o pelo menos um RNA guia direciona TTR.

92. Método para editar ou modificar um genoma de um gene alvo, caracterizado pelo fato de que compreende contatar uma célula com o mRNA, construto de expressão, composição ou nanopartícula lipídica como definidos em qualquer uma das reivindicações 1 a 83 ou 87 a 91.

93. Uso do mRNA, construto de expressão, composição ou nanopartícula lipídica, como definidos em qualquer uma das reivindicações 1 a 83 ou 87 a 91, caracterizado pelo fato de que é para edição do genoma ou modificação de um gene alvo.

94. Uso do mRNA, construto de expressão, composição ou nanopartícula lipídica, como definidos em qualquer uma das reivindicações 1 a 83 ou 87 a 91, caracterizado pelo fato de que é para a fabricação de um medicamento para edição ou modificação de genoma de um gene alvo.

95. Método ou uso, de acordo com qualquer uma das reivindicações 92 a 94, caracterizado pelo fato de que a edição ou modificação do genoma do gene alvo ocorre em uma célula do fígado.

96. Método ou uso, de acordo com a reivindicação 95, caracterizado pelo fato de que a célula hepática é um hepatócito.

97. Método ou uso, de acordo com qualquer uma das reivindicações 92 a 96, caracterizado pelo fato de que a edição ou modificação do genoma do gene alvo é in vivo.

98. Método ou uso, de acordo com qualquer uma das reivindicações 92 a 97, caracterizado pelo fato de que a edição ou modificação do genoma do gene alvo está em uma célula isolada ou cultivada.