BR112020003439A2

BR112020003439A2 - tecnologia de alteração específica de sequência alvo usando o reconhecimento alvo nucleotídico

Info

Publication number: BR112020003439A2
Application number: BR112020003439-8A
Authority: BR
Inventors: Keishi Osakabe; Yuriko Osakabe
Original assignee: Tokushima University
Priority date: 2017-08-21
Filing date: 2018-08-20
Publication date: 2020-08-25
Also published as: MX2020001998A; CA3073372A1; NZ762361A; WO2019039417A1; JP7054283B2; JP2022009293A; AU2018321021A1; KR20200039775A; US20210363520A1; JP7017259B2; KR102626503B1; AU2018321021B2; EP3674404A1; JPWO2019039417A1; IL272688A; SG11202001471SA; CN111247247A; US12012596B2; EP3674404A4

Abstract

A presente invenção refere-se a um método para direcionar uma sequência nucleotídica alvo. O método inclui a introdução em uma célula: (i) proteínas relacionadas tipo I-D de CRISPR Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam estas proteínas; e (ii) um RNA guia que inclui uma sequência complementar à referida sequência nucleotídica alvo e uma sequência repetitiva comum derivada do locus do gene de CRISPR antes e depois da referida sequência complementar, ou um DNA que codifica o referido RNA guia.

Description

Relatório Descritivo da Patente de Invenção para "TECNO-

LOGIA DE ALTERAÇÃO ESPECÍFICA DE SEQUÊNCIA ALVO USANDO O RECONHECIMENTO ALVO NUCLEOTÍDICO". Campo técnico

[0001] A presente invenção refere-se a um método para direcionar uma sequência nucleotídica alvo, um método para alterar especifica- mente a sequência nucleotídica alvo e um método para suprimir a ex- pressão de um gene alvo, em que o reconhecimento alvo nucleotídico de CRISPR (Repetições Palindrômicas Curtas com Intercalação Regu- lar e Agrupadas) é utilizado um sistema de identificação de tipo e um complexo compreendendo proteínas Cas (associadas às CRISPR) e um RNA guia usado nos métodos. Técnica Anterior

[0002] Bactérias e arqueias têm sistemas de CRISPR como siste- ma imunológico adaptativo contra vírus e plasmídeos estranhos hete- rólogos. O sistema de CRISPR utiliza um RNA molecular baixo (referi- do como RNA guia ou gRNA) que é complementar a uma sequência de DNA invasora para promover o direcionamento e a degradação do DNA estranho alvo. Neste momento, é necessária a proteína Cas que se liga ao gRNA para formar um complexo. O sistema de CRISPR in- clui sistemas tipo |, tipo Il, tipo Ill e tipo V. Em qualquer sistema, o complexo Cas-proteína-RNAm atua na sequência alvo para causar interferência em vírus e plasmídeos estranhos. Nos sistemas tipo Il e tipo V, o mecanismo de interferência envolve quebras de fita dupla do DNA no DNA alvo por uma proteína integrada com um domínio protei- co que retém a ligação ao gRNA e um domínio proteico de clivagem de DNA do tipo RuvC. Para o sistema tipo Ill, foi demonstrado in vitro e in vivo que a interferência é causada pela clivagem de uma sequência de RNA alvo por um complexo de cinco a oito proteínas Cas e um gRNA, diferentemente do sistema tipo |l.

[0003] Nos últimos anos, foram desenvolvidas técnicas de edição de genoma usando os sistemas de CRISPR tipo || e tipo V, em que Cas9 e Cpf1 são utilizados como proteína Cas. Cas9 e Cpf1 exigem uma sequência que consiste em cerca de 2 a 5 nucleotídeos na proxi- midade de uma sequência alvo, que é chamada de sequência de moti- vo adjacente protoespaçador (PAM), a fim de reconhecer o DNA alvo. Ela foi demonstrada in vitro e in vivo que um complexo Cas9-gRNA e um complexo Cpf1-gRNA são endonucleases guiadas por RNA espe- cíficas da sequência que causam quebras de fita dupla de DNA em sítios alvo próximos às sequências de PAM.

[0004] Por outro lado, em relação ao sistema de CRISPR tipo |, vários subtipos foram identificados em sequências genômicas de vá- rias bactérias, e os subtipos foram denominados tipo IA, IB, IC, ID, IE, IF e IU. Entre esses subtipos, o sistema tipo IE derivado de Escheri- chia coli foi mais estudado e demonstrou-se que um complexo que consiste em seis proteínas Cas (Cas3, Cse1l, Cse2, Cas7, Cas5, Cas6e) e um gRNA promove a degradação de uma sequência de DNA alvo. Para os outros subtipos, excluindo um subtipo (tipo |-C), no en- tanto, os componentes da proteína Cas, sequências de gRNA, se- quências de PAM que determinam os DNAs alvo, etc. necessários pa- ra o efeito de interferência, dificilmente são elucidados. Além disso, como técnicas que utilizam proteínas CAS derivadas do sistema de CRISPR tipo |, um método para suprimir a expressão de um gene alvo que compreende o uso de moléculas de ácido nucleico recombinantes que codificam proteínas CAS derivadas do sistema de CRISPR tipo | (Literatura de Patente 1) e um método para alterar um ácido nucleico alvo que compreende a utilização de um complexo de proteínas Cas derivadas do sistema de CRISPR tipo | e outras proteínas (literatura de patente 2 e literatura de patente 3) foram relatadas. No entanto, nunca foi relatada uma técnica para clivar e alterar uma fita dupla de uma molécula de DNA alvo por endonuclease guiada por RNA derivada do sistema de CRISPR tipo |. Lista de Citação Literatura de Patente

[0005] Literatura de Patente 1: WO2015/155686

[0006] Literatura de patente 2: JP-A 2015-503535

[0007] Literatura de Patente 3: WO2017/043573 Sumário da Invenção Problemas Técnicos

[0008] Nos sistemas de CRISPR convencionais tipo |l e tipo V, uma molécula de RNA a ser utilizada para direcionar é limitada a uma molécula de RNA de cerca de 20 nucleotídeos que precede ou segue uma sequência PAM de 2 a 5 nucleotídeos que determina a especificida- de do alvo. Assim, os sistemas de CRISPR convencionais tipo Il e V têm problemas em que existem locis em que um alvo não pode ser projetado e que sequências semelhantes podem ser clivadas. É desejável o de- senvolvimento de um novo sistema de direcionamento e de uma nova endonuclease guiada por RNA que não possua os problemas. Solução de Problemas

[0009] Para resolver os problemas acima, os presentes inventores estudaram intensivamente. Como resultado, surpreendentemente, um novo sistema de direcionamento e uma nova endonuclease guiada por RNA que têm como alvo uma sequência mais longa do que a sequên- cia alvo das endonucleases CRISPR tipo Il ou endonucleases guiadas por RNA tipo V convencionalmente usadas na tecnologia de edição de genoma foram encontradas a partir do CRISPR tipo ID, e então verifi- cou-se que o novo sistema de direcionamento e a endonuclease guia- da por RNA podem ser usados em técnicas de edição de genoma para permitir a alteração em uma sequência nucleotídica alvo. Assim, a presente invenção foi concluída.

[0010] Ou seja, a presente invenção fornece:

[1] Um método para direcionar uma sequência nucleotídica alvo, o método compreendendo a introdução em uma célula de: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia;

[2] Um método para alterar uma sequência nucleotídica al- vo, o método compreendendo a introdução em uma célula de: (i) proteínas associadas a CRISPR tipo |-D Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos que codificam as proteí- nas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia;

[3] Um método para suprimir a expressão de um gene alvo, o método compreendendo a introdução em uma célula de: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar a pelo menos uma parte da sequência do gene alvo e sequên- cias repetitivas comuns derivadas de um locus de CRISPR, preceden- do e seguindo a sequência complementar, ou um DNA que codifica o RNA guia;

[4] O método de acordo com qualquer um dentre [1] a [3], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos que é complementar à sequência nucleotídica alvo;

[5] O método de acordo com [2] ou [4], compreendendo ainda a introdução de um polinucleotídeo doador na célula;

[6] O método de acordo com qualquer um dentre [2], [4] e

[5], em que a alteração é deleção, inserção ou substituição de nucleo- tídeos;

[7] O método de acordo com qualquer um dentre [1] a [6], em que a Cas5d reconhece 5'-GTH-3' (H = A, C ou T) como uma se- quência de motivo adjacente protoespaçador (PAM);

[8] Um complexo, compreendendo: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um RNA guia compreendendo uma sequência comple- mentar a uma sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar;

[9] O complexo de acordo com [8], compreendendo ainda Cas3d e Cas10d;

[10] O complexo de acordo com [8] ou [9], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotí- deos que é complementar à sequência nucleotídica alvo;

[11] Um vetor de expressão caracterizado pelo fato de que compreende: (i) ácidos nucleicos que codificam as proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um DNA que codifica um RNA guia compreendendo uma sequência complementar à sequência nucleotídica alvo e se- quências repetitivas comuns derivadas de um locus de CRISPR, pre- cedendo e seguindo a sequência complementar;

[12] O vetor de expressão de acordo com [11], compreen- dendo ainda ácidos nucleicos que codificam Cas3d e Cas10d;

[13] Uma molécula de DNA que codifica o complexo de acordo com qualquer um dentre [8] a [10];

[14] Uso de (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia, para direcionar a sequência nucleotídica alvo;

[15] Uso de (i) proteínas associadas a CRISPR tipo |-D Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos que codificam as proteí- nas, e (ii) um RNA guia compreendendo uma sequência comple- mentar à sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequên- cia complementar, ou um DNA que codifica o RNA guia, para alterar a sequência nucleotídica alvo;

[16] Uso de (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência comple- mentar a pelo menos uma parte da sequência genética segmentada e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, ou um DNA que codifica o RNA guia, para suprimir a expressão do gene alvo;

[17] Uso de acordo com qualquer um dentre [14] a [16], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos complementares à sequência nucleotídica alvo;

[18] Uso de acordo com [15] ou [17], em que a alteração é exclusão, inserção ou substituição de nucleotídeo;

[19] Uso de acordo com qualquer um dentre [14] a [18], em que a Cas5d reconhece 5'-GTH-3' (H = A, C ou T) como uma sequên- cia de motivo adjacente protoespaçador (PAM);

[20] Uso de um complexo compreendendo: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um RNA guia que compreende uma sequência comple- mentar a uma sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, para direcionar a sequência nucleotídica alvo;

[21] Uso de um complexo compreendendo: (i) proteínas associadas a CRISPR tipo |-DCas3d, Cas5d, Cas6d, Cas7d e Cas10d e (ii) um RNA guia que compreende uma sequência comple- mentar a uma sequência nucleotídica alvo e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, para alterar a sequência nucleotídica alvo;

[22] Uso do complexo, compreendendo: (i) proteínas associadas a CRISPR tipo |-D Cas5d, Cas6d e Cas7d, e (ii) um RNA guia que compreende uma sequência comple- mentar a pelo menos uma parte da sequência genética segmentada e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, para suprimir a expressão do gene alvo; e

[23] Uso de acordo com qualquer um dentre [20] a [22], em que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos complementares à sequência nucleotídica alvo. Efeitos da Invenção

[0011] As sequências de PAM do sistema de CRISPR tipo I|-D (a seguir, também denominado "TiD") são diferentes das sequências de PAM do sistema de CRISPR tipo |l e do sistema tipo V. Portanto, de acordo com a presente invenção, o uso das proteínas Cas de CRISPR tipo I-D torna possível direcionar loci que não podem ser direcionados pelas técnicas convencionais de edição de genoma usando endonu- cleases guiadas por RNA derivado de CRISPR tipo Il ou V. Além dis- So, as sequências de PAM da endonuclease guiada por RNA deriva- das de CRISPR tipo |-D da presente invenção são mais frequentemen- te encontradas nas sequências genômicas de alguns organismos do que as sequências de PAM de CRISPR tipo || e tipo V. Portanto, de acordo com a presente invenção, é possível direcionar um número maior de sequências de genes do que as técnicas convencionais de edição de genoma, utilizando os sistemas de CRISPR tipo |l e tipo V. Além disso, os presentes inventores descobriram que um gRNA no sistema de CRISPR tipo |-D pode direcionar uma sequência alvo com um comprimento de 30 nucleotídeos ou mais. Por outro lado, um gRNA no sistema de CRISPR tipo Il ou tipo V pode direcionar uma se- quência com um comprimento de cerca de 20 nucleotídeos. Assim, o sistema de CRISPR tipo I-D da presente invenção mostra proprieda- des de ligação mais estáveis e especificidade de alvo do que as técni- cas convencionais.

[0012] Assim, de acordo com a presente invenção, é possível rea- lizar a geração de alelos mutantes, controle da expressão gênica por ativação e inativação transcricional e alteração epigenômica por dire- cionamento de um domínio proteico modificador de DNA/modificador de histona, em regiões gênicas que não podem ser direcionadas pelas técnicas convencionais. Breve Descrição dos Desenhos

[0013] A FIG. 1 descreve o componente do sistema de CRISPR tipo I-D da presente invenção e os modos de direcionamento e cliva- gem em uma sequência alvo.

[0014] A FIG. 2 mostra o vetor de expressão TiD para edição do genoma de E. coli: a) a estrutura do plasmídeo pEcTiD2; b) a estrutura do plasmídeo pEcTiD3, promotor sintético Pro: J23108, t1: sequência terminadora STOP767, RBS: sequência de ligação ao ribossoma, t2: sequência terminadora STOP768 (1), t3: sequência terminadora TOP768 (2), t3: sequência terminadora T7: T7, 7d: Cas7 derivada de Microcys- tis aeruginosa (daqui em diante, abreviado como "Ma"), 6d: MaCas6d, 5d: MaCas5d, 3d: MaCas3d, 10d: MaCas10d, promotor T7 pro: T7, CrRN: sequência de repetição CRISPR derivada de TiD, Cm: gene de resistência ao cloranfenicol, origem de replicação derivada do plasmí- deo p15A ori: p15A.

[0015] A FIG. 3 mostra as estruturas dos plasmídeos das bibliote- cas pMW ccdB e pMW cedB-PAM: a) a estrutura de pMW ccedB, t2: sequência terminadora rrnB2, t1: sequência terminadora rrnB1, PAM: sequência de motivos adjacente protoespaçadores, promotor 17 pro: T7, gene ccdB, Km : gene de resistência à canamicina, origem de re- plicação derivada do plasmídeo pSC101 ori: pSC101; b) a sequência alvo da biblioteca de plasmídeos pMW ccedB-PAM, em que 4 nucleotí- deos aleatórios são inseridos no sítio NNNN para obter um plasmídeo da biblioteca de rastreamento de sequências de PAM, uma região em caixa indica o promotor T7, a sequência sublinhada indica a sequência alvo TiD e as letras maiúsculas indicam o locus do ccdB.

[0016] A FIG. 4 mostra o vetor de expressão de TiD para edição do genoma da planta: a) a estrutura do plasmídeo pEgPTiD1; b) a es-

trutura do cassete de expressão de crRNA para plantas; c) a estrutura do plasmídeo pEgPTiD2, RB: sequência da borda direita, LB: sequên- cia da borda esquerda, 2x35S: 2x promotor do gene 358 do vírus do mosaico de couve-flor e sequência realçadora OQ de translação, 3d: MaCas3d com uma sequência que codifica 2xNLS (sinal de localiza- ção nuclear), 10d : MaCas10d com 2xNLS, 7d: MaCas7d com 2xNLS, 6d: MaCas6d com 2xNLS, 5d: MaCas5d com 2xNLS, 2A (1) - (4): se- quências 2A do peptídeo de autoclivagem (1) - (4), Ter: terminador do gene da proteína de 18,2 kDa de choque térmico de Arabidopsis, Km: cassete de expressão do gene de resistência à canamicina, U6-26: promotor do gene U6 snRNA-26 de Arabidopsis, cr»RNA: sequências de repetição de CRISPR derivadas do locus TiD.

[0017] A FIG. 5-1 mostra a mutagênese do gene PDS do tabaco usando pEgPTiD2-pds: a) sequências alvo no gene PDS do tabaco, em que a sequência alvo 1 foi selecionada a partir do terceiro éxon e a sequência alvo 2 foi selecionada a partir do sexto éxon, as partes em caixa nas sequências alvo mostradas no painel inferior indicam as se- quências de PAM e as partes sublinhadas indicam as sequências alvo; b) introdução de pEgPTiD2-pds e um vetor binário de expressão de GFP por agroinfiltração, em que as agrobactérias que transportam pE- gPTiD2-pds (1) ou pegPTiD-pds (2) e as Agrobacteria que transportam um plasmídeo binário de expressão de GFP foram infectadas por agroinfiltração e discos foliares nos quais o GFP foi infectado por dis- cos de folhas e a expressão de GFP foi observada, foram excisados e utilizados para a análise da introdução da mutação do PDS.

[0018] A FIG. 5-2 mostra a mutagênese direcionada ao sítio do gene PDS do tabaco usando pEgPTiD2-pds: c) análise da introdução da mutação PDS pelo ensaio Cel-1, onde o DNA genômico foi prepa- rado a partir dos discos das folhas nas quais a expressão de GFP foi observada na FIG . 5-b), e a presença ou ausência de mutações foi analisada pelo ensaio Cel-1. Marcas de triângulo indicam fragmentos do gene PDS mutado que foram clivados pela nuclease Cel-1.

[0019] A FIG. 6 mostra a mutagênese do gene IAA9 do tomate usando pEgPTiD2-iaa9: a) uma sequência alvo no gene IAAS9 do toma- te, em que a sequência alvo 1 foi selecionada a partir do segundo éxon, uma parte encaixotada na sequência alvo mostrada no painel inferior indica a sequência PAM, e a parte sublinhada indica a sequên- cia alvo; b) pegPTiD2-iaa9 foi introduzido em um disco de folhas de tomate pelo método Agrobacterium para obter células de calo trans- formadas; c) análise de mutação por POCR-RFLP, em que a região con- tendo a sequência alvo IAAS9 foi amplificada por PCR a partir de um DNA genômico que foi preparado a partir das células de calo transfor- madas nas quais foi introduzido o pEgPTiD2-iaa9, e a análise de mu- tação foi realizada por POR-RFLP usando Accl. Triângulos abertos indicam fragmentos de clivagem Accl derivados tipo selvagem, e um triângulo acima dos triângulos abertos indica um fragmento mutado que não sofre clivagem por Accl.

[0020] A FIG. 7 mostra a análise de mutação por sequenciação em calos introduzidos por pEcTiD2-iaa9. A sequência superior mostra a sequência IAAS9 tipo selvagem e uma parte sublinhada indica a se- quência alvo. Sequências em caixa indicam as sequências de PAM. Os sítios onde ocorreram mutações são mostrados por símbolos ou hífens de inserção. O hífen indica a exclusão de nucleotídeos.

[0021] A FIG. 8 mostra a análise de mutação em uma planta regene- rada introduzida por pEcTiD2-iaa9: a) análise de mutação por PCR- RFLP, em que triângulos abertos indicam fragmentos de clivagem Accl derivados tipo selvagem, e um triângulo acima dos triângulos abertos in- dica fragmentos mutados que não sofrem clivagem Accl; e b) uma foto- grafia de um tomateiro introduzido por mutação que mostra morfologia anormal de folhas verdadeiras como resultado da ruptura do gene IAA9.

[0022] A FIG. 9 mostra um esquema experimental de edição de genoma usando a linhagem celular HEK293.

[0023] A FIG. 10 mostra resultados da análise de mutação pela análise de mobilidade heteroduplex. Um fragmento considerado deri- vado de uma sequência mutada foi detectado (símbolo de chave preta) do genoma de uma célula na qual um crRNA contendo a sequência do alvo 1 no gene EMX1 e os genes TiD foram introduzidos.

[0024] A FIG. 11 mostra os resultados da análise de mutação pela análise de mobilidade heteroduplex. Um fragmento considerado deri- vado de uma sequência mutada foi detectado (símbolo de chave preta) a partir do genoma de uma célula na qual foi introduzido um cr»RNA contendo a sequência do alvo 2 no gene EMX1 e nos genes TiD.

[0025] A FIG. 12 mostra a análise de sequenciamento de sequên- cias mutadas. Letras brancas em fundo preto indicam PAM (sequência adjacente do protoespaçador) reconhecida por TiD. Sequências em caixa indicam sequências alvo. Hífens (-) indicam exclusão de nucleo- tídeo. Um caractere alfabético em minúscula em negrito indica inser- ção de nucleotídeo. No lado direito de cada sequência, é mostrada a eficiência somática da mutação (o número de clones nos quais uma sequência mutada foi observada/o número total de clones analisados).

[0026] A FIG. 13 mostra a análise de sequenciamento de sequên- cias mutadas. Letras brancas em fundo preto indicam PAM (sequência adjacente do protoespaçador) reconhecida pelo TiD. Sequências em caixas indicam sequências alvo. Hífens (-) indicam deleção de nucleo- tídeos. Os caracteres alfabéticos minúsculos em negrito indicam a in- serção de nucleotídeos. No lado direito de cada sequência, é mostrada a eficiência somática da mutação (o número de clones nos quais uma sequência mutada foi observada/o número total de clones analisados). Modo de Realização da Invenção

[0027] A presente invenção fornece uma técnica de edição de ge-

noma utilizando o sistema de CRISPR tipo |-D. Especificamente, entre as proteínas Cas de CRISPR tipo I|-D, Cas3d, Cas5d, Cas6d, Cas7d e Cas10d são utilizadas na presente invenção. Na presente invenção, veri- ficou-se que o sistema de CRISPR tipo |-D compreende um módulo de reconhecimento alvo compreendendo Cas5d, Cas6d e Cas7d e um mó- dulo de clivagem polinucleotídica compreendendo Cas3d e Cas10d.

[0028] Especificamente, o princípio de ação da presente invenção é o seguinte.

[0029] Complexo, compreendendo: 1) um gRNA necessário para o direcionamento de uma se- quência nucleotídica alvo (a seguir também denominada "direciona- mento"), compreendendo uma sequência complementar à sequência nucleotídica alvo e uma sequência repetitiva comum presente no locus de CRISPR tipo |-D, 2) Cas5d que reconhece uma sequência PAM presente na proximidade da sequência nucleotídica alvo, 3) Cas7d que se liga ao gRNA de 1) e é necessário para o direcionamento da sequência nucleotídica alvo, e 4) Cas6d, que realiza o processamento do gRNA de 1), e 5) um complexo compreendendo Cas10d que interage com o complexo compreendendo 1) a 4) e executa a remodelagem da se- quência nucleotídica alvo e Cas3d que executa a degradação de um polinucleotídeo são fornecidos a uma célula e na célula, 6) direcionamento da sequência nucleotídica alvo pelo complexo compreendendo 1) a 4), ou seja, 7) direcionamento da sequência nucleotídica alvo por um complexo compreendendo um gRNA maduro que é obtido pelo pro- cessamento do gRNA de 1) por Cas6d de 4) e 2) e 3) é realizado, e

8) um polinucleotídeo na sequência nucleotídica alvo é cli- vado pelo complexo de 5).

[0030] Portanto, a presente invenção fornece um método para di- recionar uma sequência nucleotídica alvo (a seguir também referido como "o método de direcionamento de sequência alvo da presente in- venção"), um método para alterar uma sequência nucleotídica alvo (a seguir referido como "o método de alteração de sequência alvo da presente invenção") e um método para suprimir a expressão de um gene alvo (a seguir também referido como" o método de supressão de expressão do gene alvo da presente invenção"), em que o sistema de identificação de tipo CRISPR é utilizado nos métodos. Além disso, a presente invenção fornece um complexo compreendendo proteínas Cas associadas a CRISPR tipo |-D e um gRNA (a seguir também refe- rido como "o complexo da presente invenção"), e um vetor compreen- dendo uma molécula de ácido nucleico que codifica o complexo, que é usada nos métodos acima mencionados da presente invenção. (1) Célula

[0031] Na presente invenção, a célula pode ser uma célula proca- riótica ou uma célula eucariótica, e não é particularmente limitada. Exemplos de células incluem bactérias, arqueias, leveduras, células vegetais, células de insetos e células animais (por exemplo, células humanas, células não humanas, células de vertebrados não mamiífe- ros, células de invertebrados, etc.). (2) Endonuclease quiada por RNA e proteína Cas

[0032] Na presente invenção, a "endonuclease guiada por RNA" significa uma endonuclease compreendendo pelo menos um domínio nuclease e pelo menos um domínio que se liga a um gRNA, que é gui- ado a uma sequência nucleotídica alvo (ou a um sítio nucleotídico al- vo) pelo gRNA . A endonuclease guiada por RNA usada na presente invenção é uma endonuclease guiada por RNA derivada de CRISPR tipo

I-D e compreende proteínas associadas a CRISPR tipo I-D Cas3d, Cas5d, Cas6d, Cas7d e Cas10d. Na presente invenção, verificou-se que Cas5d, Cas6d e Cas7d constituem um "módulo de reconhecimento alvo" que contribui para o reconhecimento alvo, e Cas3d e Cas10d constituem um "módulo de clivagem de polinucleotídeos" que contribui para a cliva- gem de um polinucleotídeo. Especificamente, a endonuclease guiada por RNA utilizada na presente invenção compreende o módulo de re- conhecimento alvo compreendendo Cas5d, Cas6d e Cas7d e o módu- lo de clivagem polinucleotídica compreendendo Cas3d e Cas10d.

[0033] As Cas3d, Cas5d, Cas6d, Cas7d e Cas10d utilizadas na presente invenção podem ser derivadas de qualquer bactéria ou ar- queia. Exemplos da bactéria e da arqueia incluem Microcystis aerugi- nosa, Acetohalobiumarabaticum, Ammonifexdegensii, Anabaena cylin- drica, Anabaena variabilis, Caldicellulosiruptorlactoaceticus, Caldiline- aaerophila, Clostridium algicarnis, Crinaliumepipsammum, Cyanothece Sp., Cylindrospermumstagnale, Haloquadratumwalsbyi, Halorubrumla- cusprofundi, Methanocaldococcusvulcanius, Methanospirillumhungatei, Natrialbaasiatica, Natronomonaspharaonis, Nostocpunctiforme, Phor- midesmispriestleyi, Oscillatoriaacuminata, Picrophilustorridus, Spiro- chaetathermophila, Stanieriacyanosphaera, Sulfolobusacidocaldarius, Sulfolobusislandicus, Synechocystis Sp., Thermacetogeniumphaeum, Thermofilumpendens, etc. As informações da sequência de aminoáci- dos e da sequência nucleotídica das proteínas Cas estão disponíveis em banco de dados público, por exemplo, NCBI GenBank. Além disso, as sequências de novas espécies microbianas também podem ser ob- tidas a partir de dados do genoma microbiano obtidos por análise me- tagenômica ou por meio do programa BLAST. Os ácidos nucleicos que codificam as proteínas Cas podem ser construídos, por exemplo, por síntese química ou semelhante após a seleção de códons ideais para translação em uma célula hospedeira na qual os ácidos nucleicos são introduzidos com base nas informações da sequência de aminoácidos usada em uma célula hospedeira torna possível aumentar o nível de expressão da proteína. Por exemplo, as proteínas Cas podem ser quimicamente sintetizadas com base nas informações da sequência de aminoácidos ou produzidas em uma célula através da introdução de ácidos nucleicos que codificam as proteínas Cas na célula através de um vetor apropriado ou semelhante. Cada proteína Cas de Cas3d, Cas5d, Cas6d, Cas7d e Cas10d pode ser uma proteína Cas tipo mu- tante, desde que retenha a função de cada proteína Cas conforme descrito no princípio de ação da presente invenção. (3) RNA guia

[0034] Na presente invenção, o RNA guia (gRNA) é uma molécula que forma um complexo com o módulo de reconhecimento alvo (Cas5d, Cas6d e Cas7d) para direcionar uma sequência nucleotídica alvo juntamente com essas proteínas Cas. Na presente invenção, o gRNA se liga a Cas7d do módulo de reconhecimento alvo. Na presen- te invenção, o gRNA se liga a um complexo compreendendo Cas5d, Cas6d e Cas7d para guiar o complexo para a sequência nucleotídica alvo. Por exemplo, o gRNA se liga ao módulo de reconhecimento alvo da endonuclease guiada por RNA para guiar a endonuclease guiada por RNA para a sequência nucleotídica alvo. Quando o módulo de re- conhecimento alvo está presente como parte de uma proteína de fu- são que não seja a endonuclease guiada por RNA, o gRNA se liga ao módulo de reconhecimento alvo para guiar a proteína de fusão para a sequência nucleotídica alvo.

[0035] O gRNA compreende uma sequência complementar a uma sequência alvo, de modo que um par de bases pode ser formado entre o gRNA e a sequência nucleotídica alvo, e sequências repetitivas co- muns derivadas do locus de CRISPR tipo |-D antes e depois (no lado de extremidade 5' e no lado de extremidade 3' da) sequência comple-

mentar. As partes comuns da sequência repetitiva do gRNA podem ter pelo menos uma estrutura em formato de grampo de cabelo. Por exemplo, a sequência repetitiva comum colocada no lado de extremi- dade 5' da sequência complementar a uma sequência nucleotídica al- vo pode ter uma estrutura em formato de grampo de cabelo e a se- quência repetitiva comum colocada no lado 3' da extremidade da se- quência complementar a um alvo sequência nucleotídica pode ser de cadeia simples. Na presente invenção, o gRNA tem de preferência uma estrutura em formato de grampo de cabelo.

[0036] A sequência repetitiva comum derivada de um locus de CRISPR tipo |-D pode ser encontrada a partir de uma região de se- quência de genes de gRNA adjacente a um grupo de genes tipo |-D usando um programa de pesquisa repetida em tandem. O comprimen- to nucleotídico da sequência repetitiva comum contida no gRNA não é particularmente limitado desde que o gRNA interaja com o módulo de reconhecimento alvo para direcionar uma sequência de nucleotídeo alvo. Por exemplo, cada uma das sequências repetitivas comuns que precedem e seguem a sequência complementar a uma sequência nu- cleotídica alvo pode ter um comprimento de cerca de 10 a 70 nucleotí- deos, por exemplo, um comprimento de 30 a 50 nucleotídeos.

[0037] O gRNA pode conter uma sequência que consiste em cerca de 10 a 70 nucleotídeos, que é complementar a uma sequência nucle- otídica alvo. A sequência complementar a uma sequência nucleotídica alvo contida no gRNA é preferencialmente uma sequência consistindo em 20 a 50 nucleotídeos, mais preferencialmente uma sequência con- sistindo em 25 a 45 nucleotídeos, mais preferencialmente uma se- quência consistindo em 30 a 40 nucleotídeos, ou ainda mais preferen- cialmente uma sequência que consiste em 32 a 37 nucleotídeos, por exemplo, uma sequência que consiste em 32 nucleotídeos, 33 nucleo- tídeos, 34 nucleotídeos, 35 nucleotídeos, 36 nucleotídeos ou 37 nucle-

otídeos. A especificidade da sequência de reconhecimento alvo pelo gRNA é aumentada mais grandemente à medida que a sequência alvo que pode ser direcionada é mais longa. Além disso, o valor de Tm de um par de bases formado entre o gRNA e a sequência alvo é mais alto e a estabilidade do reconhecimento do alvo aumenta mais à medida que a sequência alvo que pode ser direcionada é mais longa. Uma vez que o comprimento de uma sequência que pode ser direcionada por um gRNA para endonucleases guiadas por RNA (por exemplo, Cas9 e Cpf1) usado nas técnicas convencionais de edição de genoma tem cerca de 20 a 24 comprimentos de nucleotídeos, a presente invenção é excelente nessa especificidade de sequência e na estabilidade em comparação com os métodos convencionais. (4) Sequência nucleotídica alvo

[0038] Na presente invenção, a sequência nucleotídica alvo (tam- bém referida como "a sequência alvo", quando aqui utilizada) é qual- quer sequência de ácido nucleico e não é particularmente limitada desde que seja uma sequência localizada nas proximidades de um mo- tivo de proximidade protoespaçador (PAM). A sequência nucleotídica alvo pode ser uma sequência de DNA de fita dupla, uma sequência de DNA de fita única ou uma sequência de RNA. Exemplos de DNA inclu- em DNA genômico nuclear eucariótico, DNA mitocondrial, DNA plastídi- co, DNA genômico procariótico, DNA fágico e DNA plasmídico. Na pre- sente invenção, a sequência nucleotídica alvo é preferencialmente um DNA de fita dupla no genoma. Quando aqui utilizada, a frase "na proxi- midade de" inclui ser adjacente a um local e estar próximo a um local. Quando aqui utilizada, a "proximidade" inclui adjacência e redondeza.

[0039] As sequências de PAM usadas para o reconhecimento do alvo dos sistemas de CRISPR variam de acordo com os tipos de sis- temas de CRISPR. Na presente invenção, verificou-se que a sequên- cia PAM utilizada pelo sistema de CRISPR tipo |-D é 5-GTH-3' (H= A,

C ou T) (Exemplo 1). De preferência, uma sequência localizada na proximidade do lado 3' a jusante da sequência PAM é selecionada como a sequência nucleotídica alvo. Por exemplo, a sequência nucleo- tídica alvo pode ser uma sequência localizada na proximidade da se- quência PAM e presente em um íntron, uma região codificante, uma região não codificante ou uma região controle de um gene alvo. O ge- ne alvo pode ser qualquer gene e opcionalmente selecionado.

[0040] As sequências de PAM para Cas9 e Cpf1i usadas nas téc- nicas convencionais de edição de genoma são 5'-NGG-3' (N= A, C, G ou T) e 5-TTTV-3' (V = A, C ou G), A frequência de aparecimento da sequência PAM para TiD (ou seja, o número de alvos candidatos do sistema de CRISPR) foi comparada com as frequências de apareci- mento das sequências de PAM para Cas9 e Cpf1i nas sequências ge- nômicas de plantas superiores. Como resultado, verificou-se que a frequência de aparência da sequência de PAM para TiDis é a mais alta e o TiD tem um número maior de alvos do que as técnicas convencio- nais de edição de genoma usando Cas9 e Cpf1 (Tabela 1). Tabela 1 Comparação do número de sequência do PAM (= número de alvos

(5) O método de direcionar uma sequência alvo da presente invenção

[0041] O método de direcionar uma sequência alvo da presente invenção é caracterizado pela introdução do módulo de reconhecimen- to alvo (Cas5d, Cas6d e Cas7d) e o gRNA na célula. Especificamente, o método de direcionamento de sequência alvo da presente invenção é caracterizado por introduzir na célula (i) Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam essas proteínas, e (ii) o gRNA ou um DNA que codifica o gRNA. O método de direcionamento de sequência alvo da presente invenção pode ser realizado in vitro ou in vivo.

[0042] No método de direcionar uma sequência alvo da presente invenção, o módulo de reconhecimento alvo pode ser introduzido na célula como um complexo isolado compreendendo Cas5d, Cas6d e Cas7d, ou cada um de Cas5d, Cas6d e Cas7d pode ser introduzido na célula como um isolado proteína. No método de direcionamento de sequência alvo da presente invenção, o módulo de reconhecimento alvo também pode ser introduzido na célula como ácidos nucleicos que codificam as proteínas Cas Cas5d, Cas6d e Cas7d. Exemplos do ácido nucleico incluem RNA como mRNA e DNA.

[0043] Os DNAs que codificam as proteínas Cas podem estar con- tidos, por exemplo, em um vetor. A sequência de DNA é de preferên- cia operacionalmente ligada a uma sequência reguladora, como um promotor ou terminador. Quando a célula na qual o módulo de reco- nhecimento alvo é introduzido é uma célula eucariótica, uma sequên- cia de sinal de localização nuclear é preferencialmente adicionada ao DNA que codifica a proteína Cas. Dois ou mais ou todos os DNAs que codificam as proteínas Cas Cas5d, Cas6d e Cas7d podem estar conti- dos em um único vetor ou em vetores separados. O número de veto- res e os tipos e combinações de proteínas Cas codificadas pelos DNAs a serem incorporados em cada vetor não são limitados. Quando dois ou mais DNAs que codificam as proteínas Cas estão contidos em um único vetor, as sequências de DNA podem ser ligadas umas às outras, por exemplo, através de uma sequência que codifica um peptí- deo autoclivante, de forma a ser expressa policistronicamente. Os dois ou mais DNAs que codificam as proteínas Cas podem estar ligadas em qualquer ordem.

[0044] O gRNA pode ser introduzido na célula como um RNA ou como um DNA que codifica o gRNA. O DNA que codifica o gRNA pode estar contido, por exemplo, em um vetor. A sequência de DNA é de preferência operacionalmente ligada a uma sequência reguladora, co- mo um promotor ou um terminador.

[0045] Os DNAs que codificam as proteínas Cas e o DNA que co- difica o gRNA podem estar contidos no mesmo vetor ou em vetores separados. Por exemplo, um ou mais ou todos os DNAs que codificam Cas5d, Cas6d e Cas7d e o DNA que codifica o gRNA podem estar contidos em um único vetor.

[0046] A sequência reguladora, como um promotor ou um termi- nador, e a sequência do sinal de localização nuclear são conhecidas na técnica e podem ser adequadamente selecionadas dependendo das espécies de organismos nas quais a célula na qual o módulo de reconhecimento alvo e o gRNA é introduzido é derivada das espécies de organismos. O vetor usado para a introdução pode ser adequada- mente selecionado, dependendo das espécies de organismos em que a célula na qual o vetor é introduzido é derivado das espécies de or- ganismos e não é particularmente limitado. Exemplos do vetor incluem vetores plasmídicos, vetores de vírus, fagomídeos, cosmídeos, cro- mossomas artificiais/minicromossomas e transposons.

[0047] A introdução do módulo de reconhecimento alvo e do gRNA na célula pode ser realizada por vários meios conhecidos na técnica. Exemplos de tais meios incluem transfecção, por exemplo, transfecção mediada por fosfato de cálcio, eletroporação, transfecção de liposso-

mas, etc., transdução de vírus, lipofecção, biolística, microinjeção, mé- todo de Agrobacterium, agroinfiltração e um método de PEG-cálcio.

[0048] O módulo de reconhecimento alvo e o gRNA podem ser introduzidos na célula simultaneamente ou sequencialmente. Cas5d, Cas6d e Cas7d constituindo o módulo de reconhecimento alvo, ou áci- dos nucleicos que codificam essas proteínas Cas podem ser introduzi- dos na célula simultaneamente ou sequencialmente. Por exemplo, as proteínas Cas Cas5d, Cas6d e Cas7d sintetizadas in vitro ou in vivo e o gRNA sintetizado in vitro ou in vivo podem ser incubadas in vitro pa- ra formar um complexo, e o complexo pode ser introduzido na célula.

[0049] Após a introdução do módulo de reconhecimento alvo e do gRNA, a célula é cultivada sob condições adequadas para o direcio- namento de uma sequência nucleotídica alvo. A célula é então cultiva- da sob condições adequadas para crescimento e manutenção celular. As condições de cultura podem ser adequadas para as espécies de organismos nas quais a célula na qual o módulo de reconhecimento alvo e o gRNA são introduzidos é derivada e podem ser adequada- mente determinadas por uma pessoa versada na técnica, por exemplo, com base na cultura de células conhecidas nas técnicas.

[0050] De acordo com o método de direcionar uma sequência alvo da presente invenção, o gRNA liga Cas7d do módulo de reconheci- mento alvo para formar um complexo do módulo de reconhecimento alvo e o gRNA. Ao mesmo tempo, o gRNA forma um par de bases com a sequência nucleotídica alvo. O módulo de reconhecimento alvo tem como alvo a sequência nucleotídica alvo de uma maneira especí- fica da sequência, reconhecendo a sequência PAM presente na pro- ximidade da sequência nucleotídica alvo. No método de direcionamen- to de sequência alvo da presente invenção, Cas10d pode ser adicio- nalmente introduzida na célula. (6) O método de direcionar uma sequência alvo da presente invenção

[0051] O método de alteração da sequência alvo da presente in- venção é caracterizado pela introdução da endonuclease guiada por RNA e o gRNA na célula. Especificamente, o método alvo de alteração de sequência da presente invenção é caracterizado por introduzir na célula (i) Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos que codificam as proteínas e (ii) o gRNA ou um DNA que codifica o gRNA. O método de alteração da sequência alvo da presente invenção compreende a clivagem de uma sequência nucleotídica direcionada pelo método de direcionamento da sequência alvo da presente inven- ção com o módulo de clivagem polinucleotídica. O método de altera- ção da sequência alvo da presente invenção pode ser realizado in vitro ou in vivo. Na presente invenção, a alteração inclui deleção, inserção e substituição de um ou mais nucleotídeos e uma combinação dos mesmos.

[0052] No método de alteração da sequência alvo da presente in- venção, além da endonuclease guiada por RNA e do gRNA, um poli- nucleotídeo doador pode ser introduzido na célula. O polinucleotídeo doador compreende pelo menos uma sequência doadora que contém alteração desejada para ser introduzida em um sítio alvo. O polinucleo- tídeo doador pode compreender, além da sequência doadora, sequên- cias com alta homologia com as sequências a montante e a jusante da sequência alvo (preferencialmente, sequências substancialmente idên- ticas às sequências a montante e a jusante da sequência alvo) em ambas as extremidades do doador sequência. O polinucleotídeo doa- dor pode ser um DNA de fita simples ou dupla. O polinucleotídeo doa- dor pode ser adequadamente projetado por uma pessoa versada na técnica com base nos métodos conhecidas na técnica.

[0053] Quando o polinucleotídeo doador está ausente no método de alterar uma sequência alvo da invenção, a clivagem na sequência nucleotídica alvo pode ser reparada por união de extremidade não homóloga (NHEJ). Sabe-se que a NHEJ é propensa a erros, e a ex- clusão, inserção ou substituição de um ou mais nucleotídeos, ou uma combinação dos mesmos, pode ocorrer durante o reparo da clivagem. Assim, a sequência pode ser alterada no sítio de sequência alvo e, as- sim, induzida a mudança de quadro ou um códon de interrupção ima- turo para inativar ou eliminar a expressão do gene codificado pela re- gião de sequência alvo.

[0054] Quando o polinucleotídeo doador está presente no método de alteração de uma sequência alvo da presente invenção, a sequên- cia doadora do polinucleotídeo doador é inserida no sítio de sequência alvo ou substitui o sítio de sequência alvo pelo reparo de recombinação homóloga (HDR) da sequência nucleotídica alvo clivada. Como resulta- do, a alteração desejada é introduzida no sítio de sequência alvo.

[0055] A endonuclease guiada por RNA pode ser introduzida na célula como um complexo isolado compreendendo Cas5d, Cas6d, Cas7d, Cas3d e Cas10d, ou cada um de Cas5d, Cas6d, Cas7d, Cas7d, Cas3d e Cas10d pode ser introduzido na célula como uma úni- ca proteína isolada. A endonuclease guiada por RNA também pode ser introduzida na célula como ácidos nucleicos que codificam as pro- teínas Cas Cas5d, Cas6d, Cas7d, Cas3d e Cas10d. Exemplos do áci- do nucleico incluem RNA como mRNA e DNA.

[0056] O DNA que codifica a proteína Cas pode estar contido, por exemplo, em um vetor, e a sequência de DNA é preferencialmente operacionalmente ligada a uma sequência reguladora, como um pro- motor ou um terminador. Quando a célula na qual a endonuclease gui- ada por RNA é introduzida é uma célula eucariótica, uma sequência de sinal de localização nuclear é preferencialmente adicionada ao DNA que codifica a proteína Cas. Dois ou mais ou todos os DNAs que codi- ficam as proteínas Cas Cas3d, Cas5d, Cas6d, Cas7d e Cas10d po- dem estar contidos em um único vetor ou em vetores separados. O número de vetores e os tipos e combinações de proteínas Cas codifi- cadas pelos DNAs a serem incorporados em cada vetor não são limi- tados. Quando dois ou mais DNAs que codificam as proteínas Cas es- tão contidos em um único vetor, as sequências de DNA podem ser |i- gadas umas às outras, por exemplo, através de uma sequência que codifica um peptídeo de autoclivagem, de modo a ser expressa policis- tronicamente. Os dois ou mais DNAs que codificam as proteínas Cas podem estar ligados em qualquer ordem.

[0057] O gRNA pode ser introduzido na célula como um RNA ou como um DNA que codifica o gRNA. O DNA que codifica o gRNA pode estar contido, por exemplo, em um vetor. A sequência de DNA é de preferência operacionalmente ligada a uma sequência reguladora, co- mo um promotor ou um terminador.

[0058] Os DNAs que codificam as proteínas Cas e o DNA que co- difica o gRNA podem estar contidos no mesmo vetor ou podem estar contidos em vetores separados. Por exemplo, um ou mais ou todos os DNAs que codificam Cas3d, Cas5d, Cas6d, Cas7d e Cas10d e o DNA que codifica o gRNA podem estar contidos em um único vetor.

[0059] A sequência reguladora, como um promotor ou um termi- nador, e a sequência do sinal de localização nuclear são conhecidas na técnica e podem ser adequadamente selecionadas dependendo tipo de célula na qual a endonuclease guiada por RAN e o gRNA são introduzidos. O vetor usado para uma introdução pode ser adequada- mente selecionado, dependendo tipo de célula na qual o vetor é intro- duzido, e não é particularmente limitado. Exemplos do vetor incluem vetores de plasmídeo, vetores de vírus, fagomídeos, cosmídeos, cro- mossomas artificiais/minicromossomas e transposons.

[0060] A introdução da endonuclease guiada por RNA, o gRNA e o polinucleotídeo doador na célula pode ser realizada por vários meios conhecidos na técnica. Exemplos de tais meios incluem transfecção,

por exemplo, transfecção mediada por fosfato de cálcio, eletroporação, transfecção de lipossomas, etc., transdução de vírus, lipofecção, bio- lística, microinjeção, método Agrobacterium, Agroinfiltração e método PEG-cálcio.

[0061] A endonuclease guiada por RNA, o gRNA e o polinucleotí- deo doador podem ser introduzidos na célula simultaneamente ou se- quencialmente. Cas3d, Cas5d, Cas6d, Cas7d e Cas10d que constitu- em a endonuclease guiada por RNA ou ácidos nucleicos que codificam essas proteínas Cas podem ser introduzidos na célula simultaneamen- te ou sequencialmente.

[0062] Após a introdução da endonuclease guiada por RNA e do gRNA ou da endonuclease guiada por RNA, o gRNA e o polinucleotí- deo doador, a célula é cultivada em condições adequadas para cliva- gem no sítio de sequência alvo. A célula é então cultivada sob condi- ções adequadas para crescimento e manutenção celular. As condi- ções de cultura podem ser adequadas para as espécies de organis- mos das quais derivam as células nas quais a endonuclease guiada por RNA e o gRNA ou a endonuclease guiada por RNA, o grRNAÃ e o polinucleotídeo doador são introduzidos e podem ser adequadamente determinados por uma pessoa versada na técnica, por exemplo, com base em técnicas conhecidas de cultura de células.

[0063] De acordo com o método de alteração de uma sequência alvo da presente invenção, o gRNA forma um par de bases com a se- quência nucleotídica alvo e, ao mesmo tempo, o gRNA interage com o módulo de reconhecimento alvo da endonuclease guiada por RNA pa- ra guiar a Endonuclease guiada por RNA para o sítio de sequência al- vo. Então, o módulo de clivagem da endonuclease guiada por RNA cliva a sequência no sítio de sequência alvo. Quando a sequência cli- vada é reparada, a sequência alvo é alterada. Por exemplo, o método de alteração de uma sequência alvo da presente invenção pode ser utilizado para uma alteração de uma sequência nucleotídica alvo no genoma. Um DNA de cadeia dupla no genoma é clivado e depois alte- rado no sítio alvo pelo método de alteração de uma sequência alvo da presente invenção. (7) O método de supressão de genes alvo da presente invenção

[0064] O método de expressão-supressão do gene alvo da presen- te invenção é caracterizado pela introdução do módulo de reconheci- mento alvo (Cas5d, Cas6d e Cas7d) e o gRNA na célula. Especifica- mente, o método de supressão do gene alvo da presente invenção é caracterizado pela introdução na célula (i) Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) o gRNA ou um DNA que codifica o gRNA. No método de supressão do gene alvo da pre- sente invenção, pelo menos uma parte da sequência do gene alvo é selecionada como uma sequência nucleotídica alvo, e o gRNA conten- do uma sequência complementar à sequência alvo é usado. O método de supressão do gene alvo da presente invenção compreende suprimir a expressão de um gene contendo a sequência alvo pela ligação de um complexo do módulo de reconhecimento alvo e o gRNA à sequên- cia alvo ao direcionar a sequência nucleotídica alvo pelo método de supressão de gene alvo da presente invenção. O método de supres- são do gene alvo da presente invenção pode ser realizado in vitro ou in vivo. De acordo com o método de supressão do gene alvo da pre- sente invenção, embora a sequência do gene alvo não seja clivada, a função de uma região gênica contendo a sequência alvo ou a expres- são do gene é inibida pela ligação do complexo do módulo de reco- nhecimento do alvo e o gRNA para a sequência nucleotídica alvo.

[0065] O módulo de reconhecimento alvo e o gRNA, um método para um método para introduzi-los na célula, a cultura de células no momento da introdução e após a introdução e similares são como descritos em "(5) O método de direcionar uma sequência alvo da pre-

sente invenção". No método de supressão gênica alvo da presente in- venção, Cas10d pode ser também introduzido na célula. (8) Complexo da presente invenção

[0066] O complexo da presente invenção compreende as proteí- nas Cas tipo |-D de CRISPR e o gRNA. A presente invenção fornece particularmente um complexo compreendendo o módulo de reconhe- cimento alvo e o gRNA, e um complexo compreendendo a endonu- clease guiada por RNA e o gRNA. Mais especificamente, um complexo compreendendo Cas5d, Cas6d, Cas7d e o gRNA, e um complexo compreendendo Cas5d, Cas6d, Cas7d, Cas3d, Cas10d e o gRNA é fornecido. Além disso, uma molécula de DNA que codifica o complexo é fornecida. O complexo da presente invenção pode ser utilizado no méto- do de alterar uma sequência alvo, no método de supressão gênica alvo e no método de direcionar uma sequência alvo da presente invenção. Uma sequência alvo no genoma de uma célula pode ser alterada pela introdu- ção de um complexo compreendendo a endonuclease guiada por RNA (um complexo compreendendo Cas5d, Cas6d, Cas7d, Cas3d e Cas10d) e o gRNA na célula para permitir o complexo funcionar na célula. Além disso, uma sequência alvo em uma célula pode ser direcionada e a ex- pressão de um gene codificado por uma região de sequência alvo pode ser suprimida pela introdução de um complexo compreendendo o mó- dulo de reconhecimento alvo (um complexo compreendendo Cas5d, Cas6d e Cas7d) e o gRNA na célula para permitir o complexo funcio- nar na célula. O complexo que compreende o módulo de reconheci- mento alvo e o gRNA pode ainda conter Cas10d.

[0067] O complexo da presente invenção pode ser produzido in vitro ou in vivo por um método convencional. Por exemplo, ácidos nu- cleicos que codificam as proteínas Cas que constituem a endonu- clease guiada por RNA ou o módulo de reconhecimento alvo, e o gRNA ou um DNA que codifica o gRNA podem ser introduzidos em uma célula para permitir o complexo formar-se na célula.

[0068] Exemplos do complexo da presente invenção incluem, po- rém, não estão limitados a, um complexo compreendendo Cas5d (SEQ ID NO: 1), Cas6d (SEQ ID NO: 2) e Cas7d (SEQ ID NO: 3) de Microcystis aeruginosa, e um gRNA que consiste em uma sequência mostrada por GUUCCAAUUAAUCUUAAGCCCUAUUAGGGAUUGAA

ACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCA AUUAAUCUUAAGCCCUAUUAGGGAUUGAAAC (SEQ ID NO: 6; N é qualquer nucleotídeo que constitui uma sequência complementar a uma sequência nucleotídica alvo), e um complexo compreendendo Cas 5d (SEQ ID NO: 1), Cas6d (SEQ ID NO: 2), Cas7d (SEQ ID NO: 3), Cas3d (SEQ ID NO: 4), e Cas10d (SEQ ID NO: 5) de Microcystis aeruginosa, e um gRNA que consiste em uma sequência mostrada por

GUUCCAAUUAAUCUUAAGCCCUAUUVAGGGAUUGAAACNNNNNNN

NNNNNNNNNNNNNNNNNNNNNNNNNNNNGUUCCAAUUAAUCUUA AGCCCUAUUAGGGAUUGAAAC (SEQ ID NO: 6 ; N é qualquer nu- cleotídeo que constitui uma sequência complementar a uma sequência nucleotídica alvo). Na sequência de gRNA, o número de N pode variar dentro de uma faixa de 10 a 70, preferivelmente 20 a 50, mais preferi- velmente 25 a 45, ainda mais preferivelmente 30 a 40 e ainda mais preferivelmente 32 a 37. (9) Vetor de expressão da presente invenção

[0069] A presente invenção também fornece um vetor de expres- são contendo um ácido nucleico que codifica a endonuclease guiada por RNA compreendendo Cas3d, Cas5d, Cas6d, Cas7d e Cas10d e um DNA que codifica o gRNA que compreende uma sequência com- plementar a uma sequência alvo e sequências repetitivas comuns de- rivadas de um locus de CRISPR, precedendo e seguindo a sequência alvo, e um vetor de expressão contendo ácidos nucleicos que codifi- cam as proteínas associadas tipo I-D de CRISPR Cas5d, Cas6d e

Cas7d, e um DNA que codifica o gRNA compreendendo uma sequên- cia complementar a uma sequência alvo e sequências repetitivas co- muns derivadas de um locus de CRISPR, precedendo e seguindo a sequência alvo.

[0070] O vetor da presente invenção é um vetor para introduzir as proteínas Cas e o gRNA na célula, conforme descrito em "(5) Método de direcionamento de sequência alvo da presente invenção", "(6) Mé- todo de alteração de sequência alvo da presente invenção" e "(7) Mé- todo de supressão de expressão gênica alvo da presente invenção". Após a introdução do vetor na célula, as proteínas Cas e o gRNA são expressos na célula. O vetor da presente invenção também pode ser um vetor no qual a sequência alvo contida no gRNA é substituída por qualquer sequência contendo um sítio de restrição. Tal vetor é usado após a incorporação de uma sequência nucleotídica alvo desejada no sítio de restrição. Qualquer sequência pode ser, por exemplo, uma se- quência espaçadora presente em um locus tipo |I-D de CRISPR ou uma parte da sequência espaçadora. (10) Proteína de fusão compreendendo o módulo de reconhecimento alvo da presente invenção

[0071] A presente invenção também fornece uma proteína de fu- são compreendendo o módulo de reconhecimento alvo e um polipeptí- deo funcional. Quando a proteína de fusão e o gRNA são introduzidos em uma célula, a proteína de fusão é guiada a uma sequência nucleo- tídica alvo ou um gene alvo na célula pela ação do módulo de reco- nhecimento alvo e do gRNA, e a sequência nucleotídica alvo ou o ge- ne alvo é alterado ou modificado pela ação do polipeptídeo funcional. Assim, a presente invenção também fornece um método para alterar ou modificar a sequência nucleotídica alvo ou um gene alvo, que com- preende a introdução da proteína de fusão e do gRNA em uma célula. Além disso, a presente invenção fornece um complexo compreenden-

do a proteína de fusão e o gRNA.

[0072] O polipeptídeo funcional é um polipeptídeo que exibe qual- quer função em uma sequência alvo e é um polipeptídeo diferente de Cas3d e Cas10d. Exemplos do polipeptídeo funcional incluem, porém, não estão limitados a, enzimas de restrição, fatores de transcrição, DNA metilases, histona acetonases, proteínas fluorescentes, módulos de clivagem de polinucleotídeo, por exemplo, módulos de clivagem de nucleotídeo de enzimas de restrição; módulos de regulação de ex- pressão gênica, por exemplo, módulos de ativação de transcrição e módulos de repressão de transcrição de fatores de transcrição; e mó- dulos de modificação epigenômica, por exemplo, módulos de metila- ção de DNA metilases e módulos de acetilação de histonas de histona acetilases. Um exemplo da proteína fluorescente é a GFP. Por exem- plo, uma sequência alvo pode ser alterada pela introdução da proteína de fusão compreendendo o módulo de reconhecimento alvo e o módu- lo de clivagem de polinucleotídeo com o gRNA em uma célula, da mesma maneira que o método de alteração de uma sequência alvo da presente invenção. Por exemplo, uma sequência alvo pode ser modifi- cada para regular a expressão de um gene alvo pela introdução da proteína de fusão compreendendo o módulo de reconhecimento alvo e o módulo de regulação de expressão de gene ou o módulo de modifi- cação epigenômica juntamente com o gRNA em uma célula. Por exemplo, a proximidade de uma sequência alvo pode ser fluorescen- temente marcada pela introdução da proteína de fusão compreenden- do o módulo de reconhecimento alvo e a proteína fluorescente junta- mente com o gRNA em uma célula.

[0073] A seguir, exemplos da presente invenção são mostrados. No entanto, a presente invenção não está limitada aos exemplos. Exemplos

[0074] Como uma modalidade, um grupo de genes (Cas3d, Cas5d,

Cas6d, Cas7d, Cas10d) derivados do locus tipo |-D de CRISPR (a seguir também referido como "TiD"), derivado de Microcystis aeruginosa, foi clonado e depois utilizado. Para o processamento e construção de se- quências de DNA nos Exemplos, síntese química de gene artificial, PCR, tratamento com enzimas de restrição, ligação ou um método de Gibson Assembly foi usada. Além disso, o método de Sanger ou um método de sequenciação de próxima geração foi usado para determi- nar as sequências de nucleotídeo. Exemplo 1. Edição de genoma em E. coli

[0075] Neste exemplo, foi demonstrado que a técnica da presente invenção funciona efetivamente em E. coli, que é um organismo mode- lo bacteriano típico. (1) Construção do plasmídeo de expressão do gene TiD

[0076] Um grupo de gene derivado do locus tipo |-D de CRISPR (a seguir também referido como "locus de TiD") de Microcystis aerugino- Sa (a seguir também referido como "M. aeruginosa") foi clonado. As sequências otimizadas por códon de E. coli (SEQ ID NOs: 7 a 11) que codificam cada proteína Cas foram sintetizadas quimicamente artifici- almente com base na informação da sequência de aminoácido de Cas5d, Cas6d, Cas7d, Cas3d e Cas10 derivada de locus de TiD de M. aeruginosa. Um fragmento de DNA compreendendo um promotor sin- tético J23108 (SEQ ID NO: 12) ou uma sequência de ligação ao ribos- somo sintética (SEQ ID NO: 13) a montante de cada gene de codifica- ção de proteína Cas e uma sequência terminadora (SEQ ID NO: 14 a 17) a jusante de cada gene de codificação da proteína Cas foi ligado no vetor de plasmídeo pACYC184 (fabricado pelo gene Nippon) para construir o pECTiD1. Além disso, uma sequência de repetição CRISPR (crRNA, SEQ ID NO: 18) presente nas proximidades do locus tipo |-D de CRISPR de M. aeruginosa foi extraída, e um cassete de expressão de crRNA (SEQ ID NO: 20) contendo a sequência de repetição

CRISPR sob o controle de um promotor T7 (SEQ ID NO: 19) foi sinte- tizado. O cassete de expressão de crRNA continha uma sequência de região promotora de ccdB de E. coli, que foi uma sequência alvo neste Exemplo. A sequência do cassete de expressão de crRNA foi incorpo- rada em pEcTiD1 para construir o pEcTiD2 (FIG. 2a). Além disso, pEcTiD3 contendo cassetes de expressão gênica Cas5d, Cas6d e Cas7d foi construído como um vetor de plasmídeo de expressão de TiD para edição de genoma sem quebra de fita dupla de DNA (FIG. 2b). Os promotores, terminadores, sequência de repetição CRISPR e sequência de cassete de expressão de crRNA utilizados neste Exem- plo são mostrados na Tabela 2. Tabela 2 Promotor sintético J23108 | 5-CTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGOC-3' (SEQ ID NO:12) sequência de ligação ao | S-AATAATTTTGTTTAACTTTAAGAAGGAGATATACAT-3' ribossoma (RBS) (SEQ ID NO:13) sequência terminadora | 5- AGATCCTGTAAAACGACGGCCAGT-3' (SEQ ID NO: 14) STOP767 sequência terminadora | -CGCCAGGGTTTTCCCAGTC-3' (SEQ ID NO:15) STOP768(1) sequência terminadora | - CGCCAGGGTTTTCCCAGTC-3' (SEQ ID NO:16) TOP768(2) sequência terminadora T7 | 5- TAGCATAACCCCTTGGGGCCTCTAMACGGGTCTTGA GGGGTTTTTTG-3' (SEQ ID NO:17) sequência de repetição | 5- GTTCCAATTAATCTTAAGCCCTATTAGGGATTGAAAC- CRISPR 3' (SEQ ID NO:18) sequência de promotor T7 5-TAATACGACTCACTATAGG-3' (SEQ ID NO:19) sequência de cassete de | -GTTCCAATTAATCTTAAGCCCTATTAGGGATTGAAAC expressão de cr»RNA ggtaataatacgactcactatagggagaaaggateCTTCCAATTAATCT- TAAGCCCTATTAGGGATTGAAAC-3' (SEQ ID NO:20) (As letras maiúsculas indicam a sequência de repetição de TiDCRISPR crRNA. Letras minúsculas indicam uma sequên- cia de 35 nucleotídeos da região promotora de ccdBgege, que é a sequência alvo.) (2) Construção da biblioteca de motivo adjacente ao protoespaçador (PAM)

[0077] Neste exemplo, um cassete de gene ccdB sintético (SEQ ID NO: 21) (Tabela 3) na qual a sequência do promotor T7 está ligada a montante do gene ccdB de E. coli como o DNA alvo, foi utilizado. À sequência alvo de TiD foi uma sequência de 35 nucleotídeos compre- endendo a região de promotor T7 a montante do gene ccdB. O casse- te de gene ccdB sintético foi ligado a um sítio de múltiplas clonagens no vetor de plasmídeo pMW219 (fabricado pelo gene Nippon) para construir DpMW cedB1 (FIG. 3a).

[0078] O sistema de CRISPR reconhece uma sequência de motivo adjacente ao protoespaçador (PAM) localizada nas proximidades de uma sequência alvo e se liga à sequência alvo por meio de um gRNA. Visto que a sequência de PAM de TiD de M. aeruginosa usada neste Exemplo foi desconhecida, um plasmídeo de biblioteca de sequência de PAM foi construída. Sequências de quatro nucleotídeos randomiza- das foram introduzidas a montante do promotor T7 de pMW cecdB1 usando a síntese de DNA química artificial e PCR (FIG. 3b). Os plas- mídeos da biblioteca de pMW ccedB-PAM construídos foram introduzi- dos em uma linhagem celular de E. coli resistente ao ccdB, mantendo a resistência ao CcdB (fabricada pela Thermo Fisher Scientific) e, em seguida, os plasmídeos foram preparados. Tabela 3 SEQ ID NO:21 Cassete de expressão do gene ccdB sintético (A sequência sublinhada indica o pro- 5'-aggetttaatacgacteactatagggagaaaggatccataaaggaggtaaataatgaagcagoetattacagtgacagttgacage gacagctatcagttgcteaagecatatatgateteaatatetecggtetggtaageacaaceatgcagaatgaagecegtegtetgegtg ccgaacgctggaaageggaaaateageaagegategctgagetegeccegetitatigaaatgaacgectettttgctgacgagaaca gggactggtgaa ATGCAGTTTAAGGTTTACACCTATAAA AGAGAGAGCCGTTATCGTCTG

TTTGTGGATGTACAGAGTGATATTATTGACACGCCCGGGCGACGGATGGTGATCCC CCTGGCCAGTGCACGTCTGCTGTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGG TGCATATCGGGGATGAAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCG

GTCTCCGTTATEGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCA AAAACGCCATTAACCTGATGTTCTGGGGAATATAA-3'

(3) Determinação da sequência de PAM no sistema TiD de M. aerugi- nosa

[0079] A sequência de PAM para TiD foi determinada usando PECTiD3-T7 que inseriu a sequência de 35 nucleotídeos complementa- res à região de promotora T7 no plasmídeo da biblioteca pDpMW cecdB- PAM. O pEcTiD3-T7 foi introduzido na cepa BL21AI de E. coli (fabrica- da pela Thermo Fisher Scientific) para obter uma cepa hospedeira de E. coli para a edição do genoma do gene ccdB. A cepa BL21AI [pEc- TiD3-T7] expressa as proteínas Cas5d, Cas6d e Cas7d necessárias para o reconhecimento da sequência alvo. O complexo Cas5d/Cas6d/ Cas7d-crRNA reconhece uma sequência alvo adjacente à sequência de PAM apropriada e se liga à sequência alvo para inibir a função do promotor T7, que é a sequência alvo, apesar de não clivar a sequência alvo.

[0080] A expressão de ccdB pelo pMW-cedB-PAM introduzido na cepa BL21AI é induzida em um meio suplementado com arabinose, e as células BL21AI não tendo resistência ao CcdB são mortas. Quando o plasmídeo da biblioteca PpMW cedB-PAM é introduzido nas células BL21AI nas quais o plasmídeo de expressão TiD foi introduzido ante- cipadamente, o Cas5d/Cas6d/Cas7-crRNA expresso a partir do plas- mídeo pEcTiD3 liga-se ao promotor T7 do plasmídeo da biblioteca PMW cedB-PAM tendo uma sequência PAM apropriada para ser re- conhecida por TiD, desse modo a produção da proteína CcdB é inibida e, assim, as células de E. coli podem crescer. Das colônias de E. coli crescidas, o plasmídeo da biblioteca PpMW cedB-PAM foi preparado e a sequência PAM foi analisada pelo sequenciamento para determinar a sequência PAM de TiD de M. aeruginosa.

[0081] Os plasmídeos da biblioteca pMW ccedB-PAM, que foram preparados em grandes quantidades, foram introduzidos na cepa BL21AI [pEcTiD3-T7] por um método de célula competente químico.

As células BL21AI mantendo o plasmídeo da biblioteca pMW cecdB- PAM e o pEcTiD3-T7 foram selecionadas em um meio de ágar LB con- tendo 25 mg/L de cloranfenicol, 25 mg/L de canamicina e glicose 1%. Das colônias de E. coli assim obtidas, cerca de 1 x 107 colônias foram coletadas, lavadas várias vezes com um meio líquido de LB não con- tendo antibióticos e glicose, e assim suspensas em um meio líquido de LB contendo arabinose 1% em 1 x 10º células/mL. A suspensão foi cultivada com agitação a 37ºC por 2 horas para induzir a expressão do cCcrRNA e do ccdB sob o controle do promotor T7 pela arabinose. Em seguida, 200 uL da suspensão foram riscados em um meio de ágar LB contendo 25 mg/L de cloranfenicol, 25 mg/L de canamicina e arabino- se 1%. Após cultura durante a noite a 37ºC, as colônias bacterianas foram coletadas. De cerca de 500 colônias assim coletadas, seus plasmídeos foram preparados, e a proximidade da sequência de PAM foi submetida à análise de sequenciamento. As sequências de PAM dos plasmídeos da biblioteca DpMW ccdB-PAM resgatadas na presen- ça do plasmídeo de expressão de TiD continha a sequência 5-NGTH- 3' (N= AC, GouT;H=A,CouT). As frequências de uso das se- quências de PAM foram de 28% para NGTA, 33% para NGTC e 38% para NGTT. Portanto, verificou-se que a sequência de PAM utilizada pelo TiD foi 5-GTH-3 '(H = A, CouT).

(4) Edição de genoma em E. coli

[0082] Os plasmídeos pMW cedB-PAMgta, pMW cedB-PAMgtec e PMW cedB-PAMgtt contendo os três tipos de sequências de PAM de- terminados usando os plasmídeos da biblioteca pEcTiD3-1T7 e PMW cedB-PAM foram construídos e introduzidos juntamente com PEcTiD-lI7 na cepa BL21AI. As células BL21AI mantendo pMW cecdB- PAMgta/pEcTiD2-T7, pMW cedB-PAMgtce/pEcTiD2-T7 and pMW cedB- PAMgtt/pEcTiD2-T7 foram selecionados em meio de ágar LB contendo mg/L de cloranfenicol, 25 mg/L de canamicina e glicose 1%, e em seguida constatado conter o plasmídeo introduzido em cada célula bacteriana por análise de sequenciamento. Subsequentemente, as cé- lulas BL21AIl mantendo o plasmídeo correto foram riscadas em um meio de ágar LB contendo 25 mg/L de cloranfenicol, 25 mg/L de ca- namicina e arabinose 1% e depois cultivadas durante a noite a 37ºC. Como um resultado, todas as células bacterianas não cresceram, o que provavelmente foi causado pela quebra de DNA de fita dupla no DNA do plasmídeo na presença de Cas3d e Cas10d. Exemplo 2. Edição de genoma em plantas superiores

[0083] Neste exemplo, como uma modalidade de edição de geno- ma em eucariotos superiores, foi demonstrado que a técnica da pre- sente invenção funciona efetivamente em Nicotianabenthamiana e So- lanumlycopersicum. (1) Construção do vetor binário para expressão do gene TiD em célu- las de planta superiores

[0084] De acordo com as frequências em Arabidopsis e tabaco, as sequências otimizadas com dicotiledôneo que codificam cada proteína Cas foram sintetizadas quimicamente artificialmente com base nas in- formações da sequência de aminoácido de Cas5d, Cas6d, Cas7d, Cas3d e Cas10 derivadas do locus de TiD de M. aeruginosa. Um fra- gmento de DNA, compreendendo uma sequência de sinal de localiza- ção nuclear (SEQ ID NO: 22, SEQ ID NO: 23) contendo dois sinais de localização nuclear dispostos em 5'-a montante tandem de cada um dos genes de codificação da proteína Cas, e uma sequência peptídica 2A de autoclivagem (SEQ ID NOs: 24-28) entre os genes de codifica- ção de proteína Cas. Uma sequência de promotor (promotor 2 x 358; SEQ ID NO: 29) compreendendo dois promotores de gene 358 do ví- rus em mosaico da couve-flor dispostos em tandem e a sequência OQ do realçador da translação foi ligado ao 5'-a montante dos cinco frag- mentos de gene TiD fundidos entre si por meio de sequências peptídi-

cas 2A, e a sequência terminadora gênica de 18,2 kDa da proteína de choque térmico de Arabidopsis (SEQ ID NO: 30) foi ligada a 3'-a jusan- te dos cinco fragmentos do gene TiD fundidos entre si através das se- quências peptídicas 2A, e assim um cassete de expressão do gene TiD foi preparado.

O cassete de expressão do gene TiD foi clonado no vetor de plasmídeo binário pcCAMBIAZ300 para construir o pEgPTiD1 (FIG. 4a). Para um cassete de expressão de crRNA para plantas, um DNA no qual uma sequência espaçadora contendo dois sítios de Bsal da enzima de restrição foi colocada entre duas sequências de crRNA, de modo que qualquer sequência de 35 nucleotídeos sintetizada qui- micamente artificialmente pudesse ser ligada aos sítios de Bsal (SEQ ID NO: 31). A sequência promotora gênica snRNA-26 de Arabidopsis U6 (SEQ ID NO: 32) foi ligada a 5'-a montante da sequência do casse- te de expressão de crRNA, e a sequência poli T foi ligada a 3'-a jusan- te da sequência do cassete de expressão de crRNA (Fig. 4b). O cas- sete de expressão de crRNA para plantas foi ligado entre a sequência RB e o promotor 2 x 358 de pEgPTidD1 para construir pEgPTiD2, que foi usado como um vetor de plasmídeo binário de expressão de gene TiD para edição do genoma de planta (FIG. 4c). As sequências otimi- zadas por códon dicotiledôneas que codificam cada proteína Cas à qual um sinal de localização nuclear está ligado em pEgPTidD1 e pE- gPTidD2 são mostradas nas SEQ ID NOs: 33 a 37. A sequência sinal de localização nuclear, sequência 2A peptídica de autoclivagem, pro- motor, terminador, e a sequência do cassete de expressão de cr»RNA usada neste exemplo são mostradas na Tabela 4. Tabela 4-1 sinal de localização nuclear nuclear (codificando SEQ ID NO: | GACCCAMAGAAGAAGCGGAAGGTAGACC 22) CTAAGAAGAAGCGCAAGGTTTCTGGA-3'

Lo EEIDNOA) — sequência de aminoácido 2A pep- | SSEGRGSLLTCGDVEENPGP É (SEQ ID sequência peptídica 2A (1) de | 5- autoclivagem (codificando SEQ | GGCTCTGAGGGCAGAGGCAGCCTGCTGA ID NO: 24) CCTGCEGCGACGTGGAGGAAAACCCTGG CCCT-3' (SEQ ID NO:25) sequência peptídica 2A (2) de | 5- autoclivagem (codificando SEQ | GGGTCTGAGGGACGCGGCTCCCTGCTCA ID NO: 24) CCTGTGGAGATGTGGAAGAGAACCCAGG CCCC-3' (SEQ ID NO:26) sequência peptídica 2A (3) de | 5- autoclivagem (codificando SEQ | GGTTCTGAAGGCAGAGGCTCTCTGCTGA ID NO: 24)) CATGTGGGGATGTGGAGGAAAATCCTGG CCCT-3' (SEQ ID NO:27) sequência peptídica 2A (4) de | 5- autoclivagem (codificando SEQ | GGATCCGAGGGCAGAGGAAGTCTGCTAA ID NO: 24) CATGCGGTGACGTTGAGGAGAATCCCGG GCCA-3' (SEQ ID NO:28) Sequência Q + promotora do ge- | 5'- ne 358 do vírus em mosaico da | GCCAACATGGTGGAGCACGACACTCTCG couve-flor 2 x TCTACTCCAAGAATATCAAAGATACAGTCT

CAGAAGACCAAAGGGCTATTGAGACTTTT CAACAAAGGGTAATATCGGGAAACCTCCT CGGATTCCATTGCCCAGCTATCTGTCACT TCATCAAAAGGACAGTAGAAAAGGAAGGT GGCACCTACAAATGCCATCATTGCGATAA AGGAAAGGCTATCGTTCAAGATGCCTCTG CCGACAGTGGTCCCAAAGATGGACCCCC ACCCACGAGGAGCATCGTGGAAAAAGAA GACGTTCCAACCACGTCTTCAAAGCAAGT GGATTGATGTGAACATGGTGGAGCACGA CACTCTCGTCTACTCCAAGAATATCAAAG ATACAGTCTCAGAAGACCAAAGGGCTATT GAGACTTTTCAACAAAGGGTAATATCGGG AAACCTCCTCGGATTCCATTGCCCAGCTA TCTGTCACTTCATCAAAAGGACAGTAGAA AAGGAAGGTGGCACCTACAAATGCCATCA TTGCGATAAAGGAAAGGCTATCGTTCAAG ATGCCTCTGCCGACAGTGGTCCCAAAGAT GGACCCCCACCCACGAGGAGCATCGTGG AAAAAGAAGACGTTCCAACCACGTCTTCA AAGCAAGTGGATTGATGTGATATCTCCAC TGACGTAAGGGATGACGCACAATCCCACT ATCCTTCGCAAGACCCTTCCTCTATATAAG GAAGTTCATTTCATTTGGAGAGGCCGGTC TAGAGTATTTTTACAACAATTACCAACAAC

AACAAACAACAAACAACATTACAATTACTA TTTACAATT-3' (SEQ ID NO:29) Tabela 4-2 Terminador do gene de 18,2 kDa | 5- da proteína de choque térmico de | ATATGAAGATGAAGATGAAATATTTGGTG Arabidopsis TGTCAAATAAAAAGCTTGTGTGCTTAAGTT

TGTGTTTTTTTCTTGGCTTGTTGTGTTATG AATTTGTGGCTTTTTCTAATATTAAATGAA TGTAAGATCTCATTATAATGAATAAACAAA TGTTTCTATAATCCATTGTGAATGTTTTGT TGGATCTCTTCTGCAGCATATAACTACTG TATGTGCTATGGTATGGACTATGGAATAT GATTAAAGATAAGATGGGCTCATAGAGTA AAACGAGGCGAGGGACCTATAAACCTCC CTTCATCATGCTATTTCATGATCTATTTTA TAAAATAAAGATGTAGAAAAAAGTAAGCG TAATAACCGCAAAACAAATGATTTAAAACA TGGCACATAATGAGGAGATTAAGTTCGGT

TTACGTTTATTTTAGTACTAATTGTAACGT GAGAC-3' (SEQ ID NO:30) cassete de expressão de crRNA | 5'- para plantas GTTCCAATTAATCTTAAGCCCTATTAGGG ATTGAAACggagaccctcaattgteggteteGTTCCA

ATTAATCTTAAGCCCTATTAGGGATTGAAA a os amenos TT sequência promotora gênica U6 | 5'- SNRNA-26 de Arabidopsis thalia- | AAGCTTCGTTGAACAACGGAAACTCGACT na TGCCTTCCGCACAATACATCATTTCTTCTT

AGCTTTTTTTCTTCTTCTTCGTTCATACAG TTTTTITTTGTTTATCAGCTTACATTTTCOTT GAACCGTAGCTTTCGTTTTCTTCTTTTTAA CTTTCCATTCGGAGTTTTTGTATCTTGTTT CATAGTTTGTCCCAGGATTAGAATGATTA GGCATCGAACCTTCAAGAATTTGATTGAA TAAAACATCTTCATTCTTAAGATATGAAGA TAATCTTCAAAAGGCCCCTGGGAATCTGA AAGAAGAGAAGCAGGCCCATTTATATGGG AAAGAACAATAGTATTTCTTATATAGGCCC ATTTAAGTTGAAAACAATCTTCAAAAGTCC CACATCGCTTAGATAAGAAAACGAAGCTG

AGTTTATATACAGCTAGAGTCGAAGTAGT GATT-3' (SEQ ID NO:32) (2) Edição de genoma em Nicotianabenthamiana

[0085] No Exemplo do tabaco, o gene de fitoeno dessaturase (PDS) foi selecionado como uma sequência alvo para a introdução de mutações (FIG. 5-1 a). A sequência alvo 1 (Alvo 1, SEQ ID NO: 38) foi selecionada a partir do terceiro éxon no gene de PDS do tabaco, e o DNA sintetizado químico artificial do alvo 1 foi ligado ao cassete de expressão de crRNA para plantas para construir pEgPTiD2-pds (1). Similarmente, a sequência alvo 2 (Alvo 2, SEQ ID NO: 39) foi selecio- nada a partir do sexto éxon, e o DNA sintetizado químico artificial do alvo 2 foi ligado no cassete de expressão de crRNA para plantas para construir pegPTiD2-pds (2). Os vetores binários assim construídos fo- ram introduzidos na cepa de Agrobacterium tumefaciens GV2260. À introdução do vetor de expressão de TiD direcionado à PDS do tabaco nas células do tabaco foi realizada por agroinfiltração. As células de

Agrobacterium mantendo pEgPTiD2-pds (1) ou pEgPTidD2-pds (2) e as células de Agrobacterium mantendo um vetor binário de expressão de GFP foram cultivadas separadamente, e depois coinfectadas à ver- dadeira folhagem de Nicotianabenthamiana (FIG. 5-1 b). Três dias após a coinfecção, um DNA genômico foi preparado a partir de uma região que emite fluorescência de GFP em um disco foliar e, em se- guida, usado como um padrão para amplificar por POR um fragmento de gene de PDS de 300-500 pb contendo a sequência alvo. O frag- mento amplificado por PCR foi utilizado para o ensaio Cel-1 para ana- lisar se uma mutação foi introduzida no gene de PDS. Como um con- trole, um disco de folha de tabaco no qual apenas o vetor binário de expressão de GFP foi introduzido, foi utilizado. Quando apenas o vetor de expressão de GFP foi introduzido, nenhuma mutação foi observada no gene de PDS. Por outro lado, quando pEgPTiD2-pds e o vetor de expressão de GFP foram introduzidos simultaneamente, a introdução de uma(s) mutação(ões) foi observada em cada sequência alvo do ge- ne de PDS (FIG. 5-2 c). As sequências alvo 1 e 2 são mostradas na Tabela 5. Tabela 5 de PDS do tabaco (Alvo 1) | (SEQ ID NO:38) Sequência alvo 2 no gene | 5-AMATTTGCTATTGGACTCTTGCCAGCAATGCTTGG-3' (3) Edição de genoma em Solanumlycopersicum

[0086] No Exemplo do tomate, um gene IAAS9 do fator de transcri- ção Aux/IAA foi selecionado como uma sequência alvo para a introdu- ção de mutações (FIG. 6a). A sequência alvo 1 (SEQ ID NO: 40) (Ta- bela 6) foi selecionada a partir do segundo éxon do gene IAAS9 do to- mate, e o DNA sintetizado químico artificial do alvo 1 foi ligado ao cas- sete de expressão de crRNA para plantas para construir pEgPTiD2- iaa9. O vetor binário construído foi introduzido na cepa de Agrobacte-

rium tumefaciens GV2260. A introdução do vetor de expressão de TiD direcionado ao gene IAAS9 do tomate nas células do tomate foi realiza- da por um método de Agrobacterium utilizando um disco foliar deriva- do dos cotilédones do tomate. Os discos foliares coinoculados com Agrobacterium foram cultivados em meio solidificado MS contendo 100 mg/L de canamicina e 1,5 mg/L de t-zeatina para obter calos nos quais a introdução gênica de uma região T-DNA em pEgPTiD2-iaa9 ocorreu (FIG. 6b). A sequência de reconhecimento para a enzima de restrição Accl existe na sequência alvo de IAA9. Quando uma mutação é intro- duzida como um resultado da edição do genoma por TiD, o sítio de reconhecimento Accl desaparece. Assim, a análise do polimorfismo de comprimento de enzima de restrição por PCR (RFLP) usando Accl foi realizada para analisar mutações que ocorreram na sequência alvo de IAA9. Um DNA genômico foi preparado a partir dos calos transforma- dos obtidos e usado como um padrão para amplificar por PCR uma região de aproximadamente 300 bases contendo a sequência alvo de IAA9. O fragmento de PCR foi digerido com Accl. Verificou-se que o fragmento de PCR das culturas de calo em que o pEgPTiD2-iaa9 foi introduzido continha uma sequência que não foi digerida por Accl co- mo um resultado da introdução de mutação na sequência alvo IAA9 (FIG. 6c). A sequência nucleotídica do fragmento de PCR do calo no qual pEgPTiD2-iaa9 foi introduzido, foi determinada. Como um resul- tado, verificou-se que a deleção nucleotídica de 1 a 4 nucleotídeos foi introduzida imediatamente após a sequência PAM na sequência alvo de IAAS9. (FIG. 7).

[0087] Os calos em que o pEgPTiD2-iaa9 foi introduzido, foi tam- bém cultivado em um meio solidificado com MS contendo 100 mg/L de canamicina e 1,0 mg/L de t-zeatina para obter brotos transformados e regenerados. Um DNA genômico foi preparado a partir dos brotos re- generados, e usados como um padrão para realizar a análise de POCR-

RFLP com Accl. Como mostrado na FIG. 8a, fragmentos de PCR que não foram clivados com Accl foram observados. Por outras palavras, os brotos transformados e regenerados nos quais a sequência alvo IAAS foi quase 100% mutada foram obtidos. De 14 brotos transforma- dos e regenerados, os 13 brotos mostraram os mesmos resultados como mostrado na FIG. 8A. Nestas plantas regeneradas, as folhagens verdadeiras eram em forma de folha única, que é um dos fenótipos causados pela deficiência de IAA9. Assim, foi demonstrado que uma(s) mutação(ões) pode(m) ser introduzida(s) com alta eficiência pela edição do genoma usando TiD. Tabela 6 IAA9 do tomate (SEQ ID NO:40) Exemplo 3. Edição de genoma em animais superiores

[0088] Neste exemplo, como uma modalidade de edição de geno- ma em animais superiores, foi demonstrado que a técnica da presente invenção funciona efetivamente na linhagem celular derivada de célu- las renais embrionárias humanas HEK293. (1) Construção do vetor para expressão do gene TiD em células de animais superiores

[0089] As sequências gênicas que codificam cada proteína Cas foram sintetizadas quimicamente artificialmente com base na informa- ção da sequência de aminoácido de Cas5d, Cas6d, Cas7d, Cas3d e Cas10 derivadas do locus de TiD de M. aeruginosa. Um fragmento de DNA compreendendo uma sequência sinal de localização nuclear (SEQ ID NO: 22, SEQ ID NO: 23) contendo dois sinais de localização nuclear dispostos em 5'-a montante tandem de cada um dos genes de codificação de proteína Cas, e uma sequência peptídica 2A de autocli- vagem (SEQ ID NOs: 24-28) entre os genes de codificação de proteí- na Cas foi preparada. Uma sequência híbrida promotora de realçador de citomegalovírus + gene de B-actina de galinha (promotor CBh; SEQ

ID NO: 41) foi ligada em 5'-a montante dos cinco fragmentos do gene TiD fundidos entre si através das sequências peptídicas 2A, e uma se- quência terminadora gênica do hormônio de crescimento bovino (ter- minador bGH; SEQ ID NO: 42) foi ligada em 3'-a jusante dos cinco fra- gmentos do gene TiD fundidos entre si através das sequências peptí- dicas 2A e, assim, um cassete de expressão do gene TiD foi prepara- do. O cassete de expressão gênica TiD foi ligado a um vetor pCR8TOPO (fabricado pela Thermo Fisher Scientific) para construir pCR hTiD. Para um cassete de expressão de crRNA, um DNA no qual uma sequência espaçadora contendo dois sítios Bsal da enzima de restrição foi colocada entre duas sequências de crRNA para que qual- quer sequência de 35 nucleotídeos pudesse ser ligada, foi artificial- mente quimicamente sintetizado (SEQ ID NO: 31). A sequência pro- motora gênica U6 snRNA humano (SEQ ID NO: 43) como uma se- quência de controle de expressão foi ligada a 5'-a montante do cassete de expressão de crRNA, e a sequência de poli T foi ligada a 3'-a jusan- te do cassete de expressão de crRNA. O cassete de expressão de CcrRNA com o promotor do gene U6 snRNA humano e a sequência poli T foi ligado em um vetor pCR8TOPO (fabricado por Thermo Fisher Scientific) para construir pCR crRNA. As sequências que codificam cada proteína Cas com os sinais de localização nuclear em pCR hTiD são mostradas como SEQ ID NOs: 33-37. As sequências promotoras de CBh, terminadoras de bGH e promotoras do gene U6 snRNA hu- manas são mostradas na Tabela 7. Tabela 7 realçador de cito- | CGTTACATAACTTACGGTAMATGGCCCGCCTGGCTGACCGCCCA megalovírus + gene | ACGACCCCCGCCCATTGACGTCAATAGTAACGCCAATAGGGACT de B-actina de gali- | TICCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCA nha universal CTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTA

TTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTGTGCCCA GTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGT

ATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCT GCTTCACTCTCCCCATOTOECCCCCEeTeCCCACCCCCAATTTTG

TATTTATTTATTTTITAATTATTTTGTGCAGCGATGGGGGCEGEG GECEGECGEGEGECECECECCAGECEGEGCEGEGCEGEGCGE AGGGGCEGEGCEGEGCEAGECGGAGAGGTGCGGCGGCAGCC AATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGC GEGCEEGCEGCEGCEGCCCTATAMAMAGCGAAGCGCGCGGCEGGE

CGEGGAGTCGCTGCGACGCTGCCTTCGCCCCEGTGCCCEGCTCE GCCGCCECCTEGEGCEGCCeGCceeGGCTETGACTGACCGCG

TTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGG GCTGTAATTAGCTGAGCAAGAGGTAAGGGTTTAAGGGATGGTTG

GTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGA AATCACTTTTTTTCAGGTTGGACCGGTGCCACC-3' —“(SEQ |D NO:41) sequência termina- | 5- dora gênica do | GCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTT hormônio de cres- | GTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCA cimento bovino CTCCCACTGTCCTTTCCTAATAMAATGAGGAAATTGCATCGCATT

GTCTGAGTAGGTGTCATTCTATTCTGGGGEGTEGEGTEGEGCA

GGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCT GGGGA-3' (SEQ ID NO:42) promotor do gene | 5- U6 snRNA humano | GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATAC

AAGGCTGTTAGAGAGATAATTGGAATTAATTTGACTGTAAACACA AAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTT GGGTAGTTTGCAGTTTTAAAATTATGTTTTAAMAATGGACTATCATA

TGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATAT CTTGTGGAAAGGACGAAACACC-3' (SEQ ID NO:43) (2) Edição de genoma em células animais cultivadas

[0090] No Exemplo de células animais cultivadas, uma linhagem celular derivada de células renais embrionárias humanas (linhagem celular HEK293) foi utilizada, e o gene EMX1 foi selecionado como uma sequência alvo para a introdução de mutações. O alvo 1 (SEQ ID NO: 44) e o alvo 2 (SEQ ID NO: 45) foram selecionados como sequên- cias alvo no gene EMX1, e o DNA sintetizado químico artificial do alvo 1 e 2 foi ligado no cassete de expressão de crRNA para células humanas cultivadas preparadas em (1) acima para construir puC crRNA-T1 contendo o alvo 1 e puC crRNA-T2 contendo o alvo 2. Os plasmídeos construídos foram amplificados na cepa de E. coli HSTO8 (fabricada por Takara Bio Inc.) e depois purificados usando PureYield (marca regis- trada) Plasmid Miniprep System (fabricado por Promega Corp.). Entre os plasmídeos purificados, uma mistura de pCR hTiD e pUC crRNA-T1 ou uma mistura de pCR hTiD e puUC crRNA-T?2 foi introduzida nas célu- las HEK293 por transfecção. Três dias após a introdução dos vetores de plasmídeos, as células foram coletadas, e um DNA genômico foi preparado a partir deles usando o Mini-Kit de DNA Blood & Cell Cultu- re (fabricado por Qiagen). Utilizando o DNA genômico preparado como um padrão, a região da sequência genômica compreendendo o alvo 1 ou o alvo 2 foi amplificada por PCR e a análise de mutação foi realiza- da pela análise de mobilidade de heteroduplex usando um aparelho de eletroforese automático MuUltiNA (fabricado por Shimadzu Corporation). Além disso, o fragmento de PCR amplificado foi clonado no vetor PNEB193 (fabricado por New England Biolab), e uma sequência muta- da foi identificada por análise de sequenciação. A eficiência da muta- ção somática foi calculada com base no "número de clones nos quais uma sequência mutada foi observada/no número total de clones anali- sados". A linhagem celular na qual o plasmídeo não foi introduzido, ou PCR hTiD, pUC crRNA-T1 ou pUC crRNA-T2 foi introduzido isola- damente, foi usada como controle para realizar a análise de mutações da mesma maneira. Um esquema experimental para edição do geno- ma usando a linhagem celular HEK293 é mostrado na FIG. 9

[0091] FIG. 10 e FIG. 11 mostram resultados experimentais obti- dos quando a linhagem celular HEK293 foi transfectada com a mistura de pCR hTiD e pUC crRNA-T1 ou a mistura de pCR hTiD e PUC crRNA-T2 ou quando a linhagem celular HEK293 não foi trans- fectada com o plasmídeo (controle). Como mostrado na FIG. 10 e FIG. 11, picos indicando mutações introduzidas na sequência alvo foram detectados na linhagem celular HEK293 transfectada com a mistura de pCR hTiD e pUC crRNA-T1 ou a mistura de pCR hTiD e pUC crRNA- T2. Por outro lado, nenhum pico indicando a introdução da mutação foi detectado na linhagem celular na qual o plasmídeo não foi introduzido como um controle. Similarmente à linhagem celular na qual o plasmí- deo não foi introduzido, nenhum pico indicando a introdução da muta- ção foi detectado na linhagem celular na qual pCR hTiD, puUC crRNA- T1 ou pUC crRNA-T2 foram introduzidos isoladamente.

[0092] Em seguida, as amostras de sequência nas quais um pico indicando a introdução de mutação foi detectado por análise de mobili- dade de heteroduplex foram clonadas em um vetor de plasmídeo e analisadas por sequenciação. Como um resultado, como mostrado na FIG. 12 e FIG 13, verificou-se que mutações de deleção e/ou inserção foram introduzidas no alvo 1 e no alvo 2. Tabela 8 ID NO:44) NO:45) Aplicabilidade Industrial

[0093] De acordo com a presente invenção, é possível direcionar uma sequência gênica que não pode ser direcionada pela técnica de edição de genoma convencional usando endonuclease guiada por RNA derivada de tipo Il ou tipo V de CRISPR. Especificamente, de acordo com a presente invenção, é possível gerar alelos mutantes, controlar a expressão gênica por ativação e inativação transcricional e realizar alteração epigenômica por direcionamento de um domínio de proteína de modificação de DNA/modificação de histona em regiões gênicas que não podem ser direcionadas pelas técnicas convencio- nais.

Texto Livre da Listagem de Sequência

[0094] SEQ ID NO: 1; Sequência de aminoácido de Cas5d de Mi- crocystis aeruginosa

[0095] SEQ ID NO: 2; Sequência de aminoácido de Cas6d de Mi- crocystis aeruginosa

[0096] SEQ ID NO: 3; Sequência de aminoácido de Cas7d de Mi- crocystis aeruginosa

[0097] SEQ ID NO: 4; Sequência de aminoácido de Cas3d de Mi- crocystis aeruginosa

[0098] SEQID NO: 5; Sequência de aminoácido de Cas10d de Mi- crocystis aeruginosa

[0099] SEQ ID NO: 6; TiDcrRNA contendo repetição direta (37b) e espaçador (35b de N). N é qualquer nucleotídeo que constitui uma se- quência complementar a uma sequência nucleotídica alvo.

[00100] SEQ ID NO: 7; Sequência nucleotídica de Cas5d para ex- pressão em Escherichia coli

[00101] SEQID NO: 8; Sequência nucleotídica de Cas6d para ex- pressão em Escherichia coli

[00102] SEQID NO: 59; Sequência nucleotídica de Cas7d para ex- pressão em Escherichia coli

[00103] SEQID NO: 10; Sequência nucleotídica de Cas3d para ex- pressão em Escherichia coli

[00104] SEQ ID NO: 11; Sequência nucleotídica de Cas10d para expressão em Escherichia coli

[00105] SEQID NO: 12; Promotor de síntese J23108

[00106] SEQID NO: 13; Sequência de ligação ribossômica

[00107] —SEQID NO: 14; Sequência terminadora STOP767

[00108] SEQID NO: 15; Sequência terminadora STOP768 (1)

[00109] —“SEQID NO: 16; Sequência terminadora TOP768 (2)

[00110] SEQID NO: 17; Sequência terminadora T7

[00111] SEQID NO: 18; Sequência de repetição CRISPR

[00112] SEQID NO: 19; Sequência promotora T7

[00113] SEQID NO: 20; cassete de expressão de cr»RNA

[00114] SEQID NO: 21; Cassete de expressão gênica cccdB de síntese

[00115] SEQ ID NO: 22; Sequência de aminoácido sinal de locali- zação nuclear (NLS)

[00116] SEQID NO: 23; Sequência nucleotídica NLS

[00117] SEQID NO: 24; Sequência de aminoácido 2A peptídica de autoclivagem

[00118] SEQID NO: 25; Sequência de codificação 2A (1) peptídica de autoclivagem

[00119] SEQID NO: 26; Sequência de codificação 2A (2) peptídica de autoclivagem

[00120] SEQ ID NO: 27; Sequência de codificação 2A (3) peptídica de autoclivagem

[00121] SEQID NO: 28; Sequência de codificação 2A (4) peptídica de autoclivagem

[00122] SEQID NO: 29; Sequência ômega + promotora do gene 358 do vírus em mosaico da couve-flor 2 x

[00123] SEQID NO: 30; Sequência terminadora gênica de 18,2 kDa da proteína de choque térmico de Arabidopsis

[00124] SEQID NO: 31; cassete de expressão de cr»RNA

[00125] SEQID NO: 32; Sequência promotora gênica U6 snRNA-26 de Arabidopsis

[00126] SEQID NO: 33; 2xNLS + Cas5d

[00127] SEQID NO: 34; 2xNLS + Cas6d

[00128] SEQID NO: 35; 2xNLS + Cas7d

[00129] SEQID NO: 36; 2xNLS + Cas3d

[00130] SEQID NO: 37; 2xNLS + Cas10d

[00131] SEQID NO: 38; Sequência alvo 1 no gene de PDS do ta- baco

[00132] SEQID NO: 39; Sequência alvo 2 no gene de PDS do ta- baco

[00133] “SEQID NO:40; Sequência alvo no gene IAAS9 do tomate

[00134] SEQ ID NO: 41; Promotor híbrido de realçador de citome- galovírus + gene de B-actina de galinha universal

[00135] SEQID NO: 42; Sequência terminadora gênica do hormô- nio crescimento derivada de bovino

[00136] SEQID NO: 43; promotor do gene U6 snRNA humano

[00137] SEQID NO: 44; Sequência de alvo 1 no gene EMX1 huma- no

[00138] SEQID NO: 45; Sequência de alvo 2 no gene EMX1 huma- no

Claims

REIVINDICAÇÕES

1. Método para direcionar uma sequência nucleotídica alvo, caracterizado pelo fato de que o método compreende a introdução em uma célula: (i) proteínas associadas ao Tipo |-D de CRISPR, Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência com- plementar à sequência nucleotídica alvo, e sequências repetitivas co- muns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, ou um DNA que codifica o RNA guia.

2. Método para alterar uma sequência nucleotídica alvo, caracterizado pelo fato de que o método compreende a introdução em uma célula: (i) proteínas associadas ao tipo |-D de CRISPR Cas3d, Cas5d, Cas6d, Cas7d e Cas10d, ou ácidos nucleicos codificando as proteínas, e (ii) um RNA guia compreendendo uma sequência com- plementar à sequência nucleotídica alvo e sequências repetitivas co- muns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar, ou um DNA que codifica o RNA guia.

3. Método para suprimir a expressão de um gene alvo, ca- racterizado pelo fato de que o método compreende a introdução em uma célula: (i) proteínas associadas ao tipo |-D de CRISPR Cas5d, Cas6d e Cas7d, ou ácidos nucleicos que codificam as proteínas, e (ii) um RNA guia compreendendo uma sequência com- plementar a pelo menos uma parte da sequência gênica alvo e se- quências repetitivas comuns derivadas de um locus de CRISPR, pre- cedendo e seguindo a sequência complementar, ou um DNA que codi- fica o RNA guia.

4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o RNA guia compreende uma se- quência que consiste em 20 a 50 nucleotídeos que é complementar à sequência nucleotídica alvo.

5. Método, de acordo com a reivindicação 2 ou 4, caracteri- zado pelo fato de que ainda compreende a introdução de um polinu- cleotídeo doador na célula.

6. Método, de acordo com qualquer uma das reivindicações 2,4 e 5, caracterizado pelo fato de que a alteração é a deleção, inser- ção ou substituição de nucleotídeos.

7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a Cas5d reconhece 5'-GTH-3' (H = A, C ou T) como uma sequência de motivo adjacente ao protoespa- çador (PAM).

8. Complexo, caracterizado pelo fato de que compreende: (i) proteínas associadas ao tipo |-D de CRISPR Cas5d, Cas6d e Cas7d, e (ii) um RNA guia compreendendo uma sequência com- plementar a uma sequência nucleotídica alvo, sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar.

9. Complexo, de acordo com a reivindicação 8, caracteriza- do pelo fato de que também compreende Cas3d e Cas10d.

10. Complexo, de acordo com a reivindicação 8 ou 9, carac- terizado pelo fato de que o RNA guia compreende uma sequência que consiste em 20 a 50 nucleotídeos que é complementar à sequência nucleotídica alvo.

11. Vetor de expressão, caracterizado pelo fato de que compreende: (i) ácidos nucleicos que codificam as proteínas associa-

das ao tipo |-D de CRISPR Cas5d, Cas6d e Cas7d, e (ii) um DNA que codifica um RNA guia compreendendo uma sequência complementar a uma sequência nucleotídica alvo, e sequências repetitivas comuns derivadas de um locus de CRISPR, precedendo e seguindo a sequência complementar.

12. Vetor de expressão, de acordo com a reivindicação 11, caracterizado pelo fato de que ainda compreende ácidos nucleicos que codificam Cas3d e Cas10d.

13. Molécula de DNA, caracterizada pelo fato de que codifi- ca o complexo como definido em qualquer uma das reivindicações 8 a

10.