BR112014014105B1

BR112014014105B1 - Método para modificar um sítio-alvo predeterminado no interior de um ácido nucleico genômico ou organelar alvo em uma célula hospedeira eucariótica por um complexo núcleoproteína

Info

Publication number: BR112014014105B1
Application number: BR112014014105-3A
Authority: BR
Inventors: Yoel Moshe Shiboleth; Dan Michael Weinthal
Original assignee: Targetgene Biotechnologies Ltd
Priority date: 2011-12-16
Filing date: 2012-12-16
Publication date: 2023-10-10
Also published as: US20150211023A1; US20170183687A1; NZ626105A; CN104080462A; HK1203362A1; ZA201403785B; RU2663354C2; US11278560B2; US11458157B2; US10220052B2; US20170233752A1; RU2014129015A; AU2012354062B2; CA2858801C; AU2017268502A1; EP2790708B1; IL253372A0; US20240148771A1; AU2017268502B2; PH12014501360A1

Abstract

métodos para modificar uma sequência de ácido nucleico- alvo predeterminada e célula hospedeira a presente invenção fornece métodos para modificar uma sequência predeterminada de ácido nucleico. é fornecido um complexo molecular de nucleoproteína programável contendo uma fração polipeptídeo e um ácido nucleico propiciador de especificidade (scna) que é montado in vivo, em uma célula-alvo, e é capaz de interagir com a sequência de ácido nucleico-alvo predeterminada. o complexo molecular de nucleoproteína programável é capaz de modificar e/ou editar especificamente um sítio-alvo no interior da sequência de ácido nucleico-alvo e/ou modificar a função da sequência de ácido nucleico-alvo. a presente invenção refere-se ainda a uma célula hospedeira tendo modificação genética em um sítio alvo predeterminado.

Description

Campo da Invenção

[001] A presente invenção se refere a composições e métodos de endereça-mento e modificação de sequências de ácido nucleico utilizando um complexo mole-cular programável.

Fundamentos da Invenção

[002] A principal área de interesse na biologia e medicina é a alteração dire-cionada de sequências de nucleotídeo genômico. Estas alterações incluem inserção, deleção e substituição de sequências de ácido nucleico cromossômico endógeno. Foram realizadas tentativas de alteração genômica no passado com o uso de diferentes técnicas.

[003] O endereçamento de gene é uma ferramenta biotecnológica desejada para a manipulação do genoma ou para a modificação funcional do genoma. O endereçamento de gene pode induzir uma alteração em um local genômico específico que pode ou não estar relacionada às sequências de codificação.

[004] Em um evento de endereçamento de gene, um gene endógeno previa-mente definido, ou outra sequência de ácido nucleico endógeno previamente definida, é endereçado para clivagem resultando na deleção, mutação, inserção ou substituição ou é endereçado para a modificação química através da modificação funcional do gene endereçado. Uma vantagem do endereçamento do gene em relação à produção de organismo transgênico não endereçado é a possibilidade de modificar ou excluir sequências genômicas existentes sem a inserção de DNA externo, ou alternativamente, posicionar um DNA doador externo, por inserção ou substituição, em um locus predefinido. Esta capacidade de manipular desta maneira uma sequência sem sequências supérfluas é vantajosa, uma vez que estas não são desejadas por melho- ristas, agricultores, consumidores e agências reguladoras, e embora muitas técnicas para evitar tais sequências tenham sido sugeridas, cada uma delas possui inconvenientes próprios.

[005] As estratégias para o endereçamento de gene em seres eucariotos de-pendem de dois mecanismos de reparo da quebra do dsDNA celular: as vias de reparo da recombinação homóloga (HR) e da recombinação não homóloga (NHEJ). Na NHEJ, as inserções de gene dependem da existência de uma quebra do dsDNA que pode ocorrer aleatoriamente (por exemplo, através de radiação ou dano oxidativo) ou ser endereçada por uma nuclease, como a nuclease TALE (TALEN), meganuclease ou nuclease dedo de zinco (ZFN). A HR pode ser induzida por quebras do dsDNA. Na HR, uma quebra do dsDNA não é essencial, mas pode aumentar a eficiência quando próxima ao sítio de recombinação.

[006] Extensas pesquisas foram conduzidas a respeito do endereçamento de gene mediado por HR, que funciona com grande utilidade em vários organismos, como, bactérias, levedura e plantas primitivas, musgo. A HR também foi utilizada em organismos superiores, tais como, drosophila, camundongos, e humanos. As taxas de HR nestes organismos são de cerca de 10A-6, e podem ser aumentadas além de 10A-2, na HR assistida, criando uma DSB específica do gene. As baixas taxas de transformantes são uma das razões para que estes métodos não sejam prevalentes na terapia de gene ou nos programas de melhoramento.

[007] Várias técnicas para modificação de ácidos nucleicos in vivo foram su-geridas e podem ser divididas em métodos baseados em enzimas ou nucleotídeos. De maneira geral, os métodos baseados em enzima utilizam uma proteína de ligação do DNA que possui a atividade catalítica desejada e a capacidade de se ligar à se-quência-alvo desejada através de uma interação ácido nucleico-proteína de maneira similar às enzimas de restrição. Exemplos incluem meganucleases, que são enzimas de corte de sequência rara sintéticas ou naturais, nucleases dedo de zinco (ZFNs) ou nucleases semelhantes a ativadores da transcrição (TALENs) que contêm a subuni- dade de nuclease catalítica FokI ligada a um domínio de ligação de DNA modificado, cada um podendo cortar uma sequência predeterminada. Nas ZFNs, o domínio de ligação é formado por cadeias de aminoácidos que se dobram em domínios dedo de zinco personalizados. Nas TALENs, de maneira semelhante, 34 repetições de amino- ácido originárias dos fatores de transcrição se dobram em um imenso domínio de ligação do DNA. No caso do endereçamento de gene, estas enzimas podem clivar o DNA genômico para formar uma quebra do filamento duplo (DSB) ou criar um nick que pode ser reparado por uma das duas vias de reparo, recombinação não homóloga (NHEJ) ou recombinação homóloga (HR). A via NHEJ potencialmente pode resultar em eventos de mutações, deleções, inserções ou substituição específicos. A via HR resulta em substituição da sequência endereçada por uma sequência doadora fornecida. Uma desvantagem destes métodos baseados unicamente em proteína é a extensa e laboriosa necessidade de projetar e fornecer uma proteína diferente para cada sequência-alvo desejada. Outras desvantagens incluem o subconjunto relativamente limitado de triplets de ácido nucleico ou sequências reconhecidas por ZFNs e meganucleases, respectivamente. Além disso, até mesmo uma ZFN com seis dedos de zinco, que é de difícil construção, é limitada a um sítio de ligação de somente 18 nucleotí- deos, e como os 18 nucleotídeos não são estatisticamente suficientes para conferir especificidade de sequência no espaço da sequência, ou complexidade, de todo um genoma, estes devem ser fornecidos como heterodímeros. Além disso, a natureza das ZFNs e TALENs requer avaliação da funcionalidade e até mesmo nucleases bem sucedidas podem exibir baixa eficiência de endereçamento do gene.

[008] Para os métodos baseados em nucleotídeo, os ácidos nucleicos são fornecidos ao organismo e os processos endógenos ocasionam reparo de DNA ou endereçamento de gene através de recombinação homóloga não assistida ou integração do oligonucleotídeo no genoma. Estes ácidos nucleicos podem ser fornecidos com o uso de vetores virais, vetores de plasmídeo, vetores de T-DNA e oligonucleotídeos de DNA de filamento duplo. Nucleotídeos mais curtos denominados Oligonucleotídeos formadores de hélice tripla (TFOs) são utilizados para Reparo de erro de emparelha- mento baseado em oligonucleotídeo, e podem realizar o reparo de mutações de ponto ou reparo de até 4 nucleotídeos. Há amplas evidências de que estes métodos também dependem da formação de DSBs, que pode ser aleatória, induzida aleatoriamente ou induzida localmente através de modificação enzimática ou química com enzimas ou substâncias químicas reativas ligadas covalentemente ao ácido nucleico fornecido. As quebras de filamento duplo (DSB) no DNA são necessárias para HR. DSBs específicas já existentes não são essenciais, embora aumentem a eficiência. Quebras naturais no DNA são localizadas aleatoriamente e raras, portanto, a eficiência deve ser baixa (10A-6). DSBs podem ser induzidas aleatoriamente com radiação ionizante ou substâncias químicas oxidantes, aumentando a eficiência em detrimento da genotoxi- dez. No aprimoramento deste sistema, o reparo ou HR assistida foram realizados no passado com o uso de clivagem de DNA não enzimática assistida pela modificação química do terminal de um ácido nucleico. Estas modificações incluem EDTA-Fe ou Psoralen fotoativável e foram utilizados para a produção de uma DSB específica da sequência em dsDNA quando incorporado in vitro para formar tripla hélice. Um método adicional utiliza oligonucleotídeos, ou oligonucleotídeos modificados, derivados de DNA de filamento simples (ssDNA), também conhecidos como “oligodexoxinucleotí- deos pequenos de filamento único sintéticos (ODNs ou ssODNs). No entanto, embora os métodos baseados em oligonucleotídeo possam resultar em mutações de ponto relativamente eficientes em genomas de células de mamíferos, restringem-se a este modo de edição.

[009] Os conjugados oligonucleotídeo-enzima são uma combinação de dois métodos compreendendo um ácido nucleico ligado covalentemente in vitro a uma enzima catalítica antes de fornecer o conjugado ao organismo. Estes métodos, em oposição aos métodos unicamente enzimáticos, são modulares, possibilitando a pre-paração de conjugados dirigidos a uma diversidade de sequências-alvo. A principal desvantagem dos conjugados oligonucleotídeo-enzima é que eles não conseguem constituir uma montagem autonomamente in vivo, limitando severamente sua utilidade na edição do genoma in vivo. Outra desvantagem crucial desses sistemas conhecidos na técnica é que, no uso destes conjugados, o componente enzimático é ativo como monômero e, desse modo, qualquer ligação da enzima a um ácido nucleico, específico ou não, resultará em clivagem. Essa clivagem não específica reduz drasticamente a segurança desses sistemas, pois podem introduzir alterações/mutações indesejadas em locais indesejados.

[010] Os sistemas de oligonucleotídeo-proteína não conjugados também fo-ram utilizados para clivar um substrato de ssDNA. Neste sistema uma Enzima de Restrição Classe-IIS, FokI, que cliva fora de seu sítio de reconhecimento, foi utilizada in vitro, junto com um oligonucleotídeo formador de grampo que reconstitui a sequência de reconhecimento FokI, com uma enzima PolIk e dNTPs para criar uma seção de duplo filamento de DNA iniciada pelo oligonucleotídeo a ser clivado. Neste sistema, não somente a sequência pretendida é clivada, mas qualquer sítio FokI de ocorrência natural será reconhecido e a sequência adjacente a ele será clivada. Como FokI possui somente um sítio de reconhecimento com 5 nucleotídeos, isso implica na existência de milhares de potenciais sítios de clivagem em todo um genoma, tornando este sistema inútil para a edição do genoma.

[011] Em plantas superiores e humanos, em contraposição a outros organis-mos onde a HR pode ser utilizada para endereçamento de gene, a via NHEJ é o me-canismo endógeno predominante. A máquina vegetal de reparo de DNA não permite a HR entre DNA doador e cromossômico. De fato, aceita-se largamente que moléculas do DNA doador externo, que são em geral entregues através de transformação genética mediada por Agrobacterium, são reconhecidas pela via da Recombinação não homóloga (NHEJ), que ocasiona a integração aleatória em todo o genoma hos-pedeiro. Os métodos de transformação vegetal mais correntes, portanto, não são con-siderados endereçamento de gene, pois nestes métodos, as sequências são inseridas aleatoriamente no genoma, e como efeito colateral indesejado, pode colapsar o gene existente, e em geral são inseridas em múltiplas cópias, ou contêm remanescentes da sequência bacteriana, plasmídeo ou marcador indesejados.

[012] Métodos para a indução de quebras do dsDNA específicas, úteis para HR assistida e NHEJ dirigida, utilizam a expressão de nucleases in vivo. Estas incluem nucleases de corte de sequência rara (rare-cutters), tais como, meganucleases ou meganucleases quiméricas, derivadas de endonucleases de homing, Nucleases Dedo de Zinco recombinantes (ZFNs) customizadas, ou nucleases do efetor de TAL recom- binante produzidas de forma customizada. Nestes métodos, o reconhecimento do sítio-alvo clivado, é obtido pela interação de uma subunidade ou domínio de proteína que reconhece naturalmente uma sequência de nucleotídeo específica, ou é desenvolvida especificamente para reconhecer uma sequência de nucleotídeo específica e não se baseia em emparelhamento de base ou hibridização de polinucleotídeo-poli- nucleotídeo. Por exemplo, as nucleases dedo de zinco são proteínas quiméricas, construídas como híbridos entre a subunidade de nuclease FokI e domínios dedo de zinco sintéticos (ZF). As nucleases dedo de zinco não contêm um componente do ácido nucleico. As ZFNs são projetadas para reconhecer especificamente triplets de nucleotídeo através da combinação de diversos motivos ZF. As ZFNs não podem ser construídas para reconhecer todas as sequências em função da sua capacidade inerente de reconhecer somente um subconjunto limitado de triplets de nucleotídeo. O uso de heterodímeros de ZFN, portanto, duas ZFNs diferentes, que são inativas como monômero, são entregues concomitantemente, possui efeito positivo sobre a especi-ficidade, embora isso torne ainda mais complexo o desenho e reduza a escolha das sequências-alvo. As ZFNs também foram utilizadas para criar fatores de transcrição artificiais para ativação e repressão de genes, para alterar a regulação gênica. No entanto, esses fatores de transcrição baseados em dedo de zinco não podem se ligar a todas as sequências, sendo limitadas em termos de comprimento do sítio de reco-nhecimento e restritas a diversos motivos de trinucleotídeo específicos, desse modo não podendo ser utilizadas para ativar ou suprimir possíveis genes.

[013] Por exemplo, Schierling et. al., revelam uma plataforma inusitada de nu- cleasse dedo de zinco com um módulo de clivagem específico da sequência. Por exemplo, Eisenschmidt K, et. al. Revelam uma endonuclease de restrição programada para a clivagem de DNA altamente específico. Por exemplo, o documento WO 2006/027099 trata de conjugados enzimáticos com especificidade programável, os quais reagem de maneira altamente específica com o DNA.

[014] Kubo et. al., por exemplo, revelam o controle da entrega intracelular de oligonucleotídeos por peptídeos-sinal e expressão genética em células humanas. Ji- nek et. al., revelam uma endonuclease de DNA Orientada por DNA Duplo programável na imunidade bacteriana adaptativa.

[015] O documento WO 2012/129373, por exemplo, aborda métodos para pro-duzir um locus de complexa característica transgênica.

[016] No entanto, resta insatisfeita a necessidade na técnica de composições e métodos seguros, confiáveis, modulares e econômicos que permitam a modificação e o endereçamento específico de sequências de ácido nucleico-alvo in vivo.

Sumário da Invenção

[017] A presente invenção fornece composições e métodos para o endereça-mento e a modificação de sequências de ácido nucleico, in vivo ou in vitro. De acordo com algumas modalidades o complexo molecular programável compósito inusitado (complexo nucleoproteína) aqui fornecido é utilizado para editar ou adaptar funcionalmente uma sequência de ácido nucleico-alvo predeterminada de maneira precisa, confiável e econômica.

[018] Em algumas modalidades, o complexo molecular aqui revelado é utili-zado para endereçamento de gene e/ou modificação funcional do gene endereçado que inclui, mas não se limitando a, geração de quebras em um ou dois filamentos do ácido nucleico-alvo para iniciar a mutação de gene, deleção, substituição de gene, e integração de uma molécula de ácido nucleico externa, ou para sua modificação fun-cional química, conformacional ou biológica.

[019] De acordo com algumas modalidades, o complexo molecular aqui reve-lado compreende a) um polipeptídeo quimérico (que pode ser codificado por uma mo-lécula de polinucleotídeo), o polipeptídeo quimérico compreendendo: (i) um domínio funcional (efetor) (FD) capaz de modificar um sítio-alvo; e (ii) um domínio de ligação (LD); e (b) um ácido nucleico propiciador de especificidade (SCNA), o SCNA compre-endendo: (i) uma sequência de nucleotídeo complementar a uma região de um ácido nucleico-alvo flanqueando o sítio-alvo; e (ii) uma região de reconhecimento capaz de anexar-se especificamente ao domínio de ligação do polipeptídeo; e desse modo a montagem do polipeptídeo e do SCNA no interior de uma célula hospedeira/alvo forma um complexo molecular de nucleoproteína, programável e funcional, capaz de modificar especificamente o ácido nucleico-alvo no sítio-alvo.

[020] Em algumas modalidades, a presente invenção fornece uma composi-ção vantajosa compreendendo um módulo efetor de proteína (ou uma molécula de ácido nucleico que a codifica) e um módulo de ácido nucleico de programação/ende- reçamento que pode montar-se autonomamente in vivo formando um complexo nu- cleoproteína molecular que modifica o ácido nucleico ativo específico. Neste com-plexo, o ácido nucleico, aqui também denominado “fração de programação”, "oligonu- cletídeo de programação" ou “ácido nucleico propiciador de especificidade” (SCNA) fornece as capacidades de especificidade e ligação do complexo molecular ao ácido nucleico-alvo através do emparelhamento de base do dito ácido nucleico propiciador de especificidade e de um ácido nucleico-alvo. O módulo ou componente efetor da proteína deste complexo é projetado para se ligar/unir/anexar ao ácido nucleico pro-piciador de especificidade através de uma fração química anexada ao oligonucleotí- deo, uma modificação de um nucleotídeo ou nucleotídeos no oligonucleotídeo, uma sequência de reconhecimento específica no oligonucleotídeo, e similares, ou combi-nações dos citados. Sob o aspecto vantajoso, as composições e métodos aqui reve-lados conferem especificidade mais alta com uma ampla gama de sequência-alvo desejadas, são menos genotóxicos, de montagem modular, confiáveis, utilizam uma única plataforma sem customização, são práticos para uso independente fora de ins-talações essenciais especializadas, e possuem intervalo de tempo de desenvolvi-mento mais curto e custos reduzidos.

[021] A atividade do módulo de proteína pode resultar na modificação da se-quência de ácido nucleico-alvo e/ou na modificação funcional do ácido nucleico-alvo. A modificação ácido nucleico-alvo pode incluir, entre outras coisas: mutação, deleção, inserção, substituição, ligação, digestão, corte (nicking), metilação, acetilação, ligação, recombinação, desespiralação de hélice, modificação química, marcação, ativação, e inativação ou qualquer uma de suas combinações. A modificação funcional do ácido nucleico-alvo pode induzir, entre outras coisas: alterações na ativação da transcrição, inativação da transcrição, splicing alternativo, rearranjo da cromatina, inativa- ção do patógeno, inativação do vírus, alteração da localização celular, compartimen- talização do ácido nucleico, e similares, ou combinações dos citados. Qualquer ação de edição ou outra modificação efetuada pela fração de proteína é dirigida ou orientada a um ácido nucleico-alvo específico (predefinido) pretendido através de sua ligação ao ácido nucleico propiciador de especificidade. Sob o aspecto vantajoso, o uso de cada tipo único de proteína pode ser associado a um sortimento ilimitado de sequências de nucleotídeo de ácidos nucleicos propiciadores da especificidade concomitantemente ou separadamente, para permitir a ação similar em diferentes seções do ácido nucleico-alvo pretendido. Isso permite superar as desvantagens dos métodos do estado da técnica, ao fornecer métodos e composições versáteis confiáveis e econômicas para a modificação dos alvos da sequência de ácido nucleico predeterminada. Desse modo, se utilizado em um depositário ou organismo, somente um tipo de proteína deve ser fornecido junto com qualquer combinação ou multiplicidade de tipos de ácidos nucleicos propiciadores de especificidade. Isso inclui ainda a possibilidade do uso concomitante de mais de um tipo de componente da proteína com mais de um tipo de ácidos nucleicos propiciadores da especificidade.

[022] De acordo com algumas modalidades, o complexo aqui revelado é mo-dular e pode montar-se autonomamente no interior de uma célula-alvo, quer in vivo quer in vitro, possibilitando o fornecimento de um tipo de fração de proteína de uma vez e com um ou múltiplos oligonucleotídeos propiciadores de especificidade conco-mitantemente. Ademais, em algumas modalidades, o componente da proteína pode ser entregue a uma célula(s) desejada(s) e expresso in vivo, aguardando a entrega de qualquer SCNA apropriado em um momento futuro. Em algumas modalidades, o componente da proteína e o SCNA podem ser entregues simultaneamente, ou essencialmente simultaneamente. Desse modo, a combinação do componente da proteína e do SCNA, preferencialmente no interior da célula-alvo desejada, pode realizar a indução de quebras do filamento duplo genômico específico (DSBs), ou qualquer outra modificação de ácido nucleico desejado, in vivo. Os métodos da presente invenção não se restringem à introdução de mutações de ponto no ácido nucleico-alvo, uma vez que o complexo molecular pode endereçar qualquer sequência de ácido nucleico ou par de sequências, cortar/restringir/clivar áreas muito próximas às mesmas, e consequentemente excluir uma seção de ácido nucleico grande ou pequena, ou cor- tar/restringir/clivar a sequência a fim de iniciar uma remoção, ou uma inserção, ou uma substituição de qualquer sequência de ácido nucleico.

[023] Sob o aspecto vantajoso, a presente invenção revela pela primeira vez em suas modalidades a expressão de um componente da proteína in vivo e sua liga- ção/anexação ao(s) SCNA(s) através da automontagem in vivo para formar um complexo molecular in vivo, sem a necessidade da prévia ligação covalente/química entre a fração de proteína e o ácido nucleico de endereçamento. De acordo com as modalidades da presente invenção, em oposição aos sistemas baseados em oligonucleotí- deo conhecidos na técnica, não se pretende que o SCNA ligado à proteína aja como doador, e sim como uma fração propiciadora de especificidade, e não passe a integrar o ácido nucleico modificado. Ademais, em algumas modalidades da presente invenção, o SCNA pode ser expresso in vivo de maneira a causar a montagem de todos os componentes do complexo molecular com um único evento de entrega. Ademais, de acordo com algumas modalidades, é possível projetar a proteína efetora para que seja ativa somente diante de sua dimerização (isto é, ela deve formar um dímero para ser ativa), e com isso a dimerização pode ser controlada de modo que um dímero ativo somente possa se formar quando endereçado/programado por um SCNA e ligado ao seu sítio-alvo, por exemplo, quando as distâncias moleculares entre os parceiros mo- noméricos (proteínas) do dímero forem suficientemente precisas. Desse modo, sob o aspecto vantajoso, o complexo molecular é ativado somente em seu sítio-alvo pretendido, aumentando assim a especificidade e a confiabilidade. De acordo com outras modalidades, um componente da proteína pode ser expresso para formar/produzir homodímeros, cada um deles programado/endereçado por um oligonucleotídeo diferente propiciador especificidade. Adicionalmente, como os sistemas de expressão viral, os quais são conhecidos na técnica por seu uso na expressão da proteína in vivo, são geralmente limitados à produção de uma proteína em virtude de limitações de tamanho, e geralmente excluem vírus similares em virtude da proteção cruzada, o uso de um componente da proteína, portanto, confere uma vantagem crítica para aquele modo de entrega. Ademais, em contrapartida aos demais métodos conhecidos na téc-nica (por exemplo, ZFNs e meganucleases), que têm um subconjunto limitado de sequências de reconhecimento, os oligonucletídeos de programação (SCNAs) aqui revelados, possuem um repertório infinito de sequências, possivelmente atingindo extrema especificidade da sequência em genomas de altíssima complexidade. Além disso, como muitos oligonucletídeos de programação podem ser fornecidos concomitantemente a uma única fração efetora da proteína, é possível modificar mais de um alvo ao mesmo tempo, conferindo vantagens adicionais em relação aos métodos conhecidos na técnica. Isso pode ser útil, por exemplo, para knock out múltiplos genes rapidamente, ou para inserir inúmeras características diferentes em diferentes locais, ou para marcar inúmeros diferentes locais com um tag do nucleotídeo doador.

[024] De acordo com algumas modalidades, como um componente da prote-ína não programado (isto é, uma proteína não anexada/ligada a um oligonucletídeo de programação) não possui afinidade, ou esta afinidade é baixíssima, ácidos nuclei- cos-alvo, torna-se vantajosa a possiblidade de alcançar maior especificidade e segu-rança e menor genotoxidez. Como detalhado acima, o efetor ou o domínio catalítico do componente da proteína somente é ativo após a dimerização, e com isso pelo me-nos dois oligonucletídeos de programação (SCNAs) devem se ligar às sequências flanqueadoras-alvo para causar a dimerização e ativação da proteína. Dois oligonu- cletídeos de programação suficientemente longos podem conferir a altíssima especi-ficidade teórica necessária nos genomas de alta complexidade ao criar complementaridade extensiva com os sítios de ligação. Como a proteína expressa não programada não possui afinidade com o ácido nucleico-alvo, ela não se liga, e/ou modifica o ácido nucleico-alvo. Desse modo, nas aplicações em que, por exemplo, os oligonucletídeos de programação são entregue/fornecidos separadamente à célula-alvo (que já expressa o componente da proteína não programado), ou em condições onde os oligo- nucleotídeos são excluídos da célula-alvo (por exemplo, através de diluição ou degradação), não pode ocorrer clivagem inespecífica, o que aumenta a segurança e reduz a genotoxidez.

[025] Desse modo, de acordo com as modalidades da presente invenção, tanto a recombinação não homóloga endereçada (NHEJ) quanto a recombinação ho-móloga assistida (HR) podem ser utilizadas especificamente e de maneira programá-vel para obter um ou mais dos seguintes eventos:

[026] Mutar uma sequência de DNA clivando seu interior, criando uma quebra de filamento duplo (DSB), que será degradada em parte pelas nucleases endógenas e religadas pelo mecanismo de reparo de DNA NHEJ endógeno para criar uma dele- ção dentro do quadro e/ou uma mutação de deslocamento do quadro do DNA. Contrariamente ao T-DNA ou linhas de inserção de transposon em plantas, este método de deleção ou mutação de um gene endógeno não permite que reste qualquer DNA externo e a planta pode ser denominada não transgênico de acordo com algumas definições. Na NHEJ, um ou mais nucleotídeos também podem ser adicionados na DSB em um mecanismo endógeno ainda não caracterizado, obtendo essencialmente o mesmo efeito de deslocamento do quadro de leitura ou mutação.

[027] Deletar uma extensão da sequência de DNA clivando duas sequências flanqueadoras, que será religada pelo mecanismo de reparo de DNA NHEJ endógeno, ou por HR assistida clivando a ou próximo à sequência a ser excluída e fornecendo um DNA doador que é posteriormente recombinado no alvo, e que contém sequências flanqueando a sequência a ser excluída no alvo.

[028] Inserir um ácido nucleico doador em uma DSB clivando um ácido nu- cleico-alvo e fornecendo um DNA Doador que será ligado diretamente ao gap pelo mecanismo de NHEJ, ou preferencialmente, fornecendo um doador que apresente homologia às extremidades do gap a ser recombinado e ligado no gap por HR assis-tida.

[029] Substituir uma sequência do ácido nucleico-alvo clivando ambas as se-quências flanqueadoras, e fornecendo um ácido nucleico doador a ser inserido, que será ligada no interior da sequência flanqueadora-alvo, seja por NHEJ seja, preferencialmente, recombinado e ligado por HR, adicionando-se sequências simila-res ao ácido nucleico-alvo, ou aquelas flanqueadoras, nos terminais do doador.

[030] De acordo com algumas modalidades, e sem vincular-se à teoria ou mecanismos, as vantagens das composições e métodos aqui revelados, incluem a criação de um esquema de construção de um complexo enzimático geral que pode endereçar uma seleção ilimitada de sequências. Uma vez que um componente da proteína tenha sido otimizado para um propósito específico (por exemplo, clivagem do dsDNA), esta mesma proteína pode ser utilizada com uma seleção ilimitada de sequências de ácido nucleico de programação (SCNA). Desse modo, a diversidade das sequências- alvo que será afetada é obtida pelo desenho do SCNA, sem a necessidade complexa e demandante de novo desenho e otimização da proteína, inerente a outros métodos conhecidos na técnica, tais como, TALENs, ZFNs e Meganucleases, onde a própria proteína deve ser alterada e adaptada a cada sequência-alvo. O desenho e o preparo de SCNAs sintéticos é relativamente simples, rápido e econômico. É possível ainda, em algumas modalidades desta invenção, produzir SCNAs in vivo, escapando da necessidade de entregar SCNAs sintetizados quimicamente a uma célula. Ademais, os SCNAs podem ser projetados para emparelhar bases com praticamente qualquer sequência-alvo desejada, e desse modo, endereçar o complexo molecular a praticamente qualquer sequência-alvo. Além disso, diversas sequências-alvo podem ser utilizadas na mesma célula concomitantemente. Por exemplo, nas funções de edição que requeiram mais de um sítio de clivagem, por exemplo, deleção ou substituição de extensões específicas de ácido nucleico, simplesmente fornecendo quatro diferentes SCNAs e uma fração de proteína.

[031] De acordo com algumas modalidades, desse modo é fornecido uma composição de nucleoproteína para modificar um sítio-alvo predeterminado em uma sequência de ácido nucleico-alvo em uma célula-alvo, a composição compreendendo: uma molécula de polinucleotídeo que codifica um polipeptídeo, ou um polipeptídeo, o dito polipeptídeo compreendendo: (i) um domínio funcional (efetor) (FD) capaz de modificar o dito sítio-alvo, o domínio funcional sendo destituído de um sítio de ligação do ácido nucleico específico; e (ii) um domínio de ligação (LD), capaz de interagir com um ácido nucleico propiciador de especificidade (SCNA), em que o domínio de ligação é destituído de um sítio de ligação do ácido nucleico-alvo específico; e; (b) o ácido nucleico propiciador de especificidade (SCNA) ou um ácido nucleico codificador do SCNA, o SCNA compreendendo: (i) uma sequência de nucleotídeo complementar a uma região do ácido nucleico-alvo flanqueando o sítio-alvo; e (ii) uma região de reconhecimento capaz de anexar-se especificamente ao domínio de ligação do polipeptí- deo com alta afinidade de ligação; e assim a montagem do polipeptídeo e do SCNA no interior da célula-alvo forma um complexo de nucleoproteína funcional, capaz de modificar especificamente o dito ácido nucleico-alvo no sítio-alvo.

[032] Em algumas modalidades, o domínio funcional compreende um domínio catalítico. Em algumas modalidades, o polipeptídeo compreende adicionalmente um domínio de localização subcelular.

[033] Em algumas modalidades, a modificação do ácido nucleico-alvo é sele-cionada entre: mutação, deleção, inserção, substituição, ligação, digestão, promover a quebra do filamento duplo, corte (nicking), metilação, acetilação, ligação, recombi- nação, desespiralação de hélice, modificação química, marcação, ativação e inativa- ção.

[034] De acordo com algumas modalidades, o SCNA compreende uma molé-cula de ácido nucleico selecionada entre o grupo formado de um DNA de um único filamento, um RNA de um único filamento, um RNA de duplo filamento, um DNA mo-dificado, um RNA modificado, um ácido nucleico bloqueado (LNA) e um peptídeo- ácido nucleico (PNA) ou suas combinações.

[035] Em algumas modalidades, a região de reconhecimento do SCNA com-preende uma modificação selecionada entre a modificação do 5’-terminal, modificação do 3’-terminal, e modificação interna. Em algumas modalidades, a modificação quí-mica é selecionada entre o grupo formado por uma modificação do nucleotídeo, e a adição de uma fração não nucleotídeo. Em algumas modalidades, a fração não nucle- otídeo é selecionada entre: Biotina, Fluoresceína, Linkers de amina, oligopeptídeos, Aminoalila, uma molécula de corante, fluoróforos, Digoxigenina, Acridita, Adenilação, Azida, NHS-éster, Colesteril-TEG, Alcinos, Biotina Fotoclivável, Tiol, Ditiol. Em algumas modalidades, a modificação do nucleotídeo é selecionada entre o grupo formado de fosfato, 2-Aminopurina, Trimer-20, 2,6-Diaminopurina, 5-Bromo-desoxiUridina, De- soxiUridina, dT invertida, didesoxi-nucleotídeos, 5-metil desoxiCitidina, desoxiInosina, 5-nitroindol, bases de RNA 2-O-metil, Iso-dC, Iso-dG, Bases de flúor modificadas e Ligações fosforotioato. Em algumas modalidades, a modificação é selecionada entre o grupo formado por uma modificação do nucleotídeo, Biotina, Fluoresceína, Linkers de amina, oligopeptídeos, Aminoalila, uma molécula de corante, fluoróforos, Digoxi- genina, Acridita, Adenilação, Azida, NHS-Éster, Colesteril-TEG, Alcinos, Biotina Foto- clivável, Tiol, Ditiol, Bases modificadas, fosfato, 2-Aminopurina, Trimer-20, 2,6-Diami- nopurina, 5-Bromo-desoxiUridina, DesoxiUridina, dT invertida, didesoxi-nucleotídeos, 5-metil desoxiCitidina, desoxiInosina, 5-nitroindol, bases de RNA 2-O-metil, Iso-dC, Iso-dG, Bases modificadas do flúor e Ligações fosforotioato, e proteínas ligadas co- valentemente por sua interação com as sequências de nucleotídeo específicas. Em algumas modalidades, as proteínas ligadas covalentemente através de sua interação com as sequências de nucleotídeo específicas podem ser selecionadas entre, mas não se limitando a: proteína VirD2 de Agrobacterium, VPg de Picornavirus, Topoiso-merase, proteína A do fago PhiX174, proteína A* PhiX e quaisquer variantes dos cita-dos.

[036] Em algumas modalidades, a anexação/ligação/associação entre a mo-dificação no SCNA e o domínio de ligação resulta de uma interação de um par de ligação selecionado entre interação não covalente de um par de ligação selecionado entre, mas não se limitando a: Biotina-Avidin; Biotina-Estreptavidina; formas da avi- dina modificadas por biotina; proteína-proteína; interações proteína-ácido nucleico; interações ligante-receptor; interações ligante-substrato; antígeno-anticorpo; antígeno- anticorpo de cadeia simples; anticorpo ou anticorpo de cadeia simples-hapteno; proteína de ligação hormônio-hormônio; receptor-agonista; antagonista receptor-receptor; proteína A IgG; cofator enzima-enzima; inibidor enzima-enzima; DNA de um único filamento-VirE2; StickyC - dsDNA; RISC - RNA; ácido nucleico da proteína da capa viral; anticorpo de fragmento variável de cadeia simples anti-fluoresceína (ScFV antiFAM) - Fluoresceína; imunoglobulina de fragmento variável de cadeia simples antiDIG (scFv) (DIG-ScFv) - Digoxigenina (DIG) e proteína de ligação VirD2-VirD2 de Agrobacterium; e quaisquer variantes dos citados.

[037] Em algumas modalidades, a região de reconhecimento do SCNA com-preende um motivo de nucleotídeo capaz de se anexar/ligar/associar especificamente ao domínio de ligação da proteína quimérica. Em algumas modalidades, a anexa- ção/associação/ligação entre o motivo de nucleotídeo e o domínio de ligação é selecionada entre, mas não se limitando a: Proteína dedo de zinco-motivo dedo de zinco; domínio do reconhecimento da enzima de restrição-sequência de reconhecimento da enzima de restrição; domínio de ligação do DNA do fator de transcrição-motivo de DNA; repressor-operador; Zíper de leucina -promotor; domínio hélice-alça-hélice-E box; Motivos de ligação do RNA compreendendo domínios do motivo rico em arginina, domínios da αβ proteína, domínios do motivo de reconhecimento do RNA (RRM), domínios de K-Homologia, Motivos de ligação do RNA com Filamento Duplo, Dedos de zinco de ligação ao RNA, e enzimas de Endereçamento de RNA-sequência de RNA específica cognata; proteína HIV-rev- Stem IIB do elemento de resposta HIV rev (RRE); Domínio principal Tat do vírus da imunodeficiência bovina (BIV) de ligação- alça 1 da sequência do elemento de resposta de ação-trans (TAR) do BIV; Fago lambda, phi21, e Nproteínas P22 - os grampos da alça boxB nos sítios de N-utilização (nut) em seus respectivos RNAs.

[038] De acordo com algumas modalidades, é fornecido um método para mo-dificação de um sítio-alvo predeterminado no interior de uma sequência de ácido nu- cleico-alvo através de um complexo molecular de nucleoproteína programável, o mé-todo compreendendo as etapas de: a) entregar uma sequência de ácido nucleico que codifica uma proteína quimérica programável (polipeptídeo) ou a proteína (polipeptí- deo) à uma célula hospedeira; b) entregar uma molécula de ácido nucleico propiciador de especificidade (SCNA), ou um ácido nucleico codificador do SCNA à dita célula hospedeira; c) ligar a dita proteína quimérica ao SCNA, direcionando a proteína quimérica à sequência de ácido nucleico-alvo predeterminada no interior da célula hospedeira, para formar um complexo de nucleoproteína programado ativo; e d) possibilitar a modificação do sítio-alvo predeterminado da sequência de ácido nucleico-alvo pelo dito complexo molecular de nucleoproteína programado ativo.

[039] Em algumas modalidades, é fornecido um método para modificação de um sítio-alvo predeterminado no interior de uma sequência de ácido nucleico-alvo através de um complexo molecular de nucleoproteína programável, o método com-preendendo as etapas de: a. entregar uma sequência de ácido nucleico que codifica um polipeptídeo quimérico programável a uma célula hospedeira, o dito polipeptídeo quimérico com-preendendo: i. um domínio funcional capaz de modificar o dito sítio-alvo, o domínio funcional sendo destituído de um sítio de ligação do ácido nucleico específico; e ii. um domínio de ligação que é capaz de interagir com um ácido nucleico pro-piciador de especificidade, em que o domínio de ligação é destituído de um sítio de ligação do ácido nucleico-alvo específico; b. entregar uma molécula de ácido nucleico propiciador de especificidade (SCNA), ou um ácido nucleico que codifica o SCNA à dita célula hospedeira, a dita molécula de SCNA compreendendo: i. uma sequência de nucleotídeo complementar a uma região do ácido nucleico- alvo flanqueando o sítio-alvo; e ii. uma região de reconhecimento capaz de anexar-se especificamente ao do-mínio de ligação do polipeptídeo com alta afinidade de ligação;

[040] em que a expressão do polipeptídeo na célula que aloja o SCNA possi-bilita a anexação do dito polipeptídeo quimérico ao SCNA, formando um complexo de nucleoproteína programado ativo, com isso direcionando o polipeptídeo quimérico à sequência de ácido nucleico-alvo predeterminada no interior da célula hospedeira, possibilitando a modificação do sítio-alvo predeterminado da sequência de ácido nu- cleico-alvo pelo dito complexo molecular de nucleoproteína programado ativo.

[041] Em algumas modalidades, o ácido nucleico-alvo é o DNA. Em algumas modalidades, o DNA-alvo é o DNA genômico. Em algumas modalidades, a sequência de ácido nucleico-alvo é uma sequência de ácido nucleico extracromossômico. Em algumas modalidades, a sequência de ácido nucleico extracromossômico-alvo reside em uma organela selecionada entre o grupo formado por mitocôndria, cloroplasto, amiloplasto e cromoplasto. Em algumas modalidades, a sequência de ácido nucleico- alvo é uma sequência de ácido nucleico viral. Em algumas modalidades, a sequência de ácido nucleico-alvo é uma sequência de ácido nucleico procariótica. Em algumas modalidades, a sequência de ácido nucleico-alvo é uma sequência de ácido nucleico sintética.

[042] Em algumas modalidades, a modificação é selecionada entre mutação, deleção, inserção, substituição, ligação, digestão, promover a quebra do filamento duplo, corte (nicking), metilação, acetilação, ligação, recombinação, desespiralação de hélice, modificação química, marcação, ativação e inativação.

[043] Em algumas modalidades, a proteína quimérica (polipeptídeo) compre-ende uma fração de proteína que tem uma atividade de modificação do ácido nucleico. Em algumas modalidades, a proteína quimérica compreende uma fração de proteína que tem um modificador funcional do ácido nucleico, em que a modificação funcional é selecionada entre o grupo formado por ativação da transcrição, inativação da transcrição, silenciamento do transcrito de RNA, splicing alternativo de RNA, rearranjo da cromatina, parasita celular e inativação do vírus e alteração da localização celular ou compartimentalização da dita sequência de ácido nucleico-alvo.

[044] Em algumas modalidades, o SCNA compreende uma molécula selecio-nada entre o grupo formado por um DNA de um único filamento, um RNA de um único filamento, um RNA de duplo filamento, um DNA modificado, um RNA modificado, um ácido nucleico bloqueado (LNA) e um peptídeo-ácido nucleico (PNA) ou suas combinações. Em algumas modalidades, o SCNA compreende uma sequência propiciadora de especificidade configurada especificamente para interagir com o ácido nucleico- alvo. A interação entre o SCNA e o ácido nucleico-alvo ocorre através de emparelha- mento de base, selecionado entre o grupo formado por um emparelhamento integral de base de hélice dupla, um emparelhamento parcial de base de hélice dupla, um emparelhamento integral de base de hélice tripla, um emparelhamento parcial de base de hélice tripla, e alças D ou formas ramificadas, formados pelo dito emparelhamento de base.

[045] Em modalidades adicionais, o SCNA compreende uma região de reco-nhecimento configurada para se associar/ligar/anexar a um domínio de ligação da proteína quimérica. Em algumas modalidades, a região de reconhecimento compreende uma modificação selecionada entre o grupo formado por modificação do 5’-terminal, modificação do 3’-terminal, e modificação interna. A modificação pode ser selecionada entre, mas não se limitando a, modificação do nucleotídeo, Biotina, Fluoresceína, Linkers de amina, oligopeptídeos, Aminoalila, uma molécula de corante, fluoróforos, Di- goxigenina, Acridita, Adenilação, Azida, NHS-éster, Colesteril-TEG, Alcinos, Biotina Fotoclivável, Tiol, Ditiol, Bases modificadas, fosfato, 2-Aminopurina, Trimer-20, 2,6- Diaminopurina, 5-Bromo-desoxiUridina, DesoxiUridina, dT invertida, didesoxi-nucleo- tídeos, 5-metil desoxiCitidina, desoxiInosina, 5-nitroindol, bases de RNA 2-O-metil, Iso-dC, Iso-dG, Bases modificadas do flúor e Ligações fosforotioato, e proteínas ligadas covalentemente por sua interação com as sequências de nucleotídeo específicas. As proteínas ligadas covalentemente por sua interação com as sequências de nucle- otídeo específicas são selecionadas entre a proteína VirD2 de Agrobacterium, VPg de Picornavirus, Topoisomerase, proteína A do fago PhiX174, proteína A* PhiX e quaisquer variantes dos citados.

[046] Em algumas modalidades, a associação/ligação/anexação entre a mo-dificação no SCNA e o domínio de ligação resulta de uma interação não covalente de um par de ligação selecionado entre: Biotina-Avidin; Biotina-Estreptavidina; formas da avidina modificadas por biotina; Interações proteína-proteína; interações proteína- ácido nucleico; interações ligante-receptor; interações ligante-substrato; interações antígeno-anticorpo; antígeno-anticorpo de cadeia simples; anticorpo ou interações anticorpo de cadeia simples-hapteno; proteína de ligação hormônio-hormônio; receptor- agonista; antagonista receptor-receptor; anticorpo de fragmento variável de cadeia simples anti-fluoresceína (ScFV anti-FAM) - Fluoresceína; imunoglobulina de fragmento variável de cadeia simples anti-DIG (scFv) (DIG-ScFv) - Digoxigenina (DIG); proteína A-IgG; cofator enzima-enzima; inibidor enzima-enzima; DNA de um único fi- lamento-VirE2; StickyC - dsDNA; RISC - RNA; ácido nucleico da proteína da capa viral e proteína de ligação VirD2-VirD2 de Agrobacterium; e quaisquer variantes dos citados.

[047] Em algumas modalidades, a ligação/associação entre a sequência de ácido nucleico conferindo especificidade e o domínio de ligação da fração de proteína é criada covalentemente in vivo. Em algumas modalidades, a associação covalente do domínio de ligação e do SCNA resulta de uma interação biológica de VirD2 de Agrobacterium- sequência da borda direita ou quaisquer variantes dos citados, e é criada em uma bactéria compreendendo Agrobacterium.

[048] Em algumas modalidades, a região de reconhecimento compreende um motivo de nucleotídeo capaz de interagir/anexar-se/ligar-se ao domínio de ligação da proteína quimérica. Em algumas modalidades, o par de interação é selecionado entre: Proteína dedo de zinco-motivo dedo de zinco; domínio do reconhecimento da enzima de restrição- sequência de reconhecimento da enzima de restrição; domínio de ligação do DNA do fator de transcrição- motivo de DNA; repressor- operador; Zíper de leucina -promotor; domínio E box-Hélice-alça-hélice; motivos de ligação do RNA compreendendo domínios do motivo rico em arginina, domínios da αβ proteína, domínios do motivo de reconhecimento do RNA (RRM), domínios de K-Homologia, motivos de ligação do RNA com Filamento Duplo, Dedos de zinco de ligação ao RNA, e Enzimas de Endereçamento de RNA- sequência de RNA específica cognata; proteína HIV-rev- Stem IIB do elemento de resposta HIV rev (RRE); domínio principal Tat do vírus da imunodeficiência bovina (BIV) de ligação- alça 1 da sequência do elemento de resposta de ação-trans (TAR) do BIV; Fago lambda, phi21, e Nproteínas P22 - os grampos da alça boxB no sítios de N-utilização (nut) em seus respectivos RNAs.

[049] De acordo com algumas modalidades, a sequência de ácido nucleico- alvo predeterminada está envolvida em uma característica genética, e a modificação resulta em alterações na transcrição ou tradução de um elemento genético, por meio de um procedimento técnico selecionado entre o grupo formado por substituição, knock-out permanente ou intensificação, shut-off, knock-down, e deslocamento do quadro de leitura temporária ou permanente. Em algumas modalidades, a caracterís-tica genética é modificada editando a sequência do elemento genético em si, suas sequências reguladoras, genes reguladores do gene de interesse ou suas sequências reguladoras em uma cadeia reguladora de eventos.

[050] De acordo com outras modalidades, é fornecido um complexo núcleo- proteína, em que uma associação física entre a fração de proteína e a fração do ácido nucleico propiciador de especificidade forma um complexo funcional programado. Em algumas modalidades, a associação física entre o domínio de ligação da fração de proteína e o SCNA se baseia em uma interação de afinidade selecionada entre o grupo formado por ligante-receptor, ligante-substrato, ligações de hidrogênio, ligações de van der Waals, ligações iônicas e interação hidrofóbica.

[051] De acordo com algumas modalidades, é fornecida uma célula hospe-deira dotada de predeterminada modificação genética em um sítio-alvo predetermi-nado, criada pela o método aqui revelado. Em algumas modalidades, a célula hospe-deira pode ser qualquer tipo de célula, tais como, mas não se limitando a: célula de vertebrado, célula de mamífero, célula humana, célula animal, célula vegetal, célula de invertebrado, célula de nematóide, célula de inseto e célula-tronco.

[052] De acordo com algumas modalidades, é fornecido um organismo trans- gênico ou organismo knock out, dotado de predeterminada modificação genética for-mada pelo método aqui descrito. Em algumas modalidades, o organismo é uma planta ou animal.

[053] De acordo com algumas modalidades, é fornecido um método de trata-mento de uma doença genética em um organismo, o método compreendendo intro-duzir em uma célula do organismo o complexo molecular programável de nucleopro- teína.

[054] De acordo com algumas modalidades, é fornecida uma célula hospe-deira compreendendo: a) um polipeptídeo que compreende:(i) um domínio funcional capaz de modi-ficar um sítio-alvo em uma sequência de ácido nucleico-alvo na célula, o domínio funcional sendo destituído de um sítio de ligação do ácido nucleico específico; e (ii) um domínio de ligação que é capaz de interagir com um ácido nucleico propiciador de especificidade e sendo destituído de um sítio de ligação do ácido nucleico-alvo específico; e; (b) um ácido nucleico propiciador de especificidade (SCNA) compreendendo: i. uma sequência de nucleotídeo complementar a uma região do ácido nucleico- alvo flanqueando o sítio-alvo; e (ii) uma região de reconhecimento capaz de anexar- se especificamente ao domínio de ligação do polipeptídeo;

[055] E assim a montagem do polipeptídeo e do SCNA no interior da célula hospedeira forma um complexo de nucleoproteína funcional capaz de modificar especificamente o ácido nucleico-alvo no sítio-alvo.

[056] Em algumas modalidades, é fornecida uma célula hospedeira que aloja: (a) uma molécula de polinucleotídeo codificadora de um polipeptídeo, o polipeptídeo compreendendo:(i) um domínio funcional capaz de modificar um sítio-alvo em uma sequência de ácido nucleico-alvo na célula, o domínio funcional sendo destituído de um sítio de ligação do ácido nucleico específico; e (ii) um domínio de ligação que é capaz de interagir com um ácido nucleico propiciador de especificidade e sendo destituído de um sítio de ligação do ácido nucleico-alvo específico; e (b) um ácido nucleico propiciador de especificidade (SCNA) compreendendo: (i) uma sequência de nucleo- tídeo complementar a uma região do ácido nucleico-alvo flanqueando o sítio-alvo; e (ii) uma região de reconhecimento capaz de anexar-se especificamente ao domínio de ligação do polipeptídeo; e desse modo a montagem do polipeptídeo e SCNA no interior da célula hospedeira forma um complexo de nucleoproteína funcional capaz de modificar especificamente o ácido nucleico-alvo no sítio-alvo.

Breve Descrição dos Desenhos

[057] As Figuras 1A-B são pranchas esquemáticas mostrando elemen- tos/componentes de um complexo molecular programável, de acordo com algumas modalidades;

[058] As Figuras 2A-B são pranchas esquemáticas mostrando a montagem do complexo molecular programável, de acordo com algumas modalidades;

[059] A Figura 3 demonstra um exemplo em modelo tridimensional de um complexo molecular projetado para a clivagem de uma sequência-alvo de dsDNA nu-clear predefinida, de acordo com algumas modalidades;

[060] As Figuras 4A-B são desenhos esquemáticos (fora de escala) do modo exemplificativo de montagem dos componentes do complexo molecular programável em um ácido nucleico-alvo, de acordo com algumas modalidades.

[061] A Figura 5 é um desenho esquemático demonstrando a entrega do complexo molecular programável a uma célula utilizando SCNAs produzidos in vitro, de acordo com algumas modalidades;

[062] A Figura 6 é um esquema geral demonstrando a entrega do complexo molecular programável a uma célula utilizando um SCNA produzido in vivo, de acordo com algumas modalidades;

[063] As Figuras 7A-B são esquemas mostrando exemplos não limitantes da entrega da fração do ácido nucleico de programação do complexo molecular a uma célula utilizando um SCNA com DNA de um único filamento produzido em Agrobacterium (Figura 7A) e sistema de secreção bacteriano (Figura 7B), de acordo com algumas modalidades;

[064] As Figuras 8A-B são uma ilustração esquemática demonstrando a en-trega da fração de programação do complexo molecular programável a uma célula utilizando SCNAs de RNA produzidos em Agrobacterium (Figura 8A) ou por um vetor de replicação autônoma, como um vírus (Figura 8B), de acordo com algumas modali-dades;

[065] A Figura 9 mostra uma ilustração esquemática (fora de escala) de um exemplo não limitante de um vetor ou veículo de entrega para a entrega concomitante da composição compreendendo os componentes necessários para a montagem de um complexo molecular programável a uma célula eucariótica-alvo suscetível em um único evento de entrega, de acordo com algumas modalidades;

[066] A Figura 10 é uma ilustração esquemática (fora de escala) demonstrando o uso de um complexo molecular programado para criar uma mutação em um ácido nucleico-Alvo, de acordo com algumas modalidades.

[067] A Figura 11 é uma ilustração esquemática (fora de escala) demons-trando o uso de um complexo molecular programado para inserir um ou múltiplos nu- cleotídeos em um ácido nucleico-alvo utilizando um ácido nucleico doador fornecido, de acordo com algumas modalidades.

[068] A Figura 12 é uma ilustração esquemática (fora de escala) demons-trando o uso de um complexo molecular programado para substituir um ou múltiplos nucleotídeos em um ácido nucleico-alvo utilizando um ácido nucleico doador forne-cido, de acordo com algumas modalidades.

[069] A Figura 13 é uma ilustração esquemática (fora de escala) demons-trando o uso de um complexo molecular programado para criar uma deleção de um ou de múltiplos nucleotídeos consecutivos oriundos de um ácido nucleico-alvo, de acordo com algumas modalidades.

[070] A Figura 14 é uma ilustração esquemática (fora de escala) demons-trando o uso de um complexo molecular programado para substituir um ou múltiplos nucleotídeos em um ácido nucleico-alvo utilizando um ácido nucleico doador forne-cido, de acordo com algumas modalidades.

[071] A Figura 15 mostra uma ilustração esquemática de um exemplo não li- mitante de um vetor ou veículo de entrega (fora de escala) para a entrega concomi-tante da proteína do complexo molecular programável (PMCP) a uma célula eucarió- tica-alvo suscetível juntamente com uma sequência-alvo para testar sua atividade, de acordo com algumas modalidades, e conforme detalhado no Exemplo 10.

[072] A Figura 16 mostra um desenho esquemático (fora de escala) de parâ-metros que determinam empiricamente a distância ideal entre os pares de SCNA e para testar a capacidade de diferentes tipos de complexos moleculares programados para clivar especificamente um DNA-alvo, conforme detalhado no Exemplo 12.

Descrição Detalhada da Invenção

[073] De acordo com algumas modalidades, são fornecidos composições e métodos para modificar um ácido nucleico-alvo predeterminado. São revelados espe-cificamente métodos para a modificação de uma sequência-alvo in vivo, utilizando uma composição que compreende um complexo molecular programável. O complexo molecular programável (aqui também denominado "complexo nucleoproteína") com-preende uma fração de proteína, (aqui também denominada “fração programável”), e uma fração do ácido nucleico, (aqui também denominada “ácido nucleico propiciador de especificidade” (SCNA) ou “o ácido nucleico de programação”). De acordo com algumas modalidades, os componentes do complexo molecular sã montados autono-mamente in vivo em uma célula viva, organismo, tecido, calo, órgão ou parte do mesmo, diferenciada ou não, na presença de uma sequência de ácido(s) nucleico- alvo para formar um complexo molecular funcional programado ativo.

[074] Fica entendido que a terminologia aqui utilizada tem por objetivo des-crever modalidades particulares somente, não pretendendo assumir caráter limitante. Cabe notar que, como utilizado no relatório descritivo e nas reivindicações em anexo, a forma singular “um”, “uma”, “o” e “a” incluem equivalentes no plural, a menos que o contexto claramente imponha de outra forma.

[075] Para a citação de faixas numéricas, cada número intermediário com o mesmo grau de precisão é contemplado explicitamente. Por exemplo, para a faixa 69, os números 7 e 8 são contemplados além de 6 e 9, e para a faixa 6,0-7,0, o número 6,0, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6, 6,7, 6,8, 6,9 e 7,0 são explicitamente contemplados.

Definições

[076] cerca de

[077] Como aqui utilizado, o termo “cerca de” se refere a +/-10%.

[078] administrar

[079] “Administrar” se refere ao fornecimento de uma composição ou agente farmacêutico a um indivíduo, e inclui, entre outras coisas, a administração por um professional da área médica e a autoadministração.

[080] “Administração parenteral”, significa administração não através dos in-testinos. Administração parenteral inclui, entre outras coisas, administração subcutâ-nea, administração intravenosa, ou administração intramuscular.

[081] “Administração subcutânea” significa administração imediatamente abaixo da pele.

[082] “Administração intravenosa” significa administração na veia.

[083] “Administração intratumoral” significa administração no interior de um tumor.

[084] “Quimioembolização” significa um procedimento em que o fornecimento sanguíneo ao tumor é bloqueado cirurgicamente ou mecanicamente e agentes quimi- oterapêuticos são administrados diretamente ao tumor. antissentido

[085] O termo "antissentido”, como aqui utilizado, se refere a sequências de nucleotídeo que são complementares a uma sequência de DNA ou RNA específica. O termo "filamento antissentido" é utilizado em referência a um filamento do ácido nucleico que é complementar ao filamento "sentido". Moléculas antissentido podem ser produzidas com o uso de qualquer método, inclusive síntese através da ligação de gene(s) de interesse em uma direção inversa a um promotor viral que permite a síntese de um filamento complementar. Uma vez introduzido em uma célula, este filamento transcrito se combina às sequências naturais produzidas pela célula para formar duplexes. Estes duplexes então bloqueiam, tanto a transcrição quanto a tradução posterior. Deste modo, fenótipos mutantes podem ser gerados. vetores de replicação autônoma

[086] “Vetores de replicação autônoma” são aqui definidos de modo a com-preender qualquer sequência de ácido nucleico natural ou sintética capaz de replicar no interior de um hospedeiro, compreendendo, mas não se limitando a vírus, vírus modificados, alguns vetores e plasmídeos recombinantes, réplicons e parasitas intra-celulares. célula

[087] “Célula” é aqui definida de modo a compreender qualquer tipo de célula, procariótica ou uma célula eucariótica, isolada ou não, cultivada ou não, diferenciada ou não, e compreendendo alto nível de organização celular, por exemplo, tecidos, órgãos, calos, organismos ou partes dos citados. Células exemplificativas incluem, mas não se limitam a: células de vertebrado, células de mamíferos, células humanas, células vegetais, célula animais, células de invertebrado, células de nematóides, células de inseto, células-tronco, e similares. complemento

[088] “Complemento” ou “complementar”, como aqui utilizado, significa o em- parelhamento de base de Watson-Crick (por exemplo, A-T/U e C-G) ou Hoogsteen entre nucleotídeos ou análogos de nucleotídeo de moléculas de ácido nucleico. Um complemento total ou totalmente complementar pode significar 100% de emparelha- mento de base complementar entre nucleotídeos ou análogos de nucleotídeo de mo-léculas de ácido nucleico. Complementar parcial pode significar menos de 100% de complementaridade, por exemplo, 80% de complementaridade. vetor de entrega

[089] "vetor de entrega" ou " vetores de entrega" trata-se de qualquer vetor de entrega que possa ser utilizado na presente invenção para colocar a célula em contato ou entregar nas células ou compartimentos subcelulares os agentes/substâncias químicas e moléculas (proteínas ou ácidos nucleicos) necessários na presente invenção. Isso inclui, entre outras coisas, vetores de transdução, vetores de entrega lipossômica, vetores de entrega de plasmídeo, vetores de entrega viral, vetores de entrega bacte- riana, vetores de entrega e fármacos, carreadores químicos, carreadores poliméricos, lipoplexos, poliplexos, dendrimeros, microbubbles (agentes de contraste de ultras-som), nanopartículas, emulsões ou outros vetores de transferência apropriados. Estes vetores de entrega permitem a entrega de moléculas, substâncias químicas, macro- moléculas (genes, ácido(s) nucleico(s), proteínas), ou outros vetores, tais como, plas- mídeos e T-DNA. Estes vetores de entrega são carreadores moleculares. dose

[090] “Dose”, como aqui utilizado, significa uma quantidade especificada de um agente farmacêutico fornecido em uma única administração. Em algumas modalidades, uma dose pode ser administrada em dois ou mais bolos, comprimidos, ou injeções. Por exemplo, em algumas modalidades, quando desejada a administração subcutânea, a dose desejada requer um volume não acomodado facilmente por uma única injeção. Nessas modalidades, duas ou mais injeções podem ser utilizadas para obter a dose desejada. Em algumas modalidades, uma dose pode ser administrada em duas ou mais injeções para minimizar a reação no local da injeção em um indivíduo. unidade de dosagem

[091] “Unidade de dosagem”, como aqui utilizado significa, uma modalidade de fornecimento de um agente farmacêutico. Em algumas modalidades, uma unidade de dosagem é um frasco contendo oligonucleotídeo liofilizado. Em algumas modalidades, uma unidade de dosagem é um frasco contendo oligonucleotídeo reconstituído. ácido nucleico doador

[092] “Ácido nucleico doador” é aqui definido como qualquer ácido nucleico fornecido a um organismo ou receptáculo a ser inserido ou recombinado, no todo ou em parte, na sequência-alvo por mecanismos de reparo de DNA, recombinação ho-móloga (HR), ou recombinação não homóloga (NHEJ). duração

[093] “Duração”, como aqui utilizado, significa o período de tempo de duração de uma atividade ou evento. Em algumas modalidades, a duração do tratamento é o período de tempo durante o qual as doses de um agente farmacêutico ou composição farmacêutica são administrados. vetor de expressão

[094] “Vetor de expressão”, como aqui utilizado, significa qualquer ácido nu- cleico projetado para codificar artificialmente uma proteína ou proteínas exógenas em uma célula hospedeira. Exemplos de vetores de expressão compreendem DNA de plasmídeo, T-DNA, RNA viral, ssDNA ou dsDNA, Réplicons, vetores de replicação autônoma, ssDNA linear, dsDNA linear, produtos da polimerase phi, transcrito de RNA, RNA circular, e em algumas aplicações desta invenção, DNA genômico e orga- nelar transferido para a célula hospedeira. fragmento

[095] “Fragmento” é aqui utilizado para indicar uma parte de comprimento in-tegral de um ácido nucleico ou polipeptídeo. Desse modo, o fragmento em si também é um ácido nucleico ou polipeptídeo, respectivamente. gene

[096] "Gene", como aqui utilizado, pode ser um gene natural (por exemplo, genômico) ou sintético compreendendo sequências reguladoras de transcrição e/ou tradução e/ou uma região codificadora e/ou sequências não traduzidas (por exemplo, íntrons, sequências 5'- e 3' não traduzidas). A região codificadora de um gene pode ser uma sequência de nucleotídeo que codifica uma sequência de aminoácido ou um RNA funcional, como, tRNA, rRNA, RNA catalítico, siRNA, miRNA ou RNA antissen- tido. Um gene também pode ser um mRNA ou cDNA correspondendo às regiões codificadoras (por exemplo, éxons e miRNA) compreendendo opcionalmente sequências 5'- e 3' não traduzidas ligadas ao mesmo. Um gene também pode ser uma molécula de ácido nucleico amplificada produzida em vitro compreendendo toda ou parte da região codificadora e/ou sequências 5'- e 3' não traduzidas ligadas ao mesmo. endereçamento de gene

[097] “Endereçamento de gene” é aqui utilizado como toda técnica genética que induza uma alteração permanente em uma sequência de ácido nucleico-alvo, incluindo-se deleção, inserção, mutação e substituição de nucleotídeos em uma se-quência-alvo. modificação genômica

[098] “Modificação genômica” é aqui utilizado como qualquer modificação gerada em um genoma ou um cromossoma ou DNA extracromossomial ou DNA orga- nelar de um organismo em consequência do endereçamento de gene ou modificação funcional do gene. célula hospedeira

[099] "Célula hospedeira", como aqui utilizado, pode ser uma célula de ocor-rência natural ou uma célula transformada que possa conter um vetor. Células hospedeiras podem ser células cultivadas, explantes, células in vivo, e similares. Células hospedeiras podem ser células procarióticas, como, E. Coli, ou células eucarióticas, tais como, células de planta, levedura, inseto, anfíbios, ou mamíferos, tais como, CHO e HeLa.

[0100] De acordo com algumas modalidades, a dita célula hospedeira é uma célula inteira ou não, diferenciada ou não, no organismo, órgão, tecido ou calo. identidade

[0101] "Idêntica" ou "identidade" como aqui utilizado no contexto de dois ou mais sequências de ácidos nucleicos ou polipeptídeos significam que as sequências exibem um percentual especificado de resíduos iguais ao longo de uma região espe-cificada. O percentual pode ser calculado alinhando de maneira ideal as duas sequências, comparando as duas sequências ao longo da região especificada, determinando o número de posições em que ocorre o resíduo idêntico nas duas sequências para determinar o número de posições pareadas, dividindo o número de posições emparelhadas pelo número total de posições na região especificada, e multiplicando o resultado por 100 para determinar o percentual da identidade da sequência. Nos casos em que as duas sequências exibem diferentes comprimentos ou o alinhamento produz uma ou mais extremidades descompassadas e a região especificada de comparação inclui somente uma única sequência, os resíduos da única sequência são incluídos no denominador, mas não no numerador do cálculo. Na comparação de DNA e RNA, a timina (T) e a uracila (U) podem ser consideradas equivalentes. A identidade pode ser realizada manualmente ou utilizando um algoritmo sequência de computador, tais como, BLAST ou BLAST 2.0. inibir

[0102] “Inibir”, como aqui utilizado, pode significar evitar, suprimir, reprimir, re-duzir ou eliminar. in vitro

[0103] “In vitro” é aqui definido como um ambiente artificial fora das membra-nas de um organismo vivo, órgão, tecido, calo ou célula inteiro ou não, diferenciado ou não. Em algumas modalidades, o termo in vitro não inclui uma célula viável. in vivo

[0104] “In vivo” é aqui definido como dentro de um organismo, órgão, tecido, calo ou célula completa ou parcial, diferenciado ou não diferenciado. kits

[0105] Um kit como aqui utilizado pode compreender as composições aqui descritas juntamente com algumas ou todas as seguintes: reagentes de ensaio, tam-pões, sondas e/ou iniciadores, e solução salina estéril ou outra base de suspensão ou emulsão farmaceuticamente aceitável. Além disso, os kits podem incluir materiais instrutivos contendo instruções (por exemplo, protocolos) para a prática dos métodos aqui descritos. marcador

[0106] "Marcador", como aqui utilizado, significa uma composição detectável por dispositivo de espectroscopia, fotoquímico, bioquímico, imunoquímico, químico, ou outro dispositivo físico. Por exemplo, marcadores uteis incluem 32P, corantes fluo-rescentes, reagentes denso a elétron, enzimas (por exemplo, como comumente utili-zado em um ELISA), biotina, digoxigenina, ou haptenos e outras entidades que podem ser detectáveis. Um marcador pode ser incorporado aos ácidos nucleicos e proteínas em qualquer posição. erro de emparelhamento

[0107] “Erro de emparelhamento” significa uma nucleobase de um primeiro ácido nucleico que não é capaz de emparelhar com uma nucleobase em uma posição correspondente de um segundo ácido nucleico. oligonucleotídeo modificado

[0108] “Oligonucleotídeo modificado”, como aqui utilizado, significa um oligo- nucleotídeo que tem uma ou mais modificações em relação a uma ligação internucleo- sídica, terminal, açúcar e/ou nucleobase de ocorrência natural. modulação

[0109] "Modulação", como aqui utilizado, significa uma perturbação de função e/ou atividade e/ou estrutura. Em algumas modalidades, a modulação significa um aumento da expressão do gene. Em algumas modalidades, a modulação significa uma redução da expressão do gene. mutante

[0110] "Mutante", como aqui utilizado, se refere a uma sequência em que pelo menos uma porção da funcionalidade da sequência foi perdida, por exemplo, alterações na sequência de um promotor ou região enhancer afetarão pelo menos parcialmente a expressão de uma sequência codificadora em um organismo. Como aqui utilizado, o termo "mutação”, se refere a qualquer alteração eventualmente surgida na sequência em uma sequência de ácido nucleico, por exemplo, a partir de deleção, adição, substituição, ou rearranjo. A mutação também pode afetar uma ou mais etapas em que a sequência está envolvida. Por exemplo, uma alteração em uma sequência de DNA pode levar à síntese de um mRNA alterado e/ou uma proteína ativa, parcialmente ativa ou inativa. ácido nucleico

[0111] "Sequência de ácido nucleico" ou "oligonucleotídeo" ou "polinucleotí- deo", como aqui utilizado, significa pelo menos dois nucleotídeos ligados por covalên- cia em conjunto. A representação de um único filamento também define a sequência do filamento complementar. Desse modo, um ácido nucleico engloba ainda o filamento complementar de um único filamento representado. Muitas variantes de um ácido nu- cleico podem ser utilizadas para o mesmo propósito como um dado ácido nucleico. Sendo assim, um ácido nucleico também engloba ácidos nucleicos substancialmente idênticos e seus complementos. Um único filamento fornece uma sonda que pode hibridizar em uma sequência-alvo sob condições estritas de hibridização. Portanto, um ácido nucleico também engloba uma sonda que hibridiza em condições estritas de hibridização.

[0112] Os ácidos nucleicos podem ter um único filamento ou dois filamentos, ou conter porções da sequência com dois filamentos ou com um único filamento. O ácido nucleico pode ser o DNA, genômico e cDNA, RNA, ou um híbrido, onde o ácido nucleico pode conter combinações de desoxirribonucleotídeo e ribonucleotídeos, e combinações de bases que incluem uracila, adenina, timina, citosina, guanina, inosina, xantina hipoxantina, isocitosina e isoguanina. Os ácidos nucleicos podem ser obtidos com métodos de síntese química ou com métodos recombinantes.

[0113] Um ácido nucleico, de maneira geral, conterá ligações fosfodiéster, muito embora possam ser incluídos análogos de ácido nucleico que tenham pelo menos uma ligação diferente, por exemplo, ligações fosforamidato, fosforotioato, fosforo- ditioato, ou O-metilfosforoamidita e esqueletos e ligações de ácido nucleico- peptídeo. Outros análogos de ácidos nucleicos incluem os de esqueletos positivo; esqueletos não iônicos, e esqueletos diferentes da ribose, inclusive os descritos nas Patentes dos Estados Unidos N° 5.235.033 e 5.034.506, que são aqui incorporados por meio de citação. Ácidos nucleicos contendo um ou mais nucleotídeos de ocorrência não natural ou modificados também estão incluídos na definição de ácidos nucleicos. O análogo do nucleotídeo modificado pode estar localizado por exemplo, no 5’-terminal e/ou 3’-terminal da molécula de ácido nucleico. Exemplos representativos de análogos de nucleotídeo podem ser selecionados entre ribonucleotídeos de açúcar ou esqueleto modificado. Deve-se notar, no entanto, que também os ribonucleotídeos com nucleo- base modificada, isto é, ribonucleotídeos, contendo uma nucleobase de ocorrência não natural no lugar de uma nucleobase de ocorrência natural, como uridinas ou citi- dinas modificadas na 5-posição, por exemplo, 5-(2-amino) propil uridina, 5-bromo uri- dina; adenosinas e guanosinas modificadas na 8-posição, por exemplo, 8-bromo gua- nosina; nucleotídeos deaza, por exemplo, 7-deaza-adenosina; nucleotídeos O- e N- alquilados, por exemplo, N6-metil adenosina, são adequados. O grupo 2'-OH- pode ser substituído por um grupo selecionado entre H, OR, R, halo, SH, SR, NH2, NHR, NR2 ou CN, em que R é alquila, alquenila ou alquinila C1-C6 e halo é F, Cl, Br ou I. Nucleotídeos modificadas também incluem nucleotídeos conjugados com colesterol, por exemplo, através de uma ligação hidroxiprolinol. As modificações do esqueleto de ribose-fosfato podem ser efetuadas por diversas razões, por exemplo, para aumentar a estabilidade e meia-vida de tais moléculas em meios fisiológicos, para intensificar a difusão através das membranas celulares, ou como sondas em um biochip. A modifi-cação do esqueleto também permite elevar a resistência à degradação, por exemplo, no ambiente endocítico hostil das células. A modificação do esqueleto pode também reduzir a depuração (clearance) de ácido nucleico pelos hepatócitos, por exemplo, no fígado. Misturas de análogos e ácidos nucleicos de ocorrência natural são possíveis; alternativamente, misturas de diferentes análogos de ácido nucleico, e misturas de análogos e ácidos nucleicos de ocorrência natural também são possíveis. ligado funcionalmente

[0114] "Ligado funcionalmente", como aqui utilizado, pode significar que a expressão de um gene está sob o controle de um promotor ao qual está espacialmente conectado. Um promotor pode estar posicionado 5' (a montante) ou 3' (a jusante) de um gene sob seu controle. A distância entre o promotor e um gene pode ser aproximadamente igual à distância entre que o promotor e o gene que ele controla no gene do qual o promotor é derivado. Como é do conhecimento na técnica, a variação desta distância pode ser ajustada sem perda da função do promotor. promotor

[0115] "Promotor", como aqui utilizado, pode significar uma molécula de ori-gem sintética ou natural que é capaz de conferir, ativar ou intensificar a expressão de um ácido nucleico em uma célula. Um promotor pode compreender uma ou mais sequências reguladoras de transcrição específicas para intensificar ainda mais a expressão e/ou alterar sua expressão espacial e/ou expressão temporal. Um promotor pode ainda compreender enhancer distal ou elementos repressores, que podem estar localizados a milhares de pares de base de distância do sítio de início da transcrição. Um promotor pode ser derivado de fontes como vírus, bactérias, fungos, plantas, insetos, e animais. Um promotor pode regular a expressão de um componente gênico constitutivamente, ou diferencialmente em relação à célula, tecido ou órgão em que ocorre a expressão ou, em relação ao estágio do desenvolvimento em que a expressão ocorre, ou em resposta a estímulos externos, tais como, estresses fisiológicos, pató- genos, íons metálicos, ou agentes indutores. Exemplos representativos de promotores incluem o promotor do bacteriófago T7, promotor do bacteriófago T3, promotor do SP6, promotor-operador lac, promotor de tac, promotor do SV40 tardio, promotor de SV40 precoce, promotor de RSV-LTR, promotor do CMV IE, promotor de CaMV 35S, promotor de NOS, promotores de choque térmico, promotores regulados por esteróide, promotores regulados por metais, promotores de semente e promotores de ubiquitina vegetal. células hospedeiras recombinantes

[0116] “Células hospedeiras recombinantes" se refere a células que foram transformadas com vetores construídos a partir de técnicas de DNA recombinante. marcador selecionável

[0117] "Marcador selecionável", como aqui utilizado, pode significar qualquer gene que confira um fenótipo em uma célula hospedeira, tecido, órgão, calo ou orga-nismo no qual é expresso para facilitar sua identificação e/ou a seleção daqueles que foram transfectados ou transformados com um construto genético. Exemplos representativos de marcadores selecionáveis incluem o gene de resistência à ampicilina (AmpR), gene de resistência à tetraciclina (TcR), gene de resistência à canamicina bacteriana (KanR), gene de resistência à zeocina, o gene AURI-C que confere resistência ao antibiótico aureobasidina A, o gene de resistência à fosfinotricina (Bar), gene neomicina fosfotransferase (nptII), gene de resistência à higromicina, gene beta-glucuronidase (GUS), gene da cloranfenicol acetiltransferase (CAT), gene codificador da proteína fluorescente verde (GFP) e o gene da luciferase. Em algumas modalidades desta invenção, um marcador selecionável pode ser produzido a partir de uma modificação de um gene endógeno, por exemplo, a eliminação de um receptor da quimio- cina expresso e exibido na superfície de uma célula quando uma mutação deste gene resulta em um mutação de deslocamento do quadro de leitura e pode ser então selecionado negativamente com um anticorpo, ou por exemplo, uma mutação W568L no gene acetolactato sintase do fumo, que resulta na resistência aos herbicidas chlorsul- furon e imazaquin. condições estritas de hibridização

[0118] "Condições estritas de hibridização", como aqui utilizado, significam condições sob as quais uma primeira sequência de ácido nucleico (por exemplo, sonda) hibridizará em uma segunda sequência de ácido nucleico (por exemplo, alvo), tais como, em uma mistura complexa de ácidos nucleicos. Condições estritas são dependentes da sequência e serão diferentes em diferentes circunstâncias. As condições estritas podem ser selecionadas entre cerca de 5-10°C abaixo do ponto de fusão térmica (Tm) para a sequência específica em resistência iônica e pH definidos. A Tm pode ser a temperatura (sob resistência iônica, pH, e concentração de ácido nucleico definidos) em que 50% das sondas complementares ao alvo hibridizam na sequência- alvo em equilíbrio (como a sequências-alvo estão presentes em excesso, na Tm, 50% das sondas são ocupadas em equilíbrio).

[0119] Condições estritas podem ser aquelas em que a concentração salina é inferior a cerca de íon sódio 1,0 M, por exemplo, concentração do íon sódio de cerca de 0,01-1,0 M (ou outros sais) em pH 7,0 a 8,3 e a temperatura é pelo menos de cerca de 30°C para sondas curtas (por exemplo, cerca de 10-50 nucleotídeos) e pelo menos cerca de 60°C para sondas longas (por exemplo, acima de cerca de 50 nucleotídeos). Condições estritas também podem ser obtidas com a adição de agentes de desesta- bilização, tais como, formamida. Para a hibridização seletiva ou específica, um sinal positivo pode ser de pelo menos 2 a 10 vezes a hibridização anterior. Exemplos de condições estritas de hibridização incluem as seguintes: 50% formamida, 5x SSC, e SDS a 1%, incubando a 42°C, ou, 5x SSC, SDS a 1%, incubando a 65°C, com lavagem em 0,2x SSC, e SDS a 0,1% a 65°C. complementar

[0120] "complementar", como aqui utilizado, significa que uma primeira se-quência é pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% idêntica ao complemento de uma segunda sequência ao longo de uma região de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais nucleotídeos, ou que as duas sequên-cias hibridizam em condições estritas de hibridização. substancialmente idêntica

[0121] "Substancialmente idêntica", como aqui utilizado, significa que uma primeira e uma segunda sequência são pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% idênticas ao longo de uma região de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais nucleotídeos ou aminoácidos, ou em relação aos ácidos nucleicos, se a primeira sequência for substancialmente complementar ao complemento da segunda sequência. ácido nucleico-alvo

[0122] “Ácido nucleico-alvo” ou “sequência-alvo”, como aqui utilizado, é qual-quer sequência de ácido nucleico predeterminada em que se desejada atuar, inclu-sive, mas não se limitando a, por sequências codificadoras ou não codificadoras, ge-nes, exons ou íntrons, sequências reguladoras, sequências intergênicas, sequências sintéticas e sequências parasitas intracelulares. Em algumas modalidades, o ácido nucleico-alvo reside no interior de uma célula, tecido, órgão ou organismo-alvo. O ácido nucleico-alvo compreende um sítio-alvo, que inclui um ou mais nucleotídeos dentro da sequência-alvo, que são modificados em qualquer grau com os métodos e composições aqui revelados. Por exemplo, o sítio-alvo pode compreender um nucle- otídeo. Por exemplo, o sítio-alvo pode compreender 1-300 nucleotídeos. Por exemplo, o sítio-alvo pode compreender cerca de 1-100 nucleotídeos. Por exemplo, o sítio-alvo pode compreender cerca de 1-50 nucleotídeos. Por exemplo, o sítio-alvo pode compreender cerca de 1-35 nucleotídeos. Em algumas modalidades, um ácido nucleico- alvo pode incluir mais de um sítio-alvo, que pode ser idêntico ou diferente. modificação funcional do gene endereçado

[0123] “Modificação funcional do gene endereçado” e "modificação do gene- alvo" trata-se de qualquer técnica genética que resulte na alteração permanente ou temporária de um ácido nucleico-alvo, inclusive, mas não se limitando a, deleção, inserção, mutação, substituição, corte (nicking), metilação, acetilação, ligação, recom- binação, desespiralação de hélice, modificação química, marcação, ativação, inativa- ção e repressão de um ou mais nucleotídeos em uma sequência-alvo. terapia

[0124] “Terapia”, como aqui utilizado, significa um método para o tratamento de enfermidades. Em algumas modalidades, a terapia inclui, entre outras coisas, qui-mioterapia, ressecção cirúrgica, transplante, e/ou quimioembolização. organismo transgênico

[0125] O termo é dirigido a um organismo que tem uma ou mais modifica- ção(s) do gene-alvo em seu genoma, introduzida pela composições e métodos aqui revelados. Por exemplo, a modificação é selecionada entre: inserção, mutação, subs-tituição de um ou mais nucleotídeos, corte (nicking), metilação, acetilação, ligação, recombinação, desespiralação de hélice, modificação química, marcação, ativação, inativação e/ou repressão. O organismo pode ser qualquer tipo de organismo, por exemplo, humano, animal, vegetal, e similares. expressão transitória

[0126] “Expressão transitória” ou “que expressa transitoriamente”, como aqui utilizado, pode se referir à transcrição, ou tradução de um ácido nucleico fornecido em um organismo, órgão, tecido, calo ou célula completa ou parcial, diferenciado ou indiferenciado, a dita expressão sendo limitada devido à não integração do ácido nucleico fornecido aos ácidos nucleicos estáveis do organismo, órgão, tecido, calo ou célula compreendendo o genoma ou ácidos nucleicos organelares. Vetores for expressão transitória compreendem ssDNA, dsDNA ou RNA linear ou circular, plasmídeos, vetores de replicação autônoma, vírus, transcritos in vitro, T-DNA, ácidos nucleicos sintéticos e seus derivados modificados. Desse modo, embora a expressão transitória não seja hereditária por definição, pode ser expressa continuamente em linhagens celulares e transferida autonomamente de uma célula a outra em virtude da replicação do ácido nucleico fora do cromossoma ou genoma organelar. tratar

[0127] “Tratar” ou “tratando”, como aqui utilizado, em referência à proteção de um indivíduo contra determinada condição pode significar prevenir, suprimir, reprimir, ou eliminar a condição. Prevenir a condição envolve administrar uma composição aqui descrita a um indivíduo antes do início da condição. Suprimir a condição envolve administrar a composição a um indivíduo após a indução da condição, mas antes de seu surgimento clínico. Reprimir a condição envolve administrar a composição a um indivíduo após o surgimento clínico da condição para reduzir a condição ou evitar seu desenvolvimento. Eliminação da condição envolve administrar a composição a um indivíduo após o surgimento clínico da condição para que o indivíduo deixe de sofrer com a condição. variante

[0128] “Variante”, como aqui utilizado, em referência a um ácido nucleico sig-nifica (i) uma porção de uma sequência de nucleotídeo citada; (ii) o complemento de uma sequência de nucleotídeo citada ou porção da mesma; (iii) um ácido nucleico que é substancialmente idêntico a um ácido nucleico citado ou ao seu complemento; ou (iv) um ácido nucleico que hibridiza em condições estritas no ácido nucleico citado, seu complemento, ou em uma sequência substancialmente idêntica ao mesmo. vetor

[0129] "Vetor" como aqui utilizado significa uma sequência de ácido nucleico utilizado para a entrega do ácido nucleico. Um vetor pode ser utilizado nesta invenção para ocasionar a transformação genética, a expressão de uma proteína, a transcrição de um RNA, ou para ser utilizado diretamente como Doador para recombinação homóloga ou recombinação não homóloga. Um vetor pode ser um DNA de plasmídeo, T-DNA, RNA viral, ssDNA ou dsDNA, Réplicons, vetores de replicação autônoma, ssDNA linear ou circular, dsDNA linear ou circular, produtos da polimerase phi ramificada, dendrímeros do ácido nucleico, transcrito de RNA, RNA circular, bacterió- fago, cromossoma artificial de bactéria ou cromossoma artificial de levedura e em al-gumas aplicações desta invenção, DNA genômico e organelar transferidos para a cé-lula hospedeira. Um vetor pode ser um vetor extracromossômico não replicante, au- torreplicante ou um vetor que se integra ao genoma do hospedeiro. tipo selvagem

[0130] Como aqui utilizado, o termo sequência do "tipo selvagem" se refere a uma sequência codificadora, não codificadora ou de interface que é uma forma alélica da sequência que realiza a função natural ou normal para aquela sequência. Sequências do tipo selvagem incluem múltiplas formas alélicas de uma sequência cognata, por exemplo, múltiplos alelos de uma sequência do tipo selvagem podem codificar alterações silentes ou conservadoras na sequência de proteína que uma sequência codificadora codifica.

[0131] De acordo com algumas modalidades, a composição compreendendo o complexo molecular programável que inclui uma fração (polipeptídica) da proteína, e uma fração do ácido nucleico, forma montagens autonomamente in vivo em uma célula, organismo, tecido, calo, órgão ou parte viva dos citados, na presença de uma sequência(s) de ácido nucleico-alvo para formar complexos moleculares funcionais programados e ativos.

[0132] De acordo com algumas modalidades, os vários complexos molecula-res programados podem ser construídos para modificar permanentemente ou transi-toriamente um sequência-alvo eucariótica, procariótica, sintética, parasita intracelular ou viral existentes ou iminentes, tais como, aquelas encontradas no genoma, núcleo, cromossoma, citoplasma, organela, ou ácido nucleico extracromossômico. A modifi-cação-alvo realizada pela ação do complexo molecular compreende alterações/modi- ficações genéticas hereditárias e não hereditárias, permanentes e transitórias. Em al-gumas modalidades, o alvo é constituído por um ácido nucleico envolvido em uma característica genética de interesse que seria vantajosamente modificada. Alterações na sequência endereçada incluem, por exemplo, mas não se limitando a: deleção permanente, mutação, inserção de ácidos nucleicos, e substituição de uma sequência endereçada por outra sequência de ácido nucleico, knock-out, deslocamento do quadro de leitura, ou qualquer alteração em qualquer modalidade de transcrição ou tradução de um gene, suas sequências reguladoras, nos genes reguladores do gene de interesse ou suas sequências reguladoras em uma cadeia reguladora de eventos. Alterações permanentes do ácido nucleico-alvo incluem, por exemplo, edição do material genético ou alterações de sequência, tais como, mutação, deleção, inserção, substituição e recombinação do ácido nucleico. Alterações transitórias da sequência-alvo incluem, por exemplo, ligação, digestão, corte (nicking), desespiralação de hélice, ativação, inativação, modificação química, metilação, acetilação e marcação do ácido nucleico-alvo. Modificação-alvo inclui, por exemplo, modificação funcional-alvo que pode ocasionar na célula a ativação da transcrição, inativação da transcrição, silenci- amento de RNA, splicing alternativo de RNA, rearranjo da cromatina, inativação por parasita intracelular, e alterações na localização celular ou compartimentalização do ácido nucleico-alvo.

[0133] De acordo com algumas modalidades, e sem vincular-se a qualquer teoria ou mecanismo, o desenho do complexo molecular programável, se baseia em sua capacidade de formar montagens autônomas, sua capacidade de endereçar uma sequência pretendida predefinida em um ácido nucleico-alvo, e sua capacidade de agir sobre a sequência-alvo de maneira predeterminada. Os componentes do complexo são modulares e ajustáveis de modo a se adequarem 1) aos tipos particulares de ação molecular requerida, 2) ao alvo, e 3) ao método de entrega do ácido nucleico desejado utilizado para sua expressão in vivo. Os métodos e composições da presente descrição possuem inúmeras vantagens em relação aos demais sistemas conhecidos na técnica. Por exemplo, as frações da proteína do complexo são inativas como monômeros, e somente o espaçamento correto, em uma faixa limitada, de dois oligo- nucleotídeos de SCNA que se ligam ao ácido nucleico-alvo em uma sequência predeterminada, resultarão no posicionamento dos domínios efetores das frações da proteína de modo a dimerizarem e estarem aptos a atuar especificamente sobre o sítio-alvo predeterminado desejado. Essa configuração, através da qual somente dímeros de complexos moleculares programados (isto é, complexo que compreende uma fração de proteína ligada ao SCNA, que é ligado ao ácido nucleico-alvo), reduz ou elimina completamente a clivagem potencial em sítio incorreto ou não específica, já que a fração de proteína em si não se liga ao ácido nucleico-alvo e não age como monô- mero.

[0134] De acordo com algumas modalidades, a porção ativa (domínio funcio-nal), do complexo molecular é projetada para ser ativada após a dimerização do do-mínio funcional da fração de proteína somente. O componente da proteína não pro-gramado é projetado para ter baixa afinidade específica com a sequência de ácido nucleico e com o sítio-alvo ou para essa afinidade específica ser praticamente inexiste. Desse modo, embora para todos os tipos de modificações seja necessária a expressão de um único tipo de monômero da fração de proteína, para as funções mínimas de modificação de ponto, tais como, por exemplo, uma mutação de ponto mediada por um domínio da nuclease, ou alternativamente, uma metilação de ponto mediada por um domínio da metilase, dois SCNAs, projetados para ligar sequências flanqueando o sítio-alvo, devem estar presentes para interferir no espaçamento correto da proteínas e permitir a ligação e dimerização mútuas. Sob o aspecto vantajoso, isso aumenta a especificidade de sequência do complexo. Em algumas modalidades, para as funções de edição de deleção e substituição, pode ser necessário clivar dois diferentes sítios flanqueadores da região de interesse para de maneira simultânea. Nessa modalidade, mesmo neste caso, somente um componente da proteína exógena precisa ser expresso junto com quatro SCNAs. Quando os oligonucleotídeos são excluídos, seja por diluição seja por degradação, a expressão da proteína não progra-mada não possui afinidade com o ácido nucleico-alvo e cessará de agir sobre ele (isto é, neste case, cessará a clivagem do ácido nucleico-alvo).

[0135] De acordo com algumas modalidades, a fração da proteína (polipeptí- deo) pode ser expressa como polipeptídeos separados ou como uma proteína contí-gua (polipeptídeo). Em algumas modalidades, a fração de proteína (componente) pode ter um ou mais domínio(s) identificáveis, identificáveis de acordo com a estrutura e/ou função (utilidade). Em algumas modalidades, um domínio estrutural pode ter mais de um domínio de utilidade, ou seja, um domínio estrutural separável pode ter diversas funções. De acordo com algumas modalidades, a fração de proteína pode compreender um ou mais dos seguintes domínios estrutural e/ou utilidade: a) um "domínio efe- tor" (domínio funcional), que pode interagir com e consequentemente afetar o ácido nucleico-alvo; e/ou b) um "domínio de ligação", que pode se ligar direta ou indiretamente ao SCNA de modo específico; e/ou c) um "domínio de localização celular"; e/ou d) espaçadores ou conectores interdomínio; e qualquer combinação dos citados.

[0136] De acordo com algumas modalidades, o "Domínio Efetor" (aqui tam-bém denominado "Domínio Funcional"), interage com o ácido nucleico-alvo após a montagem do complexo molecular e exerce o efeito pretendido sobre a sequência- alvo. Em algumas modalidades exemplificativas, este domínio possui função enzimá- tica ou catalítica, compreendendo uma atividade de modificação do ácido nucleico. Em algumas modalidades, este domínio pode ser derivado de domínios ativos deriva-dos de proteínas inteiras, ou de porções ou porções modificadas de proteínas de fun-ção conhecida, tais como, uma proteína de ligação do DNA, uma nuclease, uma me- tilase, um fator de ligação do DNA metilado, um fator de transcrição, um fator de mo-delagem da cromatina, uma polimerase, uma demetilase, uma acetilase, uma desa- cetilase, uma quinase, uma fosfatase, uma integrase, uma recombinase, uma ligase, uma topoisomerase, uma girase e uma helicase. Em algumas modalidades, o domínio funcional pode ser construído fundindo a(s0) sequência(s) de aminoácido de domínios ativos derivados de proteínas inteiras, ou de porções ou porções modificadas de proteínas de função conhecida compreendendo uma proteína de ligação do DNA, uma nuclease, uma metilase, um fator de ligação do DNA metilado, um fator de transcrição, um fator de modelagem da cromatina, uma polimerase, uma demetilase, uma aceti- lase, uma desacetilase, uma quinase, uma fosfatase, uma integrase, uma recombinase, uma ligase, uma topoisomerase, uma girase e uma helicase. Em algumas modalidades, para um domínio efetor que é ou é derivado de uma nuclease, o domínio de reconhecimento da ligação do DNA da nuclease pode ser removido. Por exemplo, quando o domínio efetor for derivado de uma nuclease FokI, os domínios de ligação e reconhecimento do sítio FokI estão ausentes no Domínio efetor da fração de proteína. Em algumas modalidades, o domínio efetor é destituído de um sítio de ligação do ácido nucleico-alvo específico, isto é, não pode se ligar especificamente a uma sequência-alvo específica.

[0137] De acordo com algumas modalidades, o "Domínio de ligação" é proje-tado para se ligar/anexar, direta ou indiretamente, ao SCNA de maneira específica (e em particular, à região de reconhecimento do SCNA). A ligação/anexação entre o do-mínio de ligação e o SCNA pode ser direta, ou indireta através, por exemplo, de uma modificação no SCNA. As anexações/ligação/uniões entre o domínio de ligação e o SCNA possibilitam a montagem in vivo do SCNA com a fração de proteína. Em algu-mas modalidades, o domínio de ligação é construído fundindo-se a sequência de ami- noácido da fração de proteína a aminoácidos que incorporam um domínio que se liga especificamente a uma sequência de nucleotídeo ou uma substância química ou elemento biológico no ácido nucleico propiciador de especificidade. A interação física entre o domínio de ligação e o ácido nucleico propiciador de especificidade pode derivar, entre outras coisas, da afinidade decorrente de um ou mais dos seguintes tipos de interações; ligante-receptor, ligante-substrato, Ligações de hidrogênio, ligações de van der Waals, Ligações covalentes formadas in vivo, Ligações iônicas e interações hidrofóbicas. Exemplos de ligação não covalente compreendem, um ou mais, ou de fragmentos ou porções ou formas modificadas dos seguintes: exemplos de par de ligação: Biotina-Avidina; Biotina-Estreptavidina; formas modificadas da avidina-bio- tina; Proteína-proteína; ácido nucleico-proteína; ligante-receptor; substrato-ligante; antígeno-anticorpo; antígeno-anticorpo de cadeia simples; hapteno-anticorpo ou -an-ticorpo de cadeia simples; proteína de ligação hormônio-hormônio; agonista-receptor; receptor antagonista-receptor; proteína A-IgG; cofator enzimático - enzima; inibidor enzimático-enzima; DNA de um único filamento-VirE2; dsDNA-StickyC; proteína da família do Argonauta-RNA; proteína da família da RnaseIII-dsRNA; ácido nucleico- proteína da capa viral e VirD2 de Agrobacterium ou partes dos citados-proteína de ligação VirD2, onde cada ácido nucleico propiciador de especificidade e Domínio de ligação compreende um dos membros do par. Em um modalidade exemplificativa, o domínio de ligação contém um anticorpo de cadeia simples ScFV capaz de ligar-se ao corante Fluoresceína, por sua vez é ligada quimicamente via linker a um 5’-terminal ou 3’-terminal do ácido nucleico propiciador de especificidade, permitindo desse modo a associação da fração de proteína e a fração do ácido nucleico do complexo programável. Em algumas modalidades, o domínio de ligação é derivado da repetição de tripla hélice oito do elemento de ligação PUF5 de C. elegans, e o ácido nucleico propiciador de especificidade (SCNA) contém a sequência RNA conforme descrito no N° ID SEQ:1 (CUCUGUAUCUUGU) no ou suficientemente perto de um de seus terminais. Nesta modalidade, a proteína e o SCNA são colocados diretamente juntos sem a necessidade de modificação química do SCNA, permitindo sua biossíntese in vivo como um transcrito e, assim, permitindo a associação in vivo da fração de proteína e da fração do ácido nucleico do complexo programável. Em algumas modalidades exemplificativas, uma sequência/molécula de RNA capaz de formar estruturas secundárias ou terciárias (tais como, estrutura em grampo), localizada no interior do SCNA, interage com o domínio de ligação da fração de proteína, que é um domínio de ligação que liga o motivo de RNA, derivado de proteínas de TAT viral (tais como, HIV, BIV, e similares). Em algumas modalidades exemplificativas, uma sequência de ligação do grampo de RNA boxB 20-mer do bacteriófago Phi21 está localizada no SCNA e é capaz de ligar/anexar sua contraparte do domínio de ligação na fração de proteína, que é derivada da proteína N do bacteriófago Phi21 da proteína de ligação ao RNA (RBP). Em outra modalidade exemplificativa, que permite a produção do SCNA in vivo, o domínio de ligação é derivado de uma proteína que se liga à proteína VirD2 de Agrobacterium, compreendendo VirD2 - proteínas de ligação encontradas em bactérias compreendendo VBP1, VBP2 e VBP3 e anticorpos artificiais de cadeia simples projetados para se ligarem a VirD2. Nesta modalidade, o SCNA é produzido como um ssDNA de um T-DNA em Agrobacterium, onde é ligado covalentemente em seu 5’- terminal à tirosina 29 de VirD2 necessária para a associação covalente, ocorrendo assim a ligação covalente in vivo. A catálise ocorre na bactéria e o complexo é posteriormente exportado da bactéria através de um sistema de secreção bacteriano em uma célula eucariótica compreendendo células, tecidos, calos e órgãos vegetais, animais e humanos completos ou parciais. Nesta modalidade, o domínio de ligação VirD2 no Domínio de Ligação se liga à proteína VirD2 anexada ao SCNA, possibilitando a associação da fração de proteína e da fração do ácido nucleico do complexo programável. Nesta modalidade, as modificações de VirD2 expresso na bactéria poderiam ser projetadas para que se aumentasse a integração do DNA e talvez fosse positivo evitar a integração do DNA não específico. Exemplos de Ligação Covalente formada in vivo no organismo-alvo compreendem respectivamente, na região de reconhecimento do SCNA, e no Domínio de ligação, um ou mais, de fragmentos ou porções ou formas modificadas de, mas não se limitando a, o exemplo de par de ligação a seguir pareado por um símbolo de traço; a sequência RB de T-DNA GTTTACCCGCCAATATATCCTGTCA (N° ID SEQ: 2) - VirD2 de Agrobacterium; RNA de Picornavírus - VPg; DNA - Topoisomerase; sequência de origem do fago PhiX174 em ssDNA- proteína A do fago PhiX174 ou proteína A* PhiX, e similares. Em uma modalidade exemplificativa da anexação in vivo do SCNA-Domínio de ligação, um oli- gonucleotídeo de ssDNA sintético contendo uma sequência RB na ou perto de seu 5’- terminal é entregue a uma célula onde encontra a fração de proteína. A proteína aloja uma porção de VirD2 capaz de clivar a sequência RB e posteriormente se ligar ao restante do oligonucleotídeo contendo a sequência TCA em sua extremidade 5’, um espaçador adequado, e uma sequência de emparelhamento de base-alvo, e com isso “programa” efetivamente o complexo molecular in vivo. Em algumas modalidades, o domínio de ligação é destituído de um sítio de ligação do ácido nucleico-alvo específico, isto é, não pode ligar-se especificamente a uma sequência-alvo específica.

[0138] De acordo com algumas modalidades, um "domínio de localização ce-lular" que pode localizar a fração de proteína ou a fração da proteína programada ou o complexo montado em uma localização celular ou subcelular específica em uma célula viva, pode opcionalmente ser parte da fração de proteína. O domínio de locali-zação celular pode ser construído fundindo-se a sequência de aminoácido da fração de proteína aos aminoácidos que incorporam um domínio compreendendo um Sinal de localização nuclear (NLS); uma sequência líder mitocondrial (MLS); uma sequência líder de cloroplasto; e/ou quaisquer sequências projetadas para transportar ou conduzir ou localizar uma proteína em uma organela contendo o ácido nucleico, um compartimento celular ou qualquer subdivisão de uma célula. Em algumas modalidades exemplificativas, o organismo é eucariótico e o domínio de localização celular compreende um domínio de localização nuclear (NLS) que permite o acesso da proteína ao núcleo e ao DNA genômico interno. A sequência do dito NLS pode compreender qualquer sequência carregada positivamente de NLS funcional compreendendo, por exemplo, a sequência SV40NLS PKKKRKV (N° ID SEQ: 3). Em outra modalidade exemplificativa, este domínio é formado por uma sequência líder permitindo a entrada da fração de proteína ou da nucleoproteína programada em uma organela, possibili-tando a modificação desejada do DNA da organela pelo complexo. Em outra modali-dade exemplificativa, uma sequência derivada da Cox4p de Levedura mitocondrial (MLSLRQSIRFFKPATRTLCSSRYLL (N° ID SEQ: 4)) ou uma sequência derivada da sequência líder mitocondrial da malato desidrogenase humana (MLS) (MLSALARPASAALRRSFSTSAQNNAKVAVLGAS (N° ID SEQ: 5)) ou derivada da sintase do ácido lipoico de Arabidopsis (NCBI Ref. Seq. ID: NP_179682.1 aqui desig-nada como N° ID SEQ: 6: MHSRSALLYRFLRPASRCFSSSS) podem ser utilizadas para localizar o complexo em uma matriz mitocondrial para modificar o DNA mitocon- drial. Um dos usos desta aplicação seria a cura de defeitos mitocondriais do DNA de herança materna em vários eucariotos, tais como, Síndrome da Oftalmoplegia Crônica Externa Progressiva em humanos. Outro exemplo é induzir defeitos para ocasionar esterilidade masculina em plantas utilizadas na produção de plantas híbridas. Em uma modalidade o alvo mitocondrial é uma ATPase e reconstitui a função do locus pcf em Petunia.

[0139] De acordo com outras modalidades, vários conectores interdomínio ou espaçadores opcionais são projetados para permitir a função desejada do complexo agindo como dobradiças ou adaptadores moleculares. Muitos desses conectores po-dem ser divisados pelos indivíduos versados na técnica. A escolha conector pode afetar a especificidade do complexo molecular programado afetando a gama de ácido nucleico-alvo ao alcance do sítio ativo do domínio funcional. Em uma modalidade exemplificativa, o C’ do domínio de ligação e o N’ do domínio funcional são conectados de maneira flexível aos aminoácidos GGSGG (N° ID SEQ: 7), abrangendo cerca de 15 Angstrom. Em outra modalidade, um linker rígido alfa-hélice com os aminoácidos NIHHVTWHMDFP (N° ID SEQ: 8) abrangendo cerca de 16 Angstrom é utilizado. Em outra modalidade, um linker helicoidal rígido com os aminoácidos PNSLIVP (N° ID SEQ: 9) abrangendo cerca de 16,88 Angstrom é utilizado. Em outra modalidade, um linker espiralado desorganizado com os aminoácidos TGLDSP (N° ID SEQ: 10) abrangendo cerca de 15,55 Angstrom é utilizado. Aminoácidos adicionais codificados pelos sítios da enzima de restrição podem ser adicionados ao conector interdomínio para facilitar a permuta dos módulos de proteína (por exemplo, GSLE (N° ID SEQ: 11) que codifica BamHI/XhoI).

[0140] De acordo com algumas modalidades, a fração do ácido nucleico do complexo molecular, aqui denominado "Ácido nucleico propiciador de especificidade" (SCNA) ou “ácido nucleico de programação” compreende uma ou mais porções (regiões) e funções. Uma porção (região) define a região-alvo a ser atacada, e contém a sequência definidora de especificidade. A sequência definidora de especificidade no SCNA define sua especificidade ao ácido nucleico-alvo pelo emparelhamento de base. Este emparelhamento pode formar, por exemplo, mas não se limitando a: dupla hélice completa ou parcial, tripla hélice completa ou parcial, alças D e formas ramificadas, podendo ser o resultado de ligações de hidrogênio ou ligações de hidrogênio Hoogsteen ou de suas combinações. Em algumas modalidades, a sequência definidora de especificidade é capaz de interagir com os ácidos nucleicos-alvo, nas regiões próximas, ou flanqueando o sítio-alvo. Em algumas modalidades, a sequência definidora de especificidade do SCNA não se liga/interage com o sítio-alvo. Em algumas modalidades, a sequência definidora de especificidade pode incluir qualquer número de nucleotídeos. Por exemplo, a sequência definidora de especificidade pode apresentar comprimento de cerca de 3-200 nucleotídeos. Por exemplo, a sequência definidora de especificidade pode apresentar comprimento de cerca de 10-100 nucleotí- deos. Por exemplo, a sequência definidora de especificidade pode apresentar comprimento de cerca de 15-50 nucleotídeos. Por exemplo, a sequência definidora de especificidade pode apresentar comprimento de acima de cerca de 18 nucleotídeos.

[0141] De acordo com algumas modalidades, uma segunda porção do SCNA, é a região de reconhecimento (porção), que é uma região capaz de se ligar/anexar/reconhecer especificamente o domínio de ligação da fração de proteína. Em algumas modalidades, esta região de reconhecimento pode ser e/ou incluir uma modificação ou uma sequência de reconhecimento do domínio de ligação (aqui tam-bém denominada motivo do nucleotídeo de SCNA ou sequência do nucleotídeo de ligação do domínio de ligação do SCNA). A região de reconhecimento pode ser uma parte integrada ou pode estar ligada (por exemplo, covalentemente) à sequência de-finidora de especificidade, e ser constituída por uma sequência ou por uma modifica-ção que possibilita a ligação do SCNA ao domínio de ligação da fração de proteína, como detalhado acima.

[0142] Em algumas modalidades, o SCNA é formado por, mas não se limi-tando a, uma molécula dos tipos a seguir: DNA de um único filamento, RNA de um único filamento, RNA de duplo filamento, DNA modificado, RNA modificado, ácido nu- cleico bloqueado (LNA), peptídeo-ácido nucleico (PNA) e quaisquer combinações entre os indicados. Em algumas modalidades, o SCNA pode incluir adicionalmente uma ou múltiplas modificações aptas a intensificarem a estabilidade, intensificarem sua especificidade ao alvo, modificar sua afinidade aos ácidos nucleicos e/ou intensificarem sua ligação ao domínio de ligação do complexo. As modificações podem estar posicionadas em sua extremidade 5’, em sua extremidade 3’, como espaçadores e/ou internamente no SCNA. Modificações exemplificativas incluem, mas não se limitam a, Nu- cleotídeos, Biotina, Fluoresceína, Linkers de amina, oligopeptídeos, Aminoalila, uma molécula de corante, fluoróforos, Digoxigenina, Acridita, Adenilação, Azida, NHS- Éster, Colesteril-TEG, Alcinos, Biotina Fotoclivável, Tiol, Ditiol, bases modificadas, fosfato, 2-Aminopurina, Trimer-20, 2,6-Diaminopurina, 5-Bromo-desoxiUridina, DesoxiU- ridina, dT invertida, didesoxi-nucleotídeos, 5-metil desoxiCitidina, desoxiInosina, 5-ni- troindol, bases de RNA 2-O-metil, Iso-dC, Iso-dG, Bases modificadas do flúor, Ligações fosforotioato e a proteína VirD2 de Agrobacterium e partes da dita VirD2 e modificações da VirD2.

[0143] De acordo com algumas modalidades, o SCNA pode incluir adicional-mente sequências de espaçador opcionais possivelmente uteis na otimização das distâncias moleculares e dos graus de liberdade necessários para reunir o domínio de ligação e um ácido nucleico-alvo. Em algumas modalidades, as sequências de espa- çador podem apresentar comprimento de cerca de 0-100 nucleotídeos. Por exemplo, o espaçador pode apresentar comprimento de cerca de 0-6 nucleotídeos.

[0144] De acordo com algumas modalidades, o SCNA pode ser produzido quimicamente e/ou biologicamente, in vitro e in vivo, e a modificação pode ser previa-mente sintetizada ou adicionada após a síntese. Em algumas modalidades exemplifi- cativas, o SCNA é produzido quimicamente e é formado por ssDNA modificado por fosforotioato que é modificado em um de seus terminais através da ligação de uma molécula de corante Fluoresceína C6. Este SCNA é consequentemente entregue a uma célula, (por exemplo, com o uso de bombardeamento de partícula, transfecção de polietileno glicol, lipossomas, partículas virais, whiskers de carboneto de silício e/ou eletroporação) onde entra tanto o componente da proteína do complexo molecular, que compreende um Domínio de ligação compreendendo um anticorpo de cadeia simples ScFV capaz de ligar-se ao corante Fluoresceína, programando assim o complexo molecular, e entregar/endereçar o complexo à sequência de nucleotídeo-alvo pretendida. De acordo com algumas modalidades, o SCNA não se liga/interage com o sítio- alvo.

[0145] Neste momento fazemos referência às Figuras 1A-B que são pranchas esquemáticas (fora de escala) mostrando os elementos/componentes de um complexo molecular programável, de acordo com algumas modalidades. As pranchas esquemáticas (fora de escala) das Figuras 1A-B, mostram uma molécula de uma fração de proteína programável na forma de um monômero, e duas moléculas de ácidos nu- cleicos propiciadores de especificidade (SCNA). Como mostram as Figuras 1A-B, a fração de proteína é um polipeptídeo (uma cadeia de aminoácidos) organizada em diversos domínios estrutural/funcional: um domínio de ligação (LD), um Domínio fun-cional ou efetor (FD); um Domínio de localização celular opcional (CLD) e um conec- tor(s) de interdomínio (IDC) opcional, cada um deles definido por sua função no com-plexo molecular. A função do domínio de ligação é ligar-se ao SCNA. A função do Domínio efetor é interagir com o ácido nucleico-alvo e modificar estruturalmente o sí-tio-alvo e/ou modifica sua função e/ou a função de todo o ácido nucleico-alvo. A função do domínio de localização celular opcional é localizar o complexo de proteína para o mesmo compartimento celular ou subcelular como o ácido nucleico-alvo. A função dos conectores interdomínio opcionais é permitir distâncias moleculares e graus de liberdade ideais entre os domínios para a função adequada do complexo. Os SCNAs são formados por uma cadeia de ácido nucleico ou cadeia de ácido nucleico modificado (forma de pente) e incluem uma modificação, preferencialmente em um de seus terminais (mostrados na Figura 1A como elipse preta) para ligar-se à fração de proteína, ou uma sequência, (denominado motivo de nucleotídeo do SCNA, ou sequência de nucleotídeo de ligação do domínio de ligação ou segmento ou sequência de reconhecimento do domínio de ligação, mostrados na Figura 1B, pente assinalado com seta), que podem se ligar ao domínio de ligação na fração de proteína. No exemplo não limitante apresentado nas Figuras 1A-B, a porção do SCNA determinadora de especificidade possui um único filamento. Em algumas modalidades, o SCNA pode formar segmentos/regiões com dois filamentos (por autoanelamento, por exemplo, formando estruturas em grampo). A especificidade do SCNA a uma sequência de ácido nucleico- alvo predeterminada é obtida através de uma extensão de ácidos nucleicos em em- parelhamento com base ou ácidos nucleicos modificados (emparelhamento de base do ácido nucleico-alvo, forma de pente), também denominada sequência variável, que pode incluir qualquer número de nucleotídeos, por exemplo, 3-200 nucleotídeos, e todos os seus intervalos. Por exemplo, o comprimento pode ser de 10-100 nucleotí- deos. Por exemplo, o comprimento pode ser de pelo menos 18 nucleotídeos. Sequências de espaçador opcionais (Sequência de espaçador, forma de pente), pode estar presente para otimizar as distâncias moleculares e os graus de liberdade necessários para reunir o domínio de ligação e um ácido nucleico-alvo. Em algumas modalidades, as sequências de espaçador podem apresentar comprimento de cerca de 0100 nucleotídeos. Por exemplo, o espaçador pode apresentar comprimento de cerca de 0-6 nucleotídeos. A ação ou efeito do domínio funcional da fração de proteína, que ocorre mediante a ligação ao domínio de ligação do SCNA e dimerização e sua consequente colocalização no ácido nucleico-alvo, é representada por um símbolo luminoso ("Ação/Efeito").

[0146] Neste momento fazemos referência às Figuras 2A-B, que são pranchas esquemáticas mostrando a montagem do complexo molecular programável, de acordo com algumas modalidades. As pranchas esquemáticas (fora de escala) das Figuras 2A-B demonstram o modo de montagem dos componentes do complexo molecular programável em um ácido nucleico-alvo. No exemplo mostrado nas Figuras 2A-B, dois monômeros de proteína se ligam a dois SCNAs diferentes, cada um deles tendo um determinante de especificidade diferente em sua região da sequência variável. Estes SCNAs emparelham com as bases e se ligam a sequências homólogas predefinidas em um ácido nucleico-alvo (assinalados nas Figuras como "ácido nucleico-alvo"). Este emparelhamento de base pode formar uma hélice dupla ou tripla com o ácido nucleico- alvo, dependendo se o alvo possui um ou dois filamentos (ilustrados nestas figuras como dsDNA). Ambos os SCNAs podem se ligar ao mesmo filamento ou a filamentos opostos conforme a necessidade, em uma distância otimizada. Os SCNAs podem se ligar ao Domínio de ligação da proteína através de uma modificação em seu terminal (Figura 2A) ou através de um motivo de nucleotídeo do SCNA (Figura 2B). Após a montagem, o domínio funcional provoca seu efeito sobre o sítio-alvo predeterminado (assinalado como "Sítio-alvo") no ácido nucleico-alvo.

[0147] Neste momento fazemos referência à Figura 3, que demonstra um exemplo em modelo tridimensional de um complexo molecular projetado para a clivagem de uma sequência-alvo de dsDNA nuclear predefinida, de acordo com algumas modalidades. Uma fração de proteína dimerizada programada é mostrada em associação a seu DsDNA-alvo (A, mostrado em parte). Cada monômero da fração de proteína é formado por um Domínio funcional derivado de uma subunidade da nuclease FokI (B); um domínio de localização celular derivado de SV40NLS (C); um Domínio de ligação derivado de um anticorpo de fragmento variável de cadeia simples anti- fluoresceína (ScFV anti-FAM, D) e um conector interdomínio (E). Cada Domínio de ligação (D) é mostrado ligado a um ácido nucleico propiciador de especificidade, SCNA ssDNA (F, mostrado em parte) através de sua molécula de Fluoresceína 6- carboxi modificadora (G), que é ligada covalentemente ao terminal de cada SCNA. Sítios de clivagem (sítio-alvo) esperados do dsDNA-alvo (mostrado como esferas no esqueleto de hélice) são assinalados com setas 300A-B. Cada SCNA é aqui representado de maneira a formar uma tripla hélice parcial que ocupa o sulco principal da sequência flanquedora do dsDNA alvo.

[0148] Neste momento fazemos referência às Figuras 4A-B, que são dese-nhos esquemáticos (fora de escala) do modo exemplificativo de montagem dos com-ponentes do complexo molecular programável em um ácido nucleico-alvo, de acordo com algumas modalidades. Como mostram os exemplos não limitantes apresentados nas Figuras 4A-B, dois monômeros da fração de proteína se ligam a dois SCNAs di-ferentes (SCNA1, SCNA2), cada um deles com um determinante de especificidade diferente na região da sequência variável. Como mostram as figuras, ambos os SCNAs residem em um único ácido nucleico e são conectados a uma sequência de sequência indeterminada ou comprimento que não emparelham com o Alvo, aqui de-nominado “conector de SCNA”. O conector de SCNA pode incluir qualquer sequência de nucleotídeos, de qualquer comprimento (X(n)). Em algumas modalidades, X(n) significa um comprimento indeterminado de nucleotídeos de RNA conectando entre si as duas regiões propiciadoras de especificidade. Em algumas modalidades, para o DNA linear, o comprimento ideal esperado (n) é de cerca de, por exemplo, entre 10-100 nucleotídeos. Por exemplo, o comprimento é de cerca de 35-73 nucleotídeos (nts). Por exemplo, o comprimento é superior a cerca de 70 nucleotídeos. Por exemplo, o comprimento é menor que cerca de 35 nucleotídeos. Estes SCNAs emparelham com as bases e se ligam às sequências homólogas predefinidas (correspondentes) no ácido nucleico-alvo. Este emparelhamento de base pode formar uma hélice dupla ou tripla com o ácido nucleico-alvo, dependendo se o alvo possui um ou dois filamentos (no exemplo ilustrado nas Figuras 4A-B, dsDNA). Em algumas modalidades, ambos os SCNAs podem se ligar ao mesmo filamento ou a filamentos opostos do ácido nu- cleico-alvo conforme a necessidade, em uma distância otimizada para alcançar um resultado desejado. Em algumas modalidades, somente um ácido nucleico contendo SCNA duplamente conectado é necessário para endereçar um sítio-alvo, flanqueando as duas extremidades do sítio-alvo. Em algumas modalidades, os SCNAs podem se ligar ao sítio de ligação do domínio de ligação (endentação no Domínio de ligação) da fração de proteína, via motivo de nucleotídeo do SCNAs em ambos os SCNAs (pentes assinalados no sítio de ligação do domínio de ligação, Figura 4A, ou através de uma modificação em ambos os terminais (elipses pretas no sítio de ligação do Domínio de ligação, Figura 4B). Após a montagem, o domínio funcional pode provocar seu efeito sobre o sítio-alvo no ácido nucleico-alvo.

[0149] De acordo com algumas modalidades, os métodos para entrega do SCNA ao organismo ou célula compreendem diversos métodos familiares aos indiví-duos versados na técnica e em geral são ideais para o tipo de organismo ou célula utilizado na circunstância relevante. Estes pode incluir a entrega do ácido nucleico com o uso de métodos biológicos de: infecção com vetores de replicação autônoma, transdução ou infecção de vírus transgênico, incluindo o uso de vírus descontruído ou parcial, inoculação, entrega de T-DNA de Agrobacterium, melhoramento, cruzamento, enxertia, transferência de organela, transferência de cromossoma, fusão celular; os métodos de absorção mediados por substâncias químicas de: utilizando agentes de transfecção, DEAE-Dextrano, Fosfato de cálcio, lipídeos artificiais, dendrímeros, polí-meros (PEG etc.), proteínas/peptídeos, partículas semelhantes a vírus; os métodos mecânicos de: bombardeamento, injeção/microinjeção, pressão, whiskers; e o método elétrico de eletroporação, e qualquer método que altere a membrana plasmática celu-lar, possibilitando que os ácidos nucleicos penetrem ativamente ou passivamente na célula.

[0150] De acordo com algumas modalidades, os métodos para entrega do ácido nucleico que codifica o módulo de proteína ao organismo ou célula compreen-dem inúmeros métodos familiares aos indivíduos versados na técnica e em geral são ideais para o tipo de organismo ou célula utilizado na circunstância relevante. Estes podem incluir a entrega do ácido nucleico através de cruzamento ou melhoramento de um organismo com um organismo transgênico portador do gene ou através de métodos biológicos de: infecção com vetores de replicação autônoma, transdução ou infecção de vírus transgênico, incluindo o uso de vírus descontruído ou parcial, inoculação, entrega de T-DNA de Agrobacterium, enxertia, transferência de organela, transferência de cromossoma, fusão celular; os métodos de absorção mediados por substância químicas de: uso de agentes de transfecção, DEAE-Dextrano, Fosfato de cálcio, lipídeos artificiais, dendrímeros, polímeros (PEG, etc.), proteínas/peptídeos, partículas semelhantes a vírus; os métodos mecânicos de: bombardeamento, injeção/mi- croinjeção, pressão, whiskers; e o método elétrico de eletroporação, e qualquer método que altere a membrana plasmática celular, possibilitando que os ácidos nucleicos penetrem ativamente ou passivamente na célula.

[0151] De acordo com algumas modalidades, os métodos para entrega de “DNA doador”, no subgrupo de usos demandantes de DNA que compreenda inserção de gene ou substituição de gene, compreendem métodos similares aos descritos para entrega do ácido nucleico codificador do módulo de proteína. Este DNA pode ser de um único filamento, de dois filamentos ou parcialmente dois filamentos, linear ou cir-cular. Este DNA pode ser fornecido em um único vetor ou em vários vetores, simulta-neamente ou separadamente do ácido nucleico que codifica o componente da prote-ína do complexo molecular e do ácido nucleico de programação propiciador de espe-cificidade. Desse modo, os ácidos nucleicos podem ser entregues a partir da escolha dos métodos de entrega apropriados já mencionados, a uma planta ou parte de uma planta, a uma planta, tecido ou órgão, como, um embrião, pólen, óvulo, antera, es-tigma, flor completa, cotilédone, folha, raiz, caule, pecíolo, a células vegetais isoladas, tais como, protoplastos, ou tecido, calo, ou células vegetais cultivadas, diferenciados ou não diferenciados. Em algumas modalidades, os ácidos nucleicos podem ser entregues a um fungo, inclusive fungos unicelulares e multicelulares, e a um membro do reino animal, inclusive invertebrados (como artrópodes e nematóides), vertebrados (como aves, peixes, mamíferos, répteis, e anfíbios) e a partes destes organismos que incluam órgãos, cultura de órgãos, tecidos, cultura de tecidos, células isoladas, culturas de célula, linhagens celulares e células-tronco, tais como, células-tronco embrionárias humanas ou células-tronco hematopoiéticas humanas.

[0152] Neste momento fazemos referência à Figura 5 que mostra uma ilustra-ção esquemática demonstrando as opções de entrega do complexo molecular programável a uma célula utilizando SCNAs produzidos in vitro, de acordo com algumas modalidades. Apresenta-se um esquema geral para a seleção de um método de entrega apropriado. Uma molécula de ácido nucleico codificadora da fração de proteína é selecionada entre a coluna da esquerda e é entregue através de métodos aplicáveis selecionados entre as duas colunas seguintes. Um SCNA sintético é fornecido através de métodos selecionados entre os métodos mostrados nas duas colunas da direita. Dentro da célula-alvo, um ácido nucleico codificadora da proteína ocasiona a expressão da proteína por meio de sua tradução in vivo a partir de uma molécula de RNA molde. Se a molécula de ácido nucleico entregue for formada por dsDNA, pode pri-meiramente transcrever-se em RNA (por meio de um promotor designado). Se a mo-lécula de ácido nucleico entregue for formada por ssDNA pode primeiramente sofrer complementação do dsDNA e em seguida transcrita. Se a molécula de ácido nucleico entregue for formada por RNA, tal como, um codificador de vírus ou outro vetor de replicação autônoma, ela pode prosseguir através de replicação por meio de um filamento minus antes de ser traduzida. A proteína traduzida pode ser então localizada no subcompartimento celular desejado, de acordo com seu sinal de localização (se presente). Os SCNAs podem ser entregues concomitantemente ou separadamente da molécula de ácido nucleico codificadora da fração de proteína usando um método de entrega igual ou diferente. Uma vez que o SCNA, a fração de proteína e o ácido nucleico-alvo estejam colocalizados dentro da célula, eles podem se reunir para formar um complexo dimérico molecular ativo. O DNA Doador, se necessário, também pode ser entregue separadamente ou simultaneamente.

[0153] Neste momento fazemos referência à Figura 6, que é um esquema ge-ral demonstrando a entrega do complexo molecular programável a uma célula utili-zando um SCNA produzido in vivo, de acordo com algumas modalidades. Uma molé-cula de ácido nucleico que codifica a fração de proteína é selecionada entre a coluna da esquerda e entregue utilizando métodos aplicáveis selecionados entre as três colunas seguintes. Os SCNAs produzidos in vivo são codificados por uma molécula de ácido nucleico fornecida para esse fim e introduzidos na célula usando estes mesmos métodos. As moléculas de ácido nucleico codificadoras da fração de proteína e/ou o SCNA podem ser entregues separadamente ou concomitantemente. Na célula, o ácido nucleico que codifica o SCNA expressa o SCNA por meio de transcrição ou clivagem do ácido nucleico. Se a molécula de ácido nucleico entregue for formada por dsDNA, primeiramente pode ser transcrita em RNA através de um promotor designado. Se a molécula de ácido nucleico entregue for formada por ssDNA, primeiramente pode ser complementada por dsDNA e em seguida transcrita. Se a molécula de ácido nucleico entregue for formada por RNA, como, um codifica dor de vírus ou outro vetor de replicação autônoma, pode prosseguir através de replicação por meio de um filamento minus. Dentro da célula, o ácido nucleico que codifica a proteína é expresso através de sua tradução in vivo a partir de uma molécula de RNA produzida de maneira semelhante à descrita para o SCNA. A proteína traduzida pode ser então localizada no subcompartimento celular desejado, de acordo com seu sinal de localização (se presente). As moléculas de ácido nucleico codificadoras da fração de proteína e/ou as moléculas de ácido nucleico codificador dos SCNAs podem ser entregues concomitantemente (ao mesmo tempo) ou separadamente, usando méto-dos de entrega idênticos ou diferentes. Uma vez que o SCNA, fração de proteína e o ácido nucleico-Alvo estejam colocalizados dentro da célula, eles podem se reunir para formar um complexo dimérico molecular ativo. O DNA Doador, se necessário, também pode ser entregue separadamente ou simultaneamente.

[0154] De acordo com algumas modalidades, a síntese biológica in vivo do SCNA pode ser realizada através de diversas rotas, tais como, mas não se limitando a: (a) o uso de Agrobacterium para sintetizar o ácido nucleico e a fração de ligação do Domínio de ligação, neste exemplo, VirD2, que também catalisa sua ligação cova-lente. O Agrobacterium então facilita a transferência a uma célula de um ssDNA ligado covalentemente a VirD2, (b) o uso de Agrobacterium para transferir um T-DNA a uma célula, o dito T-DNA compreendendo promotores que orientam a síntese na célula dos SCNAs de RNA que têm um domínio de RNA que se liga ao domínio de ligação do complexo quando convergem. Desse modo, o complexo, expresso na célula-alvo, é montado através de uma interação RNA-proteína, (c) o uso de vetores de replicação autônoma compreendendo vírus e vetores de expressão à base de vírus para entregar um réplicon a uma célula, o dito réplicon compreendendo promotores subgenômicos que orientam a síntese dos SCNAs de RNA que tem um domínio de RNA que se liga ao domínio de ligação do complexo, quando convergem. Desse modo, o complexo, expresso na célula-alvo, é montado através de uma interação RNA-proteína.

[0155] Neste momento fazemos referência às Figuras 7A-B que são desenhos esquemáticos (fora de escala) mostrando exemplos não limitantes da entrega do SCNA a uma célula utilizando um DNA de um único filamento produzido em Agrobacterium. A Figura 7A mostra um exemplo não limitante do uso de Agrobacterium para a produção de SCNA ssDNA ligado a uma proteína, VirD2, in vivo, em sua extremidade 5’. Como mostra este exemplo, a sequência SCNA variável de endereçamento é inserida em um sítio de clonagem múltipla (MCS) em um plasmídeo capaz de se replicar em Agrobacterium. A Agrobacterium é então transformada com este plasmí- deo. A sequência da Borda Direita (RB) do plasmídeo Ti no plasmídeo é clivada e o ssDNA é ligado por VirD2 a bactéria. 3 nucleotídeos da sequência RB são deixados na posição 5’ da sequência após a clivagem, e 21 nucleotídeos da sequência da Borda Direita (RB) do plasmídeo Ti são deixados após a clivagem na posição 3’ da sequência. A sequência LB pode auxiliar ainda na estabilização do SCNA e na avaliação de eventos de integração indesejados. A forma mutada de Agrobacterium, (por exemplo, carentes de VirE1 ou VirE2 ou com funcionalidade VirD2 parcial) são úteis na inibição de eventos de integração indesejados. A Agrobacterium então exporta o T-DNA compreendendo o SCNA ligado a VirD2 para a célula. A Figura 7B mostra um exemplo não limitante do uso de um sistema de secreção bacteriano para a entrega de SCNAs a uma célula hospedeira. Uma ou múltiplas Agrobacterium transformadas com diferentes T-DNAs codificadores de diferentes sequências de SCNA são utilizadas para infectar uma célula. O SCNA do ssDNA ligado a VirD2 criado desta maneira nas bactérias e exportado para a célula hospedeira pode encontrar e se ligar ao domínio de ligação da fração de proteína através de uma interação entre a proteína VirD2 e o domínio de ligação VirD2 no Domínio de ligação na célula hospedeira. Um exemplo desse domínio de ligação VirD2 compreende um fragmento variável de cadeia única artificial de um anticorpo (scFv) produzido contra VirD2. Desse modo, o SCNA pode ocasionar a montagem do complexo molecular em um ácido nucleico-Alvo.

[0156] Neste momento fazemos referência às Figuras 8A-B, que são ilustra-ções esquemáticas demonstrando a entrega do SCNA a uma célula utilizando SCNAs de RNA produzidos dentro da célula hospedeira, a partir de um T-DNA entregue por Agrobacterium (Figura 8A) ou a partir de um ácido nucleico entregue por um vetor de replicação autônoma, como, um vírus, por exemplo (Figura 8B). Os SCNAs de RNA apresentados nestas figuras incluem um motivo SCNA-RNA (pentes assinalados) que podem se ligar a um motivo de ligação de RNA correspondente do domínio de ligação da fração de proteína. Como mostra a Figura 8A, as sequências de SCNA são inseridas em um sítio de clonagem múltipla (MCS) em um plasmídeo capaz de replicar em Agrobacterium e contendo os promotores eucarióticos apropriados para a transcrição de um ou múltiplos SCNAs de RNA na célula infectada. Figura 8B: A(s) sequência(s) de SCNA é/são inserida(s) no genoma de um vírus ou um de vetor de replicação autônoma derivado de um vírus, cada um deles sob o controle de um promotor subge- nômico (sg) para a transcrição de um ou múltiplos SCNAs de RNA na célula infectada. Nos exemplos não limitantes mostrados nas Figuras 8A-B, a molécula de ácido nu- cleico codificadora para a codificação da fração da proteína pode ser entregue antecipadamente à célula-alvo, junto com (concomitantemente) ou após a entrega do SCNA codificador da molécula de ácido nucleico. Quando a fração de proteína e o SCNA são expressos na célula, ocorre a montagem do complexo molecular no ácido nucleico-alvo.

[0157] Neste momento fazemos referência à Figura 9, que mostra uma ilus-tração esquemática (fora de escala) de um exemplo não limitante de um vetor ou ve-ículo de entrega para a entrega concomitante da composição compreendendo os componentes necessários para a montagem de um complexo molecular programável em uma célula eucariótica-alvo suscetível em um único evento de entrega, de acordo com algumas modalidades. Para o exemplo não limitante mostrado na Figura 9, a ação desejada é a substituição de uma extensão do DNA genômico (o ácido nucleico-alvo), por uma sequência predeterminada, o "cassete Doador". Por conseguinte, os domínios da fração de proteína incluem: um Domínio funcional, derivado de uma nuclease e dotada de atividade de clivagem nucleica; um domínio de localização celular, que é um sinal de localização nuclear (NLS); e Domínio de ligação capaz de reconhecer e ligar-se a um motivo de RNA nos SCNAs. No exemplo mostrado na Figura 9, utiliza- se um sistema de entrega biológica. O Agrobacterium é transformado com um vetor de plasmídeo, tais como, plasmídeo (800), que contém várias sequências funcio- nais/estruturais, tais como, marcador selecionável bacteriano, várias origens dos sítios de replicação (origem de E. Coli-, pSa Ori), sequência LB, regiões promotoras (designadas como (P)), a sequência que expressa a fração de proteína (compreendendo um códon inicial ATG e um códon de PARADA dentro do quadro), sítio Terminador (T), múltiplos cassetes de transcrição de SCNA (mostrados como quatro cassetes de transcrição de SCNA, cada compreendendo um promotor e sequências terminadoras), um cassete Doador, e sítio de RB. O vetor de plasmídeo (Agrobacterium transfectado) é então colocado em contato com as células do organismo-alvo. Em seguida Agrobacterium forma um T-DNA partindo da região entre as sequências da Borda Direita (RB) e Borda Esquerda (LB) e secreta o mesmo na célula eucariótica. O ssDNA do T-DNA é entregue ao núcleo, complementado in vivo passando a dsDNA, e transcrito em RNA por promotores compatíveis (P) que estão no plasmídeo. O transcrito assim formado da fração de proteína é traduzido para formar a proteína designada. Transcritos originários do cassete de SCNA que compreendem uma sequência de motivo de RNA são ligados por um domínio de ligação da sequência de RNA específica na fração de proteína. O cassete Doador contém uma sequência suficientemente longa que pode re- combinar-se com o ácido nucleico-alvo na presença de uma quebra do filamento duplo (DSB) formada nas adjacências do sítio de recombinação. Os SCNAs são projetados para endereçar e hibridizar sequências flanqueando a sequência a ser substituída. Em algumas modalidades, um plasmídeo similar, sequências sem bordas, ou um DNA linear de construção similar, podem ser também utilizados para transfectar células em um sistema de entrega não biológica, para o mesmo efeito.

[0158] De acordo com algumas modalidades, e como detalhado acima, alte- rações/modificações na sequência endereçada incluem, por exemplo, mas não se li-mitando a: deleção permanente, mutação, inserção de ácidos nucleicos, e substituição de uma sequência endereçada por outra sequência de ácido nucleico, knock-out, deslocamento do quadro de leitura, ou qualquer alteração da transcrição ou tradução de um gene, de suas sequências reguladoras, dos genes reguladores do gene de interesse ou de suas sequências reguladoras em um cadeia reguladora de eventos.

[0159] Neste momento fazemos referência à Figura 10, que é uma ilustração esquemática (fora de escala) demonstrando o uso de um complexo molecular progra-mado para criar uma mutação em um ácido nucleico-alvo, de acordo com algumas modalidades. Como mostra o exemplo não limitante apresentado na Figura 10, o do-mínio funcional da fração de proteína é derivado de uma nuclease, e a mutação do sítio-alvo no ácido nucleico-alvo é obtida através da criação de uma quebra do dsDNA (DSB) no ácido nucleico-Alvo em um local predefinido. Os complexos moleculares programados de SCNA unem-se entre si através do emparelhamento de base do SCNA com uma sequência-alvo correspondente no ácido nucleico-alvo. Após a montagem dos componentes do complexo, o domínio funcional é dimerizado e a nuclease é ativada, clivando o sítio-alvo, que está localizado, neste exemplo, no ou próximo ao ponto médio, entre as duas moléculas de SCNA, criando assim uma DSB (por exemplo, a DSB pode ter saliências 5’ (overhang) do nucleotídeo 4, como as criadas pela enzima de restrição FokI). Mecanismos de reparo celular por recombinação não homóloga (NHEJ) tentam reparar a DSB e nessa tentativa podem: 1) fazer uma ligação perfeita enquanto o complexo pode continuar clivando novamente a mesma sequência por diversas vezes na mutação até a depleção dos componentes do complexo, 2) adicionar um ou múltiplos nucleotídeos ampliando desse modo a distância entre os SCNAs e eliminando dimerização do domínio funcional, encerrando com isso a ação do complexo, ou 3) remover um ou múltiplos nucleotídeos (figura “pacman”), desse modo reduzindo a distância entre os SCNAs e eliminando a dimerização do domínio funcional, encerrando com isso a ação do complexo. Quando qualquer uma das op-ções 2 ou 3 ocorre no interior da célula, consegue-se uma mutação.

[0160] Neste momento fazemos referência à Figura 11, que é uma ilustração esquemática (fora de escala) demonstrando o uso de um complexo molecular progra-mado para inserir um ou múltiplos nucleotídeos em um ácido nucleico-alvo utilizando um ácido nucleico Doador fornecido, de acordo com algumas modalidades. Como mostra o exemplo não limitante apresentado na Figura 11, o domínio funcional da fração de proteína é derivado de uma nuclease, e uma quebra do dsDNA (DSB) no ácido nucleico-alvo em um local predefinido (sítio-alvo) auxilia o processo de recom- binação homóloga (HR). Os complexos moleculares programados de SCNA se reúnem autonomamente pelo emparelhamento de base do SCNA com uma sequência- alvo correspondente. Após a montagem dos componentes do complexo, o domínio funcional é dimerizado e a nuclease é ativada, clivando desta maneira o ácido nu- cleico-alvo no sítio-alvo, que pode estar localizado, por exemplo, no ou próximo ao ponto médio entre as duas moléculas de SCNA, criando assim uma DSB. O DNA Doador contém a sequência a ser inserida e extensões suficientemente longas de nucleotídeos, flanqueando esta sequência que são essencialmente idênticos à Sequência-alvo flanqueando o ponto DSB pretendido. Estas sequências flanqueadoras podem então se recombinar (X) com o ácido nucleico-alvo através do processo celular de HR, substituindo então uma extensão predeterminada de nucleotídeos no ácido nucleico-Alvo, e de fato ocasionando a Inserção da sequência desejada. Com a re- combinação e Inserção da sequência Doadora predeterminada, a distância entre os SCNAs é ampliada, interferindo na dimerização do domínio funcional, e assim encer-rando a ação do complexo. Nas ocasiões em que ocorre a religação perfeita por NHEJ, o complexo programado ativado pode tentar diversas vezes clivar novamente a mesma sequência na inserção.

[0161] Neste momento fazemos referência à Figura 12, que é uma ilustração esquemática (fora de escala) demonstrando o uso de um complexo molecular progra-mado na substituição, inserção e/ou deleção de um ou múltiplos nucleotídeos em um ácido nucleico-Alvo utilizando um ácido nucleico Doador fornecido, de acordo com algumas modalidades. Como mostra o exemplo não limitante apresentado na Figura 12, o domínio funcional da fração de proteína é derivado de uma nuclease, e uma quebra do dsDNA (DSB) no ácido nucleico-Alvo em um local predefinido (sítio-alvo) auxilia o processo de recombinação homóloga (HR). Os complexos moleculares pro-gramados de SCNA se reúnem autonomamente pelo emparelhamento de base do SCNA com uma sequência predeterminada-alvo. Após a montagem dos componentes do complexo, o domínio funcional é dimerizado e a nuclease é ativada, clivando o ácido nucleico-alvo no sítio-alvo, que pode estar localizado, por exemplo, no ou próximo ao ponto médio entre as duas moléculas de SCNA, criando assim uma DSB. O DNA Doador contém a sequência exógena a ser inserida no lugar da sequência-alvo endógena que será removida, bem como extensões suficientemente longas de nucle- otídeo flanqueando esta sequência exógena, que são essencialmente idênticas à sequência-alvo flanqueando a sequência que se pretende remover. Estas sequências flanqueadoras podem então se recombinar (X) com o DNA-Alvo através do processo celular de HR, substituindo assim uma extensão do DNA no DNA-Alvo e de fato ocasionar a substituição de uma sequência endógena indesejada por uma sequência exógena desejada. Após a recombinação e substituição bem sucedida da sequência exógena desejada, é possível projetar a eliminação dos sítios de ligação do SCNA no ácido nucleico-alvo, encerrando assim a ação do complexo. Nas ocasiões em que ocorre a religação perfeita por NHEJ, o complexo pode tentar diversas vezes clivar novamente a mesma sequência na recombinação.

[0162] Neste momento fazemos referência à Figura 13, que é uma ilustração esquemática (fora de escala) demonstrando o uso de um complexo molecular progra-mado para criar a deleção de um ou de múltiplos nucleotídeos consecutivos oriundos de um ácido nucleico-alvo, de acordo com algumas modalidades. Como mostra o exemplo não limitante apresentado na Figura 13, o domínio funcional da fração de proteína é derivado de uma nuclease, e a deleção é alcançada através da criação de duas quebras do dsDNA (DSBs) no ácido nucleico-Alvo em dois locais predefinidos. Os complexos moleculares programados de SCNA se reúnem autonomamente pelo emparelhamento de base de SCNA com sequências-alvo correspondentes. Após a montagem dos componentes do complexo, os domínios funcionais são dimerizados e as nucleases são ativadas, clivando o ácido nucleico-alvo no sítio-alvo, que pode estar localizado no ou próximo ao ponto médio entre cada par de moléculas de SCNA criando DSBs. A clivagem simultânea ou sequencial de ambos os sítios essencialmente elimina, ou exclui, a sequência intermediária. Mecanismos de reparo celular por re- combinação não homóloga (NHEJ) tentam reparar a DSB e nessa tentativa podem: 1) realizar uma ligação perfeita do DNA-alvo flanqueando a sequência excluída, enquanto o complexo ativado pode continuar clivando a mesma sequência até a deple- ção dos componentes do complexo (painel da esquerda); 2) realizar uma religação perfeita de cada DSB separado - enquanto o complexo pode continuar clivando a mesma sequência diversas vezes na deleção até a depleção dos componentes do complexo; 3) remover um ou múltiplos nucleotídeos (figura “pacman”, painel à direita) no gap de DSB, estreitando desse modo a distância entre os SCNAs e eliminando a Dimerização do domínio funcional, encerrando assim a ação do complexo; ou 4) adicionar um ou múltiplos nucleotídeos no gap de DSB ampliando desse modo a distância entre os SCNAs e eliminando a Dimerização do domínio funcional, encerrando com isso a ação do complexo.

[0163] Neste momento fazemos referência à Figura 14, que é uma ilustração esquemática demonstrando o uso de um complexo molecular programado para subs-tituir um ou múltiplos nucleotídeos em um ácido nucleico-Alvo utilizando um ácido nu- cleico Doador fornecido, de acordo com algumas modalidades. Como mostra o exemplo não limitante apresentado na Figura 13, o domínio funcional da fração de proteína é derivado de uma nuclease, e a substituição é obtida através da criação de duas quebras do dsDNA (DSBs) no ácido nucleico-Alvo em dois locais predefinidos (sítio- alvos), criando uma deleção, e fornecendo um DNA Doador linear ou linearizado para preencher o espaço. Os complexos moleculares programados de SCNA se reúnem autonomamente pelo emparelhamento de base do SCNA com as sequências-alvo correspondentes. Após a montagem dos componentes do complexo, os domínios funcionais são dimerizados e as nucleases são ativadas, clivando o alvo no ou próximo ao ponto médio entre cada par de moléculas de SCNA, criando assim as DSBs. A clivagem simultânea ou sequencial dos dois sítios essencialmente elimina, ou exclui, a sequência região intermediária. Mecanismos de reparo celular por recombinação não homóloga (NHEJ) tentam reparar a DSB e nessa tentativa podem: 1) realizar um par de ligações perfeitas do Doador no Alvo eliminando a dimerização do domínio funcional, encerrando com isso a ação do complexo; 2) realizar uma ligação perfeita da sequência de ácido nucleico-alvo flanqueando a sequência excluída - enquanto o complexo pode tentar diversas vezes clivar a mesma sequência na substituição até a depleção dos componentes do complexo; 3) realizar uma religação perfeita de cada DSB separada, enquanto o complexo pode tentar diversas vezes reclivar a mesma sequência na substituição até a depleção dos componentes do complexo; 4) remover um ou múltiplos nucleotídeos em um gap da DSB, estreitando desse modo a distância entre os SCNAs e eliminando a dimerização do domínio funcional, encerrando com isso a ação do complexo; ou 5) adicionar um ou múltiplos nucleotídeos em um gap de DSB ampliando desse modo a distância entre os SCNAs e eliminando a dimerização do domínio funcional, encerrando com isso a ação do complexo.

Doenças Genéticas

[0164] De acordo com certas modalidades, as composições e métodos da pre-sente invenção podem ser utilizados para substituir qualquer sequência genômica por uma sequência homóloga, não idêntica. Por exemplo, uma sequência genômica mutante pode ser substituída por sua contraparte do tipo selvagem, fornecendo assim métodos para o tratamento, por exemplo, de doença genética, disfunções hereditárias, câncer, e doenças autoimunes. Do mesmo modo, um alelo de um gene pode ser substituído por um alelo diferente utilizando os métodos aqui revelados. Exemplos de doenças genéticas incluem, mas não se limitam a, acondroplasia, acromatopsia, deficiência da maltase ácida, imunodeficiências adquiridas, deficiência da adenosina desa- minase (OMIM No. 102700), adrenoleucodistrofia, síndrome de aicardi, deficiência de alfa-I antitripsina, talassemia alfa, síndrome da insensibilidade nas zonas erógenas, síndrome de apert, Displasia arritmogênica do ventrículo direito, ataxia telangiectasia, síndrome de barth, talassemia beta, síndrome de nevus azul (blue rubber bleb nevus), doença de canavan, doenças granulomatosas crônicas (CGD), síndrome do miado do gado, fibrose cística, doença de dercum, displasia ectodérmica, anemia de Fanconi, fibrodisplasia ossificante progressiva, síndrome do X frágil, galactosemia, doença de Gaucher, gangliosidose generalizada (por exemplo, GM1), hemocromatose, hemoglo- binopatias (por exemplo, anemia de célula falciforme, a mutação da hemoglobina C no 6.sup.th códon do beta-globin, talassemia alfa, talassemia beta), hemofilia, doença de Huntington, síndrome de Hurler, hipofosfatasia, síndrome de Klinefleter, doença de Krabbes, síndrome de Langer-Giedion, deficiência de adesão leucocitária (LAD, OMIM No. 116920), leucodistrofia, síndrome do QT longo, doenças de depósito lisossômico (por exemplo, doença de Gaucher, GM1, doença de Fabry e doença de Tay-Sachs), síndrome de Marfan, síndrome de Moebius, mucopolissacaridose (por exemplo, doença de Hunter, doença de Hurler), síndrome unha-patela, diabetes insípida nefro- gênica, neurofibromatose, doença de Neimann-Pick, osteogênese imperfeita, porfiria, síndrome de Prader-Willi, progeria, síndrome de Proteus, retinoblastoma, síndrome de Rett, síndrome de Rubinstein-Taybi, síndrome de Sanfilippo, imunodeficiência combinada severa (SCID), síndrome de Shwachman, doença de célula falciforme (anemia de célula falciforme), síndrome de Smith-Magenis, síndrome de Stickler, doença de Tay-Sachs, síndrome da trombocitopenia com ausência de rádio (TAR), síndrome de Treacher Collins, trissomia, esclerose tuberosa, síndrome de Turner, distúrbios do ciclo da ureia, doença de von Hippel-Landau, síndrome de Waardenburg, síndrome de Williams, doença de Wilson, síndrome de Wiskott-Aldrich, síndrome linfoproliferativa ligada ao cromossoma X (XLP, OMIM No. 308240).

[0165] Os exemplos a seguir são apresentados com a finalidade de ilustrar mais profundamente algumas modalidades da invenção. No entanto, não devem ser interpretados de forma alguma como uma limitação ao escopo abrangente da inven-ção.

EXEMPLOS EXEMPLO 1 - Sistema in vivo como bioensaio de ajustes dos componentes do complexo molecular:

[0166] Este exemplo descreve um bioensaio adequado para testar e otimizar as permutações no desenho e uso do complexo molecular programável, por exemplo, para testar sua atividade em diferentes organismos ou células, diferentes métodos de entrega, e testar as funções de edição de mutação, substituição, deleção e inserção.

[0167] Os experimentos mostrados nos exemplos abaixo servem para detec-tar o endereçamento de gene e a clivagem específica por uma composição do com-plexo molecular programável, o que inclui uma nuclease modificada como o domínio efetor da fração de proteína.

[0168] Sistemas repórteres visuais são utilizados com base no reparo de um códon de PARADA que é inserido na sequência codificadora repórter. O repórter nestes exemplos é a proteína verde fluorescente (GFP). Quando endereçado, quebras do filamento duplo (DSB) formadas pelo complexo ativado são reparadas, (presumivelmente através de NHEJ como ilustrado na Figura 10), eliminando o códon de PARADA e recuperando a atividade de GFP. Deste modo, este ensaio pode indicar satisfatoriamente a eficiência do endereçamento de gene. Este ensaio também é conhecido como ensaio “STOP GFP”.

[0169] Este ensaio visual é projetado para endereçar o plasmídeo ou DNA genômico in vivo. Nos exemplos adiante, um bioensaio baseado em protoplasto de Arabidopsis é utilizado. No bioensaio descrito, os sistemas repórteres mencionados são entregues aos protoplastos em um plasmídeo, coentregues com o plasmídeo que expressa a fração de proteína do complexo molecular in vivo e coentregues com um par de Ácidos Nucleicos Propiciadores de Especificidade ao ssDNA (SCNA) modifi-cado, neste exemplo, com um terminal (NHS-Éster-)-Digoxigenina (DIG). Uma se-gunda modificação para a proteção da exonuclease, (fosforotioato), é adicionada no terminal oposto (aqui assinalada com um asterisco). Os vetores de plasmídeo aqui utilizados compreendem promotores de planta. Sequência de proteína e propriedades

[0170] O complexo molecular projetado para esta aplicação é formado por duas sequências de ácidos nucleicos homólogos para determinação de especificidade (SCNAs) e um componente quimérico da proteína contendo uma nuclease que se liga aos SCNAs in vivo. A clivagem resultante do sítio-alvo predeterminado (códon de PARADA) do ácido nucleico-alvo (sequência codificadora GFP) resulta em sua mutação desejada, através de processos endógenos. O complexo molecular programável neste exemplo consiste de 2 monômeros idênticos de uma fração de proteína e duas moléculas diferentes de SCNA (como ilustram esquematicamente as Figuras 1A e 2A). Neste exemplo, a fração de proteína contém uma sequência de aminoácido modificada a partir de um domínio da nuclease FokI como domínio funcional; uma sequência de aminoácido adaptada a partir da imunoglobulina de fragmento variável de cadeia simples (scFv) anti-DIG (Digoxigenina) (DIG-ScFv) similar ao que descreve (Huston et. al, 1988) como Domínio de ligação; um SV40NLS (N° ID SEQ: 3, PKKKRKV) como domínio de localização nuclear e um conector interdomínio ~15A (N° ID SEQ:7, GGSGG). A sequência de ácido nucleico codificadora da fração de proteína é inserida em vetores de expressão adequados (vetores baseados em pUC (pSAT)), inclusive um promotor NOS ou 35S.

[0171] A ligação in vivo entre o ácido nucleico propiciador de especificidade e o domínio de ligação da fração de proteína, neste exemplo, é o resultado de uma interação não covalente que pode ser descrita como uma interação antígeno-anti- corpo; antígeno-anticorpo de cadeia simples; anticorpo ou interação hapteno- anti-corpo de cadeia simples.

[0172] Neste exemplo, a modificação na extremidade do ácido nucleico do SCNA é uma Digoxigenina ligada a NHS-Éster (DIG) que é anexada à posição 5’ ou 3’ do oligonucleotídeo do SCNA.

[0173] A sequência de aminoácido (código de uma letra) da fração de proteína do complexo molecular (sequência da nuclease NLS-FokI com ScFv da Digoxigenina) foi projetada como no N° ID SEQ: 12, e é codificada pela sequência conforme descrito no N° ID SEQ: 13. Propriedades SCNA e sequência

[0174] O comprimento do SCNA do oligonucleotídeo de emparelhamento de base-alvo complementar, de preferência, apresenta pelo menos 18 bases. O SCNA pode conter ainda um número pequeno (por exemplo, 1-6, em um exemplo, 6, em outro exemplo, 2) de nucleotídeos de emparelhamento de base não endereçados (N's) de qualquer composição de sequência que sirva de espaçador entre o modificador do terminal DIG-NHS e os nucleotídeos complementares-alvo. Como detalhado acima, como histonas ocupam sulcos menos significantes do DNA no DNA cromossômico, podem existir algumas restrições no espaçamento do SCNA. Desse modo, os SCNAs são preferencialmente projetados para encaixar no sulco principal do DNA-alvo mo-dulando-se a distância entre os SCNAs, para possibilitar uma orientação da hélice- alvo que permita a ligação dos Domínios de ligação de um complexo molecular pro-gramável dimerizado. A escolha do conector interdomínio entre o domínio funcional globular e o domínio de ligação (no exemplo aqui mostrado é GSLEGGSGG (N° ID SEQ: 14)) também influencia a distância do SCNA ideal, pois restringe o permite o movimento na “dobradiça” entre estes dois domínios. A adição de nucleotídeos de emparelhamento de base não endereçados (“N’s”) altera a distância entre os SCNAs e o sentido da rotação na hélice-alvo, uma vez que altera a flexibilidade do SCNA em relação à proteína e à hélice. Estes nucleotídeos não emparelhados não estão restri-tos ao sulco principal do DNA-alvo.

[0175] Os resultados de medições espaciais obtidas com modelos tridimensi-onais computadorizados para o sistema anti-DIG-ScFv- NHS-Éster-DIG com o linker do interdomínio GSLEGGSGG (N° ID SEQ: 14), como é mostrado neste exemplo, demonstrou que a distância ideal esperada entre SCNAs, na presença de 2 N’s no SCNA, corresponde a cerca de 23-26 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à esquerda e à direita do 11o, 12o ou 13o nucleotídeo, con-tando-se a partir do último nucleotídeo que hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto dimerizado. Este critério sugere que, se a sequência endereçada for, para este exemplo com 24 nucleotídeos:

[0176] AAAAAAAAAAYYYYYYYYYXXXXXXYYYYYYYYYCCCCCCCCCC, onde Y+X representa o número de nucleotídeos entre os sítios de emparelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultante na DSB está na ou adjacente à área X. Os SCNAs podem ser complementares aos filamentos sentido e antissentido, entretanto, são escolhidos para que o emparelhamento preferencial ocorra com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima” (conforme ilustrado na Figura 2A). DA otimização da distância entre SCNAs, bem como o filamento preferencial, são um dos diversos critérios testados neste bioensaio.

[0177] O ácido nucleico-Alvo (sequência codificadora GFP), contendo um sí-tio-alvo (códon de PARADA, (TAG)) inclui a sequência de nucleotídeo descrita no N° ID SEQ: 15 ("STOP-GFP"), onde o códon de parada TAG está localizado no nucleotí- deo 878:

[0178] O doador mCherry para os exemplos 1B e 1C inclui uma sequência codificadora sem promotor e sem terminador, descrita no N° ID SEQ: 16:

[0179] A sequência do sítio-alvo a seguir é endereçada nos exemplos 1A a 1C: Exemplos 1A-C “primeira sequência-alvo”:

[0180] GTCGACAACTAGTCCAGATCT (N° ID SEQ: 17) Sequências de SCNA

[0181] Os símbolos de modificação são: Ligações de fosforotioato = *; 5’ DIG= /5DigN/ ; 3’DIG= /3DigN/).

[0182] Combinações de SCNA emparelhados testadas para o “primeiro alvo” 1A-1C: SCNA Sentido:

[0183] GFP_918_SR1: /5DigN/NNNNNNGTGTCCAAGGGCGAGGAGCTG*T; (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 18)

[0184] GFP_896 _SL1: T*TTACGAACGATAGCCATGGCCNNNNNN/3DigN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 19)

[0185] Uma segunda combinação emparelhada sentido, empregando um gap- alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:

[0186] GFP_920_SR1: /5DigN/NNGTCCAAGGGCGAGGAGCTGTT*C (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 20)

[0187] GFP_895_SL1: A*TTTACGAACGATAGCCATGGCNN/3DigN/(os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 21) SCNA antissentido:

[0188] GFP_918 _ASR1: C*AGCTCCTCGCCCTTGGAGACNNNNNN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 22)

[0189] GFP_896_ASL1: /5DIGN/NNNNNNGGCCATGGCTATCGTTCGTA*A (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 23)

[0190] Uma segunda combinação emparelhada antissentido, empregando um gap-alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:

[0191] GFP_920 _ASR1:G*AACAGCTCCTCGCCCTTGGACNN/3DIGN/( os ácidos nucleicos são aqui designados somente como N° ID SEQ: 24)

[0192] GFP_895_ASL1: /5DIGN/NNGCCATGGCTATCGTTCGTAAA*T (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 25) Combinações de pares sentido e antissentido:

[0193] GFP_918_SR1: /5DigN/NNNNNNGTGTCCAAGGGCGAGGAGCTG*T (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 18)

[0194] GFP_896_ASL1: /5DIGN/NNNNNNGGCCATGGCTATCGTTCGTA*A (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 23)

[0195] Uma segunda combinação emparelhada antissentido, empregando um gap-alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:

[0196] GFP_920_SR1: /5DigN/NNGTCCAAGGGCGAGGAGCTGTT*C /(os ácidos nucleicos são aqui designados somente como N° ID SEQ: 20)

[0197] GFP_895_ASL1: /5DIGN/NNGCCATGGCTATCGTTCGTAAA*T (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 25)

[0198] GFP_918 _ASR1: C*AGCTCCTCGCCCTTGGAGACNNNNNN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 22)

[0199] GFP_896 _SL1: T*TTACGAACGATAGCCATGGCCNNNNNN/3DigN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 19)

[0200] Uma segunda combinação emparelhada antissentido, empregando um gap-alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:

[0201] GFP_920_SL1: A*TTTACGAACGATAGCCATGGCNN/3DigN/ (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 21)

[0202] GFP_895 ASR1: G*AACAGCTCCTCGCCCTTGGACNN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 24)

[0203] “Primeiro alvo” por exemplo, 1C é idêntico ao alvo 1A e 1B.

[0204] “Segundo alvo” por exemplo, 1C: GACTCTAAGCTTGGGTCTAGA (N° ID SEQ: 26)

[0205] SCNAs para o exemplo 1C:

[0206] Uma combinação, utilizando um gap-alvo de 24bp e um linker de SCNA curto: Sentido:

[0207] GFP_1658_SR: /5DIGN/NNTCCGCAAAAATCACCAGTCTC*T (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 27)

[0208] GFP_1633_SL: G*CATGGACGAGCTGTACAAGTCNN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 28) Antissentido:

[0209] GFP_1658_ASR: A*GAGACTGGTGATTTTTGCGGANN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 29)

[0210] GFP_1633_ASL: /5DIGN/NNGACTTGTACAGCTCGTCCATG*C (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 30)

[0211] Assim como nos SCNAs do “primeiro alvo” 1A-C, estes quatro SCNAs do “segundo alvo” do exemplo 1C podem ser emparelhados utilizando um SCNA “es-querdo” (L) e um “direito” (R) da lista acima. Entrega

[0212] Configuração do bioensaio: A preparação do protoplasto de Arabi- dopsis se baseia em Wu et. al. (Wu et. al., 2009):

[0213] Material Vegetal: Arabidopsis cultivada em regime de luz ideal do dia de 16 horas (150microEinstein-m-2-s-1) a 22°C.

[0214] Folhas: plantas com 3 a 5 semanas de vida (W ~2cm L ~5cm). Soluções de trabalho:

[0215] Solução de enzima: celulase a 1%, 0,25% Macerozyme, Manitol a 0,4 M, CaCl2 10mM, KCl20mM, BSA 0,1%, MES 20mM pH5,7. Aquecimento a 50-55 °C por 10 minutos para inativar as proteases e em seguida filtrar. Usar 10ml/ 7-10 folhas descascadas secas (1-5gr)/ placa.

[0216] Solução W5 modificada: NaCl 154mM, CaCl2125mM, KCl5mM, Gli-cose 5mM, MES 2mM pH5,7. Lavar duas vezes com 25ml/placa, + duas vezes 3 ml para banho de transfecção + 1ml ressuspensão

[0217] Solução de MMg modificada: (Solução de ressuspensão) Manitol a 0,4 M, MgCl215mM, MES 4mM pH5,7.

[0218] Tampão de transfecção TEAMP modificado (solução PEG): 40% PEG MW 4000, CaCl2 0,1M, Manitol 0,2M volume = 1:1 de 200microliter de protoplastos em MMg + volume de DNA

[0219] BSA: 1% BSA Protocolo de trabalho:

[0220] Pré-aquecer em banho-maria a 50-55 °C, resfriar em centrífuga swing- out, gelar W5 e MMg, e cortar as pontas.

[0221] Prepare placas cobertas com BSA fresco (1,25ml 1%BSA/cavidade em água, incubar na bancada até ficar pronto)

[0222] Preparar solução de enzima fresca 10ml / tratamento.

[0223] Coletar 7-10 folhas, não podem estar úmidas. 10 folhas devem render ~4-5 transformações.

[0224] Cubra a epiderme superior com Time-tape, a inferior com Magic tape. Mais fácil sem luvas. É mais fácil de descascar se o pecíolo estiver aderido apenas ao time-tape.

[0225] Filtrar em 0,22μm 10ml da solução de enzima fresca em cada placa de Petri

[0226] Descasque e descarte o Magic tape. Transfira o lado do Time-tape para a placa de Petri

[0227] Agite suavemente em agitador de plataforma a 40 rpm 20-60 min na luz até a liberação dos protoplastos (verificar empiricamente)

[0228] Centrifugar em tubos de 50ml 100 x g 3 min em rotor swing-out

[0229] Lavar duas vezes com 25ml de solução W5 fria.

[0230] Colocar em gelo por 30 min, efetuar contatem durante este tempo no hemocitômetro utilizando microscópio de luz

[0231] Centrifugar e ressuspender em solução MMg até 2-5 x10A5 células/ml (cerca de 1 ml). Transfecção:

[0232] Produzir solução PEG fresca para transfecção em tubo de 2ml

[0233] Retirar BSA de placas de 6 cavidades e secar

[0234] Misturar ~5 x 10A4 protoplastos (2 x 10A4 -1 x 10A5 ) em 0,2ml de so-lução MMg com uma mistura de DNA do plasmídeo-alvo, DNA do plasmídeo que ex-pressa a Fração de proteína e ssDNA de SCNAs até o total de 30-40 microgramas a RT em tubos (tampa de encaixe) de fundo redondo de 15 ml.

[0235] Adicionar igual volume (0,2ml de protoplastos + midiprep vol.) de solu-ção PEG fresca

[0236] Incubar à temperatura ambiente por 5 min

[0237] Lavar adicionando lentamente 3ml de solução W5, 1ml de cada vez, e misturando

[0238] Centrifugar a 100 x g em swing-out por 1 min

[0239] Repetir lavagem e peletização

[0240] Ressuspender em1ml de solução W5

[0241] Verter em placas revestidas com BSA

[0242] Cultivar os protoplastos sob a luz ideal do dia de 16 horas (150micro- Einstein-mA-2-sA-i) a 22°C, substituindo o meio conforme a necessidade.

[0243] Os protoplastos suspensos em solução W5 são avaliados em termos da atividade de GFP/mCherry 3 dias após a transfecção utilizando um citômetro de fluxo automatizado (FACS). A GFP é detectada por excitação a 488nm com emissão detectada com filtro 530/30. Excitação e emissão de mCherry são 561nm e filtro 610/20. Fatores limiares e de compensação são definidos para excluir todos os falsos positivos.

Exemplo 1A: Mutação de ponto por DSB induzida.

[0244] Neste exemplo, a clivagem do alvo resulta em uma Quebra de Duplo Filamento (DSB) no DNA-alvo do plasmídeo. Esta DSB é projetada para ser criada no sítio do códon de PARADA, que é digerido e reparado pelo mecanismo de reparo de NHEJ conforme descrito na ilustração exemplificativa da Figura 10 (mutação). A NHEJ é propensa a mutações, e algumas destas mutações podem eliminar o códon de PARADA e restaurar um quadro de leitura aberta resultando em um quadro de leitura aberta (ORF) da GFP ativa. A GFP é então detectada por meio de microscopia ou citômetro de fluxo (FACS), permitindo mensurar a eficiência do sistema e a comparação entre variáveis para seu aprimoramento.

[0245] Durante o endereçamento de um transgene STOP- GFP previamente e estavelmente introduzido no genoma de Arabidopsis (invés de um plasmídeo), as plantas com seu genoma modificado podem ser regeneradas a partir de protoplastos que expressam GFP.

Exemplo 1B: Integração específica em uma DSB genômica induzida.

[0246] À semelhança do exemplo 1A, a sequência do códon de parada GFP dentro do quadro é endereçada com o complexo molecular programado. Nesta apli-cação um dsDNA linear doador é adicionado, compreendendo um gene repórter mCherry sem promotor e sem terminador contendo somente CDS. Em seguida à transfecção descrita, os protoplastos que expressam mCherry são detectados por flu-orescência vermelha através de microscopia ou citômetro de fluxo (FACS), permitindo mensurar a eficiência do sistema e a comparação entre variáveis para seu aprimoramento. A excitação e emissão de mCherry são 561nm e filtro 610/20. Como o DNA doador contém um mCherry sem promotor, sua atividade pode ser obtida pela captura do promotor. Desse modo, o cassete de GFP endereçado é clivado para formar uma DSB onde qualquer DNA linear pode ser ligado. Como um excesso de dsDNA linear de CDS mCherry é fornecido, é capturado na DSB, causando, em alguns casos, a tradução no quadro da proteína mCherry. Plasmídeos endereçados com essa inserção específica de mCherry na sequência endereçada GFP são ainda analisados por PCR com os seguintes iniciadores: um se ligando à sequência de DNA do plasmídeo- alvo, e um se ligando ao DNA inserido:

[0247] 35SF: CTATCCTTCGCAAGACCCTTCC (N° ID SEQ: 31)

[0248] mCherryR: TTATCTTGTACAGCTCGTCCAT (N° ID SEQ: 32)

[0249] De maneira semelhante, a resistência a antibiótico bacteriano (cassete de codificação de NPT-II, sem uma origem de replicação) é conferida aos protoplastos como dsDNA linear. Este DNA é inserido no lugar de CDS mCherry dos exemplos 1B e 1C, e avaliado extraindo o DNA total dos protoplastos, transformando os plasmídeos que incluem DNA com ou sem inserções em E. Coli, e cultivando estes em um meio contendo canamicina. Bactérias resistentes possuem plasmídeos que capturam o cassete NPT-II. Para avaliar a especificidade da inserção no sítio-alvo de GFP predeterminado, o sítio-alvo de GFP é amplificado por PCR com iniciadores abrangendo o sítio de inserção esperado. A inserção específica causa uma variação significativa no tamanho do produto da PCR em gel de agarose. A eficiência da inserção é calculada dividindo-se o número de colônias resistentes à canamicina pelo número de colônias resistentes à ampicilina (A resistência à ampicilina é codificada no plasmídeo-alvo) em um experimento com placas duplicadas. A especificidade é calculada repetindo-se o experimento com a omissão ou substituição de componentes do complexo molecular programável (por exemplo, SCNAs de endereçamento da GFP) e comparando aos experimentos não modificados.

Exemplo 1C: Substituição de gene através de mecanismo de reparo por NHEJ.

[0250] Neste exemplo, a sequência codificadora GFP é substituída por CDS mCherry via NHEJ endógena. Para excluir uma seção extensa do DNA-alvo com a estratégia de NHEJ, criam-se duas DSBs. Para endereçar o início e o final de CDS de GFP, dois grupos de SCNAs são utilizados juntamente com o doador de dsDNA linear mCherry. Como o DNA doador contém mCherry sem promotor, sua atividade pode ser obtida pela captura de promotor. Portanto, o cassete de GFP endereçado pode capturar CDS de mCherry. A mCherry é analisada por FACS ou microscópio com excitação e a emissão detectada a 561nm e filtro 610/20s, respectivamente.

[0251] Os protoplastos positivos à mCherry são classificados por FACS e posteriormente submetidos à extração de DNA, transformação direta dos plasmídeos que incluem o DNA total em E. Coli, crescimento em meio contendo antibiótico, e realizando duas reações de PCR de colônia em cada colônia bacteriana com dois conjuntos de iniciador:

[0252] 35SF: CTATCCTTCGCAAGACCCTTCC (N° ID SEQ: 31)

[0253] mCherryR: TTATCTTGTACAGCTCGTCCAT (N° ID SEQ: 32)

[0254] e

[0255] 35S-T-R-SEQ:CCCTATAAGAACCCTAATTCCC (N° ID SEQ: 33)

[0256] mCherryF: ATGGTGAGCAAGGGCGAGGA (N° ID SEQ: 34)

[0257] As colônias que produzem um produto de amplificação em ambas as reações de PCR contêm um plasmídeo que foi endereçado nos protoplastos de Ara- bidopsis para produzir um evento de substituição corretamente orientado através da via de reparo da NHEJ, e que depois passam por sequenciamento para fins de verifi-cação.

[0258] Durante o endereçamento de um transgene GFP previamente e esta- velmente introduzido no genoma de Arabidopsis (invés de um plasmídeo), a transfor-mação direta da E. Coli não é realizada. Invés disso, o DNA genômico é amplificado diretamente por PCR de protoplastos simples utilizando os ditos iniciadores. Alterna-tivamente, plantas com seu genoma modificado podem ser regeneradas a partir de protoplastos que não expressam GFP e expressam mCherry, cujas porções podem ser igualmente analisadas.

EXEMPLO 2. Indução da quebra do filamento duplo DNA, mutação e inserção em um genoma de plantas monocotiledôneas de cereais.

[0259] Endereçamento de IPK1 em milho para knockout.

[0260] O gene IPK1 codifica inositol-1,3,4,5,6-pentakisfosfato 2-quinase, que está envolvida na biossíntese do fitato em sementes de milho. O fitato, quando fornecido a animais não ruminantes, é um componente antinutricional que contribui para a poluição ambiental pelo fósforo. EO endereçamento de IPK1 pode reduzir o teor de fósforo da semente em 75%. Existem dois genes IPK parálogos no Zea mays compartilhando 98% de identidade da sequência no genoma do milho. Neste exemplo, a sequência IPK1 baseada no Acesso do Genbank N° EF447274 é endereçado.

Sítio-alvo na sequência de nucleotídeo-alvo:

[0261] No exon 2 de IPK1: TTCTCAAGTCATGAGCAACTC (N° ID SEQ: 35)

[0262] Sequência de proteína e propriedades

[0263] A clivagem resultante do IPK1 do sítio-alvo predeterminado pelo com-plexo molecular programado, resulta em sua mutação ou na inserção de um DNA doador na DSB criada pelo complexo programado, conforme desejado, auxiliada por processos endógenos. Neste caso, o complexo molecular programável consiste de 2 monômeros idênticos de uma fração de proteína e duas moléculas diferentes de SCNA. Neste exemplo, a fração de proteína é idêntica à do exemplo 1.

[0264] Neste exemplo, a modificação na extremidade do ácido nucleico do SCNA é um Digoxigenina ligada a NHS-Éster (DIG) que é anexada à posição 5’ ou 3’ do oligonucleotídeo. Propriedades de SCNA e sequência

[0265] O desenho lógico do SCNA corresponde essencialmente ao descrito no Exemplo 1. O comprimento do SCNA do oligonucleotídeo de emparelhamento de base-alvo complementar, de preferência, apresenta pelo menos 18 bases. O SCNA pode conter ainda um número pequeno (por exemplo, 1-6, em um exemplo, 6, em outro exemplo, 2) de nucleotídeos de emparelhamento de base não endereçados (N's) de qualquer composição de sequência que sirva de espaçador entre o modificador do terminal DIG-NHS e os nucleotídeos complementares-alvo.

Sequências de nucleotídeo de SCNA flanqueando o sítio-alvo IPK1

[0266] Combinações dos seguintes SCNAs “R” e “L” empregando um gap-alvo com 21bp são testadas:

[0267] IPK1-SR-1710: /5DIGN/NNNNNNCTGTGGGGCCATATCCCAGAA*C (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 36)

[0268] IPK1-SL-1688: G*CGGGCACCGAGTTGTATTGTANNNNNN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 37)

[0269] IPK1-ASR-1710: G*TTCTGGGATATGGCCCCACAGNNNNNN/3DIGN/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 38)

[0270] IPK1-ASL-1688: /5DIGN/NNNNNNTACAATACAACTCGGTGCCCG*C (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 39)

[0271] Um segundo grupo de combinação de SCNAs “R” e “L” emparelhados, empregando um gap-alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:

[0272] IPK1-SR-1712: /5DigN/NNGTGGGGCCATATCCCAGAAC*T (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 40)

[0273] IPK1-SL-1687: A*GCGGGCACCGAGTTGTATTGTNN/3DigN/ (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 41)

[0274] IPK1-ASL-1687: /5DigN/NNACAATACAACTCGGTGCCCGC*T (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 42)

[0275] IPK1-ASR-1712: A*GTTCTGGGATATGGCCCCACNN/3DigN/ (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 43)

[0276] SCNAs compreendem ssDNA modificado. Os símbolos de modificação são: Ligações de fosforotioato = *; 5’ DIG= /5DigN/ ; 3’DIG= /3DigN/.

Experimento 2A: knockout de IPK1 e expressão de GFP em protoplastos

[0277] Neste experimento, a DSB genômica em plantas de milho e a integra-ção específica da sequência GFP no gene IPK1 formando uma mutação por knockout e expressão de GFP no locus IPK1 são testados. O complexo molecular programado forma a DSB genômica na sequência IPK1, iniciando a integração do DNA doador na sequência IPK1 através de recombinação homóloga.

[0278] Este exemplo, 2A, é realizado em protoplastos de milho que são anali-sados por FACS em termos da atividade de GFP.

Protocolo de trabalho: Preparação do protoplasto:

[0279] Um ensaio de expressão transitória utilizando protoplastos de mesófilo de milho (Sheen, 2001) é utilizado com a entrega do ácido nucleico induzida por ele- troporação em adição ou em alternativa a um protocolo de entrega induzido por poli- breno:

[0280] Transfecção baseada em (Antonelli & Stadler, 1989):

[0281] Protoplastos frescos isolados (cerca de 2x10A6) são incubados por cerca de 6 a 12h com cerca de 20-50 microgramas de DNA de transfecção compre-endendo SCNAs de ssDNA modificados, um plasmídeo que codifica a fração de pro-teína, DNA Doador (quando aplicável), e 30 microgramas da Polibreno de policação (brometo de hexadimetrina). Ao término do período de incubação, a mistura de trans- fecção é diluída com a adição de meio de crescimento e as células são então incuba-das por aproximadamente mais 30h antes de avaliadas para a expressão transitória do gene: 1. Preparar os protoplastos, e ressuspender 2 x 10A6 células em 0,5ml de meio de crescimento Murashige Skoog com manitol a 8% (MS2D8M). 2. Para cada experimento, preparar uma solução estoque de polibreno fresca (Aldrich) (10mg/ml em tampão salino-fosfato, pH 7,0). Esta é uma substância química altamente higroscópica e as instruções de segurança do fabricante devem ser seguidas rigorosamente. A solução estoque é então diluída para atingir uma concentração final de 30microgramas de Polibreno em 0,1 ml de MS2D8M. 3. A concentração desejada do DNA de transfecção - DNA do plasmídeo e SCNAs modificado por ssDNA - é suspensa em 0,4ml de MS2D8M. 4. Misturar 0,1ml da solução de polibreno (30 microgramas) com os protoplas- tos ressuspendidos e transferir para Placa de Petri de 60 mm. 5. Adicionar imediatamente (gota a gota) os 0,4ml da suspensão de DNA. A mistura de protoplasto/Polibreno/DNA (volume total 1,0ml) é agitada suavemente (25rpm) em agitador rotativo por 15 min e em seguida incubada (estacionário) a 28°C por 6h. 6. Após 6h de incubação, diluir a mistura acima com 4,0ml de MS2D8M, vedar a placa de Petri, e seguir os procedimentos para avaliação da expressão transitória do gene ou para a seleção de transfectantes estáveis. Detecção:

[0282] Protoplastos de milho transfectados suspendidos em solução MS2D8M são analisados por citômetro de fluxo utilizando análise de separação de célula ativada por fluorescência (FACS), 3 dias após a transfecção com Polibreno. A GFP é detectada por excitação a 488nm com emissão detectada por filtro 530/30. Fatores limiares e de compensação são definidos para excluir todos os falsos positivos. FACS é utilizado para células endereçadas separadas para posterior análise.

[0283] Os protoplastos são submetidos à análise através da extração do DNA genômico e de sua amplificação por PCR utilizando os iniciadores 1F e 1R abaixo e a posterior digestão com BspHI do produto da PCR. Os produtos não cliváveis de BspHI com tamanhos aproximadamente similares ao tipo selvagem resultam de eventos de endereçamento preciso acoplados à religação imprecisa, produtos da PCR de maior tamanho resultam das inserções no sítio-alvo, conforme desejado.

[0284] Iniciador 1F: GAGCTAGATAGCAGATGCAGAT (N° ID SEQ: 44)

[0285] Iniciador 2R: CTCCAGAAAATCCCTAGAAACA (N° ID SEQ: 45)

[0286] Alternativamente, o produto da PCR é submetido ao Ensaio de Detecção Mutação Enzimática CEL I, de acordo com as instruções no Kit de Detecção de Mutação SURVEYOR (Transgenomics, EUA). Este ensaio é utilizado para avaliar a efetividade da mutação do DNA de IPK1 através de endereçamento de gene pelo complexo molecular programado.

[0287] Sequência Doadora para o experimento 2A: A GFP é fundida à sequência de IPK1 e desse modo a expressão de GFP somente pode acontecer por recom- binação homóloga (HR) precisa. A sequência de toda a sequência doadora é seme- Ihante à descrita no N° ID SEQ: 46. A sequência homóloga a IPK1 necessária para recombinação é nucleotídeos 1-621 e 1960-2610 do N° ID SEQ:46, e o cassete de GFP é codificado pelos nucleotídeos 622-1959.

[0288] Experimento 2B: knockout IPK e inserção de Bar, entrega aos calos

[0289] Neste experimento, a DSB genômica em plantas de milho e a integra-ção específica do gene de resistência bar a herbicida que confere resistência ao Bia- laphos (Fosfinotricina; Glufosinato-Amônia; seus análogos ou herbicidas comerciais, tais como, Basta, Bayer Crop Science) no gene IPK1 que forma a mutação por knockout e a expressão de bar no locus IPK1, são testadas. O complexo molecular programado forma a DSB genômica na sequência IPK1 iniciando a integração do DNA doador na sequência IPK1 através de recombinação homóloga.

[0290] Este exemplo é realizado em calos de milho que são transfectados por bombardeamento de DNA e em seguida cultivados em regime de seleção ao Biala- phos (Basta). Protocolo de trabalho: 7. Formação do calo embriogênico: Embriões imaturos com 1,6mm a 1,8mm (Plantas A188XB73 ou A188XB84) Condições de crescimento: Luz 10microEins- tein/mA2/seg a 24 °C em meio N6 contendo 2mg/L de glicina, 2,9g/L de L-prolina, 100mg/L de hidrolisado de caseína, 13,2mg/L de dicamba ou 1mg/L de 2,4D, 20g/L sacarose, pH 5,8. Solidificado com 2g/L de Gelgro. 8. Bombardeamento do DNA do plasmídeo e SCNAs modificados por ssDNA em calos baseado no método utilizado por (Gordon-Kamm et. al., 1990). 9. Transferir os calos para a condição de crescimento conforme descrito no exemplo 2A, com concentração final de 2,5mg/L de Bialaphos no meio (B0178 Gold Biotechnology, 1328 Ashby Rd., St. Louis, MO 63132 EUA). 10. Os calos são movidos para o novo meio a cada 2 semanas. 11. Os calos cultivados durante 2 meses em Bialaphos são resistentes ao herbicida e podem ser submetidos à análise de PCR ou regeneração. 12. As plantas regeneradas são resistentes a Basta e possuem níveis reduzidos de fitato. Detecção e análise:

[0291] Calos bombardeado com os SCNA modificado por ssDNA, o plasmídeo codificador da fração de proteína do complexo molecular programável e o DNA doador contendo o cassete de expressão CDS de resistência do gene bar são cultivados em meio regenerador contendo 2,5mg/L de Bialaphos. Somente calos, cujas células onde a sequência codificadora do gene bar são integradas ao IPK1 através de HR, são capazes de crescer nestas condições, portanto, considera-se que o material vegetal ainda proliferativo após 1 mês neste meio possui seu genoma modificado como desejado.

[0292] Com este desenho, enquanto o cassete de resistência bar integra o genoma por HR para funcionar adequadamente, o cassete da toxina A de Corynebac- terium diphtheria (DT-A) é um cassete autônomo que expressa DT-A mediante condições de choque térmico (HS) (42 °C). Desse modo, para posterior análise, os calos são divididos em calos induzidos por HS e calos não induzidos. Somente calos contendo um evento HR perfeito não expressam DT-A. Calos que contenham o plasmídeo integrado aleatoriamente, portador tanto do DNA doador quanto do cassete DT-A, expressam o DT-A e consequentemente morrem.

[0293] Ademais, os calos são submetidos à análise de PCR utilizando os ini-ciadores 1F e 1R mostrados no exemplo 2A, seguindo-se a digestão do produto, como acima, com BspHI.

Sequência Doadora para o experimento 2B:

[0294] O plasmídeo Doador contém um cassete de resistência bar, a ser inserido no sítio de clivagem IPK1, e um cassete DT-A que não deve recombinar no locus IPK1, como marcador de evento de integração não específica: O cassete de resistência bar é flanqueado pelas sequências homóloga em IPK1 (nts. 1-621 e 23382988 de N° ID SEQ:47) necessário para HR, enquanto o cassete DT-A está localizado fora do sítio flanqueado pela sequência homóloga. O cassete do bar (nts. 622-2337 do N° ID SEQ: 47) contém um promotor constitutivo 35S CaMv; CDS do gene bar de Streptomyces hygroscopicus para a fosfinotricina acetil transferase que confere resistência ao glufosinato de amônia (nts. 1526-2078 do N° ID SEQ:47); e o terminador NOS - a jusante do CDS bar.-Toda a sequência Doadora 2B é descrita no N° ID SEQ: 47.

[0295] No mesmo plasmídeo, um segundo cassete que codifica a toxina A da difteria, DT-A, (do GenBank: AB535096.1) sob o controle de um promotor induzível por choque térmico (Promotor HS de Arabidopsis HSP18.2 do GenBank: X17295.1) e terminado com um terminador NOS possui a sequência conforme descrita no N° ID SEQ: 48.

EXEMPLO 3. Indução de quebras do filamento duplo (DSBs) cromossômicas predeterminadas em célula vivas de Arabidopsis.

[0296] A enzima Fitoeno Desaturase (PDS) está envolvida na conversão do fitoeno em zeta-caroteno na biossíntese do carotenoide. A degradação da fitoeno de-saturase da Arabidopsis resulta em fenótipos albino e dwarf. Este fenótipo é explicado pela biossíntese da giberelina, carotenóide e clorofila danificada. Desse modo, uma mutação neste gene pode ser detectada fenotipicamente.

Experimento 3A:

[0297] Neste exemplo, uma quebra de duplo filamento cromossômica (DSB) no gene PDS endógeno é induzida especificamente a fim de criar uma mutação de ponto através de um deslocamento de quadro, e promovendo o knock-out da função do gene utilizando a via da NHEJ endógena.

Experimento 3B:

[0298] Neste exemplo, uma quebra de duplo filamento (DSB) cromossômica é especificamente no gene PDS endógeno a fim de criar uma Inserção de uma se-quência Doadora mCherry em uma sequência de PDS endógeno para knock out PDS por recombinação homóloga assistida utilizando o complexo molecular programável.

[0299] Para os exemplos 3A-3B, utiliza-se um bioensaio baseado em proto- plasto de Arabidopsis. Neste bioensaio, os protoplastos são entregues com um plas- mídeo que expressa a fração de proteína do complexo molecular in vivo e são coen- tregues com um par de Ácidos Nucleicos Propiciadores de Especificidade (SCNA) ssDNA modificados, neste exemplo, por um terminal Fluoresceína (6-carboxi-Fluores- ceína, 6-FAM), cada SCNA apresentando essa modificação no 3’-terminal ou no 5’- terminal (/36-FAM/e /56-FAM/, respectivamente). Uma segunda modificação para proteção da exonuclease, tais como, fosforotioato, é adicionada no terminal oposto, como é possível se ligarem as ligações de fosforotioato internas para a proteção da endonuclease. Neste exemplo, as sequências de codificação para a Fração de proteína e DNA Doador são entregues concomitantemente em um único plasmídeo utilizando um Protocolo de transfecção de PEG (Wu et. al., 2009). SCNAs de SsDNA modificado são produzidos sinteticamente e entregues junto com o plasmídeo que utiliza PEG conforme acima. Sequência de proteína e propriedades

[0300] Neste exemplo, a fração de proteína, codificada em um plasmídeo, contém uma sequência de aminoácido adaptada de um domínio da nuclease FokI como domínio funcional; uma sequência de aminoácido adaptada de uma imunoglo- bulina de fragmento variável de cadeia simples anti-Fluoresceína (scFv) (códigos de acesso do Banco de Dados de Proteína 1X9Q, 1FLR_H), como Domínio de ligação; um SV40NLS (PKKKRKV: N° ID SEQ: 3) como domínio de localização nuclear e um conector interdomínio de ~15A (GGSGG: N° ID SEQ: 7).

[0301] Desse modo, a fração de proteína do complexo molecular descrito neste exemplo possui a sequência de aminoácido conforme descrito no N° ID SEQ: 49 e é codificada pela sequência de nucleotídeo descrita no N° ID SEQ:50.

[0302] O ácido nucleico propiciador de especificidade (SCNA) deste exemplo é modificado pela adição de um Fluoresceína-ScFv/6-FAM, 6-carboxifluoresceína - Fluoresceína dT que inclui um linker C6 em uma extremidade de cada SCNA. Propriedades do SCNA e sequência

[0303] O desenho do SCNA essencialmente acompanha o descrito no Exem-plo 1. O comprimento do SCNA do oligonucleotídeo de emparelhamento de base-alvo complementar, de preferência, apresenta pelo menos 18 bases. O SCNA pode conter ainda um número pequeno (por exemplo, 1-6, em um exemplo, 6, em outro exemplo, 2) de nucleotídeos de emparelhamento de base não endereçados (N's) de qualquer composição de sequência que sirva de espaçador entre o modificador do 6-FAM terminal e os nucleotídeos complementares-alvo. Sequência-alvo:

[0304] A sequência-alvo é: GTCCTGCTAAGCCTTTGAAAG (N° ID SEQ: 51), Localizada no Exon 2 da sequência PDS de Arabidopsis (GI:5280985, gene dl3145c, proteína id="CAB10200.1). Opções de sequência de SCNA:

[0305] SCNAs podem ser endereçados a qualquer filamento, desse modo, para o alvo mostrado, existem 4 opções de emparelhamento de SCNA: SCNAs Sentido (S):

[0306] PDS-SL1-846: GCATCCTTCCGTAGTGCTCCTCNNNNNN/36-FAM/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 52)

[0307] PDS-SR1-868: /56-FAM/NNNNNNTTGTAATTGCTGGTGCTGGTAT (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 53) SCNAs Antissentido (AS):

[0308] PDS-ASL1-846: /56- FAM/NNNNNNGAGGAGCACTACGGAAGGATGC (os ácidos nucleicos são aqui de-signados somente como N° ID SEQ: 54)

[0309] PDS-ASR1-868: ATACCAGCACCAGCAATTACAANNNNNN/36-FAM/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ:217) SCNAs de filamento misto:

[0310] PDS-SL1-846: GCATCCTTCCGTAGTGCTCCTCNNNNNN/36-FAM/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 52)

[0311] PDS-ASR1-868: ATACCAGCACCAGCAATTACAANNNNNN/36-FAM/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ:217)

[0312] PDS-SR1-868: /56-FAM/NNNNNNTTGTAATTGCTGGTGCTGGTAT (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 53)

[0313] PDS-ASL1-846: /56- FAM/NNNNNNGAGGAGCACTACGGAAGGATGC (os ácidos nucleicos são aqui de-signados somente como N° ID SEQ: 54)

[0314] Um segundo grupo de combinações de SCNAs “R” e “L” emparelha-dos, empregando um gap-alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:

[0315] PDS-SL2-845: TGCATCCTTCCGTAGTGCTCCTNN/36-FAM/ (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 55)

[0316] PDS-SR2-870: /56-FAM/NNGTAATTGCTGGTGCTGGTATGT (os áci dos nucleicos são aqui designados somente como N° ID SEQ: 56)

[0317] PDS-ASL2-845: /56-FAM/NNAGGAGCACTACGGAAGGATGCA (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 57)

[0318] PDS-ASR2-870: ACATACCAGCACCAGCAATTACNN/36-FAM/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 58)

[0319] PDS-SL2-845: TGCATCCTTCCGTAGTGCTCCTNN/36-FAM/ (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 55)

[0320] PDS-ASR2-870: ACATACCAGCACCAGCAATTACNN/36-FAM/ (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 58)

[0321] PDS-SR2-870: /56-FAM/NNGTAATTGCTGGTGCTGGTATGT (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 56)

[0322] PDS-ASL2-845: /56-FAM/NNAGGAGCACTACGGAAGGATGCA (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 57)

[0323] /56-FAM/ simboliza uma modificação 5’ no ssDNA do SCNA compre-endendo 6-FAM (6-carboxi-Fluoresceína). /36-FAM/ simboliza uma modificação 3’ no ssDNA do SCNA compreendendo 6-FAM (6-carboxi-Fluoresceína). N simboliza qual-quer nucleotídeo.

[0324] Sequência Doadora é DOADORA PD-MCHERRY-S que tem a sequência descrita no N° ID SEQ: 59 (ORF que codifica mCherry está nos nucleotídeos 6621372 do N° ID SEQ:59). Entrega

[0325] Configuração do bioensaio: A preparação do protoplasto de Arabi- dopsis se baseia em (Wu et. al., 2009) e é similar ao exemplo 1 com diferenças na etapa de transfecção: Transfecção: 13. Produzir solução PEG fresca para transfecção em tubo de 2ml 14. Retirar BSA de placas de 6 cavidades e secar 15. Misturar ~5 x 10A4 protoplastos (2 x 10A4 -1 x 10A5) em 0,2ml de MMg com uma mistura do DNA do plasmídeo Doador (quando relevante), DNA do plasmídeo que expressa a Fração de proteína e ssDNA de SCNAs até o total de 30-40microgra- mas a RT em tubos (tampa de encaixe) de fundo redondo de 15 ml. Alternativamente o DNA Doador e DNA que expressa a fração da Proteína são construídos e entregues em um único plasmídeo. 16. Adicionar igual volume (0,2ml de protoplastos + midiprep vol.) de solução PEG fresca 17. Incubar à temperatura ambiente por 5 min 18. Lavar adicionando lentamente 3ml de W5, 1ml a cada vez, e misturando 19. Centrifugar a 100 x g em swing-out por 1 min 20. Repetir lavagem e peletização 21. Ressuspender em 1ml de solução W5 22. Verter em placas revestidas com BSA 23. Cultivar os protoplastos em regime de luz diurna ideal por 16 horas (150mi- croEinstein-mA-2-sA-1) a 22°C, substituindo o meio conforme a necessidade.

Análise

[0326] No experimento 3A, o DNA de grupo de protoplastos é analisado por PCR e análise do fragmento de restrição do produto da PCR.

[0327] A PCR é conduzida com três iniciadores:

[0328] PCR Iniciador2F: TGGTTGTGTTTGGGAATGTTTCT (N° ID SEQ: 60); e

[0329] PCR Iniciador2R: TATCCAAAAGATATCTTCCAGTAAAC (N° ID SEQ: 61)

[0330] A eliminação da clivagem com a enzima de restrição DdeI em pelo me-nos uma porção do DNA amplificado indica pelo menos algum sucesso no endereçamento de gene e mutação dirigida do modelo genômico.

[0331] No experimento 3B um DNA Doador que codifica mCherry é fundido no quadro ao gene PDS endógeno. O MRNA produzido com este gene codifica um PDS degradado fundido a uma mCherry total imediatamente seguida por um códon de PARADA (“PD-mCherry”). Os protoplastos suspensos em solução W5 são avaliados em termos da atividade de mCherry 3 dias após a transfecção utilizando uma máquina de citômetro de fluxo automatizado (FACS). Os protoplastos modificados por PDS são detectados através de análise de FACS, onde uma inserção do doador mCherry é detectado por fluorescência de mCherry utilizando um comprimento de onda de excitação de 561 nm e detecção de emissão a 590-630nm. Fatores limiares e de compensação são definidos para excluir todos os falsos positivos.

[0332] A caracterização adicional em ambos os experimentos é obtida pela regeneração dos protoplastos nos meios adequados e examinando seu caráter feno- típico posterior, quando plantas alvas ou calos indicam o sucesso do endereçamento de gene. EXEMPLO 4. Endereçamento do DNA genômico in vivo e substituição genica na planta monocotiledônea do fumo.

[0333] Substituição do gene ALS em fumo e produção de plantas resistentes a herbicida: A acetolactato sintase (ALS) é uma enzima nas vias biossintéticas da valina, leucina, e isoleucina em plantas. Mutações neste gene resultam em resistência a diversos herbicidas. Por exemplo, as mutações no gene SuRB em fumo demonstrou propiciar resistências aos herbicidas: S647T - imazaquin, P191A - chlorsulfuron, W568L - chlorsulfuron e imazaquin

[0334] Neste exemplo, o ALS do Fumo é endereçado a fim de substituir o gene do tipo selvagem por uma versão mutada tolerante a herbicida através da substituição assistida do gene mediada por recombinação homóloga.

[0335] A expressão e a montagem do complexo molecular programado nas plantas de fumo são realizadas em duas etapas. A entrega da fração de proteína é realizando infectando uma Planta de fumo com um vetor viral de expressão da proteína Fumo Rattle Vírus (TRV), por exemplo, um vetor modificado de pTRV2 (Vainstein et. al., 2011) para a entrega e expressão da fração de proteína programável na planta.

[0336] A entrega do SCNA em plantas que expressam a fração de proteína é realizada infectando as plantas com Agrobacterium portadora de T-DNA que codifica tanto um par de RNA-SCNAs quanto uma sequência Doadora.

[0337] Os RNA-SCNAs neste exemplo se ligam ao domínio de ligação da fra-ção de proteína do complexo molecular utilizando a sequência de ligação do grampo de RNA boxB 20-mer do bacteriófago Phi21 (N° ID SEQ: 62: 5’- UUCACCUCUAACCGGGUGAG-3’) como “motivo do nucleotídeo de SCNA” exempli-ficado esquematicamente na Figura 1B.

[0338] O domínio de ligação neste exemplo é derivado da proteína N do bac- teriófago Phi21 da proteína de ligação ao RNA (RBP) (N° ID SEQ: 63: N’- GTAKSRYKARRAELIAER-C’). No exemplo aqui mostrado, o grampo não está no alvo, e sim no SCNA, e a ação da proteína de ligação, portanto, não está restrita a um sítio de reconhecimento específico no RNA-alvo em si, mas pode ser utilizado para endereçar qualquer sequência, inclusive DNA, dependendo exclusivamente da se-quência de emparelhamento de base-alvo do SCNA variável adjacente ao grampo de ligação RBP invariável.

[0339] O ácido nucleico-alvo (gene) neste exemplo é SuRB (acesso GenBank GI:19778) e a mutação de aminoácido desejada é P191A - conferindo resistência ao chlorsulfuron. Assim:

[0340] Sequência original não alterada: GGTCAAGTGCCACGTAGGATG (N° ID SEQ: 64)

[0341] Mutação Induzida: GGTCAAGTGGCGCGCAGGATG (N° ID SEQ: 65) A sequência dos componentes da fração de proteína: Componentes: 1. proteína N do Bacteriófago Phi21 (N° ID SEQ: 63: GTAKSRYKARRAELIAER) na ou perto do N’-terminal, como na N-proteína de com-primento total, o peptídeo de ligação ao RNA está situado no N-terminal. 2. nuclease FokI (VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYG YRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQ TRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVE ELLIGGEMIKAGTLTLEEVRRKFNNGEINF) (N° ID SEQ: 66) 3. SV40-NLS: (N° ID SEQ: 67: MPKKKRKV) 4. Conectores interdomínio: vários linkers de poliaminoácido são testados para a função ideal do complexo molecular programado.

[0342] Duas opções para a montagem da proteína são testadas neste exem-plo: 1. A primeira opção, (como descrito no N° ID SEQ: 68), na qual a proteína N Phi21 é montada no N’-terminal da fração de proteína do construto molecular progra-mável e o sinal de localização nuclear, SV40NLS, está localizado no C’ terminal e o linker do interdomínio é GGSGG (N° ID SEQ: 7). Esta montagem da proteína é codifi-cada pela sequência de ácido nucleico conforme descrito no N° ID SEQ: 69.

[0343] Medições espaciais obtidas de modelos tridimensionais computadori-zados para a versão NP Phi21 C’ em conjunto com o sistema de grampo de RNA BoxB e o linker de interdomínio GGSGGESK (N° ID SEQ: 74), como é mostrado neste exemplo, mostraram que a distância ideal esperada entre SCNAs, na presença de um único “N” no SCNA, corresponde a cerca de 26-30 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à esquerda e à direita do 13o-17o nucleotí- deo, a contagem começa depois que o nucleotídeo hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto dimerizado. Este critério sugere que, se a sequência endereçada for de 28 nucleotídeos neste exemplo:

[0344] AAAAAAAAAAYYYYYYYYYYXXXXXXXYYYYYYYYYYCCCCCCCCC C,

[0345] onde Y+X representa o número de nucleotídeos entre os sítios de em- parelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultando na DSB está na ou adjacente à área X. Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, en-tretanto, são escolhidos para emparelharem preferencialmente com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima”. Opções de sequência de SCNA:

[0346] Os SCNAs emparelham com as sequências flanqueadoras do sítio- alvo a ser clivado em qualquer um dos filamentos, assim, para o alvo mostrado, utili-zando um gap-alvo de 28bp: existem 4 opções de emparelhamento de SCNA: Par de SCNA sentido (S):

[0347] SuRB_P191_SR1 586:

[0348] UUCACCUCUAACCGGGUGAGNGGUACUGAUGCUUUUCAGGAAA (N° ID SEQ: 70)

[0349] SuRB_P191_SL1 557:

[0350] AUAGCGUCCCCAUUGUUGCUAUNUUCACCUCUAACCGGGUGAG (N° ID SEQ: 71) Par de SCNA antissentido (AS):

[0351] SuRB_P191_ASR1 586:

[0352] UUUCCUGAAAAGCAUCAGUACCNUUCACCUCUAACCGGGUGAG (N° ID SEQ: 72)

[0353] SuRB_P191_ASL1 557:

[0354] UUCACCUCUAACCGGGUGAGNAUAGCAACAAUGGGGACGCUAU (N° ID SEQ: 73)

[0355] E todas as combinações de pares sentido e antissentido sempre esco-lhendo um SCNA Direito (R) e um Esquerdo (L):

[0356] A segunda opção para a montagem da proteína testada neste exemplo, montada com a Proteína N Phi21 no C’ da proteína e o SV40NLS no N’ da fração de proteína. Neste construto um conector interdomínio da sequência: GGSGGESK (N° ID SEQ: 74) é utilizado:

[0357] A fração de proteína programável baseada em NP Phi21 Montada deste exemplo possui a sequência de aminoácido conforme descrito no N° ID SEQ: 75 e é codificada pela sequência de ácido nucleico conforme descrito no N° ID SEQ: 76.

[0358] Os resultados das medições espaciais obtidas com modelos tridimen-sionais computadorizados para a versão NP Phi21 C’ juntamente com o sistema de grampo de RNA BoxB e o linker interdomínio GGSGGESK (N° ID SEQ: 74), conforme utilizado neste exemplo, demonstraram que a distância ideal esperada entre SCNAs, na presença de 1 N no SCNA, corresponde a cerca de 22-24 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à esquerda e à direita do 11o, 12o ou 13o nucleotídeo, contando-se a partir do último nucleotídeo que hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto dimerizado. Este critério sugere que, se a sequência endereçada for, para este exemplo de 23 nucleotídeos: AAAAAAAAAAYYYYYYYYXXXXXXXYYYYYYYYCCCCCCCCCC, onde Y+X repre-senta o número de nucleotídeos entre os sítios de emparelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultando na DSB está na ou adjacente à área X. Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, entretanto, são escolhidos para emparelharem preferencialmente com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela mo-dificação 5’ ou 3’ do iniciador que está na “extremidade próxima”. Opções de sequência de SCNA:

[0359] SCNAs emparelham com sequências flanqueando o sítio-alvo a ser clivado em qualquer filamento, utilizando um gap-alvo de 31bp, resulta em 4 opções de emparelhamento de SCNA: Par de SCNA Sentido (S):

[0360] SuRB_P191_SR1-588: UUCACCUCUAACCGGGUGAGUACUGAUGCUUUUCAGGAAACU (N° ID SEQ: 77)

[0361] SuRB_P191_SL1-556: GAUAGCGUCCCCAUUGUUGCUAUUCACCUCUAACCGGGUGAG (N° ID SEQ: 78) Par de SCNA Antissentido (AS):

[0362] SuRB_P191_ASR1-588: AGUUUCCUGAAAAGCAUCAGUAUUCACCUCUAACCGGGUGAG (N° ID SEQ: 79)

[0363] SuRB_P191_ASL1-556: UUCACCUCUAACCGGGUGAGUAGCAACAAUGGGGACGCUAUC (N° ID SEQ: 80) Combinações de pares sentido e antissentido:

[0364] SuRB_P191_SR1-588: UUCACCUCUAACCGGGUGAGUACUGAUGCUUUUCAGGAAACU (N° ID SEQ: 77)

[0365] SuRB_P191_ASL1-556: UUCACCUCUAACCGGGUGAGUAGCAACAAUGGGGACGCUAUC (N° ID SEQ: 80)

[0366] SuRB_P191_SL1-556: GAUAGCGUCCCCAUUGUUGCUAUUCACCUCUAACCGGGUGAG (N° ID SEQ: 78)

[0367] SuRB_P191_ASR1-588: AGUUUCCUGAAAAGCAUCAGUAUUCACCUCUAACCGGGUGAG (N° ID SEQ: 79)

[0368] Um segundo grupo de combinações de SCNAs “R” e “L” emparelha-dos, empregando um 23bp gap-alvo e um linker de SCNA curto (um único N) de acordo com os resultados da predição:

[0369] Sentido (S):

[0370] SURB_P191_SR2-584: UUCACCUCUAACCGGGUGAGNUCGGUACUGAUGCUUUUCAGGA (N° ID SEQ: 81)

[0371] SURB_P191_SL2-560: GCGUCCCCAUUGUUGCUAUAACNUUCACCUCUAACCGGGUGAG (N° ID SEQ: 82)

[0372] Antissentido (AS):SuRB_P191_ASR2-584:

[0373] UCCUGAAAAGCAUCAGUACCGANUUCACCUCUAACCGGGUGAG (N° ID SEQ: 83)

[0374] SuRB_P191_ASL2-560: UUCACCUCUAACCGGGUGAGNGUUAUAGCAACAAUGGGGACGC (N° ID SEQ: 84)

[0375] ou combinações de SCNAs "R" e "L" do segundo grupo.

[0376] UUCACCUCUAACCGGGUGAG (N° ID SEQ:62) é a sequência da se-quência de ligação do grampo de RNA boxB 20-mer do bacteriófago Phi21, e atua como o segmento de ligação do Domínio de ligação do SCNA (assinalado esquema-ticamente como “motivo do nucleotídeo de SCNA” na Figura 1B). Sequência codificadora de ALS SURB CDS (inalterada) é descrita no N° ID SEQ: 85. DOADOR1 P191A: O doador possui sequência de nucleotídeo alterada para criar uma mutação de Prolina em Alanina (P191A) e permitir a análise da enzima de restrição. A sequência deste doador é descrita como N° ID SEQ: 86. A sequência alterada acompanha a descrição dos nucleotídeos 544-591 do N° ID SEQ: 86.

Método:

[0377] Neste exemplo, as plantas hospedeiras naturais, petunia, Nicotiana ta- bacum ou N. Benthamiana são primeiramente inoculadas com um vetor à base de pTRV- ou de pTRVdelta2b (Vainstein et. al., 2011), que é projetado para expressar, neste exemplo, o construto molecular programável sob o controle de um promotor subgenômico viral. Cerca de 5-21 dias após a infecção, as folhas da planta são cole-tadas e a seiva vegetal, aqui utilizada como inóculo, é extraída pelo esmagamento das folhas em tampão fosfato (20mM, pH 6,8), opcionalmente suplementado com um agente de umedecimento não iônico, tais como, Silwet L-77 (cerca de 0,015%). Cla-rear a solução por centrifugação e/ou coador é opcionalmente seguida de filtragem em 0,22μm. A filtragem é necessária para a injeção em plantas cultivadas em cultura de tecido. Concomitantemente, uma porção de uma folha é analisada para a estabili-dade do construto viral extraindo-se o RNA, realizando a transcrição reversa do RNA com um iniciador 3’ do sítio de inserção do gene externo, amplificando o cDNA por PCR utilizando iniciadores abrangendo o sítio de inserção do gene externo e reali-zando eletroforese lado a lado de maneira semelhante ao plasmídeo pTRV amplifi-cado por PCR originalmente utilizado para inoculação. As plantas de fumo-alvo, com cerca de 1 mês de idade, são então infectadas por ligeira abrasão das folhas com carborundum e esfregando a seiva na superfície foliar. Estas plantas podem ser culti-vadas in vitro ou de outra maneira. O vetor de autorreplicação baseado em TRV por-tador do complexo molecular programável infecta a planta e promove a disseminação sistêmica às folhas, meristemas e tecidos e órgãos não inoculado. Embora ainda não programado o dito complexo é inativo como a nuclease.

[0378] Uma vez difundido sistemicamente o vetor de autorreplicação baseado em TRV por toda a planta (cerca de 5-7 dias), expressando a fração de proteína programável do complexo molecular, discos foliares são excisados em condições estéreis. A expressão transitória do disco foliar é realizada similarmente a (Gallois & Marinho, 1995). Em poucas palavras, os discos são infiltrados a vácuo com uma cepa adequada de Agrobacterium (por exemplo, EHA105) pré-transformada com um plas- mídeo binário (por exemplo, pRCS, pSOUP + pGreen, ou outro vetor binário adequado) que codifica entre suas sequências RB e LB uma das combinações dos dois transcritos SuRB_P191 SCNA mostrados acima (vide ainda as ilustrações esquemáticas da Figura 9 e da Figura 8A), sob o controle dois promotores de planta constitutivos, idênticos ou diferentes, tais como, CaMV 35S ou NOS ou OCS e também portadores da sequência Doador1 P191A. Os SCNAs são transcritos após a importação do filamento-T para a célula, montagem com a proteína programável para formar um complexo molecular programado que é então importado para o núcleo onde cliva especificamente uma DSB no locus SurB no DNA genômico do fumo. O DNA Doador de T-DNA então se recombina com o gene SurB perto desta DSB promovendo a mutação desejada. Discos foliares são colocados em meio de seleção contendo 420 nM de chlorsulfuron, conforme descrito por Kochevenko (Kochevenko & Willmitzer, 2003) e no protocolo detalhado abaixo. A morte do Agrobacterium é causada por um antibiótico adequado (Carbenicilina 250ug/ml + Vancomicina 250ug/ml), e o desenvolvimento de calo dos discos foliares é permitido para a formação de brotos cultivados em plantas resistentes a herbicida com seu genoma modificado. As plantas regeneradas são avaliadas para resistência a chlorsulfuron em meio Murashige e Skoog com 420 nM de chlorsulfuron conforme descrito por Kochevenko et. al. Somente as plantas que crescem em chlorsulfuron possuem um gene ALS alterado, indicando que ALS foi endereçado pelo complexo molecular programado e que o Doador estava corretamente recombinado na localização correta.

[0379] A análise possibilitando a resolução de eventos bem sucedidos de substituição do gene é obtida pela realização de PCR no DNA genômico extraído das porções de regenerantes de Fumo. Na sequência alterada, o sítio da enzima de restrição AgeI é eliminado e os sítios BssHII e KpnI são adicionados. Portanto, ampli-ficar um fragmento de PCR englobando o sítio de substituição no gene SuRB e a digestão do fragmento de PCR com AgeI, BssHII e KpnI fornece um padrão de diag-nostico que possibilita o reconhecimento do sucesso da substituição gênica. Estas plantas são ainda selecionadas para eliminar as portadoras de T-DNA integrado não deseja pela extração de DNA e amplificação de PCR de uma região não SuRB do T- DNA codificador do SCNA. Protocolo detalhado de transformação de Agrobacterium: 1. Coletar 2ml de cultura de um dia de Agrobacterium (transformado com um plasmídeo binário codificador de transcritos de SCNA e portando o DNA Doador). 2. Ressuspender em 4ml de meio de Indução (1L: 10,5g de K2HPO4, 4,5g de KH2PO4, 1g de (NH4)2SO4, 0,5g de NaCitrate, 1g de glicose, 4g de frutose, 4g de glicerol, 0,12g de MgSO4, 1,95g de MES pH5,6), adicionar Acetosiringona na concentração final de 100μM. 3. Permitir crescimento a 30 °C por 6h. 4. Coletar as bactérias por centrifugação 3000g por 5min. 5. Ressuspender em meio de infiltração (10mM de MgSO4, 10mM de MES pH5,6) contendo 200μM de Acetosiringona até OD600 final de 0,4. 6. Obter discos foliares com 4-12mm de diâmetro e incubar na solução de infiltração bacteriana (etapa 5) por 30min. 7. Posicionar os discos foliares em meio de regeneração (1L: 4,3g de MS, 30g de sacarose, 100mg de Mio-inositol, pH 5,6, 10g de Agar, adicionar NAA e BA até a concentração final de 100microgramas/L NAA e 3mg/L BA). Incubar por 48h a 20-25 °C. 8. Transferir os discos foliares para o novo meio de regeneração contendo o antibiótico carbenicilina (0,3mg) e o herbicida chlorsulfuron (420 nM). Transferir para novo meio a cada 21 dias. 9. Cortar os brotos acima de 10mm e transferir para % meio MS para enraiza-mento (1L: 2,15g de MS, 10g de Sacarose, 0,5g de MES pH=5,7 com KOH, 10g de Agar).

EXEMPLO 5. Modificação química endereçada de DNA utilizando um Com-plexo Molecular Programado.

[0380] Neste exemplo, a metilação específica do DNA em local predetermi-nado é testada.

[0381] A metilação do DNA é catalisada por DNA metiltransferases, que transferem um grupo metila (-CH3) de S-adenosil-L-metionina para a posição C-5 dos resíduos de citosina. Três metiltransferases de DNA ativas, DNMT1, DNMT3A, e DNMT3B, foram identificadas em humanos e camundongos. A metilação nestes exemplos é do DNA na Citosina de uma sequência CpG. Estas enzimas pertencem a uma classe de metiltransferases dependentes da S-adenosilmetionina (SAM ou Ado- Met-MTase), classe I; AdoMet-MTases são enzimas que utilizam a S-adenosil-L-me- tionina (SAM ou AdoMet) como substrato para a transferência do metil, criando o pro-duto S-adenosil-L-homocisteína (AdoHcy).

[0382] DNMT3A

[0383] Tanto as famílias de DNMT1 quanto de DNMT3 das metiltransferases contêm os motivos metiltransferase C-5 altamente conservados em seus terminais C, contudo não mostram similaridade de sequência em suas regiões do N-terminal. DNMT3A também se liga às desacetilases e é recrutada por um repressor específico da sequência para silenciar a transcrição. A DNMT3A se à histona desacetilase HDAC1 utilizando seu domínio de homologia ATRX. Este domínio de DNMT3A representa um domínio repressor da transcrição independente, cujas funções de silencia- mento necessitam da atividade de HDAC. DNMT3A age como proteína correpressora carregando a atividade da desacetilase e pode ser endereçada a foci reguladores específicos através de sua associação à transcrição de ligação do DNA. DNMT3A também age em cooperação com RP58 para reprimir a transcrição de modo indepen-dente da metilação. Neste exemplo, a atividade da metiltransferase está localizada em um específico locus utilizando SCNAs.

[0384] Neste exemplo, uma porção do C’ de DNMT3A é utilizada para cons-truir um complexo molecular programável à base de metiltransferase. Os domínios PWWP que endereçam DNMT3A à heterocromatina pericêntrica, domínios dedo de zinco, domínios ADD, região ATRX que causa sua associação à histona desacetilase HDAC1, e toda a parte N’ reguladora da proteína são removidos, mantendo a região que compreende a região AdoMet_MTase (www.uniprot.org Q9Y6K1). O C-terminal s DNMT3A e B contêm o domínio catalítico. Na DNMT3A, o sítio ativo é C710 (numeração baseada no acesso traduzido do GenBank AF067972.2).

[0385] A DNMT3A forma um complexo heterotetrâmero DNMT3L:DNMT3A:DNMT3A:DNMT3L. A DNMT3L é inativa como metilase, e a DNMT3A pode dimerizar e é ativa sem DNMT3L. A DNMT3A é funcional na forma homodimérica. O complexo mostra contatos específico na interface do homodímero da DNMT3A (interface do dímero) e a dimerização traz dois sítios ativos da enzima separados por aproximadamente uma volta de hélice, no DNA da forma B. Desse modo, um dímero do complexo molecular programado localizado em um locus espe-cífico pelo SCNA, pode promover a metilação de citosinas nos sítios CpG a cerca de 10-11 pares de base de distância. Para restringir ainda mais as interações da DNMT3A com a DNMTL, a mutação R729A na região AdoMet_MTase do C’ terminal é utilizada neste exemplo. Os mutantes DNMT3A que formam dímeros invés de tetrâ- meros no DNA são R771A, E733A, R729A, F732A, e Y735A.

[0386] A fim de testar a capacidade do complexo molecular deste exemplo de realizar a metilação específica direcionada em uma sequência de DNA predetermi-nada, um plasmídeo é utilizado como o ácido nucleico-alvo. A metilação dirigida de diferentes locais no gene codificador de mCherry nos dois filamentos é testada no plasmídeo pSAT6-mCherry através da análise de restrição sensível à metilação.

[0387] A detecção de células transfectadas é realizada por análise de FACS no comprimento de onda de 561nm excitação e emissão detectadas por filtro 610/20.

Construção da fração de proteína:

[0388] Neste exemplo, a proteína, codificada no plasmídeo entregue, contém uma sequência de aminoácido adaptada da região AdoMet_MTase contendo o sítio catalítico de uma metiltransferase baseada na (citosina-5)-metiltransferase 3A do DNA humano (acesso PDB DNMT3A 2QRV é utilizado para elucidar a estrutura tridimensional). Uma mutação, R729 ou R771 (baseada na numeração traduzida GenBank AF067972.2) é adicionada para eliminar a tetramerização com a DNMTL reguladora sem degradar a dimerização de DNMT3A ou reduzir Kcat. A sequência de aminoácido (traduzida de acordo com GenBank AF067972.2) da região da metiltransferase deste exemplo é descrita no N° ID SEQ: 87 (região AdoMet_MTase DNMT3A R729A)

[0389] Uma sequência de aminoácido adaptada da imunoglobulina do frag-mento variável de cadeia simples da anti-Fluoresceína (scFv) (códigos de acesso do Banco de Dados de Proteína 1X9Q, 1FLR_H) é utilizada neste exemplo como Domínio de ligação; um SV40NLS (PKKKRKV: N° ID SEQ: 3) é utilizado como domínio de localização nuclear e conectores interdomínio, como, um conector interdomínio flexível (N° ID SEQ. 14: GSLEGGSGG) são utilizados neste exemplo para sua anexação.

[0390] A fração de proteína possui a sequência de aminoácido descrita no N° ID SEQ: 88, codificada pela sequência de ácido nucleico descrita como N° ID SEQ: 89:

[0391] A sequência-alvo para o ensaio de metilação se baseia em um cassete de codificação de mCherry clonado no sítio de MCS de pSAT6-MCS (AY818383.1 GI:56553596) e inclui a sequência de nucleotídeo conforme descrito no N° ID SEQ: 90. A sequência codificadora mCherry (cds) acompanha a descrição dos nucleotídeos 952-1671 da N° ID SEQ: 90. Sequência de SCNA utilizada neste experimento:

[0392] SL898: TCGAGCTCAAGCTTCGAATTCTNNNNNN/36-FAM/ (os áci-dos nucleicos são aqui designados somente como N° ID SEQ: 91).

[0393] SR951: /56-FAM/NNNNNNGATGGTGAGCAAGGGCGAGGAG (os ácidos nucleicos são aqui designados somente como N° ID SEQ: 92).

[0394] Os sítios de ligação do domínio de ligação 3’- e 5’-6FAM (6 carboxi- Fluoresceína) são marcados, por /36-FAM/ E /56-FAM/ respectivamente. Embora um SCNA seja suficiente para a metilação do DNA, é possível usar mais de um SCNA, corretamente espaçado para permitir que a dimerização da proteína aumente a espe-cificidade. Procedimento Experimental

[0395] Uma estratégia de transfecção dupla é utilizada para permitir a expres-são da fração de proteína do complexo molecular antes da introdução de SCNAs e DNA-Alvo.

[0396] A preparação do protoplasto de Arabidopsis se baseia em Wu (Wu et. al., 2009) e é similar ao exemplo 1 com diferenças na etapa de transfecção: Transfecção: 1. Preparar solução PEG fresca para transfecção em tubo de 2ml 2. Retirar BSA de placas de 6 cavidades e secar 3. Misturar ~5 x 10A4 protoplastos (2 x 10A4 -1 x 10A5) em 0,2ml de MMg com cerca de 20microgramas do DNA do plasmídeo que expressa a fração da Proteína a RT em tubos (tampa de encaixe) de fundo redondo de 15 ml. 4. Adicionar igual volume (0,2ml de protoplastos + midiprep vol.) de solução PEG fresca 5. Incubar à temperatura ambiente por 5 min 6. Lavar adicionando lentamente 3ml de W5, 1ml a cada vez, e misturando 7. Centrifugar a 100 x g em swing-out por 1 min 8. Repetir lavagem e peletização 9. Ressuspender in 1ml de W5 10. Verter em placas revestidas com BSA 11. Cultivar os protoplastos em regime de luz diurna ideal por 16 horas (150mi- croEinstein-mA-2-sA-1) a 22°C, substituindo o meio conforme a necessidade. 12. Cerca de 16 horas depois, a retransfecção destas células é realizada, re-petindo-se as etapas 1-11, substituindo o plasmídeo da etapa 3 pelo plasmídeo que codifica mCherry-Alvo e com os SCNAs relevantes (total de cerca de 20 microgramas). 13. A expressão de mCherry e a condição de metilação dos plasmídeos ex-traídos são analisadas 48h depois. Análise

[0397] As análises da condição de metilação de CpG do DNA-alvo aplicam dois métodos: A) O DNA digerido de grupos de protoplastos é analisado por amplificação de PCR. A digestão é realizada utilizando as enzimas de restrição sensíveis à metilação Smal (CCCGGG), Sail (GTCGAC) ou SacII (CCGCGG). O cluster Smal, Sail, SacII é utilizado como sítio CpG para a metilase. Dinucleotídeos CpG sublinhados. O DNA metilado não é clivado por estas enzimas. Desse modo, a sequência de MCS que abrange os sítios de clivagem destas enzimas é amplificada e o produto medido por PCR Quantitativa, informando uma medida da eficiência da metilação versus amostras sem os componentes do complexo molecular ou deliberadamente contendo SCNAs não específicos, precariamente amplificados devido à clivagem completa resultante da não metilação. B) O DNA dos grupos de protoplastos é convertido por bissulfito antes da amplificação de PCR, clonagem e sequenciamento, para analisar a condição de metila- ção de um número de sequências de controle-alvo e não alvo. O sequenciamento do bissulfito é realizado conforme descrito no Kit EZ DNA Metilation-Gold (ZYMO, EUA) adequado for a detecção de DNA metilado e que é utilizado para análise posterior. EXEMPLO 6. Modificação do genoma endereçado em Humanos: deleção gene CCR5 em células-tronco hematopoiéticas humanas.

[0398] O tipo 5 do receptor da quimiocina C-C (CCR5, Acesso GenBank N° NT_022517.18) é um receptor da quimiocina expresso e exibido na superfície de cé-lulas T, macrófagos, células dendríticas e microgliócitos. Uma mutação deste gene - CCR5-Δ32, que consiste de uma deleção de 32 bases, resulta em uma mutação por deslocamento de quadro que introduz 31 novos aminoácidos no C’-terminal da prote-ína truncada, e confere resistência a varíola e alguns tipos de Vírus da Deficiência Humana (HIV). Este alelo é encontrado em cerca de 10% de europeus, sendo raro em outros grupos.

[0399] No exemplo adiante, CCR5 ou porções deste gene são excluídas das células-tronco hematopoiéticas (HSC) extraídas de pacientes infectados pelo HIV que não possuem o alelo Δ32.

[0400] A fração de proteína é formada por um Domínio funcional baseado na nucleasse (domínio da nuclease FokI modificado, como acima) e um domínio de liga-ção de ligação do motivo de RNA (derivado do domínio do peptídeo BIV TAT mínimo da proteína BIV TAT SGPRPRGTRGKGRRIRR (N° ID SEQ: 93), em que o domínio de ligação da fração de proteína se liga à sequência de RNA particular UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU (N° ID SEQ: 94) que é a alça 1 BIV TAR. A entrega do ácido nucleico codificador da fração de proteína é realizada concomitantemente com a entrega do ácido nucleico propiciador de especificidade (SCNA) pelo vetor adenoviral, para sua expressão transitória. O adenovírus não é integrado ao genoma hospedeiro.

[0401] Após a introdução e expressão nas células-alvo (HSC), os complexos moleculares se reúnem autonomamente no gene-alvo CCR5, permitindo que as fra-ções da proteína dimerizem e clivem a sequência CCR5, para causar uma deleção das porções deste gene, conforme pretendido. Em seguida a esta modificação gené-tica, os HSCs geneticamente modificados assim criados, ou seus descendentes são retransplantados autologamente ao paciente. As células que foram modificadas são enriquecidas por seleção removendo as células que exibem CCR5 antes da enxertia. As células T e os macrófagos mutadas por CCR5 que se desenvolvem a partir destes HSCs são resistentes à infecção por HIV. A maior parte dos adenovírus e dos compo-nentes complexo molecular foram depurados do HSCs antes da enxertia, tendo con-cluído sua função.

[0402] A prevenção funcional da exibição de CCR5 pode ser obtida através deste sistema de inúmeras maneiras diferentes, utilizando tipos e locais diferentes de SCNA, conforme detalhado adiante:

[0403] No alelo Δ32, 32 nucleotídeos de 3’ de CCR5 CDS estão ausentes, resultando em uma deleção do deslocamento de quadro. A sequência excluída é: TTCCATACAGTCAGTATCAATTCTGGAAGAA (N° ID SEQ: 95). Para excluir esta se-quência das células que expressam CCR5, os SCNAs derivados das sequências adiante (mostradas sem a modificação de ligação do domínio de ligação) são utilizados:

[0404] ATCAATTCTGGAAGAATTTCCA (N° ID SEQ: 96);

[0405] TCATTACACCTGCAGCTCTCAT (N° ID SEQ: 97).

[0406] Neste exemplo, quando a modificação de ligação do domínio de liga-ção em um SCNA transcrito utiliza BIV TAR, as sequências completas das sequências de SCNA são:

[0407] Opção de distância de SCNA 1, Utilizando um gap 16bp e nenhum linker "N" interno de SCNA:

[0408] CCR5_D32_SR_3321: UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUAUCAAUUCUGGAAGAAUUUCC A (N° ID SEQ: 98)

[0409] CCR5_D32_SL_3304: UCAUUACACCUGCAGCUCUCAUUUCAGCUCGUGUAGCUCAUUAGCUCCGAGC U (N° ID SEQ: 99)

[0410] Opção de distância de SCNA 2, empregando um gap-alvo de 27bp e 2 nucleotídeos de linker "N": CCR5_D32_SR_3319:

[0411] UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUNNGUAUCAAUUC UGGAAGAAUUUC (N° ID SEQ: 100)

[0412] CCR5_D32_SL_3291:

[0413] CAAAAAGAAGGUCUUCAUUACACNNUUCAGCUCGUGUAGCUCA UUAGCUCCGAGCU (N° ID SEQ: 101)

[0414] Estes SCNAs são projetados para possibilitar a modificação/clivagem na sequência-alvo TTTCCATACAGTCAGTATCAATTCTGGAAGAA (N° ID SEQ: 102). A clivagem e a formação de DSB mediadas por estes pares isoladamente, ema alguns casos, através de mecanismo endógenos, pode causar uma mutação que conduziria a um deslocamento do quadro de leitura. A fim de produzir deleções mais amplas nos pares do gene CCR5 do SCNAs, o endereçamento de pelo menos dois alvos em CCR5 são utilizados:

[0415] A deleção de substancialmente toda a sequência codificadora de CCR5 é induzida utilizando SCNAs de ligação da região CCR5-ATG e SCNAs de li-gação da região do códon de PARADA CCR5, concomitantemente. ATG SCNAs:

[0416] Área endereçada entre SCNAs (ATG sublinhado):

[0417] CAGGGTGGAACAAGATGGATTATCAAGTGTC (N° ID SEQ: 103).

[0418] Opção de distância de SCNA 1 utilizando um gap-alvo de 31bp e ne-nhum linker “N” interno de SCNA:

[0419] CCR5_SR_2779: UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUAAGTCCAATCTATGACATCAAT (N° ID SEQ: 104);

[0420] CCR5_SL_2747: AAGATCACTTTTTATTTATGCAUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU. (N° ID SEQ: 105).

[0421] Opção de distância de SCNA 2, baseando-se em resultados computa-cionais, empregando um gap-alvo de 27bp e 2 nucleotídeos do linker “N”:

[0422] CCR5_SR_2777:

[0423] UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUNNUCAAGUCCAA UCUAUGACAUCA (N° ID SEQ: 106)

[0424] CCR5_SL_2749:

[0425] GAUCACUUUUUAUUUAUGCACANNUUCAGCUCGUGUAGCUCAU UAGCUCCGAGCU (N° ID SEQ: 107)

[0426] STOP SCNAs:

[0427] Área endereçada entre SCNAs (códon de PARADA sublinhado): ATATCTGTGGGCTTGTGACACGGACTCAAGT (N° ID SEQ: 108)

[0428] Opção de distância de SCNA 1 Utilizando um gap-alvo de 31bp e ne-nhum linker “N” interno de SCNA:

[0429] CCR5_SR_3884: UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUGGGCTGGTGACCCAGTCAGAG T (N° ID SEQ: 109);

[0430] CCR5_SL_3802: CCGATCCACTGGGGAGCAGGAAUUCAGCUCGUGUAGCUCAUUAGCUCCGAGC U (N° ID SEQ: 110)

[0431] Opção de distância de SCNA 2, com base em resultados computacio-nais, empregando um gap-alvo de 27bp e 2 nucleotídeos do linker “N”:

[0432] CCR5_SR_3833:

[0433] UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUNNUGGGCUGGU GACCCAGUCAGAG (N° ID SEQ: 111)

[0434] CCR5_SL_3805:

[0435] AUCCACUGGGGAGCAGGAAAUANNUUCAGCUCGUGUAGCUCAU UAGCUCCGAGCU (N° ID SEQ: 112)

[0436] A fração de proteína do complexo molecular é expressa via uma se-quência de nucleotídeo transportada em um sistema de expressão baseado em Ade- novírus, tais como, Adeno-X™ Adenoviral System 3 (Clontech Laboratories (CA, EUA)) e observando-se as instruções do fabricante. Alternativamente, a fração de proteína é entregue pela transfecção de RNA nu.

A sequência de aminoácido da fração de proteína para este exemplo:

[0437] Domínio funcional: derivado da subunidade da nuclease FokI (como acima).

[0438] Domínio de ligação: domínio do peptídeo BIV TAT mínimo SGPRPRGTRGKGRRIRR (N° ID SEQ: 93).

[0439] Domínio de localização celular: domínio do sinal de localização nuclear (NLS) de SV40 (SV40NLS).

[0440] subunidade da nuclease FokI: VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHL GGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHI NPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGG EMIKAGTLTLEEVRRKFNNGEINF (N° ID SEQ: 66);

[0441] SV40NLS: MPKKKRKV (N° ID SEQ: 67);

[0442] Peptídeo BIV TAT: SGPRPRGTRGKGRRIRR (N° ID SEQ: 93).

[0443] Conector interdomínio: GSGGSGP (N° ID SEQ: 113)

[0444] A fração de proteína programável baseada em BIV TAT Montada deste exemplo possui a sequência de aminoácido conforme descrito no N° ID SEQ: 114, que é codificada pela sequência de ácido nucleico conforme descrito no N° ID SEQ: 115.

[0445] Medições espaciais obtidas de modelos tridimensionais computadori-zados para o sistema BIV-TAT-TAR com o linker do Interdomínio de GGSGGGP (N° ID SEQ: 116), conforme utilizado neste exemplo, demonstraram que a distância ideal esperada entre SCNAs, na presença de 2 N’s no SCNA, corresponde a cerca de 26-28 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à es-querda e à direita do 12o, 13o ou 14o nucleotídeo, a contagem começa depois que o nucleotídeo hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto di- merizado. Este critério sugere que se, como neste exemplo, a sequência direcionada for de 27 nucleotídeos:

[0446] AAAAAAAAAAYYYYYYYYYYXXXXXXXYYYYYYYYYYCCCCCCCCC C, onde Y+X representa o número de nucleotídeos entre os sítios de emparelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultando na DSB está na ou adjacente à área X (sítio-alvo). Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, mas são preferencialmente escolhidos para emparelhar com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posi-ção da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima”.

[0447] A detecção e seleção de células que não expressam/apresentam o CCR5 do tipo selvagem vs. células que expressam o CCR5 do tipo selvagem é reali-zada por análise de FACS, utilizando um anticorpo monoclonal de camundongo CCR5 anti-Humano (sistemas R&D - N° Catálogo FABSP1).

EXEMPLO 7. Ativador de transcrição endereçado por emparelhamento de base do ácido nucleico programável

[0448] Neste exemplo, um sistema de protoplasto em plantas monocotiledô- neas de milho (Marrs & Urioste, 1995; Rhodes et. al., 1988) é utilizado como bioensaio. Neste sistema, protoplastos de milho são eletroporados para introduzir um plasmídeo visando à expressão transitória. Estes protoplastos podem ser então regenerados, se assim desejado.

[0449] Neste exemplo, uma fração de proteína constituída pelo domínio ativa- dor da transcrição de Gal4 , excluindo o domínio de ligação UAS, e um domínio de ligação constituído por anti-fluoresceína ScFv, juntamente com um SCNA modificado com Fluoresceína, é utilizada para ativar a expressão de um gene repórter. Neste exemplo, aqui utilizado, o domínio de ligação do DNA de Gal4 é removido e substituído por um Domínio de ligação da fração de proteína.

[0450] No primeiro exemplo, utilizam-se dois plasmídeos repórteres que po-dem expressar GFP (opção 1) ou β-glucoronidase (GUS, opção 2), somente se um ativador de transcrição estiver ligado a uma sequência a montante de um TATA box. Neste exemplo, esta sequência é um 6X-UAS, sabidamente ativado pela proteína Gal4.

[0451] No segundo exemplo, as sequências UAS são removidas do ácido nu- cleico-alvo e o SCNA se liga ao minus 62 (62nt a jusante do TATA box), alcançando essencialmente o mesmo resultado, porém sem qualquer promotor natural. No sistema de bioensaio de protoplasto de milho, a fração de proteína mostrada abaixo e o SCNA podem ser cotransfectados com o uso de eletroporação.

[0452] A sequência de aminoácido da fração de proteína: compreendendo um domínio de ativação Gal4 endereçado por N’ nuclear fundido através de um conector interdomínio a uma antifluoresceína ScFv é aqui designada como N° ID SEQ: 132 e é codificado pela sequência de nucleotídeo como descrito no N° ID SEQ: 157.

[0453] O primeiro exemplo utiliza um plasmídeo-alvo com 6 repetições de UAS:

[0454] O plasmídeo-alvo contém, na seguinte ordem (5'->3'), uma região pro-motora 6UAS seguida por um TATA box e é aqui designado no N° ID SEQ: 180: GGACTGTAGAGGTTCCGGGTGACAGCCCTCCGACGGGTGACAGCCCTCCGAC GGGTGACAGCCCTCCGAATTCTAGAGGATCCGGGTGACAGCCCTCCGACGGGT GACAGCCCTCCGACGGGTGACAGCCCTCCGAATTCGAGCTCGGTACCCGGGG ATCTGTCGACCTCGATCGAGATCTTCGCAAGACCCTTCCTCTATATA;

Um espaçador que tem a sequência:

[0455] AGGAAGTTCATTTCATTTGGRGAGGACACGCTGAACC (N° ID SEQ: 192); Opção 1: Uma sequência codificadora GFP descrita no N° ID SEQ: 193. Opção 2: Uma sequência codificadora de β-glucoronidase (GUS), descrita no N° ID SEQ: 194.

[0456] uma sequência Terminadora-35:

[0457] GTCCGCAAAAATCACCAGTCTCTCTCTACAAATCTATCTCTCTCTA TTTTTCTCCAGAATAATGTGTGAGTAGTTCCCAGATAAGGGAATTAGGGTTCTTA TAGGGTTTCGCTCATGTGTTGAGCATATAAGAAACCCTTAGTATGTATTTGTATTT GTAAAATACTTCTATCAATAAAATTTCTAATTCCTAAAACCAAAATCCAGTGAC (N° ID SEQ: 195)

[0458] Duas orientações diferentes do SCNA são fornecidas em experimentos separados para a escolha da mais eficaz delas: SCNA de ligação da sequência UAS

[0459] Sentido: CGGGTGACAGCCCTCCGANNNNNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 196)

[0460] Antissentido:/5-6FAM/NNNNNNTCGGAGGGCTGTCACCCG (os áci-dos nucleicos somente estão aqui descritos no N° ID SEQ: 197)

[0461] A modificação da extremidade dos SCNAs é 6-carboxi fluoresceína (6FAM). Modificação 5’ ou 3’ mostrada como /5-6FAM/ ou /3-6FAM/ respectivamente. N representa qualquer nucleotídeo.

[0462] O segundo exemplo utiliza um plasmídeo-alvo sem promotor para con-trolar a expressão do gene reportado:

[0463] O plasmídeo-alvo contém, na seguinte ordem, uma sequência do es-queleto do plasmídeo seguida por um TATA box:

[0464] TCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAG GCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGAC GGCCAGTGCCACCCATAATACCCATAATAGCTGTTTGCCAACCGGTTCTATATA (N° ID SEQ: 198);

[0465] Uma sequência do espaçador (N° ID SEQ: 199): AGGAAGTTCATTTCATTTGGRGAGGACACGCTGAACC; Opção 1: GFP ORF, conforme descrito no N° ID SEQ: 200. Opção 2: Sequência codificadora de β-glucoronidase (GUS), conforme des-crito no N° ID SEQ: 201. Uma sequência do terminador 35S (N° ID SEQ: 202):

[0466] Duas diferentes orientações do SCNA são utilizadas:

[0467] SCNA: opções (62 minus):

[0468] GCCAGGGTTTTCCCAGTCACGANNNNNN/36-FAM/ (os ácidos nu- cleicos somente estão aqui descritos no N° ID SEQ: 203)

[0469] /5-6FAM/NNNNNNTCGTGACTGGGAAAACCCTGGC (os ácidos nu- cleicos somente estão aqui descritos no N° ID SEQ: 204)

[0470] Protoplastos de milho são testados para a expressão de GFP (opção 1) utilizando métodos microscópicos ou citometria de fluxo. As células positivas a GFP indicam o funcionamento do complexo programado. O percentual de células positivas a GFP permite calcular as eficiências relativas entre os experimentos conduzidos para aperfeiçoar diferentes parâmetros do sistema. A ausência de GFP em células carentes dos componentes apropriados do complexo (por exemplo, utilizando SCNAs não específicos de controle) permite mensurar os limites da especificidade.

[0471] Protoplastos de milho são testados para a expressão de GUS (opção 2) através da coloração das células com X-Gluc em manitol 0,45M e incubando de um dia para o outro a 37°C, e detectados com microscópio. As células positivas a GUS (coloridas de azul) indicam o funcionamento do complexo programado. O percentual de células positivas a GUS nos permite calcular as eficiências relativas entre os experimentos conduzidos para aperfeiçoar diferentes parâmetros do sistema. A ausência de GUS em células carentes dos componentes apropriados do complexo (por exemplo, utilizando SCNAs não específicos de controle) nos permite mensurar os limites da especificidade.

EXEMPLO 8: Endereçamento de gene no DNA organelar.

[0472] Nos eucariotos, organelas, como mitocôndria e plastídeos, contêm seus próprios genomas. Ademais, nas plantas, as organelas também podem conter DNAs circulares subgenômicos. A modificação do DNA mitocondrial pode ter implica-ções no tratamento de doenças humanas e no uso na agricultura, entre outros. Os desafios destas modificações incluem, entre outros obstáculos técnicos, a entrega e ativação de um sistema específico da sequência, razoavelmente eficiente, necessário para a edição do gene na organela.

[0473] PCF em Petunia

[0474] A esterilidade masculina citoplasmática (CMS) é uma característica ve-getal valiosa largamente utilizada por firmas comercializadoras de sementes como método para proteger suas linhagens de sementes. Desse modo, é vantajoso reparar a CMS nas linhagens existentes ou criar CMS em novas linhagens. A esterilidade masculina citoplasmática pode se originar da falha nas plantas em produzir anteras, pólen, ou gametas masculinos funcionais em consequência de interações nucleares e mitocondriais específicas. Nos exemplos aqui mostrados, utiliza-se o traço de este-rilidade masculina citoplasmática caracterizado em petúnia, que é causada por uma conjugação de deleção e inserção no gene atp9 no DNA mitocondrial codificador da subunit 9 de uma ATPas. Isso resulta na degradação da função de translocação do próton do complexo de multiproteína da ATPase mitocondrial, o que leva à esterilidade masculina.

[0475] A fração de proteína do complexo molecular programável deste exem-plo é projetado para alojar um sinal de localização mitocondrial a fim de garantir a localização do complexo molecular programado dentro da mitocôndria. Outros méto-dos para transferência de ácidos nucleicos para a mitocôndria incluem o uso de lipos- somas ou eletroporação. A mitocôndria vegetal, e especificamente em uma planta so- lanácea, que inclui Petunia, importa ativamente o DNA através do complexo do poro de transição da permeabilidade. O processo é restrito ao DNA de filamento duplo, mas não possui especificidade óbvia de sequência. As sequências Doadoras podem ser entregues, por exemplo, como fragmentos de PCR purificados lineares, plasmídeos linearizados, ou plasmídeos circulares, dependendo do método de entrega. A expressão a partir de plasmídeos, eletroporados na mitocôndria de trigo isolada, por exemplo, é bastante eficiente quando se utiliza um promotor compatível com a mitocôndria, como o 882 bp do promotor mitocondrial cox II de T. timopheevi contendo a região de iniciação descrita por (Hanic-Joyce e Gray, 1991).

[0476] A seleção das células contendo um evento de substituição ou inserção pode ser obtida por um operon de resistência ao Cloranfenicol codificado no DNA Doador.

[0477] Nos exemplos (8A-8C) a seguir, a fração de proteína compreende:

[0478] Um Domínio de ligação derivado do peptídeo BIV TAT compreendendo a sequência de aminoácido SGPRPRGTRGKGRRIRR (N° ID SEQ: 93);

[0479] Um Domínio funcional derivado da nuclease FokI compreendendo a sequência de aminoácido VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHL GGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHI NPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGG EMIKAGTLTLEEVRRKFNNGEINF (N° ID SEQ: 66);

[0480] Um Domínio de localização celular derivado da sintase do ácido lipoico de Arabidopsis e compreendendo a sequência de aminoácido MHSRSALLYRFLRPASRCFSSSS (N° ID SEQ:6) que é um sinal de localização mito- condrial (MLS).

[0481] Conector interdomínio: GSGGSGP (N° ID SEQ: 113)

[0482] A fração de proteína programável baseada em BIV TAT Montada deste exemplo possui a sequência de aminoácido descrita no N° ID SEQ: 205, que é codifi-cada pela sequência de nucleotídeo descrita no N° ID SEQ:206.

[0483] Os resultados das medições espaciais obtidas com modelos tridimen-sionais computadorizados para o sistema BIV-TAT-TAR com o linker do Interdomínio de GGSGGGP (N° ID SEQ: 116), deste exemplo, mostra que a distância ideal espe-rada entre SCNAs, na presença de 2 N’s no SCNA, é de cerca de 26-28 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à esquerda e à direita do 12o, 13o ou 14o nucleotídeo, a contagem começa depois que o nucleotídeo hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto dimerizado. Este critério sugere que, se a sequência endereçada for, por exemplo, os 27 nucleotídeos adiante:

[0484] AAAAAAAAAAYYYYYYYYYYXXXXXXXYYYYYYYYYYCCCCCCCCC C, onde Y+X representa o número de nucleotídeos entre os sítios de emparelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultando na DSB está na ou adjacente à área X. Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, entretanto, são escolhidos para emparelharem preferencialmente com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima”.

[0485] A sequência de RNA de ligação do Domínio de Ligação do SCNA utilizada neste exemplo é derivada da alça 1 BIV TAR compreendendo a sequência de ácidos nucleicos UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU (N° ID SEQ: 117). Desse modo o SCNA pode ser entregue diretamente à mitocôndria isolada (por eletroporação da mitocôndria na presença de um DNA codificador do SCNA sob um promotor bacteriano) ou entregue ao citoplasma (pela transcrição transitória mediada por Agrobacterium) e “arrastado” para a mitocôndria pela fração de proteína a que está ligado e compreendendo MLS.

[0486] Após a expressão do complexo molecular programável, a mitocôndria é isolada e um DNA Doador é transfectado na mitocôndria isolada.

[0487] Os exemplos adiante são executados, cada um deles tendo 2 opções para as distâncias do SCNA: 1. Formar um fenótipo CMS sem um DNA doador (8A). 2. Endereçar atp9 para formar um mutante similar a pcf utilizando um DNA Doador com resistência ao Cloranfenicol (8B). 3. Reparar um fenótipo pcf (CMS), reformar ATP9 e restaurar a fertilidade e utilizando ao mesmo tempo um DNA Doador com resistência ao Cloranfenicol (8C).

[0488] As sequências de ácido nucleico-alvo para estes exemplos incluem:

[0489] “ATP9”: subunidade 9 do ATP sintase mitocondrial de Petunia x híbrido X Petunia axillaris subsp. parodii, N° de acesso GenBank Y00609.1 GI:297475.

[0490] “pcf”: Esterilidade masculina citoplasmática (CMS) em Petunia axillaris subsp. parodii, proteína de fusão associada a CMS (CMS-afp), subunidade 3 da NADH desidrogenase (nad3), e genes S12 da proteína ribossômica (rps12), cds completo; mitocondrial, N° de acesso GenBank M16770.1 GI:1256946.

Exemplo 8A. Mutação dirigida por DNA no DNA organelar, sem isolamento da organela. Endereçar ATP9 para formar uma mutação que cause CMS ao criar uma proteína ATP9 não funcional.

[0491] Os SCNAs são projetados para formar uma única DSB no sítio-alvo, que é reparada pela via de reparo NHEJ endógena, criando deslocamentos de quadro em parte da sequência codificadora.

[0492] Sítio-alvo ATP9: GCAAAACAATTATTTGGTTATGCCATTTTGG (N° ID SEQ: 118).

[0493] Opção de distância de SCNA 1, gap-alvo de 31bp:

[0494] SCNAs flanqueando o sítio-alvo ATP9:

[0495] ATP9_ASL_705: UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUCAAUGAUGGAUUUCGCGCCAC G (N° ID SEQ: 119)

[0496] ATP9_ASR_737: UUAGCUUCGGUUAGAGCAAAGCUUCAGCUCGUGUAGCUCAUUAGCUCCGAGC U (N° ID SEQ: 120)

[0497] Opção de distância de SCNA 2, empregando um gap-alvo de 27bp:

[0498] ATP9_ASL_707:

[0499] UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUGCCAAUGAUGGA UUUCGCGCCA (N° ID SEQ: 121)

[0500] ATP9_ASR_735:

[0501] AGCUUCGGUUAGAGCAAAGCCCUUCAGCUCGUGUAGCUCAUUA GCUCCGAGCU (N° ID SEQ: 122)

[0502] Folhas de petúnia são inoculadas utilizando um método convencional de infiltração foliar conhecido na técnica, com Agrobacterium alojando T-DNA deri-vado de um plasmídeo de vetor binário que codifica a fração de proteína, e RNA- SCNAs (como mostra esquematicamente a Figura 8A). Após a transfecção, os com-ponentes do Complexo molecular programado são expressos no citoplasma, reúnem- se autonomamente, e são então localizados na mitocôndria pelo sistema de importa-ção mitocondrial, através da MLS exibida na superfície da fração de proteína. O com-plexo molecular programado (compreendendo a fração de proteína e o SCNA de endereçamento) então endereça o gene ATP9 no DNA mitocondrial, formando então a mitocôndria mutada.

[0503] Para análise, 48 horas após a transfecção, o DNA é purificado das plantas e a sequência ATP9 é amplificada por PCR utilizando iniciadores:

[0504] ATP9atgF: ATGTTAGAAGGTGCAAAATCAA (N° ID SEQ: 123)

[0505] ATP9p2R: CTAACGGACTTGGAATACGAAT (N° ID SEQ: 124)

[0506] O produto da PCR é então submetido ao Ensaio de Detecção de Mu-tação Enzimática CEL I (Kit de Detecção de Mutação SURVEYOR (Transgenomics, EUA)). Este ensaio é utilizado para avaliar a efetividade da mutação do DNA mitocon- drial através do endereçamento de gene com um complexo molecular programado.

Exemplo 8B. inserção do DNA dirigido no DNA organelar.

[0507] Neste exemplo, o ATP9 é endereçado para formar um mutante similar ao pcf inserindo um DNA Doador contendo o marcador de seleção cloranfenicol no locus ATP9.

[0508] Método: assim como no exemplo 8A, folhas de petúnia são inoculadas utilizando um método convencional de infiltração foliar com Agrobacterium que aloja o T-DNA derivado de um plasmídeo de vetor binário que codifica a fração de proteína do complexo molecular programado, e os SCNAs. Após a transfecção, os componen-tes do Complexo molecular programado são expressos no citoplasma, se reúnem au-tonomamente, e são localizados na mitocôndria pelo sistema de importação mitocon- drial através da MLS exibida na superfície da fração de proteína. Após cerca de 1272 horas, as folhas infiltradas são utilizadas para preparação mitocondrial. Um vetor de plasmídeo ou um produto da PCR linear compreendendo o DNA Doador deste exemplo, é entregue por eletroporação na mitocôndria isolada. A mitocôndria eletro- porada é então transplantada em protoplastos frescos de Petunia por microinjeção. Os protoplastos injetados são regenerados no meio de seleção de cloranfenicol pos-sibilitando que somente a mitocôndria semelhante a PCF sobreviva nas células.

[0509] O 8B DOADOR DNA (atp9 modificado para semelhança a pcf) é des-crito no N° ID SEQ: 125:

Resultados e análise:

[0510] O complexo molecular programado cliva o gene atp9 em sua sequência codificadora, a jusante da região homóloga a pcf. Isso resulta na recombinação homóloga (HR) entre o Doador semelhante a pcf e o gene atp9 clivado. Um genótipo estéril masculino pcf no genoma mitocondrial é então recriado. Ademais, o doador contém um cassete de resistência ao cloranfenicol que possibilita a seleção da mito- côndria resistente ao cloranfenicol. Os protoplastos injetados aptos à regeneração no meio de seleção contendo cloranfenicol contêm a mitocôndria endereçada com DNA modificado. O calo resultante destes protoplastos é capaz de diferenciação de brotos, e por fim plantas inteiras são formadas resultando em plantas regeneradas contendo somente a mitocôndria endereçada. Desse modo, a Petunia estéril masculina é obtida a partir da regeneração de plantas dos calos contendo mitocôndrias resistentes ao cloranfenicol.

Exemplo 8C. Substituição do DNA dirigido na DNA organelar.

[0511] Neste exemplo, o mutante pcf é endereçado para formar uma sequên-cia ATP9 reparada ativa utilizando um DNA Doador portador de resistência ao Cloran- fenicol.

[0512] Neste exemplo, o DNA Doador é projetado para ser integrado por HR ao locus pcf, criando um códon de PARADA para recriar uma proteína ATP9 intacta destituída da sequência de aminoácido supérflua causadora da disfunção pcf. Um cassete de resistência ao cloranfenicol (AY230218.1 GI:30267504) no DNA Doador é utilizado para seleção da mitocôndria reparada. The CDS no doador estão no desenho de um operon. A sequência de cloranfenicol é mostrada em caixa baixa sublinhada.

[0513] Método: Um vetor de plasmídeo compreendendo o DNA Doador deste exemplo, o SCNA mostrado no exemplo 8C e a fração de proteína do exemplo 8a, são entregues por eletroporação na mitocôndria isolada, neste exemplo em um único plas- mídeo com desenho similar ao mostrado esquematicamente na Figura 9.

[0514] De maneira semelhante ao exemplo 8B, as mitocôndrias eletroporadas são transplantadas em protoplastos de Petunia por microinjeção. Os protoplastos são semeados em meio de seleção ao cloranfenicol. O calo resultante destes protoplastos é capaz de diferenciação de brotos (Frearson et. al., 1973), e por fim plantas inteiras são formadas, resultando em plantas regeneradas contendo somente a mitocôndria endereçada. Estas plantas de petunia são avaliadas em termos de fertilidade masculina.

Sequências 8C:

[0515] Sítio-alvo no pcf: AGACTTACATCACGATGTCTTTTTCTTCGTT (N° ID SEQ: 126)

[0516] SCNAs flanqueando o sítio-alvo:

[0517] Opção de distância de SCNA 1, gap-alvo de 31bp:

[0518] CMS_ASL_704: UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUGUUAUUUGUAUACCUAACACG G (N° ID SEQ: 127).

[0519] CMS_ASR_736: AUACGAAAACCAAAAUCAGAAUUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU (N° ID SEQ: 128).

[0520] Opção de distância de SCNA 2, com base em resultados computacio-nais, empregando um gap-alvo de 27bp:

[0521] CMS_ASL_706

[0522] uucagcuCGUGUAGCUCAUUAGCUCCGagcuCUGUUAUUU- GUAUACCUAACAC (N° ID SEQ: 129)

[0523] CMS_ASR_734

[0524] ACGAAAACCAAAAUCAGAAUAAUUCAGCUCGUGUAGCUCAUUAG CUCCGAGCU (N° ID SEQ: 130)

[0525] A sequência do DOADOR 8C acompanha a descrição no N° ID SEQ: 131.

EXEMPLO 9: Modificação genômica de células de mamíferos: Prevenir morte mediada pelo receptor FAS.

[0526] O receptor FAS (FasR), também conhecido como antígeno da apop- tose 1 (APO-1, APT, TNFRSF6, CD95), é uma proteína que nos seres humanos é codificada pelo gene TNFRSF6 localizado no cromossoma 10 em humanos (acesso GenBank NC_000010 REGION: 90750288..90775542 GPC_000000034 VERSION NC_000010.10 GI:224589801). O receptor Fas é um receptor da morte exibido na superfície de células que ocasiona a morte celular programada (apoptose) formando o complexo de sinalização indutor da morte (DISC) mediante a ligação do ligante. O trímero do ligante Fas ancorado na membrana na superfície de uma célula adjacente causa a trimerização do receptor Fas. O ligante Fas ou FasL (CD95L) é uma proteína da transmembrana do tipo II homotrimérica. O FasL solúvel é menos ativo que sua contraparte ligada à membrana e não induz a trimerização do receptor e a formação de DISC. Depois de resultar na agregação do domínio da morte (DD), o complexo receptor é internalizado e inicia uma cascata de eventos através de caspases, even-tualmente culminando com a degradação do DNA, borbulhamento (blebbing) de membrana, e outras características da apoptose. Este evento também pode ser simulado pela ligação de um anticorpo de Fas agonístico, utilizado neste exemplo.

[0527] São conhecidas oito variantes de splice de FasR que são traduzidas em sete isoformas da proteína. O receptor de Fas indutor da apoptose é a isoforma 1 que é uma proteína da transmembrana do tipo 1. A proteína do Fas possui 319 ami- noácidos, é dividida em 3 domínios: um domínio extracelular, um domínio de trans- membrana, e um domínio de citoplasmático. O domínio extracelular possui 157 ami- noácidos e é rica em resíduos de cisteína. Os domínios da transmembrana e citoplasmático possuem 17 e 145 aminoácidos, respectivamente. Os exons 1 a 5 co-dificam a região extracelular que pode interagir com o trímero FasR. O exon 6 codifica a região da transmembrana. Os exons 7-9 codificam a região intracelular. Sequência de proteína e propriedades

[0528] A fração de proteína acompanha a descrição no Exemplo 3.

[0529] Sendo assim, a fração de proteína do complexo molecular descrito neste exemplo possui a sequência de aminoácido descrita na N° ID SEQ: 49.

[0530] O ácido nucleico propiciador de especificidade (SCNA) deste exemplo é modificado pela adição de um Fluoresceína-ScFv/6-FAM, 6-carboxifluoresceína - Fluoresceína dT que inclui um linker C6 em uma extremidade de cada SCNA. Propriedades e sequência de SCNA

[0531] O comprimento do SCNA do oligonucleotídeo de emparelhamento de base-alvo complementar, de preferência, apresenta pelo menos 18 bases. O SCNA pode conter ainda um número pequeno (por exemplo, 0-6, neste exemplo, 6) de nu- cleotídeos de emparelhamento de base não endereçados (N's) de qualquer composi-ção de sequência que sirva de espaçador entre o modificador do 6-FAM terminal e os nucleotídeos complementares-alvo.

[0532] Os resultados das medições espaciais obtidas com modelos tridimen-sionais computadorizados para o sistema anti-Fluoresceína-ScFv- 6-FAM com o linker do interdomínio de GGSGG (N° ID SEQ: 7), conforme utilizado neste exemplo, demonstrou que a distância ideal esperada entre SCNAs, na presença de 2 N’s no SCNA, corresponde a cerca de 23-26 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à esquerda e à direita do 11o, 12o ou 13o nucleotídeo, con-tando-se a partir do último nucleotídeo que hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto dimerizado. Este critério sugere que, se a sequência endereçada for, para este exemplo de 24 nucleotídeos:

[0533] AAAAAAAAAAYYYYYYYYYXXXXXXYYYYYYYYYCCCCCCCCCC, onde Y+X representa o número de nucleotídeos entre os sítios de emparelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultando na DSB está na ou adjacente à área X. Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, entretanto, são escolhidos para emparelharem preferencialmente com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima”. Sequência do sítio alvo:

[0534] Os exemplos de sequências-alvo são: A) O exon 1 começa em 347, a sequência-alvo é: GGGCATCTG GACCCTCCTACC (N° ID SEQ: 133)

[0535] SCNAs:

[0536] Opção de distância de SCNA 1, gap-alvo com 21bp SL351: A*GGATTGCTCAACAACCATGCTNNNNNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 134)

[0537] SR373: /56-FAM/NNNNNNTCTGGTGAGCCCTCTCCTGCC*C (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 135)

[0538] Opção de distância de SCNA 2, com base em resultados computacio-nais, empregando um gap-alvo de 24bp e um linker “N” de SCNA mais curto:

[0539] SL349: G*GAGGATTGCTCAACAACCATGNN/36-FAM/ (os ácidos nu- cleicos somente estão aqui descritos no N° ID SEQ: 136)

[0540] SR374: /56-FAM/NNCTGGTGAGCCCTCTCCTGCCC*G (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 137)

[0541] O exon 2 começa em 12499, a sequência-alvo é: TACGTCTGTTGCTAGATTATC (N° ID SEQ: 138) B)

[0542] SCNAs:

[0543] Opção de distância de SCNA 1, gap-alvo com 21bp:

[0544] SL12503: A*TGCTTTTATTTTACAGGTTCTNNNNNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 139)

[0545] SR12525: /56-FAM/NNNNNNGTCCAAAAGTGTTAATGCCCA*A (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 140)

[0546] Opção de distância de SCNA 2, com base em resultados computacio-nais, empregando um gap-alvo de 24bp e um linker “N” de SCNA mais curto:

[0547] SL12501: TCATGCTTTTATTTTACAGGTTNN/36-FAM/ (os ácidos nu- cleicos somente estão aqui descritos no N° ID SEQ: 141)

[0548] SR12526: /56-FAM/NNTCCAAAAGTGTTAATGCCCAA*G (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 142)

[0549] O exon 2 Alvo para análise de restrição: CAGTTGAGACTCAGAACTTGG (N° ID SEQ: 143) C)

[0550] SCNAS:

[0551] Opção de distância de SCNA 1, gap-alvo com 21bp

[0552] SL12595: G*GAATTGAGGAAGACTGTTACTANNNNNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 144)

[0553] SR12617: /56- FAM/NNNNNNAAGGCCTGCATCATGATGGCCAATTCT*C (os ácidos nucleicos so-mente estão aqui descritos no N° ID SEQ: 145)

[0554] Opção de distância de SCNA 2, com base em resultados computacio-nais, empregando um gap-alvo de 24bp e um linker “N” de SCNA mais curto:

[0555] SL12594: G*GAATTGAGGAAGACTGTTACTNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 146)

[0556] SR12619: /56-FAM/NNGGCCTGCATCATGATGGCCAA*T (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 147)

[0557] Iniciadores para análise do exemplo C:

[0558] FAS_E2F: CATGCTTTTATTTTACAG; (N° ID SEQ: 148)

[0559] FAS_E2R: CTGTGACTTTCACTGTAATC (N° ID SEQ: 149)

[0560] A amplificação de PCR do alvo com estes iniciadores forma (no DNA não modificado) um produto da PCR de 227bp digerido com DdeI formando fragmen-tos de 127bp e 100bp. A digestão com DdeI é eliminada pelo endereçamento preciso.

[0561] Exon 9 alvo: CAATTGTGAATTCACATAGAA (N° ID SEQ: 150) D)

[0562] SCNAs:

[0563] Opção de distância de SCNA 1, gap-alvo com 21bp

[0564] SL24524: G*GTGTCATATTATACAATATTTNNNNNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 151)

[0565] SR24546: /56-FAM/NNNNNNAACATTAAATTATAATGTTTG*A (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 152)

[0566] Opção de distância de SCNA 2, com base em resultados computacio-nais, empregando um gap-alvo de 24bp e um linker “N” de SCNA mais curto:

[0567] SL24522: T*TGGTGTCATATTATACAATATNN/36-FAM/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 153)

[0568] SR24547: /56-FAM/NNACATTAAATTATAATGTTTGA*C (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 154)

[0569] Iniciadores para análise do exemplo D:

[0570] FAS_E9F CTTTGTTTATAACTCTGAGAAG (N° ID SEQ: 155)

[0571] FAS_E9R TCAAAATGCTTTTGATGCCTGA (os ácidos nucleicos so-mente estão aqui descritos no N° ID SEQ: 156)

[0572] A amplificação de PCR do alvo com estes iniciadores forma (no DNA não modificado) um produto da PCR de 240bp digerido com EcoRI formando fragmentos de 134bp e 106bp. A digestão com EcoRI é eliminada pelo endereçamento preciso.

[0573] /56-FAM/ e /36-FAM/simbolizam uma modificação 5’ ou uma modifica-ção 3’ respectivamente no ssDNA do SCNA formado por 6-FAM (6-carboxi-Fluores- ceína). N simboliza qualquer nucleotídeo. Ligações de fosforotioato são simbolizadas por um asterisco (*).

[0574] Embora cada par de SCNA possa causar uma mutação para knock-out o receptor FAS, a deleção de toda uma extensão do DNA resultante do endereça-mento, mais de um sítio no gene pode desabilitar instantaneamente a atividade da FASR. Desse modo, por exemplo, o uso dos SCNAs nos exemplos A-C pode resultar em mutações que eliminam a atividade de FasR, enquanto o uso de quaisquer destes SCNAs juntamente com o SCNA do exemplo D leva à maior deleção genômica que elimina a atividade de FasR. Ensaio:

[0575] Consta adiante um bioensaio para detectar uma mutação específica induzida no DNA genômico humano: Células HeLa e Jurkat são transfectadas com um plasmídeo que codifica a fração de proteína do complexo molecular programável juntamente com os SCNAs de ssDNA relevantes utilizando os agentes de transfecção (Mirus, EUA) TransIT-HeLaMONSTER ou TransIT-LT1 para formular o DNA do plas- mídeo e TransIT-Oligo para formular o ssDNA de SCNA. Uma vez incubados pelo tempo prescrito, os dois grupos de misturas do agente de transfecção de DNA formulado são fornecidos simultaneamente às células, para endereçar o FasR cromossô- mico. Para determinar a eficiência do endereçamento de gene, as células são testadas quanto à sua sensibilidade a FasL em um protocolo modificado a partir de (Kotlo et. al., 2003): As células transfectadas são plaqueadas em duas repetições 20-24 h antes do tratamento com uma combinação de 200 ng/ml do anticorpo agonístico anti-FasR (Anti-Fas mAb, clone 2R2 N° de Cat.: MC-121, Kamiya Biomedical Company, ou Clone 7C11monoclonal anti CD95, N° de Cat.: PN IM2387 Beckman-Coulter) e opcionalmente, um agente sensibilizante, como o Dicumarol 100 micromolar. Dezessete horas após o tratamento, determina-se o número de células viáveis, excluindo-se azul de tripano, que permanece aderido à placa após lavagem com PBS ou, em alternativa, realiza-se a coloração com exclusão de iodeto de propídio para avaliar as células vivas intactas por Citometria de fluxo (FACS). As células em que o gene FAS é endereçado e desabilitado, não passam pelo processo de indução à morte, não são coradas, pelo contrário, multiplicam-se. Desse modo, a comparação entre células especificamente endereçadas induzidas versus células não especificamente endereçadas (por exemplo, sem SCNAs ou SCNAs sem FAS) avalia o sucesso do endereçamento de gene em células humanas. Linhagens de células sobreviventes ou classificadas por FACS são analisadas com amplificação de PCR do DNA genômico nas regiões FasR endereçadas seguida de análise do fragmento de restrição e sequenciamento para identificar as mutações induzidas.

EXEMPLO 10: Edição da sequência de DNA do plasmídeo in vivo. Modifica-ção de resistência a Antibiótico.

[0576] Este exemplo se refere a um bioensaio adequado para testar e ajustar as permutações no desenho básico do complexo molecular programável; testar sua aplicação em diferentes organismos ou células; testar diferentes métodos de entrega; e testar as funções de edição de mutação, substituição, deleção e inserção.

[0577] Genes marcadores selecionáveis bacterianos são utilizados para de-terminar a eficiência do endereçamento de gene ao endereçar o DNA do plasmídeo.

[0578] Nestes exemplos, utiliza-se um bioensaio baseado em protoplasto de Arabidopsis. Neste bioensaio, os protoplastos são entregues junto com o sistema re-pórter e o complexo molecular em um plasmídeo, coentregues com SCNA ssDNA emparelhados modificados com um terminal Digoxigenina (NHS Éster) (DIG), um SCNA que possui essa modificação no 3’-terminal e a outra no 5’-terminal. Uma se-gunda modificação para a proteção da exonuclease, como o fosforotioato, pode ser adicionada ao terminal oposto. Sequência de proteína e propriedades

[0579] A fração de proteína acompanha a descrição no Exemplo 1.

[0580] Neste exemplo, a modificação na extremidade do ácido nucleico do SCNA é uma Digoxigenina ligada a NHS-Éster (DIG), anexada à posição 5’ ou 3’ do oligonucleotídeo.

[0581] A sequência de aminoácido (código de uma letra) da fração de proteína do complexo molecular (sequência NLS-FokI-nuclease Com Digoxigenina ScFv está descrita no (N° ID SEQ: 12): Propriedades de SCNA e sequência

[0582] O comprimento do SCNA do oligonucleotídeo de emparelhamento de base-alvo complementar, de preferência, é de pelo menos 18 bases. O SCNA pode conter ainda um número pequeno (por exemplo, 1-6, em um exemplo, 6, em outro exemplo, 2) de nucleotídeos de emparelhamento de base não endereçados (”N’s”) de qualquer composição de sequência que sirva de espaçador entre o modificador do terminal DIG-NHS e os nucleotídeos complementares-alvo.

[0583] Os resultados das medições espaciais obtidas com modelos tridimen-sionais computadorizados para o sistema anti-DIG-ScFv- NHS-Éster-DIG com o linker do interdomínio GSLEGGSGG (N° ID SEQ: 14), como é mostrado neste exemplo, demonstrou que a distância ideal esperada entre SCNAs é, na presença de 2 N’s no SCNA, cerca de 23-26 nucleotídeos. Espera-se que a clivagem ocorra cerca de ±2 nucleotídeos à esquerda e à direita do 11o, 12o ou 13o nucleotídeo, contando-se a partir do último nucleotídeo que hibridizar com o SCNA em ambos os lados, levando em consideração a saliência 5’ (overhang) da base 4 criada pela clivagem do dsDNA pelo construto dimerizado. Este critério sugere que, se a sequência endereçada for, para este exemplo de 24 nucleotídeos:

[0584] AAAAAAAAAAYYYYYYYYYXXXXXXYYYYYYYYYCCCCCCCCCC, onde Y+X representa o número de nucleotídeos entre os sítios de emparelhamento de base SCNA, então os SCNAs projetados emparelham com as áreas A e C e a clivagem resultando na DSB está na ou adjacente à área X. Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, entretanto, são escolhidos para emparelharem preferencialmente com a sequência (não transcrita) sentido. Ambos os SCNAs podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima”. Ensaio de detecção:

[0585] O pTGD do plasmídeo-alvo (representado esquematicamente na Fi-gura 15) compreende 4 seções principais: 1. O cassete-alvo de resistência à ampicilina (AmpR). 2. Cassete de resistência à canamicina (Km) de seleção constitutiva (KanR). 3. Origem de replicação (ori). 4. O cassete de sequência codificador da fração de proteína do complexo molecular programável (PMCP) incluindo um promotor adequado para o organismo de teste, neste exemplo, plantas. 5. T1 e T2 - sequências-alvo 1 e 2.

[0586] Este plasmídeo se multiplica em células bacterianas, por exemplo, cé-lulas de E. Coli. Neste exemplo, os SCNAs, o pTDG do plasmídeo-alvo codificador da fração de proteína do complexo molecular programável e um DNA doador (nos exem-plos 10B, 10C) são entregues em protoplastos de Arabidopsis. 48 horas após a trans- fecção, o DNA é extraído dos protoplastos transfectados (Kit A1120 Promega Corp.) e transformado em células competentes bacterianas de E. Coli (Kit L3002 Promega Corp.). As bactérias transfectadas são espalhadas em meio LB contendo Canamicina na concentração de 100microgramas/ml. As colônias são cultivadas por cerca de 16h a 37 °C. As colônias são em seguida transferidas em cópia a placas LB de Ampicilina (100 microgramas/ml) ou Tetraciclina (100 microgramas/ml) e crescem por mais 16h a 37 °C. Análise:

[0587] As colônias de cada cópia são contadas. O número de colônias resis-tentes à canamicina sugere o número total de plasmídeo, o que também representa o número alvo total. As colônias não resistentes à Ampicilina são colônias que contêm um plasmídeo endereçado com sucesso, validando as funções de edição de “Muta-ção” ou "Deleção". As colônias resistentes à Tetraciclina, no entanto, não à Ampicilina, representam a integração do DNA doador ao plasmídeo-alvo por NHEJ validando a função de edição de “Substituição”. Colônias resistentes à Ampicilina e à Tetraciclina são colônias contendo plasmídeos que foram endereçados, tiveram o doador integrado à sequência-alvo da Ampicilina, mas não a substituíram, validando a função de edição de “Inserção”.

[0588] Os plasmídeos são então submetidos a PCR e análise de sequência para verificação dos resultados com os iniciadores:

[0589] A961F: TAGGGCGCTGGCAAGTGTAG (N° ID SEQ: 158)

[0590] A2161R: CATAACACCCCTTGTATTAC (N° ID SEQ: 159)

Experimentos: Exemplo 10A - Mutação endereçada no cassete AMPR.

[0591] O ensaio de detecção é realizado essencialmente conforme descrito acima (“ensaio de detecção”) com os seguintes detalhes adicionais: plasmídeo pTGD é transfectado juntamente com os SCNAs flanqueando a sequência-alvo 1 (N° ID SEQ: 161) aos protoplastos de Arabidopsis. O DNA é purificado e transformado em células competentes de E. Coli que são espalhadas em meio Kan LB. Uma cópia é realizada em placas AMP LB. As colônias que perderam a resistência à AMP contêm um plasmídeo endereçado.

Exemplo 10B

[0592] O ensaio de detecção é realizado essencialmente conforme descrito acima (“ensaio de detecção”) com os seguintes detalhes adicionais: o plasmídeo pTGD é transfectado juntamente com os SCNAs flanqueando a sequência-alvo 1 e um doador de Tetraciclina (Tet) com dsDNA linear, produzido como produto da PCR, em protoplastos de Arabidopsis. O DNA é purificado e transformado em células com-petentes de E. Coli que são espalhadas em meio KM LB. Uma cópia é realizada em placas LB AMP e Tet. As colônias que perdem a resistência à AMP contêm um plas- mídeo endereçado. As colônias resistentes à Tet representam plasmídeos contendo DNA doador integrado especificamente.

Exemplo 10C

[0593] A ensaio de detecção é realizado essencialmente conforme descrito acima (“ensaio de detecção”) com os seguintes detalhes adicionais: o plasmídeo pTGD é transfectado juntamente com os SCNAs endereçados contra a sequência- alvo 1 e SCNAs contra a sequência-alvo 2 (N° ID SEQ: 170), juntamente com o DNA doador de Tetraciclina (Tet) aos protoplastos de Arabidopsis. O DNA é purificado e transformado em células competentes de E. Coli que são espalhadas em meio KM LB. Uma cópia é realizada em placas LB AMP e em placas Tet LB. As colônias que perdem a resistência ao AMP contêm um plasmídeo endereçado. Colônias resistentes à Tet representam o DNA doador especificamente integrado. As colônias sensíveis à AMP são submetidas à análise de PCR com iniciadores A961F e A2161R.

[0594] Colônias que contêm um plasmídeo incorporando o doador Tet (ca. 1.9Kb) invés da sequência-alvo AMP (ca. 860bp) demonstram eventos de substituição gênica.

[0595] Colônias sensíveis à AMP e à Tet demonstram deleção do gene por NHEJ.

[0596] Colônias resistente à Tet e AMP contêm um plasmídeo incorporando o doador TetR sem a deleção do cassete de resistência à Amp e demonstram integra-ção ou “inserção” do doador endereçado. Entrega

[0597] Configuração do bioensaio: a preparação do protoplasto de Arabi- dopsis baseia-se em Wu et. al. (2009), e é similar ao exemplo 1 com diferenças na etapa de transfecção: Transfecção: 1. Produzir solução PEG fresca para transfecção em tubo de 2ml 2. Retirar BSA de placas de 6 cavidades e secar 3. Misturar ~5 x 10A4 protoplastos (2 x 10A4 -1 x 10A5 ) em 0,2ml de MMg com uma mistura de plasmídeo compreendendo o DNA do plasmídeo-Alvo e o DNA que expressa a fração de proteína, os ssDNA SCNAs e o Doador de dsDNA linear a um total de 30-40microgramas à temperatura ambiente em tubos (tampa de encaixe) de fundo redondo de 15 ml. 4. Adicionar igual volume (0,2ml de protoplastos + midiprep vol.) de solução PEG fresca 5. Incubar à temperatura ambiente por 5 min 6. Lavar adicionando lentamente 3ml de W5, 1ml a cada vez, e misturando 7. Centrifugar a 100 x g em swing-out por 1 min 8. Repetir lavagem e peletização 9. Ressuspender em 1ml de solução W5. 10. Verter em placas revestidas com BSA 11. Cultivar os protoplastos em regime de luz diurna ideal por 16 horas (150mi- croEinstein-mA-2-sA-i) a 22°C, substituindo o meio conforme a necessidade.

[0598] Os protoplastos são então submetidos à extração de DNA conforme descrito no Ensaio de detecção.

[0599] O cassete AmpR endereçado acompanha a descrição no N° ID SEQ: 160.

[0600] Os pares de SCNA são escolhidos um esquerdo (L) e um direito (R) independentemente do filamento sentido (S) ou antissentido (AS): A escolha da combinação do par de SCNA é um parâmetro testado no experimento.

[0601] Sequência-alvo T1 no cassete AMPR: TATGAGTATTCAACATTTCCG (N° ID SEQ: 161) (códon inicial ATG é sublinhado)

Grupo 1 de SCNAs de endereçamento de AMP: Opção 1 - utilizando um gap-alvo com 21bp:

[0602] pTGD_130_SL: A*ATAATATTGAAAAAGGAAGAGNNNNNN/3DIGN/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 162)

[0603] pTGD_152_SR: /5DIGN/NNNNNNTGTCGCCCTTATTCCCTTTTT*T (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 163)

[0604] pTGD_130_ASL: /5DIGN/NNNNNNCTCTTCCTTTTTCAATATTAT*T (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 164)

[0605] pTGD_152_ASR: A*AAAAAGGGAATAAGGGCGACANNNNNN/3DIGN/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 165) Opção 2 - combinações pareadas, empregando um gap-alvo de 24bp e um linker de SCNA mais curto de acordo com os resultados da predição:AMP_129_SL: C*AATAATATTGAAAAAGGAAGANN/3DIGN/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 166)

[0606] AMP_154_SR: /5DIGN/NNTCGCCCTTATTCCCTTTTTTG*C (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 167)

[0607] AMP_129_ASL: /5DIGN/NNTCTTCCTTTTTCAATATTATT*G (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 168)

[0608] AMP_154_ASR: G*CAAAAAAGGGAATAAGGGCGANN/3DIGN/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 169)

[0609] Sequência-alvo T2 no cassete AMPR: AGCATTGGTAACTGTCAGACC (N° ID SEQ: 170)

Grupo 2 de SCNAs de endereçamento de AMP: Opção 1 utilizando um gap-alvo com 21bp:

[0610] pTGD_981_SL: G*AGATAGGTGCCTCACTGATTANNNNNN/3DIGN/ (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 171)

[0611] pTGD_1003_SR: /5DIGN/NNNNNNAAGTTTACTCATATATACTTT*A (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 172)

[0612] pTGD_981_ASL: /5DIGN/NNNNNNTAATCAGTGAGGCACCTATCT*C (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 173)

[0613] pTGD_1003_ASR: T*AAAGTATATATGAGTAAACTTNNNNNN/3DIGN/ (os ácidos nucleicos somente es-tão aqui descritos no N° ID SEQ: 174) Opção 2 combinações pareadas, empregando um gap-alvo de 24bp e um lin-ker de SCNA mais curto de acordo com os resultados da predição:

[0614] AMP_980_SL: T*GAGATAGGTGCCTCACTGATTNN/3DIGN/ (os áci-dos nucleicos somente estão aqui descritos no N° ID SEQ: 175)

[0615] AMP_1005_SR: /5DIGN/NNGTTTACTCATATATACTTTAG*A (os áci-dos nucleicos somente estão aqui descritos no N° ID SEQ: 176)

[0616] AMP_980_ASL: /5DIGN/NNAATCAGTGAGGCACCTATCTC*A (os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 177)

[0617] AMP_1005_ASR: T*CTAAAGTATATATGAGTAAACNN/3DIGN/ os ácidos nucleicos somente estão aqui descritos no N° ID SEQ: 178)

Doador:

[0618] Sequência Doadora que codifica a resistência à Tetraciclina do vetor de clonagem pSoup, EU048870.1 GI:155733614 acompanha a descrição no N° ID SEQ: 179.

EXEMPLO 11: Construção do complexo molecular programável para atuar com um par de sequências de SCNA conectadas.

[0619] Neste exemplo, o complexo molecular programável é projetado para operar com uma única molécula de ácido nucleico incorporando a dupla sequência- alvo que se liga às sequências de ácido nucleico, aqui designadas como um par co-nectado de Sequências de Ácido Nucleico Propiciador de Especificidade (sequências de SCNA) como ilustram esquematicamente as Figuras 4A e 4B.

[0620] Neste exemplo, uma sequência-alvo GFP degradada é reparada pela remoção ou mutação de um códon de PARADA. A clivagem resultante de GFP-Alvo predeterminada leva à mutação de ponto que pode restaurar a atividade de GFP.

[0621] Nestes exemplos, um bioensaio baseado em protoplasto de Arabi- dopsis, no qual os protoplastos são entregues junto com o sistema repórter (plasmí- deo-alvo), plasmídeo que expressa a fração de proteína, coentregues com: Por exem-plo, 12A (ilustrado esquematicamente na Figura 4A) - Um ácido nucleico que codifica um RNA, RNA formado por duas sequências de SCNA modificadas, neste exemplo, pela sequência de ligação do grampo de RNA boxB 20-mer do bacteriófago Phi21 (N° ID SEQ: 62: 5’-UUCACCUCUAACCGGGUGAG-3’) e um “Conector de SCNA”, uma extensão de hibridização não alvo de nucleotídeos de sequência ou comprimento indefinidos. Um SCNA dotado dessa modificação no 3’-terminal e a outra no 5’-terminal da molécula de RNA. Os RNA-SCNAs, neste exemplo, se ligam ao domínio de ligação da Fração de proteína dos dois complexos moleculares utilizando a sequência de ligação do grampo de RNA boxB 20-mer do bacteriófago Phi21 (5’- UUCACCUCUAACCGGGUGAG-3’(N° ID SEQ: 62), ou:

[0622] No exemplo 11B (ilustrado esquematicamente na Figura 4B), um SCNA modificado por ssDNA contendo a sequência, neste exemplo, modificada em ambos os terminais 5’ e 3’ pela adição das moléculas do terminal Digoxigenina (NHS Éster) (DIG) e um “Conector de SCNA”, uma extensão de hibridização não alvo de nucleotídeos com sequência ou comprimento indefinidos. Sequência de proteína e propriedades

[0623] A fração de proteína no exemplo 11A, contém uma sequência de ami- noácido derivada de um domínio da nuclease FokI como domínio funcional, O domínio de ligação derivado da N proteína do bacteriófago Phi21 da proteína ligação ao RNA (RBP) (N° ID SEQ: 63: N’-GTAKSRYKARRAELIAER-C’), um SV40NLS (PKKKRKV: N° ID SEQ: 3) como domínio de localização nuclear e um conector interdomínio (N° ID SEQ: 14: GSLEGGSGG).

[0624] A fração de proteína no exemplo 11B contém uma sequência de ami- noácido adaptada de um domínio da nuclease FokI como domínio funcional; uma se-quência de aminoácido adaptada da imunoglobulina de fragmento variável de cadeia simples anti-DIG (scFv) (DIG-ScFv) similar à descrita em (Huston et. al., 1988) como Domínio de ligação; um SV40NLS (PKKKRKV: N° ID SEQ: 3) como domínio de localização nuclear e um conector interdomínio (N° ID SEQ: 14: GSLEGGSGG).

[0625] As modificações da extremidade do ácido nucleico do SCNA são Digo- xigenina ligada a NHS-Éster (DIG) e estão anexadas nas posições 5’ e 3’ do oligonu- cleotídeo.

Exemplo 11A: Sequência da fração de proteína do complexo molecular pro-gramável baseado emPhi21NP: Componentes:

[0626] Proteína N do Bacteriófago Phi21 (N° ID SEQ: 63: GTAKSRYKARRAELIAER) na ou perto do N’-terminal como no comprimento total da proteína N, o de ligação do RNA está situado no N-terminal.

[0627] Nuclease FokI:

[0628] VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFM KVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYV EENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAV LSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINF (N° ID SEQ: 66)

[0629] SV40-NLS: (PKKKRKV: N° ID SEQ: 3)

[0630] Conectores interdomínio: vários linkers de poliaminoácido são testados quanto à função ideal do complexo molecular programado.

[0631] Sequência de aminoácido da fração de proteína do complexo molecu-lar: Neste exemplo, a proteína N Phi21 (sequência de aminoácido conforme descrito no N° ID SEQ:68) é montada no N’-terminal da fração de proteína do construto mole-cular programável e o sinal de localização nuclear, SV40NLS, está localizado no C’ terminal e o linker interdomínio é GGSGG (N° ID SEQ: 7).

Exemplo 11B: A sequência de aminoácido (código de uma letra) da fração de proteína do complexo molecular (nuclease NLS-FokI com ScFv Digoxigenina, é des-crita no N° ID SEQ: 12). Propriedades de SCNA e sequência

[0632] O comprimento de SCNA do oligonucleotídeo de emparelhamento de base-alvo complementar pode apresentar qualquer comprimento predeterminado. Por exemplo, o comprimento pode ser de pelo menos 18 bases. O SCNA pode conter ainda um número pequeno (preferencialmente 0-6, mais preferencialmente 1-2) de nucleotídeos de emparelhamento de base não endereçados (N's) de qualquer com-posição de sequência que sirva de espaçador entre o A) modificador do terminal de grampo de RNA do boxB Phi21 no exemplo 11A ou 11B) modificador do terminal DIG- NHS no exemplo 12B, e os nucleotídeos complementares. Nestes exemplos, os SCNAs são conectados por uma sequência de emparelhamento de base não alvo designada “Conector de SCNA” na Figura 14 ou X(n) nas sequências deste exemplo. X(n) significa um comprimento indeterminado de nucleotídeos de RNA que conectam as duas regiões propiciadoras de especificidade entre si. Para o DNA linear, o comprimento ideal esperado (n) é de cerca de, 35-73 nucleotídeos (nts), apesar de que conectores de SCNA mais longos (acima 73 nts) e mais curtos (4-34 nts) são aplicáveis. Nos presentes exemplos n=40 nucleotídeos.

[0633] Os SCNAs podem ser complementares a qualquer um dos filamentos sentido e antissentido, entretanto, são escolhidos para emparelharem preferencial-mente com a sequência (não transcrita) sentido embora duas opções sejam aqui mostradas para cada exemplo. As duas sequências de SCNA podem emparelhar com o mesmo filamento, já que a posição da fração de proteína está situada na “extremidade próxima” do SCNA conforme definido pela modificação 5’ ou 3’ do iniciador que está na “extremidade próxima”.

[0634] “STOP GFP” Alvo contendo o plasmídeo para os ensaios dos Exem-plos 11A e 11B contém a sequência de ácido nucleico conforme descrito no (N° ID SEQ: 181).

Exemplo 11A: (baseado em Phi21NP)

[0635] SCNAs duplos de hibridização sentido ou antissentido são construídos: SCNAs conectados sentido:

[0636] GFP-921SR-X(n)-892SL BOXBPHI

[0637] UUCACCUCUAACCGGGUGAGNUCCAAGGGCGAGGAGCUGUUC A (N° ID SEQ: 207)-X(n)- ACCAUUUACGAACGAUAGCCAUNUUCACCUCUAACCGGG UGAG (designado como N° ID SEQ: 208). SCNAs conectados antissentido:

[0638] GFP-921ASR-X(n)-892ASL BOXBPHI

[0639] UUCACCUCUAACCGGGUGAGNAUGGCUAUCGUUCGUAAAUGGU (N° ID SEQ: 209)-X(n)-UGAACAGCUCCUCGC CCUUGGANUUCACCUCUAACCGGG UGAG (N° ID SEQ: 210)

[0640] A sequência PHI boxB 20-mer 5’-UUCACCUCUAACCGGGUGAG-3’ (N° ID SEQ: 62) está sublinhada. Sequências que conferem especificidade ao SCNA duplo são assinaladas nos desenhos esquemáticos das Figuras 4A-B as SCNA1 e SCNA2. N's significam extensão curta (0-6) de qualquer nucleotídeo, X(n) significa uma extensão de hibridização não alvo de nucleotídeos com sequência ou comprimento indefinidos (Conector de SCNA).

Exemplo 11B:

[0641] SCNAs duplos de hibridização sentido ou antissentido são construídos: SCNAs conectados sentido:

[0642] GFP-919SR-X(n)-894SL-DIG

[0643] /5DigN/NNTGTCCAAGGGCGAGGAGCTGTT (somente os ácidos nu- cleicos são designados como N° ID SEQ: 211)

[0644] -X(n)- CATTTACGAACGATAGCCATGGNN/3DigN/ (somente os áci-dos nucleicos são designados como N° ID SEQ: 212) SCNAs conectados antissentido:

[0645] GFP-919ASR-X(n)-894ASL-DIG

[0646] /5DigN/NNCCATGGCTATCGTTCGTAAATG (somente os ácidos nu- cleicos são designados como N° ID SEQ: 213)-X(n)- AACAGCTCCTCGCCCTTGGACA NN/3DigN/ (somente os ácidos nucleicos são de-signados como N° ID SEQ: 214)

[0647] Os símbolos de modificação são aqueles utilizados no website da Inte-grated DNA Technology (IDT) (5’ DIG= /5DigN/; 3’DIG= /3DigN/), X(n) significa uma extensão de hibridização não alvo de nucleotídeos com sequência ou comprimento indefinidos (Conector de SCNA). Entrega

[0648] Configuração do bioensaio: A preparação do protoplasto de Arabi- dopsis se baseia em Wu et. al. (Wu et. al., 2009) e é similar ao exemplo 1 com dife-renças na etapa de transfecção: Transfecção: 1. Produzir solução PEG fresca para transfecção em tubo de 2ml 2. Retirar BSA de placas de 6 cavidades e secar 3. Misturar ~5 x 104 protoplastos (2 x 104 -1 x 105 ) em 0,2ml de MMg com uma mistura de plasmídeo compreendendo o DNA do plasmídeo-Alvo e o DNA que expressa a fração de proteína e o plasmídeo que expressa o SCNA duplo (Por exem-plo, 12A) ou SCNA duplo contendo ssDNA (Por exemplo, 12B) de 30-40μg à RT em tubos (tampa de encaixe) de fundo redondo de 15 ml. 4. Adicionar igual volume (0,2ml de protoplastos + midiprep vol.) de solução PEG fresca 5. Incubar à temperatura ambiente por 5 min 6. Lavar adicionando lentamente 3ml de W5, 1ml a cada vez, e misturando 7. Centrifugar a 100 x g em swing-out por 1 min 8. Repetir lavagem e peletização 9. Ressuspender em 1ml de solução W5 10. Verter em placas revestidas com BSA 11. Cultivar os protoplastos em regime de luz diurna ideal por 16 horas (150μE-m-2'S-1) a 22°C, substituindo o meio conforme a necessidade.

[0649] Os protoplastos são então submetidos a FACS ou extração de DNA conforme descrito abaixo. Resultados: Mutação de ponto por DSB induzida.

[0650] Neste exemplo, a clivagem do alvo pelo complexo molecular resulta em uma Quebra de Duplo Filamento (DSB) no alvo do DNA do plasmídeo. Esta DSB é criada no sítio do códon de PARADA, que é digerido e reparado pelo mecanismo de reparo de NHEJ endógena. A NHEJ é propensa a mutações, e algumas destas mutações podem eliminar o códon de PARADA e restaurar um quadro de leitura aberta resultando em um quadro de leitura aberta GFP (ORF) ativo. A GFP é então detectada por meio de microscopia ou citômetro de fluxo (FACS), permitindo mensurar a eficiência do sistema e a comparação entre variáveis para seu aprimoramento. Análise:

[0651] A eficiência de endereçamento de gene é determinada como o percentual de células positivas a GFP. Os protoplastos suspensos em solução W5 são avaliados para a atividade de GFP 3 dias após a transfecção utilizando um citômetro de fluxo automatizado (FACS). A GFP é detectada por excitação a 488nm com emissão detectada por filtro 530/30. Fatores limiares e de compensação são definidos para excluir todos os falsos positivos.

[0652] A sequência-alvo é um códon de PARADA acoplado a um sítio de res-trição diagnóstico (Spel ACTAGT, STOP sublinhado) na sequência codificadora GFP. Quando endereçado com sucesso, o códon de PARADA e o sítio de restrição diagnóstico são eliminados por um evento de deleção, inserção ou mutação de ponto. O reparo em um quadro específico também pode restaurar a expressão da GFP. O ensaio é analisado por FACS como descrito adiante ou purificando o DNA do plasmídeo a partir de protoplastos utilizando um kit miniprep de plasmídeo (Bioneer K3030) da seguinte maneira: os protoplastos na solução W5 são precipitados, e lisados pela adição de 250ul de Tampão 1 e realizando o protocolo para pélete bacteriano nas instruções do fabricante. A região entre os SCNAs é amplificada a partir da preparação do plasmídeo resultante com o uso de PCR. Os produtos da PCR são clivados exaustivamente com SpeI. Após a eletroforese, os produtos não clivados são excisados do gel, clonados em um vetor de clonagem T/A (pUC57/T Fermentas) e clones individuais são sequenciados para detectar diferentes eventos de mutação.

EXEMPLO 12. Bioensaio para determinação das distâncias ideais de SCNA.

[0653] Para determinar as distâncias ideais de SCNA a partir de potenciais sítios-alvo, para cada tipo de alvo diferente ou tipo de complexo molecular programá-vel, um grupo de plasmídeos-alvo (pTARGET-STOPGFP(n), Figura 16) contendo uma sequência codificadora repórter de GFP degradada (STOP-GFP) são criados. Em um líder N’ artificial e na sequência codificadora de GFP (CDS) duas sequências de liga-ção de SCNA (SCNAbs) são inseridas, as quais flanqueiam uma sequência-alvo com comprimentos variáveis formando uma série de plasmídeos designados como pTAR- GET-STOPGFP(1-8) (Figura16). Insertos são inseridos, conforme esboço na Figura 16 com o uso das enzimas de restrição NcoI e MscI. A sequência-alvo é um códon de PARADA acoplado a um sítio de restrição diagnóstico (SpeI ACTAGT (N° ID SEQ:215) ou BclI TGATCA (N° ID SEQ:216), STOP sublinhado) na líder N’ artificial.

[0654] Outros componentes do plasmídeo incluem 1) um promotor ligado fun-cionalmente à sequência de GFP. O ensaio pode ser conduzido em diferentes Euca- riotos. Neste exemplo, um promotor de planta, como o NosP, é utilizado para conduzir o experimento em protoplastos de Arabidopsis. 2) um par de sítios de ligação de SCNA (SCNA1bs e SCNA2bs); 3) um Sítio-alvo contendo um códon de PARADA; 4) uma sequência codificadora de GFP e 5) uma sequência de transcrição terminadora, neste exemplo, NosT.

[0655] A representação esquemática (fora de escala) mostrada na Figura 16, ilustra um grupo de oitos construtos exemplificativos em um grupo de plasmídeos pAlvo-STOPGFP(n), contendo uma sequência codificadora repórter (STOPGFP) da Proteína fluorescente verde (GFP) degradada, onde “n” significa um número de série como mostra o quadro na Figura 16. O grupo de insertos de comprimento e composi-ção variáveis são delineados por um sítio de restrição NcoI englobando o códon inicial e um sítio MscI na extremidade oposta. SCNA1bs está localizado no líder N’ artificial GFP e SCNA2bs está localizado na sequência codificadora de GFP. A sequência-alvo é um códon de PARADA acoplado a um sítio de restrição diagnóstico (SpeI ACTAGT (N° ID SEQ:215) ou BclI TGATCA (N° ID SEQ:216), STOP sublinhado) e um deslocamento de quadro (exceto em n=5) no líder N’ artificial. Sequências de espaçadores do sítio-alvo são mostrados no exemplo 12. Na tabela, “n” significa o número de série do plasmídeo. A distância entre SCNAbs nos pares de base (bp) é mostrada acompa-nhada pelo sítio de restrição diagnóstico em parênteses. As posições de clivagem desejadas nos filamentos superiores e inferiores, devido às 4 saliências 5’ de bp, são mostradas, onde ±2 números estão em insertos de número par e ±3 números em in- sertos de número ímpar, em virtude da incerteza causada pelo posicionamento do local catalítico “sobre” um nucleotídeo e não entre nucleotídeos. Em alguns eventos de clivagem, os mecanismos de reparo endógenos podem causar reparo imperfeito, causando a deleção, mutação ou adição de nucleotídeos sem molde. Algumas destas sequências reparadas podem causar a eliminação do códon de PARADA e do sítio de restrição diagnóstico acoplado a um deslocamento do quadro de leitura que restaura a expressão da GFP. Os eventos de restauração mínimos, adição ou deleção de nu- cleotídeos ou mutações de ponto, são mostrados na coluna mais à direita da tabela. Sequência de reconhecimento da Ligação de SCNA1 no inserto:

[0656] ATCTCAAGTCTCTAGGACTGGT (N° ID SEQ: 182) Sequência de reconhecimento da ligação de SCNA2 na sequência de GFP:

[0657] ATCTGTGAGCAAAGGCGAGGAG (N° ID SEQ: 183)

[0658] Conforme esboço na Figura 16:

[0659] Inserto NcoI/MscI para n=1:

[0660] CCATGGGATCTCAAGTCTCTAGGACTGGTCTTCAAAATCTTTCTC ACTAGTTTCTACGATCTTGGCCA (N° ID SEQ: 184)

[0661] Inserto NcoI/MscI para n=2:

[0662] CCATGGGATCTCAAGTCTCTAGGACTGGTCAAAATCTTTCTCACT AGTTTCTACGCTGGCCA (N° ID SEQ: 185)

[0663] Inserto NcoI/MscI para n=3:

[0664] CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTCACTAGT TACGCTGGCCA (N° ID SEQ: 186)

[0665] Inserto NcoI/MscI para n=4:

[0666] CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTTGATCAG TCTGGCCA (N° ID SEQ: 187)

[0667] Inserto NcoI/MscI para n=5:

[0668] CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTTGATCAG CTGGCCA (N° ID SEQ: 188)

[0669] Inserto NcoI/MscI para n=6:

[0670] CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTTGATCAC TGGCCA (N° ID SEQ: 189)

[0671] Inserto NcoI/MscI para n=7:

[0672] CCATGGGATCTCAAGTCTCTAGGACTGGTCTTTCTCACTAGTTCT GGCCA (N° ID SEQ: 190)

[0673] Inserto NcoI/MscI para n=8:

[0674] CCATGGGATCTCAAGTCTCTAGGACTGGTCTTCACTAGTGGCCA (N° ID SEQ: 191)

[0675] Cada complexo molecular é cotransfectado em protoplastos de Arabi- dopsis como descrito adiante: Entrega

[0676] Configuração do bioensaio: A preparação do protoplasto de Arabi- dopsis se baseia em (Wu et. al.) e é similar ao exemplo 1 com diferenças na etapa de transfecção: Transfecção: 1. Produzir solução PEG fresca para transfecção em tubo de 2ml 2. Retirar BSA de placas de 6 cavidades e secar 3. Misturar ~5 x 10A4 protoplastos (2 x 10A4 -1 x 10A5 ) em 0,2ml de MMg com uma mistura do DNA do plasmídeo Doador (quando relevante), DNA do plasmídeo que expressa a Fração de proteína e ssDNA de SCNAs até um total de 30-40micro- gramas à RT em tubos (tampa de encaixe) de fundo redondo de 15 ml. Alternativamente, o DNA Doador e DNA que expressa a fração da proteína são cons-truídos e entregues em um único plasmídeo. 4. Adicionar igual volume (0,2ml de protoplastos + midiprep vol.) de solução PEG fresca 5. Incubar à temperatura ambiente por 5 min 6. Lavar adicionando lentamente 3ml de W5, 1ml a cada vez, e misturando 7. Centrifugar a 100 x g em swing-out por 1 min 8. Repetir lavagem e peletização 9. Ressuspender em 1ml de solução W5 10. Verter em placas revestidas com BSA 11. Cultivar os protoplastos em regime de luz diurna ideal por 16 horas (150mi- croEinstein-mA-2'SA-1) a 22°C, substituindo o meio conforme a necessidade. Análise:

[0677] A eficiência do endereçamento de gene de cada forma do complexo molecular é testada na série do plasmídeo pTARGET-STOPGFP(n).

[0678] Quando endereçado com sucesso, o códon de PARADA e o sítio de restrição diagnóstico são eliminados por um evento de deleção, inserção ou mutação de ponto (Figura 16). O reparo em um quadro específico também pode restaurar a expressão de GFP (Figura 16). O ensaio é analisado por FACS ou purificando o DNA do plasmídeo a partir de protoplastos utilizando um kit miniprep plasmídeo (Bioneer K3030) da seguinte maneira: os protoplastos na solução W5 são precipitados, e lisa- dos pela adição de 250ul de Tampão 1 e realizando o protocolo para péletes bacteri- ano nas instruções do fabricante. A região do “espaçador” é amplificada a partir da preparação de plasmídeo resultante por PCR. Os produtos da PCR são clivados exaustivamente com SpeI (37°C) ou BclI (50°C) conforme adequado. Após eletroforese, os produtos não clivados são excisados do gel, clonados em um vetor de clonagem T/A (pUC57/T Fermentas) e clones individuais são sequenciados para detectar diferentes eventos de mutação.

[0679] A eficiência do endereçamento de gene é então determinada como o percentual de células positivas a GFP. Os protoplastos suspensos em solução W5 são avaliados para a atividade de GFP 3 dias após a transfecção utilizando um citômetro de fluxo automatizado (FACS). A GFP é detectada por excitação a 488nm com emissão detectada por filtro 530/30. Fatores limiares e de compensação são definidos para excluir todos os falsos positivos.

[0680] Os controles incluídos no experimento são 1) uso de SCNAs ilegítimos (não emparelhamento de base) para controlar a clivagem não específica, 2) uso de um pTARGET-STOPGFP carente de um sítio de ligação-alvo para controlar uma ação de não dímero, 3) uso de pTARGET-GFP, plasmídeo similar sem o códon de PARADA para degradação de GFP e que tem uma GFP dentro do quadro como controle positivo, 4) uso de pTARGET-STOP-I-SceI-GFP, plasmídeo similar ao pTARGET- STOPGFP, mas contendo um sítio de restrição I-SceI perto do códon de PARADA de degradação de GFP, junto com pSAT4-NLS-I-SceI, um plasmídeo que expressa uma enzima de restrição I-SceI localizada no núcleo em células vegetais, como controle de sistema heterólogo comparativo.

[0681] A presente descrição a respeito das modalidades específicas revelará tão integralmente a natureza geral da invenção que outros indivíduos, ao aplicarem o conhecimento corrente, podem prontamente modificar e/ou adaptar para várias apli-cações tais modalidades específicas sem experimentação indevida e sem desviar do conceito genérico e, portanto, tais adaptações e modificações devem e estão compre-endidas no significado e âmbito de equivalentes das modalidades reveladas. Muito embora a invenção tenha sido descrita juntamente com modalidades específicas, é evidente que muitas alternativas, modificações e variações serão notadas pelos indi-víduos versados na técnica. Por conseguinte, a presente descrição pretende abraçar todas essas alternativas, modificações e variações inseridas na essência e no amplo escopo das reivindicações em anexo. REFERÊNCIAS 1. Schierling B, Dannemann N, Gabsalilow L, Wende W, Cathomen T, Pingoud A. (2012). A novel zinc-finger nuclease platform with a sequence-specific cleavage module. Nucleic Acids Res. 2012 Mar;40(6):2623-38. 2. Eisenschmidt K, Lanio T, Simoncsits A, Jeltsch A, Pingoud V, Wende W, Pingoud A. (2005). Developing a programmed restriction endonuclease for highly specific DNA cleavage. Nucleic Acids Res. 2005 Dec 14;33(22):7039-47. 3. Kubo T, Kanno K, Ohba H, Rumiana B, Fujii M. (2004). Control of intracel-lular delivery of oligonucleotides by signal peptides and genetic expression in human cells. Nucleic Acids Symp Ser (Oxf). 2004;(48):303-4. 4. Jinek M, Chylinski K, Fonfara I, Hauer M, Doudna JA, Charpentier E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science. 2012 Aug 17;337(6096):816-21. 5. Hanic-Joyce PJ, Gray MW (1991) Accurate transcription of a plant mito-chondrial gene in vitro. Mol Cell Biol 11: 2035-2039 6. Vainstein A, Marton I, Zuker A, Danziger M, Tzfira T (2011) Permanent ge-nome modifications in plant cells by transient viral vectors. Trends in Biotechnology 29: 363-369 7. Gallois P, Marinho P (1995) Leaf disk transformation using Agrobacterium tumefaciens-expression of heterologous genes in tobacco. Methods Mol Biol 49: 39-48 8. Kochevenko A, Willmitzer L (2003) Chimeric RNA/DNA oligonucleotide- based site-specific modification of the tobacco acetolactate syntase gene. Plant Physiol 132: 174-184 9. Marrs KA, Urioste JC (1995) Transient Gene Expression Analysis in Elec-troporated Maize Protoplasts. Vol. 55, pp 133-145. 10. Kotlo KU, Yehiely F, Efimova E, Harasty H, Hesabi B, Shchors K, Einat P, Rozen A, Berent E, Deiss LP (2003) Nrf2 is an inhibitor of the Fas pathway as identified by Achilles' Heel Method, a new function-based approach to gene identification in human cells. Oncogene 22: 797-806 11. Huston JS, Levinson D, Mudgett-Hunter M, Tai MS, Novotny J, Margolies MN, Ridge RJ, Bruccoleri RE, Haber E, Crea R, et. al. (1988) Protein engineering of antibody binding sites: recovery of specific activity in an anti-digoxin single-chain Fv analogue produced in Escherichia coli. Proc Natl Acad Sci U S A 85: 5879-5883 12. Wu FH, Shen SC, Lee LY, Lee SH, Chan MT, Lin CS (2009) Tape-Ara- bidopsis Sandwich - a simpler Arabidopsis protoplast isolation method. Plant Methods 5: 16. 13. Antonelli NM, Stadler J (1989) Chemical methods for direct gene transfer to maize protoplasts: I. Efficient transient expression after treatment with the polycation Polybrene Maize News letter 63: 21-22 14. Sheen J (2001) Signal transduction in maize and Arabidopsis mesophyll protoplasts. Plant Physiol 127: 1466-1475 15. Gordon-Kamm WJ, Spencer TM, Mangano ML, Adams TR, Daines RJ, Start WG, O'Brien JV, Chambers SA, Adams WR, Jr., Willetts NG, Rice TB, Mackey CJ, Krueger RW, Kausch AP, Lemaux PG (1990) Transformation of Maize Cells and Regeneration of Fertile Transgenic Plants. Plant Cell 2: 603-618.

Claims

1. Método para modificar um sítio-alvo predeterminado no interior de um ácido nucleico genômico ou organelar alvo em uma célula hospedeira eucariótica por um complexo núcleo-proteína CARACTERIZADO pelo fato de que o método compreende: a. entregar para a célula hospedeira eucariótica um polipeptídeo ou uma se-quência de ácido nucleico que codifica o polipeptídeo, o polipeptídeo compreendendo: (i) um domínio efetor que é, ou é derivado de, uma nuclease FokI, o domínio efetor sendo desprovido do reconhecimento de FokI e domínios de ligação; (ii) um conector ou espaçador interdomínio; e (iii) um domínio de ligação que interage com um ácido nucleico propiciador de especificidade (SCNA) devido a um ou mais dos seguintes tipos de interações: ligante- receptor, ligante-substrato, ligações de hidrogênio, ligações de van der Waals, ligações covalentes formadas in vivo, ligações iônicas e interações hidrofóbicas, o domínio de ligação sendo desprovido de um sítio de ligação de ácido nucleico-alvo específico; e b. entregar para a célula hospedeira eucariótica duas moléculas de SCNA diferentes, ou uma ou mais molécula de ácido nucleico que codifica as duas moléculas de SCNA diferentes, em que cada uma das duas moléculas de SCNA diferentes se liga a um polipeptídeo diferente, e em que cada uma das duas moléculas de SCNA diferentes compreende: (i) uma sequência diferente de nucleotídeos complementar a uma região do ácido nucleico-alvo; e (ii) uma região de reconhecimento que se anexa especificamente ao domínio de ligação do polipeptídeo com alta afinidade de ligação, em que a região de reconhecimento compreende: (A) uma modificação química, em que a interação entre a modificação química e o domínio de ligação resulta de uma interação não covalente de um par de ligação selecionado do grupo que consiste em: biotina-avidina; biotina-estreptavidina; biotina- formas de avidina modificadas; interações proteína-proteína; interações proteína- ácido nucleico; interações ligante-receptor; interações ligante-substrato; interações anticorpo-antígeno; anticorpo de cadeia simples-antígeno; interações anticorpo ou anticorpo de cadeia simples-hapteno; hormônio-proteína de ligação a hormônio; recep- tor-agonista; antagonista do receptor-receptor; anticorpo de fragmento variável de cadeia simples anti-Fluoresceína (anti-FAM ScFV)-Fluoresceína; imunoglobina de fragmento variável de cadeia simples anti-DIG (scFv) (DIG-ScFv) - digoxigenina (DIG); IgG-proteína A; enzima-cofator da enzima; proteína de revestimento-ácido nucleico e VirD2 de Agrobacterium- enzima de proteína de ligação VirD2-inibidor de enzima; DNA de cadeia simples-VirE2; StickyC-dsDNA; RISC-RNA; proteína de revestimento viral-ácido nucleico; e VirD2 de Agrobacterium-proteína de ligação de VirD2; ou (B) um motivo de nucleotídeo que interage, se anexa ou se liga ao domínio de ligação, onde a interação é selecionada do grupo que consiste em proteína de dedo de zinco - motivo de dedo de zinco; domínio de reconhecimento de enzima de restrição - sequência de reconhecimento de enzima de restrição; domínio de ligação ao DNA do fator de transcrição - motivo de DNA; repressor - operador; Zíper de leucina - promotor; hélice alça hélice - domínio E box; motivos de ligação de RNA compreendendo domínios de motivos ricos em arginina; domínios de proteína αβ; domínios do Motivo de Reconhecimento de RNA (RRM); domínios de K-homologia; motivos de ligação de RNA de fita dupla; Dedos de zinco de ligação de RNA; e Enzimas de Direcionamento de RNA - sequência de RNA específica cognata; proteína HIV rev - Stem IIB do elemento de resposta HIV rev (RRE); Domínio de ligação principal Tat do Vírus da imunodeficiência bovina (BIV) - alça 1 da sequência do elemento de resposta de transação (TAR) do BIV; Fago lambda, Nproteínas phi21 e P22 - os grampos de alça boxB nos sítios de N-utilização (nut) em seus respectivos RNAs; ou (C) uma sequência de nucleotídeos que está ligada covalentemente a uma proteína selecionada do grupo que consiste em proteína VirD2 de Agrobacterium, VPg de Picornavirus, Topoisomerase, proteína A do fago PhiX174 e proteína A* de PhiX; em que a montagem de cada um dos dois SCNAs diferentes com dois dos polipeptídeos forma um complexo de nucleoproteína funcional capaz de modificar especificamente o dito ácido nucleico-alvo no sítio alvo, em que a modificação compreende a geração de quebras em uma ou duas fitas do ácido nucleico-alvo para iniciar a mutação de genes, deleção, substituição de genes ou integração de uma molécula de ácido nucleico exógena, e em que os dois SCNAs diferentes fornecem a especificidade e capacidade de ligação do complexo de núcleo-proteína funcional para o sítio alvo dentro do ácido nucleico-alvo dentro da célula hospedeira eucariótica.

2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dito ácido nucleico-alvo é DNA.

3. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que dito DNA-alvo é DNA genômico.

4. Método, de acordo com qualquer uma das reivindicações 1 a 3, CARACTERIZADO pelo fato de que a dita sequência de ácido nucleico-alvo é uma sequência de ácido nucleico extracromossômico, selecionada do grupo que consiste em um ácido nucleico na mitocôndria, cloroplasto, amiloplasto e cromoplasto.

5. Método, de acordo com qualquer uma das reivindicações 1 a 4, CARACTERIZADO pelo fato de que o SCNA compreende uma molécula de ácido nucleico selecionada do grupo que consiste em um RNA de fita simples, um RNA de fita dupla ou combinações dos mesmos.

6. Método, de acordo com qualquer uma das reivindicações 1 a 5, CARACTERIZADO pelo fato de que a interação entre o SCNA e o ácido nucleico-alvo é através do pareamento de bases, selecionado do grupo que consiste em um parea- mento de bases de dupla hélice completa, um pareamento de bases de dupla hélice parcial, um pareamento de bases de tripla hélice completo, um pareamento de bases de tripla hélice parcial e alças-D ou formas ramificadas, formada pelo dito pareamento.

7. Método, de acordo com qualquer uma das reivindicações 1 a 6, CARACTERIZADO pelo fato de que a região de reconhecimento do SCNA compre-ende uma modificação química selecionada do grupo que consiste em modificação da extremidade 5', modificação da extremidade 3' e modificação interna.

8. Método, de acordo com qualquer uma das reivindicações 1 a 7, CARACTERIZADO pelo fato de que a modificação química é selecionada do grupo que consiste em: uma modificação de nucleotídeo, biotina, fluoresceína, ligantes de amina, oligopeptídeos, aminoalila, uma molécula de corante, fluoróforos, digoxige- nina, acridita, adenilação, azida, NHS-éster, colesteril-TEG, Alcinos, Biotina Fotoclivá- vel, Tiol, Ditiol, bases modificadas, fosfato, 2-Aminopurina, Trímero-20, 2,6-Diamino- purina, 5-Bromo-deoxiUridina, DeoxiUridina, dT invertido, dideoxi-nucleotídeos, 5-me- til deoxiCitidina, desoxiInosina, 5-nitroindol, bases de RNA 2-O-metil, Iso-dC, Iso-dG, bases modificadas por flúor e ligações fosforotioato e uma proteína ligada covalente- mente por sua interação com uma sequência de nucleotídeos específica.

9. Método, de acordo com qualquer uma das reivindicações 1 a 8, CARACTERIZADO pelo fato de que os dois SCNAs diferentes compreendem, cada um, um ácido nucleico selecionado do grupo que consiste em um DNA de fita simples, um RNA de fita simples, um RNA de fita dupla, um DNA modificado, um RNA modificado, um ácido nucleico bloqueado (LNA) e um peptídeo-ácido nucleico (PNA) ou combinações dos mesmos.

10. Método, de acordo com qualquer uma das reivindicações 1 a 9, CARACTERIZADO pelo fato de que a célula hospedeira eucariótica é uma célula vegetal.

11. Método, de acordo com qualquer uma das reivindicações 1 a 9, CARACTERIZADO pelo fato de que a célula hospedeira eucariótica é uma célula animal.

12. Método, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a célula animal é uma célula de inseto.

13. Método, de acordo com qualquer uma das reivindicações 1 a 12, CARACTERIZADO pelo fato de que o polipeptídeo é expresso na célula hospedeira eucariótica.

14. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o polipeptídeo e as duas moléculas de SCNA diferentes são expressas na célula hospedeira eucariótica.