BR112015021210B1 - Método para reduzir a expressão de um ácido nucleico alvo em uma planta e ácido nucleico recombinante - Google Patents

Método para reduzir a expressão de um ácido nucleico alvo em uma planta e ácido nucleico recombinante Download PDF

Info

Publication number
BR112015021210B1
BR112015021210B1 BR112015021210-7A BR112015021210A BR112015021210B1 BR 112015021210 B1 BR112015021210 B1 BR 112015021210B1 BR 112015021210 A BR112015021210 A BR 112015021210A BR 112015021210 B1 BR112015021210 B1 BR 112015021210B1
Authority
BR
Brazil
Prior art keywords
domain
protein
proteins
amino acid
nucleic acid
Prior art date
Application number
BR112015021210-7A
Other languages
English (en)
Other versions
BR112015021210A2 (pt
BR112015021210B8 (pt
Inventor
Steve E. Jacobsen
Julie Law
Lianna Johnson
Original Assignee
The Regents Of The University Of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The Regents Of The University Of California filed Critical The Regents Of The University Of California
Publication of BR112015021210A2 publication Critical patent/BR112015021210A2/pt
Publication of BR112015021210B1 publication Critical patent/BR112015021210B1/pt
Publication of BR112015021210B8 publication Critical patent/BR112015021210B8/pt

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

MÉTODOS E COMPOSIÇÕES PARA O DIRECIONAMENTO DE RNA POLIMERASES E BIOGÊNSE DE RNA NÃO CODIFICANTE PARA LOCAIS ESPECÍFICOS. A presente divulgação refere-se às proteínas recombinantes que induzem silenciamento de gene epigenético e os métodos de uso de tais proteínas para reduzir a expressão de genes em plantas.

Description

REFERÊNCIA CRUZADA AOS PEDIDOS RELACIONADOS
[0001] Este pedido reinvidica benefício ao Pedido de Patente Provisório US 61/771.743, depositado em 1 de março de 2013 e ao Pedido de Patente Provisório No. 61/929,414, depositado em 20 de janeiro de 2014, que são ambos aqui incorporados por referência nas suas totalidades.
DECLARAÇÃO SOBRE PESQUISA PATROCINADA FEDERALMENTE
[0002] Esta invenção foi feita com o apoio governamental sob a Concessão N.° GM60398, concedida pelo National Institutes of Health. O governo tem certos direitos sobre a invenção. SUBMISSÃO DA LISTAGEM DE SEQUÊNCIAS NO ARQUIVO DE TEXTO ASCII
[0003] O conteúdo da seguinte submissão no arquivo de texto ASCII é incorporado aqui por referência em sua totalidade: uma forma de leitura em computador (CRF) da Listagtem sequencial (nome do arquivo: 262232000440SEQLISTING.txt, data de gravação: 28 de fevereiro de 2014, tamanho: 712 KB).
CAMPO
[0004] A presente divulgação se refere às proteínas recombinantes que induzem ao silenciamente do gene epigenético e aos métodos de uso de tais proteínas para a redução de expressão de genes em plantas.
FUNDAMENTOS
[0005] Marcas epigenéticas são modificações químicas mediadas por enzimas do DNA e de suas proteínas associadas à cromatina. Apesar das marcas epigenéticas não alterarem a sequência primária do DNA, elas contém informações hereditárias e desempenham papel fundamental na regulação da função do genoma. Tais modificações, incluindo metilação de citosina, modificações pós-tradução das caudas de histonas e núcleo de histonas e posicionamento de nucleossomos (octâmeros de histonas envolvidos em DNA), influenciam o estado transcricional e outros aspectos funcionais da cromatina. Por exemplo, a metilação do DNA e certos resíduos na cauda H3 N-terminal da histona, tais como lisina 9 H3 (H3K9), são importantes para o silenciamento da transcrição de gene e a formação da heterocromatina. Tais marcas são essenciais para o silenciamento de sequências não-gênicas, incluindo transposons, pseudogenes, sequências repetitivas e vírus integrados, que se tornam prejudiciais às células se expressos e, portanto, ativados. O silenciamento de genes epigenéticos é importante também em fenômenos de desenvolvimento, tais como impressão em ambos plantas e mamíferos, assim como na diferenciação celular e reprogramação.
[0006] Diferentes vias envolvendo o silenciamento epigenético foram previamente descritas e incluem desacetilação de histonas, metilação de H3K27 e H3K9, dimetilação de H3K4 e metilação de DNA de promotores. Um caminho para alcançar a metilação de DNA é através de um fenômeno conhecido como metilação de DNA dirigida por RNA, onde RNAs não codificantes agem para direcionar a metilação de uma sequência de DNA. Em plantas, não foi descrita nenhuma proteína que liga ao reconhecimento de uma sequência de DNA específica com o estabelecimento de um estado epigenético. Portanto, reguladores epigenéticos de plantas geralmente não podem ser utilizados para o silenciamento de genes epigenéticos específicos ou transgenes em plantas.
[0007] Uma solução é identificar ou engenheirar reguladores epigenéticos que contenham sequências específicas de domínio de dedo de zinco, uma vez que os dedos de zinco foram primeiramente identificados como motivos de ligação ao DNA (Miller et al., 1985), e diversas outras variações destes foram caracterizadas. Progressos recentes permitem a concepção de proteínas de ligação ao DNA que reconhecem especificamente qualquer sequência de DNA desejada. Por exemplo, foi recentemente demonstrado que uma proteína de dedo de zinco de três dedos poderia ser construída para bloquear a expressão de oncogene humano que foi transformado em uma linhagem celular de camundongo (Choo and Klug, 1994). Porém, problemas potenciais para engenheirar reguladores epigenéticos que contenham um domínio de dedo de zinco engenheirado incluem assegurar que a proteína engenheirada terá a estrutura correta para ser funcional e garantindo que a fusão do domínio de dedo de zinco ao regulador epigenético não interfere na ligação do específica ao DNA do domínio de dedo de zinco ou a atividade do regulador epigenético.
[0008] Assim, existe uma necessidade de reguladores epigenéticos melhorados que sejam capazes de se ligar às sequências de DNA específicas, que se dobram apropriadamente, e que retenham ambas a atividade de ligação ao DNA específico da sequência e silenciamento epigenético de gene quando expresso em plantas.
BREVE SUMÁRIO
[0009] A presente divulgação se refere a um método para a redução de expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta tendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SHH1 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais dos ácidos nucleicos alvos, assim, reduzir a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três dedos de domínio de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui pelo menos um de um homeodomínio ou um domínio SAWADEE. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequênca de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 1. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 1. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades, a RNA polimerase é uma RNA polimerase IV. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com H3K9 metilado. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteiores, o polipeptídeo recombinante interage com H3K9me1, H3K9me2 e/ou H3K9me3. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz uma metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais dos ácidos nucleicos alvo são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais dos ácidos nucleicos alvo são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais dos ácidos nucleicos alvo é silenciado.
[0010] A presente divulgação relacionada ainda a um ácido nucleico recombinante codificando uma proteína semelhante à SHH1 contendo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SHH1 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%^ pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 1. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 1. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro,cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína, um domínio de grupo binuclear de zinco. Em algumas modalides que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio da família hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, um ou mais dos ácidos nucleicos alvo são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à SHH1 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalides que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à SHH1 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0011] Outros aspectos da presente divulgação se referem a um vetor contendo o ácido nucleico recombinante codificando a proteína semelhante à SHH1 de qualquer uma das modalidades anteriores, em que o ácido nucleico recombinante é operacionalmente ligado a uma sequência regulatória. Outros aspectos da presente divulgação referm-se à um célula hospedeira contendo o vetor de expressão da modalidade anterior. Em certas modalidades, a célula hospedeira é uma célula vegetal. Outros aspectos da presente divulgação se referem às plantas recombinantes contendo o ácido nucleico recombinante de qualquer uma das modalidades anteriores.
[0012] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácios incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SUVH2 ou um fragmento do mesmo, ou um polipeptídeo SUVH9 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores,o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla- hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz uma metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais ácidos nucleicos alvo são ácidos nucleicos engógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, oos um ou mais ácidos nucleicos alvo são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada. Em algumas modalidade que podem ser combinadas com qualquer uma das modalidades anteriores, o método inclui fornecer uma planta que ainda inclui um ácido nucleico recombinante adicional, em que o ácido nucleico recombinante adicional codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SHH1 ou um fragmento do mesmo; e cultivar a planta sob condições em que o polipeptídeo recombinante adicional codificado pelo ácido nucleico recombinante adicional é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos.
[0013] A presente divulgação se refere ainda a um ácido nucleico recombinante codificante uma proteína semelhante à SUVH2 ou uma proteína semelhante à SUVH9 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SUVH2 ou um fragmento do mesmo, ou um polipeptídeo SUVH9 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou novo dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína e domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, um ou mais dos ácidos nucleicos alvo são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à SUVH2 e/ou a proteína semelhante à SUVH9 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à SUVH2 e/ou a proteína semelhante à SUVH9 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0014] Outros aspectos da presente divulgação se referem a um vetor contendo o ácido nucleico recombinante codificando a proteína semelhante à SUVH2 e/ou a proteína semelhante à SUVH9 de qualquer uma das modalidades anteriores, em que o ácido nucleico recombinante é operacionalmente ligado a uma sequência regulatória. Outros aspectos da presente divulgação se referem a uma célula hospedeira contendo o vetor de expressão da modalidade anterior. Em certas modalidades, a célula hospedeira é uma célula vegetal. Outros aspectos da presente divulgação são relacionados a uma planta recombinante contendo o ácido nucleico recombinante de qualquer uma das modalidades anteriores.
[0015] A presente divulgação se refere ainda a um método para a redução de expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta incluindo um primeiro ácido nucleico recombinante codificando um primeiro polipeptídeo recombinate incluindo uma primeira sequência de aminoácidos incluindo um polipeptídeo SHH1 ou um fragmento do mesmo e um segundo ácido nucleico recombinante codificando um segundo polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SUVH2 ou um fragmento do mesmo, ou um polipeptídeo SUVH9 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o primeiro polipeptídeo recombinante codificado pelo primeiro ácido nucleico recombinante e o segundo polipeptídeo recombinante codificado pelo segundo ácido nucleico recombinante são expressos e se ligam a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA de pelo menos dos polipeptídeos recombinantes inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA de pelo menos um dos polipeptídeos recombinantes é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice- volta-hélice, um domínio básico, um domínio fita-hélice- hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA de pelo menos um dos polipeptídeos recombinantes inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA de pelo menos um dos polipeptídeos recombinantes inclui três domínio de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos do primeiro polipeptídeo recombinante inclui pelo menos um de um homeodomínio ou um domínio SAWADEE. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos do primeiro polipeptídeo recombinante inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 1. Em algumas modalidade que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos do primeiro polipeptídeo recombinante inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 1. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, pelo menos um dos polipeptídeos recombinantes interage com uma RNA polimerase. Em algumas modalidades, a RNA polimerase é uma RNA polimerase IV. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o primeiro polipeptídeo recombinante interage com H3K9 metilado. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o primeiro polipeptídeo recombinante interage com H3K9me1, H3K9me2 e/ou H3K9me3. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o primeiro polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos do segundo polipeptídeo recombinante inclui um domínio selecionado de um domínio de feixe dupla-hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos do segundo polipeptídeo recombinante inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos do segundo polipeptídeo recombinante inclui uma sequência de aminoácidos que é pelo menos 100% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o segundo polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o segundo polipeptídeo recombinante induz uma metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, pelo menos um dos polipeptídeos recombinantes induz uma metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos é silenciado.
[0016] Outros aspectos da presente divulgação se referem a um vetor contendo o ácido nucleico recombinantes codificando a proteína semelhante à SHH1, a proteína semelhante à SUVH2 e/ou a proteína semelhante à SUVH9 de qualquer uma das modalidades anteriores, em que o ácido nucleico recombinante é operacionalmente ligado a uma sequência regulatória. Outros aspectos da presente divulgação se referem a uma célula hospedeira contendo os vetores de expressão da modalidade anterior. Em certas modalidades, a célula hospedeira é uma célula vegetal. Outros aspectos da presente divulgação se referem a uma planta recombinante contendo ácidos nucleicos recombinante de qualquer uma das modalidades anteriores.
[0017] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DMS3 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla-hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 41. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 41. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0018] A presente divulgação se refere ainda a um ácido nucleico recombinante que codifica uma proteína semelhante à DMS3 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DMS3 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui um aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 41. Em aglumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 41. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL,, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combiandas com qualquer uma das modalidades anteriores, a proteína semelhante à DMS3 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DMS3 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0019] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo MORC6 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem se combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla- hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 53. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 53. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0020] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à MORC6 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo MORC6 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 53. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 53. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidade, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combiandas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer outra das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à MORC6 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à MORC6 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0021] A presente divulgação se refere ainda a um método para a redução de expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SUVR2 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo um efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios de dedo de zinco C2H2. Em algumas modalidade que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla- hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 66. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 66. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz uma metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0022] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à SUVR2 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SUVR2 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 66. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 66. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína e um domínio de cluster binuclear de dedo de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com as modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à SUVR2 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à SUVR2 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0023] Outros aspectos da presente divulgação se referem a um vetor contendo ácido nucleico recombinante codificando uma proteína semelhante à DMS3, semelhante à MORC6 e/ou semelhante à SUVR2 de qualquer uma das modalidades anteriores, em que o ácido nucleico recombinante é operacionalmente ligado a uma sequência regulatória. Outros aspectos da presente divulgação se referem a uma célula hospedeira contendo o vetor de expressão da modalidade anterior. Em certas modalidades, a célula hospedeira é uma célula vegetal. Outros aspectos da presente divulgação se referem a uma planta recombinante contendo o ácido nucleico recombinante de qualquer uma das modalidades anteriores.
[0024] A presente divulgação se refere ainda a um método para a redução da expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: (a) fornecer uma planta incluindo um primeiro ácido nucleico recombinante codificando um primeiro polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo SHH1 ou um fragmento do mesmo e um ou mais ácidos nucleicos adicionais recombinantes codificando um ou mais polipeptídeos, cada um dos um ou mais dos polipeptídeos adicionais incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo selecionado do grupo que consiste em um polipeptídeo SUVH2 ou um fragmento do mesmo, um polipeptídeo SUVH9 ou um fragmento do mesmo, um polipeptídeo DMS3 ou um fragmento do mesmo, um polipeptídeo MORC6 ou um fragmento do mesmo, um polipetídeo SUVR2 ou um fragmento do mesmo, um polipeptídeo DRD1 ou um fragmento do mesmo, um polipeptídeo RDM1 ou um fragmento do mesmo, um polipeptídeo DRM3 ou um fragmento do mesmo, um polipeptídeo DRM2 ou um fragmento do mesmo e um polipeptídeo FRG ou um fragmento do mesmo; e (b) cultivar a planta sob condições em que o primeiro polipeptídeo recombinante codificado pelo primeiro ácido nucleico recombinante e um ou mais dos polipeptídeos adicionais codificados por um ou mais ácidos nucleicos recombinantes são expressos e se ligam a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, pelo menos dos polipeptídeos recombinantes induz a metilação do DNA dirigida por RNA. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0025] Outros aspectos da presente divulgação se referem a uma celula hospedeira incluindo vetores de expressão incluindo os ácidos nucleicos recombinantes codificando os polipeptídeos recombinantes de qualquer uma das modalidades anteriores. Em algumas modalidades, a célula hospedeira é uma célula vegetal. Outros aspectos da presente divulgação se referem a uma planta recombinante incluindo os ácidos nucleicos recombinantes de qualquer uma das modalidades anteriores.
[0026] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo fornecer uma planta incluindo: (a) um RNA de interferência pequeno (siRNA) que tem como alvo um ou mais ácidos nucleicos alvos e um ou mais ácidos nucleicos recombinantes codificando um ou mais polipeptídeos, cada um dos um ou mais dos polipeptídeos incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo selecionado do grupo que consiste em um polipeptídeo SUVH2 ou um fragmento do mesmo, um polipeptídeo SUVH9 ou um fragmento do mesmo, um polipeptídeo DMS3 ou um fragmento do mesmo, um polipeptídeo MORC6 ou um fragmento do mesmo, um polipeptídeo SUVR2 ou um fragmento do mesmo, um polipeptídeo DRD1 ou um fragmento do mesmo, um polipeptídeo RDM1 ou um fragmento do mesmo, um polipeptídeo DRM3 ou um fragmento do mesmo, um polipeptídeo DRM2 ou um fragmento do mesmo e um polipeptídeo FRG ou um fragmento do mesmo e (b) cultivar a planta sob condições em que o siRNA interage com um ou mais ácidos nucleicos alvos e um ou mais dos polipeptídeos codificados por um ou mais ácidos nucleicos recombinantes são expressos e se ligam a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos.
[0027] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos em uma planta, incluindo: a) fornecer uma planta contendo ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DRD1 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer outra das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta- hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios dedos de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla-hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer outra das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 79. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 79. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0028] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à DRD1 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DRD1 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 79. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 79. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modaliades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DRD1 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DRD1 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0029] A presente divulgação se refere ainda a um método para a redução de expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo RDM1 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, a molécula de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta- hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínio de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla-hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 91. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 91. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0030] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à RDM1 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo RDM1 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 91. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 91. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades,o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à RDM1 reduz a expessão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à RDM1 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0031] A presente divulgação se refere ainda a um método para a redução de expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DRM3 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais dos ácidos nucleicos alvo. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qulquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla- hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 101. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 101. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirgidia por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0032] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à DRM3 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DRM3 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 101. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminácidos que é 100% idêntica à SEQ ID NO: 101. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores,o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DRM3 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DRM3 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0033] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um acido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DRM2 ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação DNA inclui três domínio de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores,a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla- hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 113. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos auq é 100% idêntica à SEQ ID NO: 113. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais ácidos nucleicos são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0034] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à DRM2 incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo DRM2 ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 113. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 113. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DRM2 reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à DRM2 silencia a expressão de um ou mais ácidos nucleicos alvos.
[0035] A presente divulgação se refere ainda a um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, incluindo: a) fornecer uma planta contendo um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo FRG ou um fragmento do mesmo; e b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, assim reduzindo a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui três domínios de dedo de zinco C2H2. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácidos inclui um domínio selecionado de um domínio de feixe dupla- hélice, um domínio SRA, um domínio pré-SET ou um domínio SET. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de amnoácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 125. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a segunda sequência de aminoácios inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 125. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante interage com uma RNA polimerase. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a RNA polimerase é uma RNA polimerase V. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o polipeptídeo recombinante induz a metilação de DNA dirigida por RNA. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais ácidos nucleicos alvo são ácidos nucleicos endógenos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, um ou mais ácidos nucleicos são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a expressão de um ou mais ácidos nucleicos alvos é silenciada.
[0036] A presente divulgação se refere ainda a um ácido nucleico recombinante codificando uma proteína semelhante à FRG incluindo uma primeira sequência de aminoácidos incluindo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos incluindo um polipeptídeo FRG ou um fragmento do mesmo. Em algumas modalidades, a segunda sequência de aminácidos inclui uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% idêntica à SEQ ID NO: 125. Em algumas modalidades, a segunda sequência de aminoácidos inclui uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 125. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco inclui dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco. Em algumas modalidades, o domínio de dedo de zinco é selecionado de um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi- cisteína e um domínio de cluster binuclear de zinco. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA é selecionado de um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA inclui um domínio tendo como alvo o efetor TAL. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. Em algumas modalidades, os um ou mais ácidos nucleicos alvos são ácidos nucleicos codificando polipeptídeos. Em algumas modalidades, os um ou mais ácidos nucleicos são ácidos nucleicos de plantas endógenos. Em algumas modalidades, um ou mais dos ácidos nucleicos alvo são ácidos nucleicos heterólogos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à FRG reduz a expressão de um ou mais ácidos nucleicos alvos. Em algumas modalidades que podem ser combinadas com qualquer uma das modalidades anteriores, a proteína semelhante à FRG silencia expressão de um ou mais ácidos nucleicos alvos.
[0037] Outros aspectos da presente divulgação se referem a uma planta tendo a expressão reduzida de um ou mais ácidos nucleicos alvo de acordo com o método de qualquer uma das modalidades anteriores, assim como a progênie vegetal da planta da modalidade anterior. Em algumas modalidades, a progênie vegetal reduziu a expressão de um ou mais ácidos nucleicos alvos e não inclui os ácidos nucleicos recombinante da presente divulgação.
DESCRIÇÃO BREVE DOS DESENHOS
[0038] A patente ou o arquivo do pedido contém pelo menos um desenho executado em cores. Cópias desta patente ou publicação de pedido de patente com desenhos coloridos serão forncecidas pelo escritório mediante solicitação e pagamento da taxa necessária.
[0039] FIG. 1A-FIG. 1G ilustram um perfil epigenétido dos clusters de sRNA afetados nos mutantes de RdDM. FIG. 1A ilustra um gráfico em pizza mostrando a abundância de leituras de siRNA de 24 nt (5.967.213 mapeando unicamente leituras totais) dentro das categorias indicadas. FIG. 1B ilustra um diagrama Venn mostrando as relações aproximadas de clusters siRNA de 24 nt reduzidos em cada genótipo e a subclasse utilizada para análise à jusante. FIG. 1C ilustra um gráfico em pizza mostrando a distrubuição cromossomal (baseado nas definições descritas previamente de heterocromatina e eucromatina pericentroméricas) dos clusters de siRNA afetados nas subclasses indicadas. FIG. 1D e FIG 1E ilustram os diagramas de caixa do siRNA e os padrões de metilação de CHH nas subclasses mostradas na FIG. 1B para os diferentes mutantes RdDM (* indica redução significativa; P<1e-10 teste U de Mann-Whitney). FIG. 1F ilustra metaplots mostrando o enriquecimento de CMT3 e Pol-V nos clusters de siRNA afetados (+/- 5000 bp a partir do ponto médio dos clusters de sRNA). FIG. 1G ilustra mapas de aquecimento do enriquecimento de Pol-V sobre clusters de siRNA afetados.
[0040] FIG. 2A-FIG. 2B ilustram os níveis de Polimerase IV nos clusters de siRNA definidos. FIG. 2A ilustra metaplots e FIG. 2B ilustra mapas de aquecimento do enriquecimento de Pol-IV sobre os clusters de siRNA definidos nas origens genéticas indicadas. Metaplots and mapas de aquecimento se extendem +/- 5000 bp a partir do ponto médio do cluster de siRNA .
[0041] FIG. 3A-FIG.3D ilustram que o domínio SHH1 SAWADEE reconhece a metilação de H3K9 e adota uma única dobra semelhante ao domínio Tudor em tandem. FIG. 3A e FIG. 3B ilustram medições baseadas em ITC do domínio SAWADEE ligado aos peptídeos de histona modificados ou não modificados como indicado. Valores Kd são listados. FIG. 3C iustra a análise metaplot mostrando o enriquecimento do H3K9me2 sobre as classes de pico de Pol-IV ChIP-seq indicadas. FIG. 3D ilustra a estrutura completa do domínio SHH1 SAWADEE em uma forma livre. Os dois domínios Tudor em tandem são mostrados em magenta (Tudor 1) e verde (Tudor 2). O motivo de ligação ao zinco único do domínio SAWADEE é mostrado como um modelo bola-e-bastão ampliado, com destaque para os detalhes da coordenação de metal. Uma molécula de detergente ligada a uma fração 4-ciclohexil-1-Butil-β-D-Maltosideo (CYMAL®-4, Hampton Research) a partir da condição de cristalização é mostrada em amarelo em uma representação em bastão.
[0042] FIG. 4A-FIG. 4J ilustram uma base estrutural para o reconhecimento do peptídeo H3(1-15)K9me2 pelo domínio SHH1 SAWADEE e análises funcionais in vivo. FIG. 4A ilustra a estrutua geral do complexo H3(1-15)K9me2-SAWADEE. O domínio SAWADEE é mostrado como um diagrama em fita e o peptídeo em uma representação em bastão. O composto anelando simulado omite o mapa de densidade de elétrons no nível 1o da ligação de peptídeo também é mostrado. Os domínios Tudor 1 e 2 são mostrados em magenta e verde, respectivamente. FIG. 4B iustra uma visão estéreo destacando os detalhes das interações intermoleculares entre o domínio SAWADEE e o peptídeo H3(1-15)K9me2 ligado. Interações de ligação de hidrogênio intermoleculares são designadas por linhas vermelhas tracejadas. A cadeia aromática, que reconhece o K9 dimetilado, também é mostrada. FIG. 4C ilustra uma representação das interações intermoleculares entre o domínio SAWADEE e o peptídeo H3(1-15)K9me2 ligado. FIG. 4D ilustra uma sobreposição do peptídeo H3K9me2 ligado ao domínio SAWADEE (com Tudor1 em magenta e Tudor 2 em verde) e a forma livre do domínio SAWADEE (em prata) revela nenhuma mudança conformacional geral significativa sobre a ligação de peptídeos. FIG. 4E ilustra que o K4 não metilado se insere em um bolso estreito formado por Glu130 e Asp141 do Tudor 1, e Leu201 e Tyr212 do Tudor 2, e forma duas ligações de hidrogênio com Glu130 e Asp141, assim como interações eletrostáticas. FIG. 4F ilustra uma visão detalhada do reconhecimento do K9 dimetilado pela cadeia aromática formada por três resíduos aromáticos. FIG. 4G ilustra que o K4 monometilado é tolerado pelo bolso de ligação a K4 do domínio SAWADEE como revelado pela estrutura cristalina do complexo H3(1-15)K4me1K9me1-SAWADEE. O grupo metil adicional quebra uma ligação de hidrogênio com Glu130 e introduz mais contatos de van der Waals com outros resíduos. FIG. 4H e FIG. 4I ilustram diagramas de caixa mostrando a % de metilação do CHH e os níveis de siRNA respectivamente, em um tipo selvagem e mutantes shh1 assim como mutantes shh1 transformados com construtos SHH1 com o tipo selvagem de sequência SHH1 ou mutações pontuais nos bolsos de ligação K9 (F162AF165A e Y140A) ou K4 (D141A e Y212A). (* indica redução significativa; P<1e-10 teste U de Mann-Whitney). FIG. 4J ilustra resultados quantitativos de PCR mostrando o enriquecimento de Pol-IV em fundos de tipo selvagem e mutante de SHH1. Barras azuis indicam a média de duas repetições biológicas após a normalização para a entrada e o nível de actina. Barras pretas indicam o erro padrão.
[0043] FIG. 5A-FIG. 5F ilustra que SUVH2 e SUVH9 são necessários para a ligação à Pol V cromatina, transcrição e a metilação de DNA resultante. FIG. 5A ilustra PCR quantativo (qPCR) do IGN22 e P6 em relação ao ACTIN7 e normalizado para Columbia (WT). Média +/- desvio padrão (SD) de duas réplicas biológicas. FIG. 5B ilustra o qPCR of IGN22 e IGN5 do Flag ChIP mostrado como o enriquecimento do IP/entrada relativo ao ACTIN7 nas linhagens NRPE1-Flag/WT e NRPE1- Flag/suvh2suvh9. Média +/- SD de duas réplicas biológicas. FIG. 5C ilust a um mapa de calor do enriquecimento do NRPE1 nos sítios NRPE1 definidos determinados pelo Flag ChIP-seq em NRPE1-Flag/WT ou NRPE1-Flag/suvh2suvh9, com Flag ChIP em Columbia como controle negativo. FIG. 5D ilustra um diagrama de caixa (extensão de whiskers a uma faixa interquartil ±1,5 (IQR)) do enriquecimento de NRPE1 nos sítios mostrados em C para NRPE1-Flag/WT e NRPE1-Flag/suvh2suvh9. FIG. 5E ilustra a porcentagem de metilação em todos os sítios NRPE1 definidos (média +/- SD) assim como determinado pelo sequenciamento de bissulfito do genoma completo. FIG. 5F ilustra a densidade de leituras de H3K9me1 ChIP-seq em WT, suvh2suvh9, e suvh4suvh5suvh6, normalizadas pelo nível médio de metilação de histonas em 80 sítios eucromáticos selecionados.
[0044] FIG. 6A-FIG. 6E ilustra que SUVH2 amarrado atrai a metilação do DNA e causa um fenótipo de florescimento tardio. FIG. 6A, na parte superior ilustra um diagrama de SUVH2 com um dedo de Zn inserido imediatamente antes do tag HA em N-terminal. FIG. 6A, na parte inferior ilustra um esquema do gene FWA mostrando as duas repetições pequenas e duas repetições grandes (setas azuis), as regiões ampliadas por PCR (promotor e transcrito), o início da transcrição (seta vermelha) e sítios ligados pelo dedo de Zn (indicados por duas setas laranja). FIG. 6B ilustras o crescimento de plantas lado-a-lado para ilustrar o florecimento precoce de ZF-SUVH2 em fwa-4 (plantas T2) comparado com fwa-4. FIG. 6C ilustra o tempo de florescimento de Columbia (WT), ZF-SUVH2 em fwa-4, HA-SUVH2 em fwa-4 e fwa-4. Média +/- SD. FIG. 6D ilustra o percentual de metilação em cada C na região de repetição FWA. Números indicam os resíduos C individuais, duas linhas pretas mostram a localização dos sítios de ligação de ZF, setas vermelhas mostram a localização do transcrito. O percentual de metilação foi determinado de 2025 clones de DNA tratado com bissulfito. FIG. 6E ilustra o percentual de metilação em cada C na região de repetição FWA de três plantas T1 individuais.
[0045] FIG. 7A-FIG.7C ilustra que ZF-SUVH2 recruta Pol V, mas não a metilação de histona, para FWA. FIG. 7A ilustra NRPE1 ChIP em WT (controle positivo), mutante nrpe1 (controle negativo), epialelo fwa-4 e ZF-SUVH2/fwa-4. qPCR de dois sítios NRPE caracterizados (IGN5 e IGN22) e duas regiões em FWA (promotor FWAp- e transcrito FWAt-) mostradas como o enriquecimento de IP/entrada relativo ao controle negativo. Média +/- SD de duas réplicas biológicas. FIG. 7B ilustra H3K9me1 ChIP em flores WT, fwa-4 e ZF-SUVH2/fwa-4 T1. O controle negativo é uma região em eucromatina desprovida de metilação de DNA. O enriquecimento é relativo à retrotransposon heterocromática Ta3. Média +/- SD de duas réplicas biológicas. FIG. 7C ilustra o mesmo da FIG. 7B, porém ZF-SUVH2/fwa-4 foi de flores T2.
[0046] FIG. 8A-FIG. 8H ilustra a estrutura cristalina de SUVH9 no estado livre e em interações entre domínios. FIG. 8A ilustra uma representação esquemática codificada em cores do comprimento completo de SUVH9 e o construto truncado N-terminalmente utilizado para a cristalização. FIG. 8B ilustra um diagrama em fita da estrutura cristalina de SUVH9 contendo um feixe dupla-hélice em direção ao N-terminal, o domínio SRA, o domínio pré-SET e o domínio SET coloridos em rosa, verde, laranja e azul respectivamente. As regiões desordenadas são mostradas em linhas tracejadas. O cluster Zn3Cys9 (lado inferior direito do painel) é destacado com um modelo bola-e-bastão. FIG. 8C ilustra as interações hidrofóbicas e interações carregadas dentro do feixe dupla-hélice mostrado em duas visões alternadas giradas em 180o. Resíduos envolvidos em interações hidrofóbicas inter-hélices são destacados em amarelo. FIG. 8D ilustra a parte N-terminal das primeiras formas carregadas de a-hélice e interações de ligações de hidrogênio com o domínio SRA e o domínio SET. Os resíduos de interação são mostrados em uma representação em bastão e as interações de ligação de hidrogênio são mostradas com linhas vermelhas tracejadas. FIG. 8E ilustra a parte C-terminal da primeira a-hélice exibindo extensas interações hidrofóbicas com o domínio SRA e os domínios pré-SET/SET. A ponta de uma longa alça do domínio SET abrange sobre a primeira a-hélice e forma interações hidrofóbicas com esta. Os resíduos da interação são mostrados em uma representação em bastão. FIG. 8F ilustra a segunda a-hélice formando algumas interações com o domínio SRA. Os resíduos de interação são mostrados em uma representação em bastão e as interações de ligação de hidrogênio são mostradas com linhas vermelhas tracejadas. FIG. 8G ilustra o domínio SRA formando um núcleo hidrofóbico que interage com os domínios pré-SET/SET e os feixes dupla- hélice. Os resíduos de interação são mostrados em uma representação em bastão. FIG. 8H ilustra uma alça de inserção longa do domínio SUVH9 SET (destacado em magenta) enriquecida com resíduos hidrofóbicos e formando interações hidrofóbicas extensivas com o feixe dupla-hélice e os domínios pré-SET e SET.
[0047] FIG. 9A-FIG. 9E ilustra a comparação estrutural de GLP ligado a SAH e ao peptídeo e SUVH9 no estado livre e a base estrutural subjacente desprovida de atividade da metiltransferase para SUVH9. FIG. 9A ilustra a estrutura cristalina de GLP humano em complexo com SAH ligado (código PDB: 2IGQ) mostrado em uma representação em fita prata no painel superior, com uma visão extendida dos sítios de ligação à SAH em uma representação da superfície eletrostática no painel inferior. O cofator SAH é mostrado em uma representação de preenchimento de espaço em ambos os painéis. O bolso de ligação à SAH do GLP é relativamente estreito e se liga à SAH com complementaridade estrutural e forma. FIG. 9B ilustra a estrutura cristalina de SUVH9 no estado livre mostrada em uma representação em fita codificada em cores no painel superior, com uma visão expandida do sítio de ligação a SAH putativo mostrado em uma representação de superfície eletrostática no painel inferior. O bolso de ligação à SAH putativo do SUVH9 é relativamente aberto e não fornece um bom ajuste para a molécula SAH. FIG. 9C ilustra a estrutura cristalina do GLP humano em complexo com os peptídeos SAH e H3K9me2 (código PDB: 2RFI) mostrada em uma representação em fita em prata no painel superior, com uma visão expandida dos sítios de ligação dos peptídeos mostrados em uma representação de superfície eletrostática no painel inferior. O domínio pós-SET e a alça ácida do domínio SET envolvidos em uma ligação de substrato de peptídeos são destacados em ciano e azul escuro, respectivamente. A ligação peptídica é mostrada em uma representação de preenchimento de espaço em ambos os painéis. O peptídeo é ligado em uma fenda na superfície entre os domínios pós-SET e SET. FIG. 9D ilustra a estrutura cristalina da SUVH9 no estado livre mostrado em uma representação em fita codificada em cores no painel superior, com uma visão expandida do sítio de ligação ao peptídeo putativo mostrado em uma representação de superfície eletrostática no painel inferior. A alça de inserção longa do domínio SET é destacada em magenta. O sítio de ligação ao peptídeo putativo é parcialmente bloqueado pela alça de inserção longa e não há fenda de ligação ao peptídeo significativa na superfície da proteína. FIG. 9E ilustra um posicionamento modelo do DNA de mCHH ao sítio ativo do domínio SUVH9 SRA seguido da superposição das estruturas do complexo SUVH5 SRA-mCHH [código PDB: 3Q0F) e SUVH9 no estado livre. O DNA se ajusta bem no domínio SRA sem confrontos de caráter espacial significativos. Alguns resíduos circundantes na segunda a-hélice do feixe dupla- hélice, que podem estar potencialmente envolvidos na ligação ao DNA, são destacados em uma representação em bastão.
[0048] FIG. 10 ilustra a estrutura baseada no alinhamento da sequência dos domínios SHH1, SHH2 e SAWADEE de Arabidopsis thaliana dos ortólogos SHH1 em outras espécies, incluindo Ricinus communis, Vitis vinifera, Picea sitchensis e Zea mays. O domínio Tudor em tandem do UHRF1 humano também é incluido para comparação. A estrutura secundária do domínio SHH1 SAWADEE e o domínio Tudor UHRF1 humano em tandem são apresentados nas partes superior e inferior do alinhamento, respectivamente. Os resíduos hidrofóbicos parcialmente conservados do domínio SAWADEE envolvidos na ligação à cauda não polar do detergente são marcados por estrelas verdes. Os resíduos aromáticos conservados envolvidos no reconhecimento do K9 metilado são marcados por hexágonos roxos. Os resíduos SAWADEE conservados envolvidos na coordenação do íon de zinco são marcados por círculos pretos.
[0049] FIG. 11 ilustra a estrutura baseada na sequência de alinhamento de proteínas da família SUVH de Arabidopsis. Os elementos estruturais secundários de SUVH9 são marcados no início da sequência de alinhamento. Os limites do domínio são marcados na parte superior. Os resíduos conservados envolvidos na interação com a base 5mC invertida e a espinha dorsal do DNA das estruturas do complexo SUVH5-DNA publicadas são destacados com círculos cianos e hexágonos azuis, respectivamente. As inserções nos domínios SET são destacados com uma caixa roxa. Os resíduos Cys de coordenação de zinco são destacados com estrelas pretas no domínio SET e estrelas cinzas no domínio pós-SET. Dois resíduos de tirosinas que são conservados e normalmente importantes para a atividade enzimática, estão destacados em pontos vermelhos.
[0050] FIG. 12A-FIG. 12C ilustra que SUVH2 e SUVH9 agem de forma redundante em todo o genoma. FIG. 12A ilustra os metaplots da metilação de CHH sobre DMRs identificados em vários mutantes SUVH. FIG. 12B ilustra os metaplots da metilação de CHH sobre os sítios de ligação à Pol V. FIG. 12C ilustra um diagrama Venn detalhando as sobreposições entre regiões hipo-metiladas CHH nos mutantes SUVH.
[0051] FIG. 13A-FIG. 13E ilustram que a ligação à Pol V é dependente da metilação de DNA. FIG. 13A ilustra um metaplot do percentual de metilação de CHH em todos os sítios de ligação ao NRPE1 definidos como determinado por BS-seq no tipo selvagem (WT), nrpe1 e suvh2 suvh9. FIG. 13B ilustra diagramas de caixa mostrando a metilação de DNA em cada contexto de citosina nos sítios de ligação NRPE1 definidos em WT e met1. FIG. 13C ilustra que a ocupação de Pol V em met1 é reduzida nos sítios NRPE1. FIG. 13D ilustra um metaplot da metilação de DNA nos sítios definidos como hiper- metilados em met1. FIG. 13E ilustra que a ocupação de Pol V em met1 é aumentada nos sítios hiper-metilados definidos.
[0052] FIG. 14A-FIG. 14B ilustram que SUVH2 amarrado recruta Pol V através de DRD1, resultando na metilação de DNA e um fenótipo de florecimento tardio. FIG. 14A ilustra o percentual de metilação em cada citosina na região de repetição FWA como determinado pela BS-seq em plantas T2 e T3 ZF-SUVH2/fwa-4 comparado à T2 ZF-KYP/fwa-4 (não metilado) e WT (padrão de metilação padrão). Sítios de ligação ZF são mostrado em verde e o gene FWA em azul. FIG. 14B ilustra os resultado de um pull-down de DRD1-Flag com ZF-SUVH2. Entrada: extrato DRD1-Flag de Arabidopsis; Grânulos-simulados: eluição de pull-down do DRD1-Flag utilizando grânulos magnéticos HA pré-ligados com extrato de Nicotiana benthamiana; Grânulos-ZFSUVH2: eluição de pull-down de DRD1- Flag utilizando grânulos magnéticos HA pré-ligados com extrato ZF-SUVH2 de Nicotiana benthamiana. Painel superior: Flag blot; Painel inferior: HA blot.
[0053] FIG. 15A-FIG. 15C ilustram que o construto ZF-SUVH2 estavelmente recruta a Pol V para FWA através de uma interação direta com DRD1. FIG. 15A ilustra a Flag-ChIP em WT versus ZF-KYP (flag-tagged) mostrando enriquecimento no FWA em ambos o promotor e a região de transcrição. FIG. 15B ilustra a BS-Seq do FWA de uma linhagem resistente a Basta contendo o transgene ZF-SUVH2 e dois irmãos sensíveis a Basta que perderam o transgene ZF-SUVH2. FIG. 15C ilustra um pull-down de HA-SUVH2 em Arabidopsis utilizando Flag- DRD1. Os paineis esquerdos são entradas de duas cepas parentais (expressando HA-SUVH2 (HA-2) ou Flag-DRD1 (Flag- D)) e a linha F2 expressando ambos HA-SUVH2 e Flag DRD1 (HA- 2xFlag-d). Os paineis direitos mostram a eluição de grânulos magnéticos Flag. Os paineis superiores são HA blots, os paineis inferiores são Flag blots.
[0054] FIG. 16 ilustra uma lista de proteínas identificadas por espectometria de massa por imunoprecipitação DRD1.
[0055] FIG. 17 ilustra metilação de CG, CHG, a CHH no gene FWA no tipo selvagem, e as linhagens de florecimento tardio fwa-4, DMS3-ZF e MORC6-ZF. A cor vermelha representa a metilação de CHH, em que H é C, A ou T. A cor verde representa a metilação de CG. A cor azul representa a metilação de CHG. A cor azul claro representa a ligação à Pol V no tipo selvagem comparado ao mutante polV mostrando a ligação à Pol V para a região promotora de FWA em plantas do tipo selvagem. Uma representação esquemática do gene FWA é representa em azul escuro na parte inferior.
[0056] FIG. 18 ilustra os RNAs pequenos presentes na região promotora APETALA1 (At1g69120) em plantas de tipo selvagem (metade superior) ou plantas contendo TAL-SHH1 (metade inferior). Os siRNAs na cadeia superior estão em vermelho e os siRNAs na cadeia inferior estão em azul.
[0057] FIG. 19 ilustra a metilação de CHH DNA na região promotora do gene SUPERMAN (At3g23130) em plantas F1 contendo apenas TAL-SUVH2, TAL-SHH1 ou ambos TAL-SHH1 e TAL- SUVH2 (TAL-SHH1/TAL-SUVH2).
DESCRIÇÃO DETALHADA Visão geral
[0058] A descrição seguinte é apresentada para possibilitar uma pessoa com conhecimento na técnica preparar e utilizar as várias modalidades. Descrições de dispositivos específicos, técnicas, métodos e aplicações são fornecidos apenas como exemplos. Várias modificações para os exemplos descritos aqui serão prontamente aparentes para aqueles com conhecimento da técnica e os princípios gerais definidos aqui podem ser aplicados a outros exemplos e aplicações sem afastamento do espírito e escopo das várias modalidades. Portanto, as várias modalidadesnão não são destinadas a serem limitadas aos exemplos descritos e mostrados aqui.
[0059] A presente divulgação se refere às proteínas recombinantes que induzem ao silenciamento de gene epigenético e aos métodos de utilização de tais proteínas para a redução de expressão de genes em plantas.
[0060] Em Arabidopsis, a metilação de DNA é estabelecida por uma proteína chamada DRM2 e é marcada como alvo por RNAs de pequena interferência (siRNAs) de 24nt através de uma via denominada metilação de DNA dirigida por RNA (RdDM) que envolve duas RNA polimerases específicas de plantas: RNA Polimerase IV (Pol IV), que funciona para iniciar a biogênese de siRNA; e RNA Polimerase V (Pol V), que funciona à jusante da fase de tendo como alvo a DNA metiltransferase da via RdDM para gerar um transcrito de esqueleto não codificando que recruta fatores RdDM à jusante. Portanto, a metilação de DNA dirigida por RNA em Arabidopsis envolve ambas a síntese de RNAs de pequena interferência não codificantes pela Pol IV e a síntese de RNAs de esqueleto não codificantes pela Pol V.
[0061] A presente divulgação é baseada, pelo menos em parte, na descoberta do Requerente que uma proteína chamada SHH1 age na via RdDM para possibilitar a produção de siRNA dos RdDM alvos e que SHH1 é requerida para a ocupação por RNA polimerase IV (Pol IV) nesse locus alvo. A presente divulgação é baseada ainda, pelo menos em parte, na descoberta do Requerente que a associação de Pol V com cromatina é dependente de duas proteínas chamadas SUVH2 e SUVH9. Além disso, uma proteína SHH1, SUVH2 e/ou SUVH9 modificada pode ser engenheirada para se ligar especificamente às diferentes sequências de DNA através da introdução de um domínio de ligação ao DNA heterólogo dentro da proteína ou um fragmento da proteína, tais como um domínio de dedo de zinco heterólogo ou um domínio tendo como alvo o efetor TAL. Vantajosamente, tais proteínas recombinantes podem ser utilizadas para recrutar a Pol IV (para proteínas semelhantes à SHH1) ou Pol V (para proteínas semelhantes à SUVH2 e/ou proteínas semelhantes à SUVH9) aos loci alvos para induzir a metilação de DNA dirigida por RNA no locus alvo e, portanto, silenciar os loci alvos.
[0062] Outras proteínas úteis nos métodos da presente divulgação para ter como alvo a Pol V, metilação de DNA e silenciamento de gene para loci específicos incluem qualquer uma de uma proteína DMS3, MORC6 e/ou SUVR2 modificada, que podem também ser engenheiradas para se ligar especificamente a diferentes sequências de DNA através da introdução de um domínio de ligação ao DNA heterólogo dentro da proteína ou um fragmento da proteína, tais como um domínio de dedo de zinco heterólogo ou um domínio tendo como alvo o efetor TAL.
[0063] De acordo, a presente divulgação fornece métodos para o silenciamento de loci específico em plantas utilizando uma ou mais de uma proteína SHH1, uma proteína SUVH2, uma proteína SUVH9, uma proteína DMS3, uma proteína MORC6 e/ou uma proteína SUVR2 que foram engenheiradas para se ligar especificamente a diferentes sequências de DNA através da introdução de um domínio de ligação ao DNA heterólogo dentro da proteína. Cada uma das proteínas modificadas mencionadas acima podem ser expressas em uma célula hospedeira individualmente ou em várias combinações para agir silenciando um locus alvo. Por exemplo, uma proteína SHH1 modificada tendo um domínio de ligação ao DNA heterólogo pode ser expressa em uma célula hospedeira para direcionar a Pol IV a um locus alvo em conjunto com uma ou mais de uma proteína SUVH2 modificada, uma proteína SUVH9, uma proteína DMS3, uma proteína MORC6 e/ou uma proteína SUVR2 tendo um domínio de ligação ao DNA heterólogo para direcionar a Pol V ao mesmo locus alvo para acionar a metilação de DNA dirigida por RNA e o silenciamento epigenético do locus alvo.
[0064] Outras proteínas que podem ser úteis para o silenciamento de loci específicos em plantas, de acordo com os métodos da presente divulgação, incluem proteínas adicionais envolvidas na metilação de DNA dirigida por RNA. Por exemplo, outras proteínas adequadas para o uso nos métodos da presente divulgação podem incluir, por exemplo, qualquer uma das DRD1, RDM1, DRM3, DRM2 e FRG. Assim, a presente divulgação também fornece métodos para o silenciamento de loci específicos em plantas utilizando uma ou mais de uma proteína SHH1, uma proteína SUVH2, uma proteína SUVH9, uma proteína DMS3, uma proteína MORC6, uma proteína SUVR2, uma proteína DRD1, uma proteína RDM1, uma proteína DRM3, uma proteína DRM2 e/ou uma proteína FRG que foi engenheirada para se ligar especificamente a diferentes sequências de DNA através da introdução de um domínio de ligação ao DNA heterólogo dentro da proteína. Cada uma das proteínas modificadas mencionadas acima pode ser expressa em uma célula hospedeira individualmente ou em várias combinações para agir para silenciar um locus alvo.
[0065] Os métodos da presente divulgação para o silenciamento de loci alvos em células hospereiras podem também envolver RNAs de interferência pequenos (siRNAs), em um locus alvo, em conjunto com com uma Pol V tendo como alvo uma ou mais de uma proteína SUVH2, uma proteína SUVH9, uma proteína DMS3, uma proteína MORC6, uma proteína SUVR2, uma proteína DRD1, uma proteína RDM1, uma proteína DRM3, uma proteína DRM2 e/ou uma proteína FRG, naquele locus. Métodos para gerar siRNAs são bem conhecidos na técnica. Estes métodos incluem, por exemplo, expressão de RNAs hairpin que são naturalmente processados em RNAs de interferência pequenos em células. Construtos hairpin que geram RNAs de interferência pequenos são conhecidos na técnica (EMBO Reports, 2006 Nov; 7(11):1168-75). Métodos adicionais para gerar siRNAs incluem, por examplo, a introdução direta de RNAs de interferência pequenos dentro de uma célula de origens exógenas. Métodos descrevendo o bombardeamento de siRNAs dentro de plantas são conhecidos na técnica (Science 328, 912 (2010)). Moléculas de RNA podem também ser pulverizadas em uma planta (aplicação exógena) de modo que RNAs pequenos possam então ser gerados em uma célula vegetal (Veja Pedido de Patente U.S. 2014/0018241). Assim, os métodos da presente divulgação para o silenciamento de loci alvos em células hospedeiras podem também envolver a introdução de RNAs de interferência pequenos (siRNAs) em um locus alvo, em conjunto com uma Pol V tendo como alvo um ou mais domínios de ligação ao DNA heterólogos contendo uma proteína SUVH2, uma proteína SUVH9, uma proteína DMS3, uma proteína MORC6, uma proteína SUVR2, uma proteína DRD1, uma proteína RDM1, uma proteína DRM3, uma proteína DRM2, e/ou uma proteína FRG naquele locus.
[0066] O silenciamento induzido através do direcionamento de várias proteínas recombinantes da presente divulgação tais como, por exemplo, proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhante à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2 e/ou proteínas semelhantes à FRG, podem ser estáveis em plantas mesmo na ausência destas proteínas recombinantes. Assim, os métodos da presente divulgação podem permitir um ou mais ácidos nucleicos alvos em uma planta a permanecerem silenciado após os polinucleotídeos recombinantes da presente divulgação terem saído da planta. Por exemplo, após ter como alvo uma região particular com siRNAs juntamente com uma proteína recombinante da presente divulgação que recruta a Pol V, o silenciamento e a metilação do DNA da região tida como alvo pode permanecer estável mesmo após a saída dos transgenes. É um objeto da presente divulgação fornecer plantas tendo reduzida a expressão de um ou mais ácidos nucleicos de acordo com os métodos da presente divulgação. Assim como os métodos da presente divulgação podem permitir um ou mais ácidos nucleicos alvos em uma planta a permanecerem silenciados após os polinucleotídeos recombinantes da presente divulgação terem saído da planta, as plantas originadas dessas plantas podem ter a expressão reduzida de um ou mais ácidos nucleicos, mesmo na ausência dos polinucleotídeos recombinantes, que produzem os polinucleotídeos recombinantes da presente divulgação.
Definições
[0067] Ao menos que definido de outra forma, todos os termos científicos e técnicos são entendidos por terem os mesmos significados comumente utilizados na técnica que pertencem. Para o propósito da presente divulgação, os termos a seguir são definidos.
[0068] Como utilizado aqui,um “ácido nucleico alvo’ se refere a uma porção de ácido polinucleotídico de fita dupla, por exemplo, RNA, DNA, PNA (ácido nucleico peptídico) ou combinações dos mesmos, ao qual é vantajoso se ligar a uma proteína. Em uma modalidades, um “ácido nucleico alvo” é todo ou uma parte de um elemento de controle de transcrição de um gene para o qual o resultado fenotípico desejado pode ser atingido pela alteração do grau de sua expressão. Um elemento de controle de transcrição inclui elementos de controle positivo e negativo tais como um promotor, um potencializador, outros elementos de resposta, por exemplo, elemento de resposta esteroide, elemento de resposta de choque térmico, elemento de resposta ao metal, um repressor de sítio de ligação, operador e/ou um silenciador. O elemento de controle de transcrição pode ser viral, eucariótico ou procariótico. Um “ácido nucleico alvo” também inclui todo ou uma porção de uma região codificante ou um gene codificando uma proteína. Um “ácido nucleico alvo’ também inclui um ácido nucleico à jusante que pode se ligar a uma proteína e cuja expressão é através dela modulada, tipicamente impedindo a transcrição.
[0069] Como utilizado aqui, um “gene alvo” se refere a um gene cuja expressão deve ser reduzida por uma proteína, tais como, por exemplo, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2 e/ou uma proteína semelhante à FRG.
[0070] Como utilizado aqui, os termos “polinucleotídeo”, “ácido nucleico”, “sequência de ácido nucleico”, “sequência de ácidos nucleicos” e variações dos mesmos devem ser genéricos a polidesoxiribonucleotídeos (contendo 2-deoxi-D-ribose), a poliribonucleotídeos (contendo D-ribose), a qualquer outro tipo de polinucleotídeo que é um N-glicosídeo de uma purina ou pirimidina base, e a outros polímeros contendo esqueletos não nucleotídicos, desde que os polímeros contenham nucleobases em uma configuração que permita o emparelhamento de bases e o empilhamento de bases, como encontrado no DNA e RNA. Portanto, estes termos incluem tipos conhecidos de modificações de sequência de ácido nucleico, por exemplo, substituição de um ou mais dos nucleotídeos de ocorrência natural com um análogo; modificações inter-nucleotídicas, tais como, por exemplo, aquelas com ligação sem carga (por exemplo, metilfosfonatos, fosfotriésteres, fosforamidatos, etc), com ligação de carga negativa (por exemplo, fosforotioatos, fosforoditioatos, etc) e ligações com carga positiva (por exemplo, aminoalquilfosforamidatos, aminoalquilfosfotriésteres); aqueles contendo frações pendentes, tais como, por exemplo, proteínas (incluindo nucleases, toxinas, anticorpos, peptídeos de sinal, poli-L- lisina, etc); aqueles com intercaladores (por exemplo, acridina, psoraleno, etc.); e aqueles contendo quelantes (por exemplo, metais, metais radioativos, boro, metais oxidativos, etc). Como utilizado aqui, os símbolos para nucleotídeos e polinucleotídeos são os recomendandos pela IUPAC-IUB Commission of Biochemical Nomenclature (Biochem. 9:4022, 1970).
[0071] Como utilizado aqui, um “polipeptídeo” é uma sequência de aminoácidos contendo uma pluralidade de resíduos aminoácidos polimerizados consecutivos (por exemplo, opcionalmente pelo menos cerca de 15 resíduos de aminoácidos polimerizados consecutivos, pelo menos cerca de 30 resíduos de aminoácidos polimerizados consecutivos ou pelo menos cerca de 50 resíduos de aminoácidos polimerizados consecutivos). Em muitas instâncias, um polipeptídeo contém uma sequência de resíduo aminoácido polimerizado que é uma enzima, uma metiltransferase, uma demetiltransferase, uma demetilase, uma desacetilase, uma proteína prevista de função desconhecida, um domínio ou uma porção ou fragmento das mesmas. O polipeptídeo opcionalmente contem resíduos de aminoácidos modificados, resíduos de aminoácidos de ocorrência natural não codificados por um códon e resíduos de aminoácidos de ocorrência não natural.
[0072] Como utilizado aqui, “proteína” se refere a uma sequência de aminoácidos, oligopeptídeo, peptídeo, polipeptídeo ou porções do mesmo de ocorrência natural ou sintética.
[0073] Genes e proteínas que podem ser utilizados na presente divulgação incluem genes codificando variantes modificadas conservativamente e proteínas que são variantes modificadas conservativamente destes genes e proteínas descritos ao longo do pedido. “Variantes modificadas conservativamente” como utilizado aqui inclui substituições individuais, deleções ou adições a uma sequência de polipeptídeos que resulta na substituição de um aminoácido com um aminoácido similar quimicamente. Tabelas de substituição conservativa fornecendo a funcionalidade de aminoácidos similares são bem conhecidas na técnica. Tais variantes de modificações conservativas são em adição e não excluem variantes polimórficas, homólogos inter-espécies e alelos da divulgação. Os oito grupos a seguir contêm aminoácidos que são substituições conservativas para um outro: 1) Alanina (A), Glicina (G); 2) Ácido aspártico (D), Ácido glutâmico (E); 3) Asparagina (N), Glutamina (Q); 4) Arginina (R), Lisina (K); 5) Isoleucina (I), Leucina (L), Metionina (M), Valina (V); 6) Fenilalanina (F), Tirosina (Y), Triptofano (W); 7) Serina (S), Treonina (T); e 8) Cisteína (C), Metionina (M) (ver, por exemplo, Creighton, Proteins (1984)).
[0074] Homólogos dos genes e proteínas descritos aqui podem também ser utilizados na presente divulgação. Como utilizado aqui, “homologia” se refere a uma similaridade de sequência entre uma sequência de referência e pelo menos um fragmento de uma segunda sequência. Homólogos podem ser identificados por qualquer método conhecido na técnica, preferencialmente, através do uso da ferramenta BLAST para comparar a sequência de referência com uma única segunda sequência, ou um fragmento de uma sequência, ou um banco de dados de sequências. Como descrito abaixo, BLAST irá comparar sequências com base no percentual de identidade e similaridade. Como utilizado aqui, “ortologia” se refere aos genes em diferentes espécies que derivam de um gene ancestral comum.
[0075] Os termos “idêntico” ou percentual “de identidade”, no contexto de dois ou mais ácidos nucleicos ou sequências de polipeptídeos, se referem a duas ou mais sequêncas ou subsequências que são as mesmas. Duas sequências são “substancialmente idênticas” se duas sequências têm um percentual de resíduos de aminoácidos especificados ou nucleotídeos que são os mesmos (isto é, 29% de identidade, optionalmente 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% ou 100% de identidade sobre a região especificada, ou, quando não especificado, sobre a sequência toda), quando comparados e alinhados para a correspondência máxima sobre uma janela de compração, ou uma região designada como mensurada utilizando um dos seguintes algoritmos de comparação de sequência ou por alinhamento manual e inspeção visual. Opcionalmente, a identidade existe sobre uma região que tem pelo menos cerca de 50 nucleotídeos (ou 10 aminoácidos) em comprimento, ou preferencialmente sobre uma região que tem 100 a 500 ou 1000 ou mais nucleotídeos (ou 20, 50, 200 ou mais aminoácidos) em comprimento.
[0076] Para a comparação de sequência, tipicamente uma sequência age como uma sequência de referência, à qual as sequências de teste são comparadas. Quando utilizando um algoritmo de comparação de sequência, as sequências de teste e de referência são inseridas em um computador, coordenadas de subsequência são designadas, se necessário, e os parâmetros do programa de algoritmo de sequências são designados. Parâmetros do programa padrão podem ser utilizados ou alternativamente os parâmetros podem ser designados. O algoritmo de comparação de sequência então calcula o percentual de identidades das sequências para as sequências teste em relacao à sequência de referência, baseado nos parâmetros do programa. Quando comparando duas sequências para identificação, não é necessário que as sequência sejam contíguas, mas qualquer espaço levaria consigo uma penalidade que iria reduzir o percentual de identidade geral. Para blastn, os parâmetros padrão são Penalidade de abertura de lacuna =5 e Penalidade de extensão de lacuna =2. Para blastp, os parâmetros padrão são Penalidade de abertura de lacuna =11 e Penalidade de extensão de lacuna =1.
[0077] Uma “janela de comparação,” como utilizado aqui, inclui referência a um segmento de qualquer um dos números de posições contíguas incluindo, entre outras, de 20 a 600, geralmente cerca de 50 a cerca de 200, mais geralmente cerca de 100 a cerca de 150 em cada sequência pode ser comparada a uma sequência de referência do mesmo número de posições contíguas após as duas sequências estarem alinhadas adequadamente. Métodos de alinhamento de sequências para comparação são bem conhecidos na técnica. O alinhamento ideal das sequências para comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith e Waterman (1981), pelo algoritmo de alinhamento de homologia de Needleman e Wunsch (1970) J Mol Biol 48(3):443-453, pelo método de pesquisa por similaridade de Pearson e Lipman (1988) Proc Natl Acad Sci USA 85(8):2444-2448, por implementações computadorizadas destes algoritmos (GAP, BESTFIT, FASTA e TFASTA em the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), ou por alinhamento manual e inspeção visual [ver, por exemplo, Brent et al., (2003) Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (Ringbou Ed)].
[0078] Dois exemplos de algoritmos que são adequados para determinar o percentual de sequência de identidade e similaridade de sequências são os algoritmos BLAST e BLAST 2.0, que são descritos em Altschul et al. (1997) Nucleic Acids Res 25(17):3389-3402 e Altschul et al. (1990) J. Mol Biol 215(3)-403-410, respectivamente. O software para a realização de análise BLAST é disponibilizado publicamente através do National Center for Biotechnology Information. Este algoritmo envolve primeiro a identificação de pares de sequência de alta pontuação (HSPs) pela identificação de palavras curtas de comprimento W na sequência pesquisada, que pode tanto corresponder ou satisfazer alguma pontuação limite de valor positivo T quando alinhada com uma palavra do mesmo comprimento em uma sequência de banco de dados. T é referido como o limite de pontuação da palavra vizinha (Altschul et al., supracitado). Estes hits iniciais de palavra vizinha agem como sementes para iniciar as buscas para encontrar HSPs mais longos contendo as mesmas. O hit de palavras é extendido em ambas as direções ao longo de cada sequência, tão longe quanto a pontuação de alinhamento cumulativo puder ser aumentada. Pontuações cumulativas são calculadas utilizando, para sequências de nucleotídeos, os parâmetros M (pontuação recompensada para um par de resíduos correspondentes; sempre > 0) e N (pontuação penalizada para resíduos não correspondentes; sempre < 0). Para sequências de aminoácidos, uma matriz de pontuação é utilizada para calcular a pontuação cumulativa. A extensão de hits de palavra em cada direção são interrompidas quando: a pontuação de alinhamento cumulativo cai na quantidade X a partir de seu valor máximo alcançado; a pontuação cumulativa vai a zero ou abaixo, devido a acumulação de um ou mais alinhamentos de resíduo de pontuação negativa; ou o final de qualquer sequência é alcançado. Os parâmetros do algoritmo BLAST W, T e X determinam a sensitibilidade e a velocidade de alinhamento. O programa BLASTN (para sequências de nucleotídeos) utiliza como um padrão um comprimento de palavra (W) de 11, uma expectativa (E) de 10, M=5, N=-4, e a comparação de ambas as fitas. Para sequências de aminoácidos, o progrma BLASTP utilza como padrão um comprimento de palavra de 3, expectativa (E) de 10 e a matriz de pontuação BLOSUM62 (ver Henikoff and Henikoff, (1992) Proc Natl Acad Sci USA 89(22):10915-10919) alinhamentos (B) de 50, expectativa (E) de 10, M=5, N=-4, e a comparação de ambas as fitas.
[0079] O algoritmo BLAST também realiza análise estatística da similaridade entre duas sequências (ver, por exemplo, Karlin and Altschul, (1993) Proc Natl Acad Sci USA 90(12):5873-5877). Uma mensuração de similaridade fornecida pelo algoritmo BLAST é a menor probabilidade de soma (P(N)), que fornecer uma indicação da probabilidade pela qual a correspondência entre dois nucleotídeos ou sequências de aminoácidos ocorreria por acaso. Por exemplo, um ácido nucleico é considerado similar a uma sequência de referência se a menor probabilidade de soma em uma comparação do ácido nucleico em teste com o ácido nucleico de referência é menor que cerca de 0,2, mais preferencialmente menor que cerca de 0,01 e mais preferencialmente menor que cerca de 0,001.
[0080] Além do percentual de sequência de identidade indicado acima, outra indicação que duas sequências de ácido nucleico ou de polipeptídos são substancialmente idênticas é que o polipeptídeo codificado pelo primeiro ácido nucleico é imunologicamente de reação cruzada com os anticorpos criados contra o polipeptídeo codificado pelo segunda ácido nucleico. Portanto, um polipeptídeo é tipicamente idêntico substancialmente a um segundo polipeptídeo, por exemplo, onde os dois peptídeos diferem apenas por substituições conservativas. Outra indicação que as duas sequências de ácido nucleico são idênticas substancialmente é que as duas moléculas ou seus complementos hibridizam uma com a outra sob condições rigorosas. Ainda outra indicação que duas sequências de ácido nucleico são idênticas substancialmente é que os mesmos iniciadores podem ser utilizados para ampliar a sequência.
Proteínas Recombinantes da Presente Divulgação
[0081] Proteínas recombinantes são fornecidas aqui para utilização na redução da expressão de um ácido nucleico alvo em uma planta. Em algumas modalidades, uma proteína recombinante da presente divulgação interage com uma RNA polimerase. Esta interação pode ser direta ou pode ser indireta. Se a interação de uma proteína recombinante da presente divulgação com uma RNA polimerase é direta ou indireta, a interação facilita o recrutamento da RNA polimerase a um ácido nucleico. Em algumas modalidades, uma ou mais proteínas adicionais podem ser ainda envolvidas na facilitação da interação de uma proteína recombinante da presente divulgação com uma RNA polimerase e o recrutamento da RNA polimerase a um ácido nucleico. Em algumas modalidades, uma proteína semelhante à SHH1 interage, diretamente ou indiretamente, com a RNA Pol IV e esta interação facilita o recrutamento da RNA Pol IV a um ácido nucleico. Em algumas modalidades, uma proteína semelhante à SUVH2 e/ou uma proteína semelhante à SUVH9 interage, diretamente ou indiretamente, com a RNA Pol V e esta interação facilita o recrutamento da RNA Pol V a um ácido nucleico. Em algumas modalidades, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6 e/ou proteínas semelhante à SUVR2 interagem, diretamente ou indiretamente, com a RNA Pol V e esta interação facilita o recrutamento da RNA Pol V a um ácido nucleico. Em algumas modalidades, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhante à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2 e/ou proteínas semelhantes à FRG, interagem, diretamente ou indiretamente, com a RNA Pol V e esta interação facilita o recrutamento da RNA Pol V a um ácido nucleico. Em algumas modalidadesm as proteínas recombinantes da presente divulgação facilitam a metilação de DNA dirigida por RNA de um ácido nucleico.
[0082] Em algumas modalidades, proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhante à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG são direcionadas ao mesmo ácido nucleico e agem cooperativamente para silenciar a expressão do ácido nucleico alvo. Proteínas recombinantes da presente divulgação, por exemplo proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhante à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2 e/ou proteínas semelhantes à FRG podem ser expressas recombinantemente em uma célula tanto sozinhas quanto em combinações.
Proteínas SHH1
[0083] Certos aspectos da presente divulgação estão relacionados às proteínas semelhantes à SHH1. Em algumas modalidades, uma proteína semelhante à SHH1 se refere a uma proteína recombinante SHH1 ou um fragmento da mesma e contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à SHH1 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0084] Proteínas SHH1 da presente divulgação são proteínas SAWADEE HOMEODOMAIN HOMOLOG 1 (SHH1). O comprimento completo das proteínas SHH1 contém um domínio SAWADEE de ligação a cromatina. O domínio de ligação à cromatina SAWADEE adota uma única dobra tipo Tudor em tandem e funciona como um leitor de lisina duplo, sondando para ambas modificações K4 não metilado e K9 metilado na cauda de histona 3 (H3). Proteínas SHH1 também contêm um homoeodomínio. Em algumas modalidades, proteínas semelhantes à SHH1 da presente divulgação são proteínas de ligação à cromatina.
[0085] Em algumas modalidades, uma proteína semelhante à SHH1 da presente divulgação incluem um fragmento funcional de uma proteína SHH1 de comprimento completo em que o fragmento mantém a capacidade de recrutar a RNA Pol IV ao DNA. Em algumas modalidades, um fragmento da proteína SHH1 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos ou 241 ou mais aminoácidos consecutivos de uma proteína SHH1 de comprimento completo. Em algumas modalidades, fragmentos de proteína SHH1 podem incluir sequências com um ou mais aminoácidos removidos de uma sequência de aminoácidos consecutivos de uma proteína SHH1 de comprimento completo. Em algumas modalidades, fragmentos de proteína SHH1 podem incluir sequências com um ou mais aminoácidos reposto/substituídos com um aminoácido diferente do aminoácido endógeno presente em uma dada posição do aminoácidos em uma sequência de aminoácidos consecutivos de uma proteína SHH1 de comprimento completo. Em algumas modalidades, fragmentos de uma proteína SHH1 podem incluir sequências com um ou mais aminoácidos adicionados a uma sequência de aminoácidos consecutivos de outro modo de uma proteína de comprimento completo.
[0086] Proteínas SHH1 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Medicago truncatula, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas SHH1 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 1, homólogos das mesmas e ortólogos das mesmas. Tabela 1: Proteínas SHH1
Figure img0001
[0087] Em algumas modalidades, uma proteína SHH1 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácidos que é pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína SHH1 da A. thaliana (isto é, SEQ ID NO: 1).
[0088] Em algumas modalidades, o homólogo de uma proteína SHH1, ou o homólogo do fragmento de uma proteína SHH1, é a sequência de aminoácidos da proteína SHH2 da Arabidopsis thaliana (SEQ ID NO: 40).
[0089] Uma proteína semelhante à SHH1 pode incluir uma sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo SHH1, tais como qualquer um dos listados na Tabela 1. Um especialista prontamente reconheceria que homólogos e/ou ortólogos SHH1 adicionais podem existir e serem utilizados aqui. Proteínas SUVH2 e Proteínas SUVH9
[0090] Certos aspectos da presente divulgação referme-se às proteínas semelhantes à SUVH2 e proteínas semelhantes à SUVH9. Em algumas modalidades, uma proteína semelhante à SUVH2 se refere a uma proteína SUVH2 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Em algumas modalidades, uma proteína semelhante à SUVH9 se refere a uma proteína SUVH9 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à SUVH2 e/ou proteínas semelhantes à SUVH9 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0091] Proteínas SUVH2 e SUVH9 da presemte divulgação são Homólogos SU-VAR(3-9). As proteínas SUVH2 e SUVH9 de comprimento completo contêm um domínio de feixe dupla-hélice em direção à N-terminal, um domínio SRA e domínios pré-SET e SET em direção à C-terminal. As características estruturais e sequênciais dos domínios SUVH são conhecidas na técnica são fornecidas aqui. Em algumas modalidades, proteínas semelhantes à SUVH2 e/ou proteínas semelhantes à SUVH9 da presente divulgação podem conter um ou mais dos domínios SUVH canônicos incluindo um domínio de feixe dupla-hélice, um domínio SRA, um domínio pré-SET e/ou um domínio SET.
[0092] Em algumas modalidades, uma proteína semelhante à SUVH2 da presente divulgação inclui um fragmento funcional de uma proteína SUVH2 de comprimento completo em que o fragmento mantém a capacidade de recrutar a RNA Pol V ao DNA. Em algumas modalidades, um fragmento de proteína SUVH2 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos, pelo menos 260 aminoácidos consecutivos, pelo menos 280 aminoácidos consecutivos, pelo menos 300 aminoácidos consecutivos, pelo menos 325 aminoácidos consecutivos, pelo menos 350 aminoácidos consecutivos, pelo menos 375 aminoácidos consecutivos, pelo menos 400 aminoácidos consecutivos, pelo menos 425 aminoácidos consecutivos, pelo menos 450 aminoácidos consecutivos, pelo menos 475 aminoácidos consecutivos, pelo menos 500 aminoácidos consecutivos, pelo menos 525 aminoácidos consecutivos, pelo menos 550 aminoácidos consecutivos, pelo menos 575 aminoácidos consecutivos, pelo menos 600 aminoácidos consecutivos, pelo menos 625 aminoácidos consecutivos ou 626 ou mais aminoácidos consecutivos de uma proteína SUVH2 de comprimento completo. Em algumas modalidades, fragmentos de proteínas SUVH2 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminácidos consecutivos de uma proteína SUVH2 de comprimento completo. Em algumas modalidades, fragmentos de proteína SUVH2 podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno presente em uma dada posição do aminoácidos em uma sequência de aminoácidos consecutivos de uma proteína SUVH2 de comprimento completo. Em algumas modalidades, os fragmentos de proteína SUVH2 podem incluir sequência com um ou mais aminoácidos adicionados a uma sequência de aminoácidos consecutivos de outro modo de uma proteína SUVH2 de comprimento completo.
[0093] Proteínas SUVH2 adequadas podem ser identificadas e isolodas de plantas monocotiledôneas e dicotiledôneas. Exmplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Medicago truncatula, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas SUVH2 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 2, homólogos das mesmas e ortólogos das mesmas. Tabela 2: Proteínas SUVH2
Figure img0002
Figure img0003
[0094] Em algumas modalidades, uma proteína SUVH2 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácidos que é pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína SUVH2 da A. thaliana (isto é, SEQ ID NO: 14).
[0095] Uma proteína semelhante à SUVH2 pode incluir uma sequência de aminoácidos ou um fragmento da mesma de qualquer um homólogo ou ortólogo SUVH2, tais como qualquer um dos listados na Tabela 2. Um especialista reconheceria prontamente que homólogos SUVH2 adicionais e/ou ortólogos podem existir e podem ser utilizados aqui.
[0096] Em algumas modalidades, uma proteína semelhante à SUVH9 da presente divulgação inclui um fragmento funcional de uma proteína SUVH9 de comprimento completo em que o fragmento mantém a capacidade de recrutar o RNA Pol V ao DNA. Em algumas modalidades, um fragmento de proteína SUVH9 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos, pelo menos 260 aminácidos consecutivos, pelo menos 280 aminoácidos consecutivos, pelo menos 300 aminoácidos consecutivos, pelo menos 325 aminoácidos consecutivos, pelo menos 350 aminoácidos consecutivos, pelo menos 375 aminoácidos consecutivos, pelo menos 400 aminoácidos consecutivos, pelo menos 425 aminoácidos consecutivos, pelo menos 450 aminoácidos consecutivos, pelo menos 475 aminoácidos consecutivos, pelo menos 500 aminoácidos consecutivos, pelo menos 525 aminoácidos consecutivos, pelo menos 550 aminoácidos consecutivos, pelo menos 575 aminoácidos consecutivos, pelo menos 600 aminoácidos consecutivos, pelo menos 625 aminoácidos consecutivos ou 626 ou mais aminoácidos consecutivos de uma proteína SUVH9 de comprimento completo. Em algumas modalidades, fragmentos de proteínas SUVH9 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína SUVH9 de comprimento completo. Em algumas modalidades, os fragmentos de proteína SUVH9 podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno presente em uma dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína SUVH9 de comprimento completo. Em algumas modalidades, fragmentos de proteína SUVH9 podem incluir sequências com um ou mais aminoácidos adicionados à uma sequência de aminoácidos consecutivos de outro modo de uma proteína SUVH9 de comprimento completo.
[0097] Proteínas SUVH9 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Medicago truncatula, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas SUVH9 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 3, homólogos das mesmas e ortólogos das mesmas. Tabela 3: Proteínas SUVH9
Figure img0004
[0098] Em algumas modalidades, uma proteína SUVH9 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácidos que é pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína SUVH9 da A. thaliana (isto é, SEQ ID NO: 27).
[0099] Uma proteína semelhante à SUVH9 pode incluir uma sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo SUVH9, tais como qualquer um dos listados na Tabela 3. Um especialista reconheceria prontamente que homólogos SUVH9 adicionais e/ou ortólogos pode existir e pode ser utilizado aqui.
Proteínas DMS3
[0100] Certos aspestos da presente divulgação se referem às proteínas semelhantes à DMS3. Em algumas modalidades, uma proteína semelhante à DMS3 se refere a uma proteína DMS3 recombinante ou um fragmento da mesma e e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à DMS3 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0101] Proteínas DMS3 são conhecidas na técnica e são descritas aqui. Em algumas modalidades, uma proteína semelhante à DMS3 da presente divulgação inclui um fragmento funcional de uma proteína DMS3 de comprimento completo em que o fragmento mantém uma ou mais funções da proteína de comprimento total. Em algumas modalidades, um fragmento de proteína DMS3 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos ou 241 ou mais aminoácidos consecutivos de uma proteína DMS3 de comprimento completo. Em algumas modalidades, fragmento de proteínas DMS3 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína DMS3 de comprimento completo. Em algumas modalidades, fragmento de proteínas DMS3 pode incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno presente em uma dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína DMS3 de comprimento total. Em algumas modalidades, os fragmentos de proteína DMS3 podem incluir sequências com um ou mais aminoácidos adicionados na sequência de aminoácidos consecutivos de outro modo de uma proteína DMS3 de comprimento completo.
[0102] Proteínas DMS3 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Medicago truncatula, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas DMS3 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 4, homólogos das mesmas e ortólogos das mesmas. Tabela 4: Proteínas DMS3
Figure img0005
[0103] Em algumas modalidades, uma proteína DMS3 ou fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína DMS3 da A. thaliana (isto é, SEQ ID NO: 41).
[0104] Em algumas modalidades, o homólogo de uma proteína DMS3, ou o homólogo de um fragmento de uma proteína DMS3, pode também ser utilizado em métodos da presente divulgação.
[0105] Uma proteína semelhante à DMS3 pode incluir a sequência de aminoácidos ou um fragmento da mesma em qualquer homólogo ou ortólogo DMS3, tais como, por exemplo, qualquer um dos listados na Tabela 4. Um especialista reconheceria prontamente que homólogos e/ou ortólogos DMS3 adicionais podem existir e podem ser utilizados aqui. Proteínas MORC6
[0106] Certos aspectos da presente divulgação se referem às proteínas semelhantes à MORC6. Em algumas modalidades, a proteína semelhante à MORC6 se refere a uma proteína MORC6 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à MORC6 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0107] Proteínas MORC6 são conhecidas na técnica e são descritas aqui. Em algumas modalidades, uma proteína semelhante à MORC6 da presente divulgação inclui um fragmento funcional de uma proteína MORC6 de comprimento completo em que o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, o fragmento da proteína MORC6 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos ou 241 ou mais aminoácidos consecutivos de uma proteína MORC6 de comprimento completo. Em algumas modalidades, fragmentos da proteína MORC6 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína MORC6 de comprimento completo. Em algumas modalidades, fragmentos de proteína MORC6 podem incluir sequência com um ou mais aminoácidos repostos/substituídos com um ou mais aminoácidos diferentes do aminoácido endógeno presente em uma dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína MORC6 de comprimento completo. Em algumas modalidades, fragmentos de proteína MORC6 podem incluir sequência com um ou mais aminoácidos adicionados a uma sequência de aminoácidos consecutivos de outro modo de uma proteína MORC6 de comprimento completo.
[0108] Proteínas MORC6 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exmplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Medicago truncatula, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas MORC6 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 5, homólogos das mesmas e ortólogos das mesmas. Tabela 5: Proteínas MORC6
Figure img0006
[0109] Em algumas modalidades, uma proteína MORC6 ou fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína MORC6 de A. thaliana (isto é, SEQ ID NO: 53).
[0110] Em algumas modalidades, o homólogo de uma proteína MORC6, ou o homólogo de um fragmento de proteína MORC6, pode também ser utilizado nos métodos da presente divulgação.
[0111] Uma proteína semelhante à MORC6 pode incluir a sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo MORC6, tais como, por exemplo, qualquer um dos listados na Tabela na Tabela 5. Um especialista reconheceria prontamente que homólogos e/ou ortólogos de MORC6 adicionais podem existir e podem ser utilizados aqui. Proteínas SUVR2
[0112] Certos aspectos da presente divulgação se referem às proteínas semelhante à SUVR2. Em algumas modalidades, uma proteína semelhante à SUVR2 se refere à uma proteínas SUVR2 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhante à SUVR2 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, como genes, em plantas.
[0113] Proteínas SUVR2 são conhecidas na técnica e são descritas aqui. Em algumas modalidades, proteínas semelhante à SUVR2 da presente divulgação incluem um fragmento funcional de uma proteína SUVR2 de comprimento tootal em que o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, um fragmento de proteína SUVR2 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivs, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos ou 241 ou mais aminoácidos consecutivos de uma proteína SUVR2 de comprimento completo. Em algumas modalidades, os fragmentos de proteína SUVR2 podem incluir sequência com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína SUVR2 de comprimento completo. Em algumas modalidades, os fragmentos de proteína SUVR2 podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno em uma dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína SUVR2 de comprimento completo. Em algumas modalidades, fragmentos de proteína SUVR2 podem incluir sequências com um ou mais amininoácidos adicionados a uma sequência de aminoácidos consecutivos de outro modo de uma proteína SUVR2 de comprimento completo.
[0114] Proteínas SUVR2 adequadas podem ser identificadas e isodalas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Medicago truncatula, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas SUVR2 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 6, homólogos das mesmas e ortólogos das mesmas. Tabela 6: Proteínas SUVR2
Figure img0007
Figure img0008
[0115] Em algumas modalidades, uma proteína SUVR2 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína SUVR2 de A. thaliana (isto é., SEQ ID NO: 66).
[0116] Em algumas modalidades, o homólogo de uma proteína SUVR2, ou o homólogo de um fragmento de uma proteína SUVR2, podem também ser utilizados nos métodos da presente divulgação.
[0117] Uma proteína semelhante à SUVR2 pode incluir a sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo SUVR2, tais como, por exemplo, qualquer um dos listados na Tabela 6. Um especialista reconheceria prontamente que homólogos e/ou ortólogos SUVR2 adicionais podem existir e podem ser utilizados aqui. Proteínas DRD1
[0118] Certos aspectos da presente divulgação se referem às proteínas semelhantes à DRD1. Em algumas modalidades, uma proteína semelhante à DRD1 se refere uma uma proteína DRD1 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à DRD1 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0119] Proteínas DRD1 são conhecidas na técnica e são descritas aqui. Em algumas modalidades, proteínas semelhantes à DRD1 da presente divulgação incluem um fragmento funcional de uma proteína DRD1 de comprimento completo em que o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, um fragmento de proteína DRD1 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos ou 241 ou mais aminoácidos consecutivos de uma proteína DRD1 de comprimento completo. Em algumas modalidades, fragmentos de proteínas DRD1 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína DRD1 de comprimento completo. Em algumas modalidades, fragmentos de proteínas DRD1 podem incluir sequência com um ou mais aminoácidos repostos/substituídos com um aminoácidos diferente do aminoácido endógeno em uma dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína DRD1 de comprimento completo. Em algumas modalidades, fragmentos de proteínas DRD1 podem incluir sequências com um ou mais aminoácidos adicionados a uma sequência de aminoácidos consecutivos de outro modo de uma proteína.
[0120] Proteínas DRD1 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas incluem, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas DRD1 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 7, homólogos das mesmas e ortólogos das mesmas. Tabela 7: Proteínas DRD1
Figure img0009
[0121] Em algumas modalidades, uma proteína DRD1 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína DRD1 de A. thaliana (isto é, SEQ ID NO: 79).
[0122] Em algumas modalidades, o homólogo de uma proteína DRD1, ou o homólogo de um fragmento de proteína DRD1, pode também ser utilizado em métodos da presente divulgação.
[0123] Uma proteína semelhante à DRD1 pode incluir a sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo DRD1, tais como, por exemplo, qualquer um dos listados na Tabela 7. Um especialista reconheceria prontamente que homólogos e/ou ortólogos DRD1 adicionais podem existir e podem ser utilizados aqui. Proteínas RDM1
[0124] Certos aspectos da presente divulgação se referem às proteínas semelhantes à RDM1. Em algumas modalidades, uma proteína semelhante à RDM1 se refere à uma proteína RDM1 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à RDM1 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0125] Proteínas RDM1 são conhecidas na técnica e são descritas aqui. Em algumas modalidades, uma proteína semelhante à RDM1 da presente divulgação inclui um fragmento funcional de uma proteína RDM1 de comprimento completo em que o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, um fragmento de proteína RDM1 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivo ou 241 ou mais aminoácidos consecutivos de uma proteína RDM1 de comprimento completo. Em algumas modalidades, fragmentos de proteína RDM1 podem incluir sequência com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína RDM1 de comprimento completo. Em algumas modalidades, fragmentos de proteína RDM1 podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente de aminoácidos endógenos presentes em uma dada posição de aminoácidos em uma sequência de aminoácidos consecutivos de uma proteína RDM1 de comprimento completo. Em algumas modalidades, fragmentos de proteínas RDM1 podem incluir sequências com um ou mais aminoácidos adicionados a uma sequência de aminoácidos de outro modo de uma proteína RDM1 de comprimento completo.
[0126] Proteínas RDM1 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays e Oryza sativa. Exemplos de proteínas RDM1 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 8, homólogos das mesmas e ortólogos das mesmas. Tabela 8: Proteínas RDM1
Figure img0010
[0127] Em algumas modalidades, uma proteína RDM1 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou pelo menos cerca de 100% de aminoácidos idêntica à sequência de aminoácidos da proteína RDM1 de A. thaliana (isto é, SEQ ID NO: 91).
[0128] Em algumas modalidades, o homólogo de uma proteína RDM1, ou o homólogo do fragmento de uma proteína RDM1, pode também ser utilizado nos métodos da presente divulgação.
[0129] Uma proteína semelhante à RDM1 pode incluir a sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo RDM1, tais como, por exemplo, qualquer um dos listados na Tabela 8. Um especialista reconheceria prontamente que homólogos e/ou ortólogos RDM1 adicionais podem existir e podem ser utilizados aqui. Proteínas DRM3
[0130] Certos aspectos da presente divulgação se referem à proteína semelhante à DRM3. Em algumas modalidades, uma proteína semelhante à DRM3 se refere à uma proteína DRM3 recombinante ou um fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à DRM3 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0131] Proteínas DRM3 são conhecidas na técnica e são descritas aqui. Em algumas modalidades, proteínas semelhantes à DRM3 da presente divulgação incluem um fragmento funcional de uma proteína DRM3 de comprimento total em que o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, um fragmento de proteína DRM3 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 aminoácidos consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos ou 241 ou mais aminoácidos consecutivos de uma proteína DRM3 de comprimento completo. Em algumas modalidades, fragmentos de proteína DRM3 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína DRM3 de comrpimento total. Em algumas modalidades, fragmentos de proteínas DRM3 podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno presente em uma dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína DRM3 de comprimento completo. Em algumas modalidades, fragmentos de proteína DRM3 podem incluir sequências com um ou mais aminoácidos adicionados a uma sequência de aminoácidos consecutivos de outro modo de uma proteína DRM3 de comprimento completo.
[0132] Proteínas DRM3 adequadas podem ser identificadas e isoladas de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Physcomitrella patens, Sorghum bicolor e Oryza sativa. Exemplos de proteínas DRM3 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 9, homólogos das mesmas e ortólogos das mesmas. Tabela 9: Proteínas DRM3
Figure img0011
[0133] Em algumas modalidades, uma proteína DRM3 ou um fragmento da mesma da presente divulgação tem uma sequência de aminoácido com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou pelo menos cerca de 100% de identidade de aminoácidos com a sequência de aminoácidos da proteína DRM3 de A. thaliana (isto é, SEQ ID NO: 101).
[0134] Em algumas modalidades, o homólogo de uma proteína DRM3, ou o homólogo de um fragmento de uma proteína DRM3, também podem ser utilizados nos métodos da presente divulgação.
[0135] Uma proteína semelhante à DRM3 pode incluir a sequência de aminoácidos ou um fragmento da mesma de qualquer homólogo ou ortólogo de DRM3, tais como, por exemplo, qualquer um daqueles listados na Tabela 9. Um especialista reconheceria prontamente que os homólogos e/ou ortólogos adicionais de DRM3 podem existir e podem ser aqui utilizados.
Proteínas DRM2
[0136] Certos aspectos da presente divulgação se referem às proteínas semelhantes à DRM2. Em algumas modalidades, uma proteína semelhante à DRM2 se refere à uma proteína DRM2 recombinante ou fragmento da mesma e que contém um domínio de ligação ao DNA heterólogo. Proteínas semelhantes à DRM2 podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0137] Proteínas DRM2 são conhecidas na técnica e são aqui descritas. Em algumas modalidades, uma proteína do tipo DRM2 da presente invenção inclui um fragmento funcional de uma proteína DRM2 de comprimento completo em que o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, um fragmento de proteína DRM2 contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 ácidos aminados consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos, ou 241 ou mais aminoácidos consecutivos de uma proteína DRM2 de comprimento completo. Em algumas modalidades, os fragmentos da proteína DRM2 podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína DRM2 de comprimento completo. Em algumas modalidades, os fragmentos da proteína DRM2 podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno presente numa dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína DRM2 de comprimento completo. Em algumas modalidades, os fragmentos da proteína DRM2 podem incluir sequências com um ou mais aminoácidos adicionados à sequência de aminoácidos consecutivos de outro modo de uma proteína DRM2 de comprimento completo.
[0138] Proteínas DRM2 adequadas podem ser identificadas e isoladas a partir de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Physcomitrella patens, Sorghum bicolor, e Oryza sativa. Exemplos de proteínas DRM2 adequadas podem incluir, por exemplo, aquelas listadas na Tabela 10, homólogos das mesmas e ortólogos das mesmas. Tabela 10: Proteínas DRM2
Figure img0012
[0139] Em algumas modalidades, uma proteína DRM2 ou o fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou pelo menos cerca de 100% de identidade de aminoácido com a sequência de aminoácidos da proteína DRM2 de A. thaliana (isto é, SEQ ID NO: 113).
[0140] Em algumas modalidades, o homólogo de uma proteína DRM2, ou o homólogo de um fragmento da proteína DRM2, também pode ser utilizado nos métodos da presente divulgação.
[0141] Uma proteína semelhante à DRM2 pode incluir a sequência de aminoácidos ou fragmento da mesma de qualquer homólogo ou ortólogo de DRM2, tais como, por exemplo, qualquer um daqueles listados na Tabela 10. Um especialista reconheceria prontamente que os homólogos e/ou ortólogos adicionais de DRM2 podem existir e podem ser aqui utilizados. Proteínas FRG
[0142] Certos aspectos da presente divulgação se referem às proteínas semelhantes à FRG. Em algumas modalidades, uma proteína semelhante à FRG se refere à uma proteína FRG recombinante ou fragmento da mesma e que contém um domínio heterólogo de ligação ao DNA. Proteínas semelhantes à FRG podem ser utilizadas na redução da expressão de um ou mais ácidos nucleicos alvos, tais como genes, em plantas.
[0143] Proteínas FRG são conhecidas na técnica e são aqui descritas. Em algumas modalidades, uma proteína semelhante à FRG da presente invenção inclui um fragmento funcional de uma proteína FRG de comprimento completo onde o fragmento mantém uma ou mais funções da proteína de comprimento completo. Em algumas modalidades, um fragmento de proteína FRG contém pelo menos 20 aminoácidos consecutivos, pelo menos 30 aminoácidos consecutivos, pelo menos 40 aminoácidos consecutivos, pelo menos 50 aminoácidos consecutivos, pelo menos 60 aminoácidos consecutivos, pelo menos 70 aminoácidos consecutivos, pelo menos 80 aminoácidos consecutivos, pelo menos 90 aminoácidos consecutivos, pelo menos 100 aminoácidos consecutivos, pelo menos 120 aminoácidos consecutivos, pelo menos 140 aminoácidos consecutivos, pelo menos 160 aminoácidos consecutivos, pelo menos 180 aminoácidos consecutivos, pelo menos 200 ácidos aminados consecutivos, pelo menos 220 aminoácidos consecutivos, pelo menos 240 aminoácidos consecutivos, ou 241 ou mais aminoácidos consecutivos de uma proteína FRG de comprimento completo. Em algumas modalidades, os fragmentos da proteína FRG podem incluir sequências com um ou mais aminoácidos removidos da sequência de aminoácidos consecutivos de uma proteína FRG de comprimento completo. Em algumas modalidades, os fragmentos da proteína FRG podem incluir sequências com um ou mais aminoácidos repostos/substituídos com um aminoácido diferente do aminoácido endógeno presente numa dada posição de aminoácido em uma sequência de aminoácidos consecutivos de uma proteína FRG de comprimento completo. Em algumas modalidades, os fragmentos da proteína FRG podem incluir sequências com um ou mais aminoácidos adicionados à sequência de aminoácidos consecutivos de outro modo de uma proteína FRG de comprimento completo.
[0144] Proteínas FRG adequadas podem ser identificadas e isoladas a partir de plantas monocotiledôneas e dicotiledôneas. Exemplos de tais plantas podem incluir, por exemplo, Arabidopsis spp., Ricinus communis, Glycine max, Zea Mays, Physcomitrella patens, Sorghum bicolor, e Oryza sativa. Exemplos de proteínas FRG adequadas podem incluir, por exemplo, aquelas listadas na Tabela 11, homólogos das mesmas e ortólogos das mesmas. Tabela 11: Proteínas FRG
Figure img0013
[0145] Em algumas modalidades, uma proteína FRG ou fragmento da mesma da presente divulgação tem uma sequência de aminoácidos com pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 40%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou pelo menos cerca de 100% de identidade de aminoácido com a sequência de aminoácidos da proteína FRG de A. thaliana (isto é, SEQ ID NO: 125).
[0146] Em algumas modalidades, o homólogo da proteína FRG, ou o homólogo de um fragmento de uma proteína FRG, também podem ser utilizados nos métodos da presente divulgação.
[0147] Uma proteína semelhante à FRG pode incluir a sequência de aminoácidos ou fragmento da mesma de qualquer homólogo ou ortólogo de FRG, tais como, por exemplo, qualquer um daqueles listados na Tabela 11. Um especialista reconheceria prontamente que os homólogos e/ou ortólogos adicionais de FRG podem existir e podem ser aqui utilizados.
Domínios de ligação ao DNA
[0148] Proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG da presente invenção têm atividade de ligação ao DNA. Esta atividade de ligação ao DNA é conseguida através de um domínio heterólogo de ligação ao DNA. Em algumas modalidades, as proteínas recombinantes da presente invenção contêm um domínio de ligação ao DNA. As proteínas recombinantes da presente invenção podem conter um domínio de ligação ao DNA ou elas podem conter mais do que um domínio de ligação ao DNA.
[0149] Em algumas modalidades, o domínio de ligação ao DNA é um domínio de dedo de zinco. Tal como aqui divulgado, um “domínio de dedo de zinco” se refere à um domínio de ligação ao DNA da proteína que contém dedos de zinco, que são motivos estruturais pequenos de proteínas que podem coordenar um ou mais íons zinco para ajudar a estabilizar o seu dobramento de proteínas. Os dedos de zinco podem ser geralmente classificados em várias famílias estruturais diferentes e tipicamente funcionar como módulos de interação que se ligam ao DNA, RNA, proteínas ou moléculas pequenas. Domínios adequados de dedo de zinco da presente invenção podem conter dois, três, quatro, cinco, seis, sete, oito, ou nove dedos de zinco. Exemplos de domínios adequados de dedo de zinco podem incluir, por exemplo, domínios de dedo de zinco Cys2His2 (C2H2), domínios de dedo de zinco C-x8-C-x5- C-x3-H (CCCH), domínios de dedo de zinco multi-cisteína e domínios do cluster binuclear de zinco.
[0150] Em algumas modalidades, o domínio de ligação ao DNA liga-se a uma sequência específica de ácido nucleico. Por exemplo, o domínio de ligação ao DNA pode se ligar a uma sequência que é de pelo menos 5 nucleotídeos, pelo menos 6 nucleotídeos, pelo menos 7 nucleotídeos, pelo menos 8 nucleotídeos, pelo menos 9 nucleotídeos, pelo menos 10 nucleotídeos, pelo menos 11 nucleotídeos, pelo menos 12 nucleotídeos, pelo menos 13 nucleotídeos, pelo menos 14 nucleotídeos, pelo menos 15 nucleotídeos, pelo menos 20 nucleotídeos, pelo menos 25 nucleotídeos, pelo menos 30 nucleotídeos, pelo menos 35 nucleotídeos, pelo menos 40 nucleotídeos, pelo menos 45 nucleotídeos, pelo menos 50 nucleotídeos, ou um elevado número de nucleotídeos no comprimento. Em algumas modalidades, o domínio de ligação ao DNA liga-se a uma sequência que é de 8 nucleotídeos de comprimento.
[0151] Em algumas modalidades, uma proteína recombinante da presente invenção contém ainda dois domínios de dedo de zinco CCCH N-terminal.
[0152] Em algumas modalidades, o domínio de dedo de zinco é um arranjo de dedo de zinco engenheirado, tais como um arranjo de dedo de zinco C2H2. Arranjos engenheirados de dedos de zinco C2H2 podem ser usados para criar proteínas de ligação ao DNA capazes de ter como alvo as sequências desejadas de DNA genômico. Os métodos para engenheirar arranjos de dedo de zinco são bem conhecidos na técnica, e incluem, por exemplo, a combinação de dedos de zinco menores de especificidade conhecida.
[0153] Em algumas modalidades, a proteína recombinante pode conter um domínio de ligação ao DNA além de um domínio de dedo de zinco. Exemplos de tais domínios de ligação ao DNA podem incluir, por exemplo, domínios tendo como alvo o efetor TAL (ativador de transcrição), domínios da família hélice-volta-hélice de ligação ao DNA, domínios básicos, domínios de fita-hélice-hélice, domínios TBP (proteínas de ligação ao TATA-box), domínios de dímero de barril, domínios RHB (domínio de homologia real), domínios BAH (homologia bromo-adjacente), domínios SANT, Cromodomínios, domínios Tudor, Bromodomínios, domínios PHD (homeodomínio de planta), domínios WD40, e domínios MBD (domínio de ligação metil-CpG).
[0154] Em algumas modalidades, o domínio de ligação ao DNA é um domínio tendo como alvo o efetor TAL. Tal como aqui utilizado, efetores TAL se referem às proteínas bacterianas secretadas, tais como aquelas secretadas por bactérias Xanthomonas ou Ralstonia quando infectam várias espécies de plantas. Geralmente, efetores TAL são capazes de se ligar às sequências promotoras na planta hospedeira, e ativam a expressão de genes da planta que ajudam na infecção bacteriana. Efetores TAL reconhecem sequências de DNA da planta através de um domínio tendo como alvo a repetição central que contém um número variável de aproximadamente 34 repetições de aminoácidos. Além disso, domínios tendo como alvo o efetor TAL podem ser engenheirados para atingir sequências específicas de DNA. Métodos de domínios tendo como alvo o efetor TAL modificados são bem conhecidos na técnica, e descritos em Bogdanove and Voytas, Science. 2011 Sep 30; 333 (6051): 1843-6.
Ácidos Nucleicos Recombinantes Codificando Proteínas Recombinantes
[0155] Certos aspectos da presente divulgação se referem aos ácidos nucleicos recombinantes codificando proteínas recombinantes que contêm um domínio heterólogo de ligação ao DNA. As proteínas recombinantes podem ser proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG. Exemplos de domínios heterólogos de ligação ao DNA podem incluir, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco multi-cisteína, um domínio do cluster binuclear de zinco, um domínio de dedo de zinco C2H2 tendo menos que três dedos de zinco, um domínio de dedo de zinco C2H2 tendo mais que três dedos de zinco, um arranjo de dedo de zinco, um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio de fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD.
[0156] Em um aspecto, a presente invenção proporciona um ácido nucleico recombinante codificando uma proteína semelhante à SHH1, em que a proteína semelhante à SHH1 contém um domínio de ligação ao DNA e um polipeptídeo SHH1 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de SHH1 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 1.
[0157] Em um aspecto, a presente invenção proporciona um ácido nucleico recombinante codificando uma proteína semelhante à SUVH2, em que a proteína semelhante à SUVH2 contém um domínio de ligação ao DNA e um polipeptídeo de SUVH2 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de SUVH2 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 14.
[0158] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à SUVH9, em que a proteína semelhante à SUVH9 contém um domínio de ligação ao DNA e um polipeptídeo de SUVH9 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de SUVH9 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 27.
[0159] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à DMS3, em que a proteína semelhante à DMS3 contém um domínio de ligação ao DNA e um polipeptídeo de DMS3 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de DMS3 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 41.
[0160] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à MORC6, em que a proteína semelhante à MORC6 contém um domínio de ligação ao DNA e um polipeptídeo de MORC6 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de MORC6 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 53.
[0161] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à SUVR2, em que a proteína semelhante à SUVR2 contém um domínio de ligação ao DNA e um polipeptídeo de SUVR2 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de SUVR2 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 66.
[0162] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à DRD1, em que a proteína semelhante à DRD1 contém um domínio de ligação ao DNA e um polipeptídeo de DRD1 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de DRD1 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 79.
[0163] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à RDM1, em que a proteína semelhante à RDM1 contém um domínio de ligação ao DNA e um polipeptídeo de RDM1 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de RDM1 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 91.
[0164] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à DRM3, em que a proteína semelhante à DRM3 contém um domínio de ligação ao DNA e um polipeptídeo de DRM3 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de DRM3 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 101.
[0165] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à DRM2, em que a proteína semelhante à DRM2 contém um domínio de ligação ao DNA e um polipeptídeo de DRM2 ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de DRM2 ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 113.
[0166] Em um aspecto, a presente divulgação proporciona um ácido nucleico recombinante codificando uma proteína semelhante à FRG, em que a proteína semelhante à FRG contém um domínio de ligação ao DNA e um polipeptídeo de FRG ou fragmento do mesmo. Em algumas modalidades, o polipeptídeo de FRG ou fragmento do mesmo tem uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à SEQ ID NO: 125.
Ácidos Nucleicos Alvos da Presente Divulgação
[0167] Outros aspectos da presente divulgação se referem à utilização de proteínas recombinantes para reduzir a expressão de um ou mais genes de interesse em plantas através da ligação a um ou mais ácidos nucleicos alvos associados com os genes de interesse. As proteínas recombinantes podem ser proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG. Em algumas modalidades, proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG reduzem a expressão de um gene de interesse através da ligação a um ácido nucleico alvo. Em algumas modalidades, proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG silenciam a expressão de um gene de interesse através da ligação a um ácido nucleico alvo.
[0168] Em algumas modalidades, um ácido nucleico alvo da presente invenção é um ácido nucleico que está localizado em qualquer local dentro de um gene alvo que proporciona um local adequado para a redução da expressão do gene alvo. O ácido nucleico alvo pode estar localizado dentro da região codificadora de um gene alvo ou à jusante ou à montante da mesma. Além disso, o ácido nucleico alvo pode residir endogenamente em um gene alvo ou pode ser inserido no gene, por exemplo, heterólogo, por exemplo, utilizando técnicas, tais como a recombinação homóloga. Por exemplo, um gene alvo da presente invenção pode ser operacionalmente ligado a uma região controle, tal como um promotor, que contém uma sequência que é reconhecida e ligada por proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG da presente invenção.
[0169] O ácido nucleico alvo pode ser qualquer ácido nucleico de interesse que pode ser ligado por uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação. Em algumas modalidades, o ácido nucleico alvo é endógeno à planta onde a expressão de um ou mais genes é reduzida por uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação. Em algumas modalidades, o ácido nucleico alvo é um transgene de interesse que foi inserido em uma planta. Os métodos de introdução de transgenes em plantas são bem conhecidos na técnica. Os transgenes podem ser inseridos em plantas a fim de proporcionar um sistema de produção de uma proteína desejada, ou podem ser adicionados para o cumprimento genético, a fim de modular o metabolismo de uma planta.
[0170] Exemplos de genes endógenos adequados de plantas cuja expressão pode ser reduzida por uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem incluir, por exemplo, genes que previnam o aumento de um ou mais traços desejados e genes que previnam o aumento de rendimento da colheita. Por exemplo, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser utilizadas para reduzir a expressão do gene GAI em plantas, o que criaria plantas que são menos sensíveis à giberelina. Em modalidades relacionadas à investigação, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser utilizadas para silenciar a expressão de um gene endógeno de interesse a fim de gerar plantas mutantes para estudar a função do gene de interesse.
[0171] Exemplos de transgenes adequados presentes em plantas cuja expressão pode ser reduzida por uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem incluir, por exemplo, transgenes que não são úteis em certos fundos genéticos, os transgenes que são prejudiciais em certos fundos genéticos, e transgenes que são expressos em determinados tecidos, que são indesejáveis. Por exemplo, no caso em que os transgenes são expressos em determinados tecidos, que são indesejáveis, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser utilizadas para silenciar a expressão de tais transgenes em tecidos específicos em momentos específicos, por ligação operacional de promotores específicos de tecidos aos polipeptídeos recombinantes da presente divulgação. Em modalidades relacionadas à investigação, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser utilizadas para estudar dinamicamente transgenes de interesse através do controle da indução/silenciamento dos transgenes.
Plantas da Presente Divulgação
[0172] Certos aspectos da presente divulgação se referem às plantas contendo uma ou mais proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG. Em algumas modalidades, as proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG ligam-se a um ou mais ácidos nucleicos alvos na planta e reduzem a expressão de um ou mais ácidos nucleicos alvos.
[0173] Tal como aqui utilizado, uma “planta” se refere à qualquer um dos vários organismos multicelulares eucarióticos fotossintéticos do reino Plantae, caracteristicamente produzindo embriões, contendo cloroplastos, tendo paredes celulares de celulose e ausência de locomoção. Tal como aqui utilizado, uma “planta” inclui qualquer planta ou parte de uma planta em qualquer fase do desenvolvimento, incluindo sementes, culturas em suspensão, células vegetais, embriões, regiões meristemáticas, tecidos de calos, folhas, raízes, rebentos, gametófitos, esporófitos, pólen, micrósporos, e progênie dos mesmos. Também estão incluídas as mudas, e culturas de células ou tecidos. Tal como utilizado em conjugação com a presente divulgação, o tecido da planta inclui, sem limitação, a planta completa, células vegetais, órgãos de plantas, por exemplo, folhas, caules, raízes, meristemas, sementes de plantas, protoplastos, calos, culturas celulares e quaisquer grupos de células vegetais organizadas em unidades estruturais e/ou funcionais.
[0174] Qualquer célula vegetal pode ser utilizada na presente divulgação, desde que permaneça viável após ter sido transformada com uma sequência de ácidos nucleicos. Preferencialmente, a célula vegetal não é adversamente afetada pela transdução das sequências necessárias de ácido nucleico, expressão subsequente de proteínas ou intermediários resultantes.
[0175] Tal como aqui divulgado, uma ampla gama de tipos de plantas pode ser modificada para incorporar uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG. Plantas adequadas que podem ser modificadas incluem ambas plantas monocotiledôneas (monocot) e plantas dicotiledôneas (dicot).
[0176] Exemplos de plantas adequadas podem incluir, por exemplo, as espécies da família das Gramineae, incluindo Sorghum bicolor e Zea mays; espécies dos gêneros: Cucurbita, Rosa, Vitis, Juglans, Fragaria, Lotus, Medicago, Onobrychis, Trifolium, Trigonella, Vigna, Citrus, Linum, Geranium, Manihot, Daucus, Arabidopsis, Brassica, Raphanus, Sinapis, Atropa, Capsicum, Datura, Hyoscyamus, Lycopersicon, Nicotiana, Solanum, Petunia, Digitalis, Majorana, Ciahorium, Helianthus, Lactuca, Bromus, Aspargus, Antirrhinum, Heterocallis, Nemesis, Pelargonium, Panieum, Pennisetum, Ranunculus, Senecio, Salpiglossis, Cucumis, Browaalia, Glycine, Pisum, Phaseolus, Lolium, Oryza, Avena, Hordeum, Secale e Triticum.
[0177] Em algumas modalidades, as células vegetais podem incluir, por exemplo, aquelas do milho (Zea mays), canola (Brassica napus, Brassica rapa ssp.), espécies úteis de Brassica como fontes de óleo de sementes, alfafa (Medicago sativa), arroz (Oryza sativa), centeio (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), milheto (por exemplo, milheto pérola (Pennisetum glaucum), painço (Panicum miliaceum), painço foxtail (Setaria italica), milheto em dedo (Eleusine coracana)), girassol (Helianthus annuus), açafrão (Carthamus tinctorius), trigo (Triticum aestivum), lentilha (Lemna), soja (Glycine max), tabaco (Nicotiana tabacum), batata (Solanum tuberosum), amendoins (Arachis hypogaea), algodão (Gossypium barbadense, Gossypium hirsutum), batata-doce (Ipomoea batatas), a mandioca (Manihot esculenta), café (Coffea spp.), coco (Cocos nucijra), abacaxi (Ananas comosus), árvores cítricas (Citrus spp.), cacau (Theobroma cacao), chá (Camellia sinensis), banana (Musa spp.), abacate (Persea americana), figo (Casica Ficus), goiaba (Psidium guajava), manga (Mangifera indica), oliva (Olea europaea), mamão (Carica papaya), caju (Anacardium occidentale), macadâmia (Macadamia spp.), amêndoa (Prunus amygdalus), beterraba (Beta vulgaris), cana- de-açúcar (Saccharum spp.), aveia, cevada, vegetais, plantas ornamentais, e coníferas.
[0178] Exemplos de plantas vegetais adequadas podem incluir, por exemplo, tomate (Lycopersicon esculentum), alface (por exemplo, Lactuca sativa), feijões verdes (Phaseolus vulgaris), feijão de lima (Phaseolus limensis), ervilhas (Lathyrus spp.), e membros do gênero Cucumis tais como pepino (C. sativus), melão cantaloupe (C. cantalupensis) e melão almiscarado (C. melo).
[0179] Exemplos de plantas ornamentais adequadas podem incluir, por exemplo, azaleia (Rhododendron spp.), hortênsia (Macrophylla hydrangea), hibiscos (Hibiscus rosasanensis), rosas (Rosa spp.), tulipas (Tulipa spp.), narcisos (Narcissus spp.), petúnias (Petunia hybrida), cravo (Dianthus caryophyllus), poinsétia (Euphorbiapulcherrima), e crisântemo.
[0180] Exemplos de plantas coníferas adequadas podem incluir, por exemplo, pinheiro loblolly (Pinus taeda), pinheiro slash (Pinus elliotii), pinheiro ponderosa (Pinus ponderosa), pinheiro lodgepole (Pinus contorta), pinheiro Monterrey (Pinus radiata), abeto de Douglas (Pseudotsuga menziesii), cicuta ocidental (Isuga canadensis), Sitka spruce (Picea glauca), sequoia (Sequoia sempervirens), abeto (Abies amabilis), abeto balsâmico (Abies balsamea), cedro vermelho ocidental (Thuja plicata), e cedro amarelo do Alasca (Chamaecyparis nootkatensis).
[0181] Exemplos de plantas leguminosas adequadas podem incluir, por exemplo, guar, alfarroba, feno-grego, soja, feijão, feijão caupi, feijão mungo, feijão lima, feijão fava, lentilhas, grão de bico, amendoim (Arachis sp.), coroa ervilhaca (Vicia sp.), ervilhaca peluda, feijão azuki, tremoço (Lupinus sp.), trifólio, feijão comum (Phaseolus sp.), fava (Pisum sp.), trevo (Melilotus sp.), lótus, trifólio, lentes, e falso índigo.
[0182] Exemplos de forragem e relvado adequados podem incluir, por exemplo, alfafa (Medicago s sp.), capim de pomar, festuca, azevém perene, agróstea rastejante, e capim.
[0183] Exemplos de plantas de cultivo e plantas modelo adequadas podem incluir, por exemplo, Arabidopsis, milho, arroz, alfafa, girassol, canola, soja, algodão, amendoim, sorgo, trigo, tabaco, e Lemna.
[0184] As plantas da presente divulgação podem ser geneticamente modificadas em que os ácidos nucleicos recombinantes foram introduzidos nas plantas, e como tal, as plantas geneticamente modificadas não ocorrem na natureza. Uma planta adequada da presente divulgação é aquela capaz de expressar um ou mais construtos de ácidos nucleicos que codificam uma ou mais proteínas recombinantes. As proteínas recombinantes codificadas pelos ácidos nucleicos podem ser proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG.
[0185] Tais como aqui utilizados, os termos “planta transgênica” e “planta geneticamente modificada” são utilizados indiferentemente e se referem a uma planta que contém dentro do seu genoma um ácido nucleico recombinante. Geralmente, o ácido nucleico recombinante está integrado de forma estável dentro do genoma de tal modo que o polinucleotídeo é passado para as sucessivas gerações. No entanto, em certas modalidades, o ácido nucleico recombinante é transitoriamente expresso na planta. O ácido nucleico recombinante pode ser integrado dentro do genoma sozinho ou como parte de um cassete de expressão recombinante. “Transgênico” é aqui utilizado para incluir qualquer célula, linhagem celular, calo, tecido, planta ou parte de planta, o genótipo do que foi alterado pela presença de ácido nucleico exógeno incluindo aqueles transgênicos inicialmente muito alterados, bem como aqueles criados por cruzamento sexual ou propagação assexual a partir do transgênico inicial.
[0186] “Ác ido nucleico recombinante” ou “ácido nucleico heterólogo” ou “polinucleotídeo recombinante” tal como aqui utilizado se refere à um polímero de ácidos nucleicos, em que pelo menos uma das seguintes condições é verdadeira: (a) a sequência de ácidos nucleicos é estranha (ou seja, não é naturalmente encontrada) em uma dada célula hospedeira; (b) a sequência pode ser naturalmente encontrada em uma dada célula hospedeira, mas em uma quantidade não natural (por exemplo, maior do que o esperado); ou (c) a sequência de ácidos nucleicos contém duas ou mais subsequências que não se encontram na mesma relação uma à outra na natureza. Por exemplo, em relação ao exemplo (C), uma sequência de ácido nucleico recombinante terá duas ou mais sequências de genes não relacionadas dispostas de modo a gerar um novo ácido nucleico funcional. Especificamente, a presente divulgação descreve a introdução de um vetor de expressão em uma célula vegetal, onde o vetor de expressão contém uma sequência de ácido nucleico que codifica uma proteína que normalmente não é encontrada na célula vegetal ou contém um ácido nucleico que codifica uma proteína que é normalmente encontrada na célula vegetal, mas está sob o controle de diferentes sequências reguladoras. Com referência ao genoma da célula vegetal, então, a sequência de ácido nucleico que codifica para a proteína é recombinante. Uma proteína que é referenciada como recombinante geralmente implica que é codificada por uma sequência de ácido nucleico recombinante na célula vegetal.
[0187] Um polipeptídeo, proteína ou enzima “recombinante” da presente divulgação, é um polipeptídeo, proteína ou enzima que é codificado por um “ácido nucleico recombinante” ou “ácido nucleico heterólogo” ou “polinucleotídeo recombinante”.
[0188] Em algumas modalidades, os genes codificando as proteínas recombinantes na célula vegetal podem ser heterólogos em relação à célula vegetal. Em certas modalidades, a célula vegetal não produz naturalmente as proteínas recombinantes, e contém construtos heterólogos de ácido nucleico capazes de expressar um ou mais genes necessários para a produção dessas moléculas. Expressão de Proteínas Recombinantes em Plantas
[0189] Uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser introduzidas em células vegetais através de quaisquer métodos adequados conhecidos na técnica. Por exemplo, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG podem ser exogenamente adicionadas às células vegetais e as células vegetais são mantidas sob condições tais que uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG liga-se a um ou mais ácidos nucleicos alvos e reduz a expressão dos ácidos nucleicos alvos nas células vegetais. Alternativamente, um ácido nucleico recombinante que codifica uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser expressas em células vegetais e as células vegetais são mantidas sob condições tais que uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG expressa liga-se a um ou mais ácidos nucleicos alvos e reduz a expressão do gene alvo nas células vegetais. Adicionalmente, em certas modalidades, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação pode ser transitoriamente expressa em uma planta por meio de uma infecção viral da planta, ou através da introdução de RNA que codifica uma proteína semelhante à SHH1, RNA que codifica uma proteína semelhante à SUVH2, RNA que codifica uma proteína semelhante à SUVH9, RNA que codifica uma proteína semelhante à DMS3, RNA que codifica uma proteína semelhante à MORC6, RNA que codifica uma proteína semelhante à SUVR2, RNA que codifica uma proteína semelhante à DRD1, RNA que codifica uma proteína semelhante à RDM1, RNA que codifica uma proteína semelhante à DRM3, RNA que codifica uma proteína semelhante à DRM2, e/ou RNA que codifica uma proteína semelhante à FRG em uma planta para reduzir ou silenciar temporariamente a expressão de um gene de interesse. Métodos de introdução de proteínas recombinantes por meio de infecção viral ou através da introdução de RNAs em plantas são bem conhecidos na técnica. Por exemplo, vírus do mosaico do Tabaco (TRV) foi usado com sucesso para introduzir dedos de zinco nucleases em plantas para causar modificação do genoma (“Nontransgenic Genome Modification in Plant Cells”, Plant Physiology 154:1079-1087 (2010)).
[0190] Um ácido nucleico recombinante que codifica uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser expressos em uma planta com qualquer vetor de expressão adequado de plantas. Vetores típicos úteis para expressão de ácidos nucleicos recombinantes em plantas superiores são bem conhecidos na técnica e incluem, sem limitação, os vetores derivados do plasmídeo indutor de tumores (Ti) de Agrobacterium tumefaciens (por exemplo, ver Rogers et al., Meth. in Enzymol. (1987) 153:253-277). Estes vetores são vetores de integração de plantas naquela transformação, os vetores integram uma porção do vetor de DNA no genoma da planta hospedeira. Exemplos de vetores de A. tumefaciens úteis para a presente divulgação são os plasmídeos pKYLX6 e pKYLX7 (por exemplo, ver Schardl et al., Gene (1987) 61:111; e Berger et al., Proc. Natl. Acad. Sci. USA (1989) 86:8402-8406); e plasmídeo pBI 101.2 que está disponível a partir da Clontech Laboratories, Inc. (Palo Alto, CA).
[0191] Além dos domínios reguladores, uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser expressas como uma proteína de fusão que é acoplada, por exemplo, à uma proteína de ligação de maltose (“MBP”), glutation S transferase (GST), hexahistidina, c-myc, ou ao epítopo FLAG para facilitar a purificação, monitoramento da expressão ou monitoramento da localização celular e subcelular.
[0192] Além disso, um ácido nucleico recombinante que codifica uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação podem ser modificados para melhorar a expressão da proteína recombinante em plantas utilizando preferência de códon. Quando o ácido nucleico recombinante é preparado ou alterado sinteticamente, pode- se tirar vantagem de conhecidas preferências de códons da planta hospedeira pretendida onde o ácido nucleico será expresso. Por exemplo, os ácidos nucleicos recombinantes da presente divulgação podem ser modificados para contabilizar as preferências de códons específicas e preferências de conteúdo de GC de monocotiledôneas e dicotiledôneas, uma vez que estas preferências demonstraram se diferir (Murray et al., Nucl. Acids Res. (1989) 17: 477-498).
[0193] Em algumas modalidades, proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG da presente divulgação podem ser usadas para criar mutações funcionais de “knockout de gene” em uma planta pela repressão da expressão do gene alvo. A repressão pode ser de um gene estrutural, por exemplo, um que codifica uma proteína possuindo, por exemplo, atividade enzimática, ou de um gene regulador, por exemplo, um que codifica uma proteína que, por sua vez, regula a expressão de um gene estrutural.
[0194] A presente divulgação proporciona ainda vetores de expressão contendo um ácido nucleico que codifica uma proteína semelhante à SHH1, um ácido nucleico que codifica uma proteína semelhante à SUVH2, um ácido nucleico que codifica uma proteína semelhante à SUVH9, um ácido nucleico que codifica uma proteína semelhante à DMS3, um ácido nucleico que codifica uma proteína semelhante à MORC6, um ácido nucleico que codifica uma proteína semelhante à SUVR2, um ácido nucleico que codifica uma proteína semelhante à DRD1, um ácido nucleico que codifica uma proteína semelhante à RDM1, um ácido nucleico que codifica uma proteína semelhante à DRM3, um ácido nucleico que codifica uma proteína semelhante à DRM2, e/ou um ácido nucleico que codifica uma proteína semelhante à FRG da presente divulgação. Uma sequência de ácido nucleico que codifica para o ácido nucleico recombinante desejado da presente divulgação pode ser utilizada para construir um vetor de expressão recombinante que pode ser introduzido na célula hospedeira desejada. Um vetor de expressão recombinante conterá tipicamente um ácido nucleico que codifica uma proteína recombinante da presente divulgação, operacionalmente ligada a sequências reguladoras de iniciação de transcrição que irão direcionar a transcrição do ácido nucleico na célula hospedeira pretendida, tais como tecidos de uma planta transformada.
[0195] Por exemplo, vetores de expressão de plantas podem incluir (1) um gene de planta clonado sob o controle de transcrição das sequências reguladoras 5’ e 3’ e (2) um marcador selecionável dominante. Tais vetores de expressão de plantas podem também conter, se desejado, uma região reguladora do promotor (por exemplo, uma que confere expressão induzível ou constitutiva, regulada pelo ambiente ou desenvolvimento, ou expressão específica/seletiva para célula ou tecido), um sítio de início de iniciação da transcrição, um sítio de ligação ao ribossomo, um sinal de processamento de RNA, um sítio de terminação da transcrição, e/ou um sinal de poliadenilação.
[0196] Um promotor da planta, ou fragmento funcional do mesmo, pode ser empregado para controlar a expressão de ácido nucleico recombinante da presente divulgação em plantas regeneradas. A seleção do promotor utilizado em vetores de expressão determinará o padrão de expressão espacial e temporal do ácido nucleico recombinante na planta modificada, por exemplo, um ácido nucleico que codifica uma proteína semelhante à SHH1, um ácido nucleico que codifica uma proteína semelhante à SUVH2, um ácido nucleico que codifica uma proteína semelhante à SUVH9, um ácido nucleico que codifica uma proteína semelhante à DMS3, um ácido nucleico que codifica uma proteína semelhante à MORC6, um ácido nucleico que codifica uma proteína semelhante à SUVR2, um ácido nucleico que codifica uma proteína semelhante à DRD1, um ácido nucleico que codifica uma proteína semelhante à RDM1, um ácido nucleico que codifica uma proteína semelhante à DRM3, um ácido nucleico que codifica uma proteína semelhante à DRM2, e/ou um ácido nucleico que codifica uma proteína semelhante à FRG é expressa apenas no tecido desejado ou em um determinado período do desenvolvimento ou crescimento da planta. Alguns promotores expressarão ácidos nucleicos recombinantes em todos os tecidos da planta e estão ativos na maioria das condições ambientais e estados de desenvolvimento ou diferenciação celular (isto é, promotores constitutivos). Outros promotores expressarão os ácidos nucleicos recombinantes em tipos de células específicas (tais como células epidérmicas da folha, células do mesófilo, células do córtex da raiz) ou em tecidos ou órgãos específicos (raízes, folhas ou flores, por exemplo) e a seleção refletirá a localização de acumulação desejada do produto do gene. Alternativamente, o promotor selecionado pode conduzir a expressão do ácido nucleico recombinante sob várias condições de indução.
[0197] Os exemplos de promotores constitutivos adequados podem incluir, por exemplo, o núcleo promotor de Rsyn7, o núcleo do promotor de CaMV 35S, (Odell et al., Nature (1985) 313:810-812), CaMV 19S (Lawton et al., 1987), actina do arroz (Wang et al., 1992; Pat. U.S. No. 5.641.876; e McElroy et al., Plant Cell (1985) 2:163-171); ubiquitina (Christensen et al., Plant Mol. Biol. (1989)12:619-632; e Christensen et al., Plant Mol. Biol. (1992) 18:675-689), pEMU (Last et al., Theor. Appl. Genet. (1991) 81:581-588), MAS (Velten et al., EMBO J. (1984) 3:2723-2730), nos (Ebert et al., 1987), Adh (Walker et al., 1987), o promotor de Pou 2’- derivado de T-DNA de Agrobacterium tumefaciens, o promotor Smas, o promotor de álcool cinamílico desidrogenase (Pat. U.S. No. 5.683.439), o promotor Nos, o promotor pEmu, o promotor de rubisco, o promotor de GRP 1 - 8, e outras regiões de iniciação da transcrição de vários genes conhecidos de plantas pelos especialistas, e promotores constitutivos descritos, por exemplo, nas Patentes US 5.608.149; 5.608.144; 5.604.121; 5.569.597; 5.466.785; 5.399.680; 5.268.463; e 5.608.142.
[0198] Exemplos de promotores específicos de tecido adequados podem incluir, por exemplo, o promotor da lectina (Vodkin et al., 1983; Lindstrom et al., 1990), o promotor de álcool desidrogenase de milho 1 (Vogel et al., 1989; Dennis et al., 1984), o promotor do complexo de coleta de luz do milho (Simpson, 1986; Bansal et al., 1992), o promotor de proteína de choque térmico do milho (Odell et al., Nature (1985) 313:810-812; Rochester et al., 1986), o promotor da subunidade pequena da RuBP carboxilase da ervilha (Poulsen et al., 1986; Cashmore et al., 1983), o promotor da manopina sintase do plasmídeo Ti (Langridge et al., 1989), o promotor da nopalina sintase do plasmídeo Ti (Langridge et al., 1989), o promotor da chalcona isomerase da petúnia (Van Tunen et al., 1988), o promotor da proteína rica em glicina 1 do feijão (Keller et al., 1989), o promotor truncado de CaMV 35s (Odell et al., Nature (1985) 313:810-812), o promotor de patatina da batata (Wenzler et al., 1989), o promotor da célula da raiz (Conkling et al., 1990), o promotor da zeína do milho (Reina et al., 1990; Kriz et al., 1987; Wandelt and Feix, 1989; Langridge and Feix, 1983; Reina et al., 1990), o promotor da globulina 1 (Belanger and Kriz et al., 1991), o promotor da a-tubulina, o promotor cab (Sullivan et al., 1989), o promotor PEPCase (Hudspeth & Grula, 1989), os promotores associados ao complexo do gene R (Chandler et al., 1989), e o promotor da chalcona sintase (Franken et al., 1991).
[0199] Alternativamente, o promotor da planta pode direcionar a expressão de um ácido nucleico recombinante da presente divulgação em um tecido específico ou pode ser, de outra forma, sob controle ambiental ou do desenvolvimento mais precisos. Tais promotores são aqui referidos como promotores “induzíveis”. Condições ambientais que possam afetar a transcrição por promotores induzíveis incluem, sem limitação, ataque de patógenos, condições anaeróbicas, ou a presença de luz. Exemplos de promotores induzíveis incluem, sem limitação, o promotor de AdhI que é induzível por hipóxia ou estresse por frio, o promotor Hsp70 que é induzível por estresse por calor, e o promotor PPDK que é induzível pela luz. Exemplos de promotores sob controle do desenvolvimento incluem, sem limitação, promotores que iniciam apenas a transcrição, ou preferencialmente, em certos tecidos, tais como folhas, raízes, frutos, sementes ou flores. Um promotor exemplar é o promotor específico de antera 5126 (Patentes US 5.689.049 e 5.689.051). A operação de um promotor pode também variar dependendo da sua localização no genoma. Assim, um promotor induzível pode tornar-se totalmente ou parcialmente constitutivo em determinadas localizações.
[0200] Além disso, qualquer combinação de um promotor constitutivo ou induzível, e um promotor não específico para tecido ou específico para tecido pode ser usado para controlar a expressão de uma proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG.
[0201] Ambos promotores heterólogos e endógenos podem ser empregados para a expressão direta de ácidos nucleicos recombinantes da presente divulgação. Assim, em certas modalidades, a expressão de um ácido nucleico que codifica uma proteína semelhante à SHH1, um ácido nucleico que codifica uma proteína semelhante à SUVH2, um ácido nucleico que codifica uma proteína semelhante à SUVH9, um ácido nucleico que codifica uma proteína semelhante à DMS3, um ácido nucleico que codifica uma proteína semelhante à MORC6, um ácido nucleico que codifica uma proteína semelhante à SUVR2, um ácido nucleico que codifica uma proteína semelhante à DRD1, um ácido nucleico que codifica uma proteína semelhante à RDM1, um ácido nucleico que codifica uma proteína semelhante à DRM3, um ácido nucleico que codifica uma proteína semelhante à DRM2, e/ou um ácido nucleico que codifica uma proteína semelhante à FRG da presente divulgação está sob controle do seu respectivo promotor endógeno. Em outras modalidades, a expressão de um ácido nucleico que codifica uma proteína semelhante à SHH1, um ácido nucleico que codifica uma proteína semelhante à SUVH2, um ácido nucleico que codifica uma proteína semelhante à SUVH9, um ácido nucleico que codifica uma proteína semelhante à DMS3, um ácido nucleico que codifica uma proteína semelhante à MORC6, um ácido nucleico que codifica uma proteína semelhante à SUVR2, um ácido nucleico que codifica uma proteína semelhante à DRD1, um ácido nucleico que codifica uma proteína semelhante à RDM1, um ácido nucleico que codifica uma proteína semelhante à DRM3, um ácido nucleico que codifica uma proteína semelhante à DRM2, e/ou um ácido nucleico que codifica uma proteína semelhante à FRG da presente divulgação está sob controle de um promotor heterólogo. Além disso, um gene SHH1, gene SUVH2, gene SUVH9, gene DMS3, gene MORC6, gene SUVR2, gene DRD1, gene RDM1, gene DRM3, gene DRM2, e/ou gene FRG endógeno da presente divulgação pode ser modificado utilizando uma abordagem knock-in, de modo que o gene modificado estará sob o controle dos seus respectivos elementos endógenos. Alternativamente, uma forma modificada de uma sequência genômica SHH1, SUVH2, SUVH9, DMS3, MORC6, SUVR2, DRD1, RDM1, DRM3, DRM2, e/ou FRG completa pode ser introduzida em uma planta, de modo a que o gene modificado/recombinante estará sob o controle dos seus elementos endógenos e o gene tipo selvagem permanece intacto. Qualquer uma ou todas estas técnicas podem também ser combinadas para direcionar a expressão de um ácido nucleico recombinante da presente divulgação.
[0202] Os ácidos nucleicos recombinantes da presente divulgação, tais como um ácido nucleico que codifica uma proteína semelhante à SHH1, um ácido nucleico que codifica uma proteína semelhante à SUVH2, um ácido nucleico que codifica uma proteína semelhante à SUVH9, um ácido nucleico que codifica uma proteína semelhante à DMS3, um ácido nucleico que codifica uma proteína semelhante à MORC6, um ácido nucleico que codifica uma proteína semelhante à SUVR2, um ácido nucleico que codifica uma proteína semelhante à DRD1, um ácido nucleico que codifica uma proteína semelhante à RDM1, um ácido nucleico que codifica uma proteína semelhante à DRM3, um ácido nucleico que codifica uma proteína semelhante à DRM2, e/ou um ácido nucleico que codifica uma proteína semelhante à FRG, e/ou um vetor hospedando um ácido nucleico recombinante da presente divulgação, também podem conter uma sequência reguladora que funciona como uma sequência terminadora 3’. Um especialista na técnica reconheceria prontamente uma variedade de terminadores que podem ser utilizados nos ácidos nucleicos recombinantes da presente divulgação. Por exemplo, um ácido nucleico recombinante da presente divulgação pode conter um terminador 3’ NOS. Além disso, um terminador nativo a partir de um ácido nucleico que codifica uma proteína semelhante à SHH1, um ácido nucleico que codifica uma proteína semelhante à SUVH2, um ácido nucleico que codifica uma proteína semelhante à SUVH9, um ácido nucleico que codifica uma proteína semelhante à DMS3, um ácido nucleico que codifica uma proteína semelhante à MORC6, um ácido nucleico que codifica uma proteína semelhante à SUVR2, um ácido nucleico que codifica uma proteína semelhante à DRD1, um ácido nucleico que codifica uma proteína semelhante à RDM1, um ácido nucleico que codifica uma proteína semelhante à DRM3, um ácido nucleico que codifica uma proteína semelhante à DRM2, e/ou um ácido nucleico que codifica uma proteína semelhante à FRG também podem ser usados nos ácidos nucleicos recombinantes da presente divulgação.
[0203] Os protocolos de transformação de plantas bem como os protocolos para introdução de ácidos nucleicos recombinantes da presente divulgação em plantas podem variar em função do tipo de planta ou célula vegetal, por exemplo, monocotiledônea ou dicotiledônea, tendo como alvo a transformação. Os métodos adequados de introdução de ácidos nucleicos recombinantes da presente divulgação em células vegetais e subsequente inserção no genoma da planta incluem, sem limitação, a microinjeção (Crossway et al., Biotechniques (1986) 4:320-334), eletroporação (Riggs et al., Proc. Natl. Acad Sci. USA (1986) 83:5602-5606), transformação mediada por Agrobacterium (Patente U.S. No. 5.563.055), transferência direta de genes (Paszkowski et al., EMBO J. (1984) 3:2717-2722), e aceleração de partícula balística (Patente U.S. No. 4.945.050; Tomes et al. (1995). “Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment,” em Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg and Phillips (Springer-Verlag, Berlin); e McCabe et al., Biotechnology (1988) 6:923-926).
[0204] Adicionalmente, proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG da presente divulgação podem ter como alvo uma organela específica dentro de uma célula vegetal. O alvo pode ser alcançado disponibilizando a proteína recombinante com uma apropriada sequência de peptídeo de direcionamento. Exemplos de tais peptídeos alvos incluem, sem limitação, peptídeos sinalizadores de secreção (direcionamento para secreção ou parede ou membrana celular), peptídeos de trânsito do plastídeo, peptídeos de trânsito dos cloroplastos, peptídeos mitocondriais alvos, peptídeos do vacúolo alvos, peptídeos nucleares alvos, e semelhantes (por exemplo, ver Reiss et al., Mol. Gen. Genet. (1987) 209(1):116-121; Settles and Martienssen, Trends Cell Biol (1998) 12:494-501; Scott et al., J Biol Chem (2000) 10:1074; e Luque and Correas, J Cell Sci (2000) 113:24852495).
[0205] A planta modificada pode ser cultivada em plantas de acordo com as formas convencionais (por exemplo, ver McCormick et al., Plant Cell. Reports (1986) 81-84.). Estas plantas podem então ser cultivadas, e polinizadas ou com a mesma cepa transformada ou cepas diferentes, com o híbrido resultante tendo a característica fenotípica desejada. Duas ou mais gerações podem ser cultivadas para garantir que a característica fenotípica é estavelmente mantida e herdada e então as sementes colhidas para assegurar que o fenótipo ou outra propriedade desejada foi alcançado.
Métodos de Redução de Expressão Gênica em Plantas
[0206] Outros aspectos da presente divulgação se referem a métodos para reduzir a expressão de um ou mais ácidos nucleicos alvos, tais como genes, em uma planta através da utilização de proteínas semelhantes à SHH1, proteínas semelhantes à SUVH2, proteínas semelhantes à SUVH9, proteínas semelhantes à DMS3, proteínas semelhantes à MORC6, proteínas semelhantes à SUVR2, proteínas semelhantes à DRD1, proteínas semelhantes à RDM1, proteínas semelhantes à DRM3, proteínas semelhantes à DRM2, e/ou proteínas semelhantes à FRG. Em um aspecto, a presente divulgação proporciona um método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, através do fornecimento de uma planta contendo um ou mais polipeptídeos recombinantes da presente divulgação, e o crescimento da planta sob condições em que os polipeptídeos recombinantes se ligam a um ou mais ácidos nucleicos alvos da presente divulgação, reduzindo assim a expressão de um ou mais genes alvos. Qualquer planta aqui descrita e contendo um polipeptídeo recombinante da presente divulgação pode ser usada.
[0207] As condições suficientes de crescimento para o polipeptídeo recombinante expresso na planta se ligar e reduzir a expressão de um ou mais ácidos nucleicos alvos da presente divulgação são bem conhecidas na técnica e incluem quaisquer condições adequadas de crescimento aqui descritas. Tipicamente, a planta é cultivada sob condições suficientes para expressar o polipeptídeo recombinante, tal como proteína semelhante à SHH1, uma proteína semelhante à SUVH2, uma proteína semelhante à SUVH9, uma proteína semelhante à DMS3, uma proteína semelhante à MORC6, uma proteína semelhante à SUVR2, uma proteína semelhante à DRD1, uma proteína semelhante à RDM1, uma proteína semelhante à DRM3, uma proteína semelhante à DRM2, e/ou uma proteína semelhante à FRG da presente divulgação, e para o polipeptídeo recombinante expresso ser localizado no núcleo das células da planta, a fim de se ligar e reduzir a expressão dos ácidos nucleicos alvos. Geralmente, as condições suficientes para a expressão do polipeptídeo recombinante dependerão do promotor usado para controlar a expressão do polipeptídeo recombinante. Por exemplo, se um promotor induzível é utilizado, a expressão do polipeptídeo recombinante em uma planta, necessitará que a planta seja cultivada na presença do indutor.
[0208] Deve ser compreendido que embora a presente divulgação tenha sido descrita em conjunto com as modalidades específicas preferidas da mesma, a descrição anterior destina-se a ilustrar e não limitar o escopo da presente divulgação. Outros aspectos, vantagens, e modificações dentro do escopo da presente divulgação serão evidentes para os especialistas na técnica a qual a presente divulgação pertence.
[0209] Os seguintes exemplos são oferecidos para ilustrar as modalidades fornecidas e não têm a intenção de limitar o escopo da presente divulgação.
EXEMPLOS Exemplo 1
[0210] O seguinte Exemplo se refere à caracterização da proteína SHH1 de Arabidopsis thaliana e o seu envolvimento na promoção da metilação do DNA dirigida por RNA e o silenciamento do gene.
Materiais e Métodos Construção e sequenciamento de biblioteca de ChIP-seq, BS- seq e siRNA-seq
[0211] A primeira réplica de bibliotecas de ChIP-seq (NRPD1-Flag e Col) foi gerada utilizando o Sistema Ovation Ultralow IL Multiplex (NuGEN) enquanto a segunda réplica (NRPD1-Flag, NRPD1-Flag; shh1, e Col) foi gerada utilizando o Sistema Ovation Ultralow DR Multiplex (NuGEN). Ambos os conjuntos de bibliotecas de ChIP-seq usaram 18 ciclos para a etapa de amplificação da biblioteca. Bibliotecas de BS-seq foram geradas como previamente relatado (Cokus et al., 2008). Bibliotecas de siRNA-seq foram geradas utilizando o kit de RNA pequeno TruSeq (Illumina) seguindo as instruções do fabricante com a exceção de que foram utilizados 15 ciclos durante a etapa de amplificação. As bibliotecas do tipo selvagem (Col) e nrpe1 BS-seq utilizadas neste estudo foram anteriormente publicadas (Zhong et al., 2012) e, subsequentemente, foram novamente analisadas. Todas as bibliotecas foram sequenciadas utilizando a plataforma HiSeq 2000 seguindo as instruções do fabricante (Illumina) com um comprimento de 50 pb. Mapeamento e processamento de leituras
[0212] As leituras sequenciadas foram nomeadas usando o pipeline Illumina padrão. Para bibliotecas de ChIP- seq e BS-seq, apenas leituras de 50 nt completas foram mantidas, enquanto que para bibliotecas de siRNA-seq, leituras tiveram sequência adaptadora aparada e foram mantidas se tivessem entre 18 nt e 28 nt de comprimento. Para bibliotecas de ChIP-seq e siRNA-seq, leituras foram mapeadas para o genoma de Arabidopsis (TAIR8) com Bowtie (Langmead et al., 2009) e apenas combinações perfeitas que mapearam exclusivamente ao genoma foram mantidas para posterior análise, embora o número total de leituras de mapeamento, exclusivas e não exclusivas, tenha sido usado durante normalização das bibliotecas de siRNA-seq ao número total de leituras por biblioteca. Para bibliotecas de BS- seq, leituras foram mapeadas usando o BSseeker wrapper para Bowtie (Chen et al., 2010). Para ChIP-seq e BS-seq, leituras idênticas foram colapsadas em uma leitura, enquanto que para siRNA-seq leituras idênticas foram mantidas. Para a análise de metilação, a percentagem de metilação foi calculada como previamente relatado (Cokus et al., 2008) com o genoma do cloroplasto não metilado que serve como a medida de metilação de fundo de bissulfito não convertido. Para a segunda réplica de bibliotecas de ChIP-seq, NRPD1-Flag e Col foram subamostradas para combinar com a leitura total da menor biblioteca (a biblioteca NRPD1-Flag;shh1). Análise da metilação do DNA
[0213] Para avaliação da metilação do DNA em clusters de siRNA, apenas aqueles clusters com pelo menos uma citosina na respectiva classe a ser ensaiada (CG, CHG, ou CHH), foram considerados. Para o cálculo de níveis de significância de mudanças na metilação através do teste U de Mann-Whitney de níveis de metilação para clusters dentro das diferentes subclasses (FIG. 1E), o número de clusters dentro de cada subclasse foi subamostrada até a menor subclasse (a subclasse drm2/nrpe1) para permitir valores de significância comparáveis entre as subclasses. Identificação de clusters de siRNA
[0214] Pequenos clusters de RNA no genoma de Arabidopsis foram definidos de uma maneira semelhante a uma abordagem previamente publicada (Heisel et al., 2008). Em resumo, o genoma foi dividido em intervalos de 200 pb, e a cobertura média por intervalo de leituras não idênticas de siRNA foi calculada em duas réplicas técnicas da biblioteca do tipo selvagem (Col). Esta média foi utilizada para ensaiar a significância do número de leituras não idênticas a um dado intervalo em plantas do tipo selvagem, assumindo uma distribuição de Poisson de tais contagens. No ambiente R um teste exato de Poisson foi realizado para cada intervalo, e intervalos com um valor de P inferior a 1e-5 em cada réplica técnica do tipo selvagem foram considerados como clusters.
[0215] Uma vez que os clusters foram definidos, as comparações entre as contagens de leitura, incluindo leituras idênticas, foram realizadas para cada mutante e a biblioteca do tipo selvagem (Col) utilizando o teste exato de Fisher. Os valores de P resultantes foram ajustados de acordo com o método de Benjamini-Hochberg para estimar FDRs, e clusters reduzidos em um fundo de mutante a um FDR <1e-10 que foram então considerados dependentes da função no tipo selvagem da proteína mutante. Para a análise boxplot dos níveis de siRNA, a primeira réplica técnica da biblioteca de Col foi utilizada como representativa dos níveis de siRNA Col. Para o cálculo de níveis de significância de mudanças de siRNA através do teste U de Mann-Whitney de níveis de siRNA para clusters dentro de subclasses genotípicas diferentes (FIG. 1D), o número de clusters dentro de cada subclasse foi subamostrado até a menor subclasse (a subclasse drm2/nrpe1) para permitir valores de significância comparáveis entre as subclasses. Identificação de picos de NRPD1
[0216] O pacote R BayesPeak (Spyrou et al., 2009; Cairns et al., 2011) foi usado para identificar regiões de enriquecimento da Pol-IV em uma biblioteca de NRPD1-Flag ChIP-SEQ, em comparação a uma biblioteca de controle emparelhada de Col ChIP-seq feita em paralelo. Somente picos de alta pontuação (PP>0,999) identificados em ambas réplicas de NRPD1-Flag ChIP-seq (928 picos) foram mantidas para análise posterior. Para efeitos de ensaio de sobreposição de picos da Pol IV com clusters de siRNA, “sobreposição” foi chamada quando >= 1 pb de um pico sobrepõe com um locus.
[0217] Para classificar picos como dependente, independente ou aprimorado de SHH1, as contagens de leitura de picos da Pol IV foram comparadas entre o NRPD1-Flag e NRPD1-Flag; bibliotecas de shh1 ChIP-seq, e a significância foi avaliada pelo teste exato de Fisher. Os valores de P resultantes foram ajustados de acordo com o método de Benjamini-Hochberg para estimar FDRs. Picos com uma perda de sinal de NRPD1 na biblioteca de shh1 a uma FDR <0,001 foram considerados dependentes de SHH1. Do mesmo modo, os picos que ganharam sinal em shh1 a uma FDR <0,001 foram considerados aprimorados de SHH1. Picos que não se enquadraram em nenhuma destas categorias foram considerados independentes de SHH1. Preparação de proteína
[0218] O gene que codifica o domínio SAWADEE de SHH1 (resíduos 125-258) foi clonado em um vetor auto modificado, que funde um tag de hexa-histidina mais um tag de sumo de levedura sobre o N-terminal do gene alvo. O plasmídeo foi transformado em E. coli cepa BL21 (DE3) RIL (Stratagene). As células foram cultivadas a 37°C até que o OD 600 atingisse 0,8 e, em seguida, o meio foi resfriado a 20°C e IPTG 0,2 mM foi adicionado para induzir a expressão da proteína durante a noite. A proteína recombinante expressa foi primeiramente purificada utilizando uma coluna HisTrap FF (GE Healthcare). O tag de hexa-histidina-sumo foi clivado pela protease Ulp1 e removido através da passagem em uma segunda coluna HisTrap FF. A proteína agrupada alvo foi adicionalmente purificada usando uma coluna Q FastFlow e uma coluna Hiload Superdex G200 16/60 (GE Healthcare) com tampão (NaCl 150 mM, Tris 20 mM, pH 8,0, e DTT 5 mM). A fim de preparar a proteína substituída por Se-metionina, a Leu200 e Leu218 do domínio SAWADEE foram mutadas para metionina usando um Kit QuikChange Site Directed Mutagenesis (Stratagene). A proteína SAWADEE substituída com Se-metionina foi purificada utilizando o mesmo protocolo assim como a proteína tipo selvagem. Os peptídeos foram sintetizados em uma instalação de síntese de peptídeos. Cristalização
[0219] A cristalização do domínio SAWADEE foi conduzida a 4°C utilizando o método de difusão de vapor em gota sentada através da mistura de 1 μL de amostra de proteína a uma concentração de 5 mg/mL e 1 μl de solução reservatório (NH4F 0,2 M e PEG 3350 20%), que foi equilibrada contra 0,4 mL de reservatório. 4-Ciclohexil-1-Butil-β-D- maltosídeo (CYMAL®-4, Hampton Research) foi adicionado na gota com uma concentração final de 7,6 mM como um aditivo, o que resultou em melhoria considerável na qualidade do cristal. Cristais em forma de placa fina apareceram em 2 dias. Para criar cristais de complexos do domínio SAWADEE com peptídeos H3 modificados, o domínio SAWADEE foi misturado com peptídeos a uma razão molar de 1:2 a 4°C durante 1 hora. Os cristais de diferentes complexos foram cultivados sob as mesmas condições como descrito para a proteína de livre de SAWADEE. Todos os cristais foram embebidos em uma solução reservatório suplementada com 20% de glicerol durante 2 minutos. Os cristais foram então montados sobre um loop de náilon para a coleta de dados de difração. Os dados de difração da proteína de SAWADEE nativa e sua contraparte substituída por Se-metionina foram coletados no NE-CAT beamline 24ID-C, Advanced Photosn Source (APS), Argonne National Laboratory, Chicago, no pico de zinco e pico de selênio, respectivamente. Os dados do complexo do peptídeo H3K9me3 ligado ao domínio SAWADEE foram coletados em beamline X29A, National Synchrotron Light Source (NSLS) no Brookhaven National Laboratory, Nova Iorque. Os dados sobre o domínio SAWADEE em complexo com peptídeos H3K9me2, H3K9me1 e H3K4me1K9me1 foram coletados no APS 24ID-E. Todos os dados cristalográficos foram processados com o programa HKL2000 (Otwinowski et al., 2011). Determinação e refinamento da estrutura
[0220] A estrutura do domínio SAWADEE substituído por selenometionina foi resolvida utilizando o método da dispersão anômala a comprimento de onda único (SAD), como implementado no programa Phenix (Adams et al., 2010). A construção do modelo foi realizada utilizando o programa Coot (Emsley et al., 2010) e o refinamento estrutural usando o programa de Phenix. A estrutura do domínio SAWADEE do tipo selvagem no estado livre foi resolvido utilizando o método de substituição molecular utilizando o programa Phenix. Íons Zn2+ foram identificados e ainda confirmados por dispersão de sinal anômalo. Todas as estruturas do domínio SAWADEE em complexos com diferentes peptídeos H3 modificados foram resolvidos utilizando o método de substituição molecular com o mesmo protocolo que a proteína nativa. Durante todo o refinamento, um fator R livre foi calculado usando 5% de reflexões escolhidas ao acaso. A estereoquímica dos modelos estruturais foi analisada utilizando o programa Procheck (Laskowski et al., 1993). Todos os gráficos moleculares foram gerados com o programa PyMOL (DeLano Scientific LLC). Calorimetria de titulação isotérmica
[0221] Todos os experimentos de ligação foram realizados em um calorímetro Microcal ITC 200 a 6°C. Primeiro, amostras de proteína foram dialisadas durante a noite contra um tampão de NaCl 100 mM, β-mercaptoetanol 2 mM e HEPES 20 mM, pH 7,5, a 4°C. Em seguida, as amostras de proteínas foram diluídas e os peptídeos liofilizados foram dissolvidos com o mesmo tampão. A titulação foi realizada de acordo com o protocolo padrão e os dados foram ajustados utilizando o programa Origin 7.0 com um modelo de ligação 1:1. Ligação de arranjos de peptídeos modificados
[0222] Um construto do domínio SAWADEE de GST-SHH1 (125-258 aa) foi gerado no plasmídeo pENTR/TEV/D (Invitrogen), recombinado no plasmídeo pDEST 15 (Invitrogen) e transformado na linhagem celular bacteriana Rosetta 2 (DE3) (Novagen). A expressão de proteínas foi induzida pela adição de 500 μL de IPTG 1M por 500 mL a um OD de 0,6 e as culturas foram cultivadas a 16°C durante a noite. No momento da indução, o meio foi suplementado com 500 μL de ZnSO4 500 mM. A proteína de fusão GST foi então purificada tal como anteriormente descrito (Johnson et al., 2008) e dialisada para um tampão de armazenamento (Tris 50 mM pH 6,8, NaCl 300 mM, glicerol 40%, DTT 2 mM, triton X-100 0,1%). A proteína purificada GST-SHH1 (125-258 aa) foi utilizada para sondar um arranjo de peptídeo de histona MODified™ (Motivo Ativo) sob as seguintes condições: O arranjo foi bloqueado a 25°C durante 45 min em solução de leite 5% TBS 1x, lavada três vezes em uma solução TBS-T 1x a 25°C durante 5 minutos e, em seguida sondadas durante a noite a 4°C com o domínio SAWADEE da proteína GST-SHH1 a uma concentração de 6,5 μg/mL em um Tampão de Ligação (HEPES 50 mM, pH 7,5, NaCl 50 mM, glicerol 5%, BSA 0,4 mg/mL, DTT 2 mM). O arranjo foi então lavado três vezes como descrito acima, e sondado a um anticorpo GST conjugado a HRP em diluição de 1:5000 a 25°C durante 1 hora. O arranjo é então lavado como descrito acima e desenvolvido utilizando um kit ECL Plus (GE Healthcare). Linhagens de plantas, mutagênese sítio dirigida, southern e western blotting
[0223] Os vários alelos mutantes de Arabidopsis RdDM caracterizados anteriormente, a complementação SHH1-3xMyc- BLRP da linhagem de planta transgênica, e o construto de pSHH1::SHH1-3xMyc-BLRP utilizados são como anteriormente descritos (Law et al., 2011). As pol-iv e pol-v mutantes correspondem a mutações nas subunidades nrpd1 e nrpe1 destas polimerases, respectivamente. As mutações baseadas em estrutura foram geradas no construto de pSHH1::SHH1-3xMyc- BLRP usando um Kit QuikChange Site Directed Mutagenesis (Stratagene) e foram transformadas em um fundo shh1-1 mutante através do método de mergulho floral. Experimentos de siRNA- seq e Chip-seq nas linhagens mutantes de Col e RdDM foram realizados utilizando tecido floral e experimentos de BS-seq foram realizados utilizando 10 dias da germinação. Experimentos de Southern e western blotting foram realizados utilizando tecidos das mesmas linhagens de plantas individuais na geração T1 e utilizando sondas (Johnson et al., 2008) e anticorpos (Law et al., 2010) anteriormente descritos. Os experimentos de siRNA-seq e BS-seq nas linhagens mutantes pontuais do domínio SAWADEE foram realizados utilizando tecido floral ou 10 dias da germinação, respectivamente, a partir de plantas homozigotas T3 para os vários transgenes de pSHH1::SHH1-3xMyc-BLRP. Os experimentos de Pol IV ChIP e experimentos de co-imunoprecipitacão nos vários fundos mutantes pontuais do domínio SAWADEE foram realizados utilizando tecidos florais das plantas F1 que eram homozigotas para o mutante alelo shh1.
Resultados
[0224] Para investigar o papel de SHH1 na via de genoma inteiro de RdDM, perfis de siRNA foram gerados em plantas Col do tipo selvagem, plantas shh1 mutantes, e vários outros mutantes RdDM para comparação. Em plantas tipo selvagem foram definidos clusters de ~12.500 siRNA, o que representa 84,2% de todos os mapeamentos exclusivos de 24 nt de siRNAs. Consistente com os resultados anteriores, 81,4% destes siRNAs foram dependentes de Pol-IV (Mosher et al., 2008; Zhang et al., 2007) (FIG. 1A). Análise de clusters reduzidos de siRNA em shh1 mutantes demonstraram que SHH1 é um regulador principal dos níveis de siRNA, atingindo 44% dos arranjos dependentes de Pol-IV, o que representa a maior parte de todos os siRNAs de 24 nt, incluindo a maioria dos clusters que foram reduzidos em dois mutantes de RdDM à jusante (drm2 e pol-v) (FIG. 1B). A sobreposição dos clusters reduzidos de siRNA nestes mutantes formaram quatro subclasses principais (denominadas pol-iv apenas, shh1, shh1/drm2/pol-v, e drm2/pol-v; FIG. 1B), que foram utilizados para análises subsequentes. Os clusters que dependem exclusivamente de Pol-IV foram mais enriquecidos na heterocromatina pericentromérica do que aqueles que também dependem de SHH1, DRM2, e Pol-V (FIG. 1C), sugerindo que os diferentes mecanismos podem controlar a produção de siRNA nos braços eucromáticos versos a heterocromatina pericentromérica.
[0225] Em mutantes shh1, os níveis de siRNA nos clusters dependentes de SHH1 (subclasses shh1 e shh1/drm2/pol-v) foram reduzidos a quase zero, enquanto os níveis de siRNA nos clusters independentes de SHH1 experimentaram pouca ou nenhuma mudança (FIG. 1D). Estes resultados demonstram que SHH1 é um componente RdDM específico do locus que tem fortes efeitos em um grande subconjunto do loci de RdDM. Notavelmente, os dois mutantes RdDM à jusante (drm2 e pol-v) têm efeito mais forte sobre os níveis de siRNAs em clusters que também exigem SHH1 (subclasse shh1/drm2/pol-v), e estes mesmos clusters estão entre os clusters produzindo siRNA mais altos e correspondem aos mais elevados níveis de metilação de CHH no genoma (Cokus et al., 2008) (FIG. 1D, 1E). Juntos, estes resultados sugerem que SHH1, e os mutantes RdDM à jusante, estão especificamente convergindo para controlar os níveis de siRNA nos sítios mais ativos de RdDM.
[0226] Usando o sequenciamento bissulfito de genoma inteiro (BS-seq), avaliamos os níveis de metilação do DNA nos loci mostrando níveis reduzidos de siRNA e descobriu-se que consistente com a sua interação com Pol-IV, SHH1 é um componente RdDM à montante; mutantes shh1 apenas afetam a metilação do DNA em sítios onde os níveis de siRNA são reduzidos (FIG. 1E). Além disso, os siRNAs residuais presentes no mutante shh1 parecem direcionar alguma metilação, como previsto para um componente RdDM à montante. Isto está em contraste com os mutantes à jusante, drm2 e pol-v, que reduziram a metilação do DNA para próximo dos níveis pol-iv mesmo em sítios que amplamente retêm siRNAs (FIG. 1E), presumivelmente devido a uma incapacidade de utilizar os siRNAs para direcionar a metilação do DNA.
[0227] Nos loci correspondentes às subclasses shh1/drm2/pol-v e drm2/pol-v dos clusters de siRNA, as perdas observadas de siRNAs foram acompanhadas com uma perda correspondentemente grande de metilação de DNA (FIG. 1E). No entanto, nas subclasses pol-iv only e shh1, grandes perdas de siRNAs foram acompanhadas por perda relativamente pequena de metilação do DNA. Sem pretender se limitar pela teoria, acredita-se que uma possível explicação para esta descoberta é que outras vias de metilação de DNA são mais ativas em sítios correspondentes aos clusters de pol-iv apenas e shh1 de siRNA. Em adição à via RdDM, a metilação do DNA é controlada por duas vias metiltransferase de manutenção (Law and Jacobson, 2010): a via DNA METILTRANSFERASE 1 (MET1), que atua para manter metilação CG, e a via CROMOMETILTRANSFERASE 3 (CMT3), que atua juntamente com várias histona H3K9 metiltransferases para manter CHG e algumas metilações CHH (Cao et al., 2003). Consistente com esta noção de redundância de metiltransferase, as subclasses pol-iv only e shh1 dos clusters reduzidos de siRNA exibiram os níveis mais elevados da ocupação de CMT3 (Du et al., 2012) (FIG. 1F), sugerindo que na ausência de uma via RdDM funcional, a via CMT3 é capaz de manter a metilação do DNA em níveis quase do tipo selvagem nestes loci. Em contraste, as subclasses shh1/drm2/pol-v e drm2/pol-v, as quais mostram dramáticas perdas de metilação do DNA em mutantes RdDM, exibem níveis mais baixos de enriquecimento da CMT3 (FIG. 1F) e são mais altamente e precisamente enriquecidos para a polimerase Pol-V (Zhong et al., 2012) (FIG. 1F, 1G), o que sugere que eles são direcionados principalmente pela via RdDM.
[0228] Um perfil de genoma inteiro da ocupação de Pol-IV em fundos do tipo selvagem e mutante shh1 foi determinado através de imunoprecipitação de cromatina de uma versão Flag-tagged da subunidade Pol-IV maior, NRPD1 (Law et al., 2011), seguido de sequenciamento de alto rendimento (ChIP-seq). Consistente com o perfil dos clusters de siRNA dependentes de Pol-IV, a Pol-IV foi largamente enriquecida na heterocromatina pericentromérica e nas subclasses definidas dos clusters de siRNA (FIG. 2A, 2B). No fundo de mutante shh1, os níveis de Pol-IV foram drasticamente reduzidos ou especificamente eliminados em cluster de siRNA dependentes de shh1 (FIG. 2A), apoiando ainda mais a relevância biológica do perfil de ChIP-seq e confirmando que o fenótipo de siRNA reduzido de mutantes shh1 é devido à associação da cromatina de Pol-IV alterada. Os níveis de Pol-IV em clusters de siRNA independentes de shh1, como os níveis de siRNA, não foram reduzidos em um mutante shh1 (FIG. 2A), sugerindo que o direcionamento de Pol-IV a estes loci requer um mecanismo alternativo.
[0229] Além da avaliação os níveis de enriquecimento de Pol-IV ao longo das subclasses do cluster de siRNA afetadas, foram definidos 928 picos de Pol-IV reprodutíveis, de alta confiança, utilizando vários conjuntos de dados ChIP- seq. Estes picos foram enriquecidos para siRNAs e metilação do DNA e preferencialmente sobrepostos com clusters de siRNA shh1/drm2/pol-v ou drm2/pol-v de alta produção em comparação aos clusters pol-iv apenas e shh1 (P<2.2e-16, Teste Exato de Fisher), sugerindo que o procedimento ChIP está preferencialmente identificando sítios onde Pol-IV é mais ativa. Nos 928 picos de Pol-IV definidos foi observado um nível variável de dependência de SHH1, o que levou a divisão dos picos em três categorias, independentes de SHH1, dependentes de SHH1, e aprimorados de SHH1. Em mutantes shh1, a metilação do DNA e os níveis de siRNA foram reduzidos nos sítios dependentes de SHH1 e, em menor grau, nos sítios definidos como independentes de SHH1. No entanto, os níveis de siRNA e Pol-IV foram aumentados em sítios aprimorados de SHH1 em mutantes shh1, sugerindo uma redistribuição de Pol- IV para esses sítios em mutantes shh1. Estes sítios aprimorados de SHH1 são únicos entre os picos Pol-IV, uma vez que eles exibem níveis muito baixos de enriquecimento de Pol-V, o que poderia explicar o baixo nível de metilação CHH correspondente observada nestes sítios em plantas do tipo selvagem. Juntamente com a análise dos clusters de siRNA dependentes de SHH1, estes resultados demonstram que SHH1 desempenha um papel crítico na facilitação da associação da cromatina de Pol-IV em um subconjunto dos sítios mais ativos de RdDM. SHH1 representa, assim, o primeiro fator conhecido para afetar o direcionamento de Pol-IV, controlando a iniciação de RdDM.
[0230] Para obter discernimento sobre o mecanismo através do qual SHH1 facilita o direcionamento de Pol-IV, a função do seu domínio SAWADEE, um domínio específico da planta de função desconhecida (Mukherjee et al., 2009), foi investigada. Os alinhamentos de sequências de proteínas SHH1 de diversas espécies são apresentados na FIG. 10. A capacidade do domínio SAWADEE para ligar as caudas das histonas modificadas utilizando um arranjo de peptídeo modificado de Motivo Ativo foi testada. Este ensaio revelou que o domínio SAWADEE tem uma preferência para metilação em H3K9, mas também é influenciada pelo estado de metilação do resíduo H3K4, somente inalterado ou com modificações em H3K4me1 sendo tolerados. Para confirmar estes resultados, experimentos de calorimetria isotérmica (ITC) foram realizados utilizando peptídeos de cauda de histona modificados (FIG. 3A, 3B). Estas análises revelaram que o domínio SAWADEE é único em sua capacidade de ligar todos os três estados de metilação em H3K9 (me1, me2, e me3) com afinidade muito semelhante, Kd « 2 μM, que é aproximadamente 17 vezes maior do que o observado usando peptídeos H3 não modificados (FIG. 3A). Experimentos ITC também confirmaram que, embora o domínio SAWADEE irá ligar os peptídeos H3K9me2 que contêm modificações em H3K4me1, a presença de modificações em H3K4me2 ou H3K4me3 resultaram em afinidade de ligação reduzida. Finalmente, os experimentos ITC, utilizando peptídeos modificados correspondentes a todos os outros resíduos de lisina metilada conhecidos nas caudas N- terminais das proteínas histonas do núcleo, confirmaram a especificidade do domínio SAWADEE de SHH1 para metilação em H3K9 (FIG. 3B). Conjuntamente, estes estudos de ligação demonstram que o domínio SAWADEE é um novo módulo de ligação de cromatina que sonda com ambas as posições K4 e K9 da cauda H3 e liga-se especificamente às modificações metil repressivas em H3K9.
[0231] De acordo com a especificidade de ligação observada in vitro do domínio SAWADEE de SHH1, picos de Pol- IV Chip-seq dependentes de SHH1 são enriquecidos para H3K9me2 (FIG. 3B). Picos de Pol-IV Chip-seq são esgotados por metilação em H3K4.
[0232] Para determinar o modo de reconhecimento da metil-lisina pelo domínio SAWADEE de SHH1, foram resolvidas as estruturas cristalinas deste domínio, no estado livre ou no complexo com caudas H3 modificadas (FIG. 3D). No estado livre, o domínio SAWADEE de SHH1 adota uma dobra do tipo domínio Tudor em tandem que contém um motivo de ligação ao zinco único situado dentro do subdomínio Tudor 2 (FIG. 3D), tornando SHH1 membro fundador de uma nova subclasse de dobra do domínio Tudor em tandem (Bian et al., 2011). Nesta estrutura, um íon zinco é coordenado por resíduos de cisteína e histidina altamente conservados (Mukherjee et al., 2009). Uma busca DALI indicou que a estrutura global do domínio SAWADEE assemelha-se ao domínio Tudor em tandem de UHRF1 com uma r.m.s.d. de 2,3 Â apesar de compartilhar apenas 11,8% de identidade de sequência (Holm and Rosenstrom, 2010; Nady et al., 2011). Esta constatação demonstra que, embora a sequência do domínio SAWADEE seja específica da planta sua dobra é altamente conservada em organismos eucarióticos.
[0233] As estruturas do domínio SAWADEE de SHH1 em complexos com peptídeos H3K9me1, H3K9me2 e H3K9me3 também foram resolvidas e todos os três peptídeos foram ligados de um modo semelhante. A estrutura de 2,70 Â resolvida com um peptídeo H3(1-15)K9me2 (FIG. 4A) foi adicionalmente analisada. Este peptídeo liga-se com direcionalidade em um sulco entre os dois subdomínios Tudor, formando contatos com ambos os subdomínios (FIG. 4A, 4B, 4C). As estruturas livres e ligadas a H3K9me2 do domínio SAWADEE podem ser bem sobrepostas (FIG. 4D) demonstrando que não existe uma alteração conformacional significativa no domínio SAWADEE na ligação do ligante, um achado que difere da situação relatada para UHRF1 (Nady et al., 2011).
[0234] Dentro do domínio SAWADEE de SHH1, existem dois bolsos que formam interações intermoleculares com K4 não modificada e as cadeias laterais K9me2 do peptídeo ligado (FIG. 4E, 4F). As cadeias laterais H3K4 não modificadas inserem-se em um bolso interfacial formado por resíduos de ambos subdomínios Tudor 1 e Tudor 2. Neste bolso, a cadeia lateral K4 é estabilizada através de ligações intermoleculares de hidrogênio e interações eletrostáticas com as cadeias laterais de Glu130 e Asp141 (FIG. 4E). A cadeia lateral H3K9me2 insere-se em uma gaiola aromática hidrofóbica formada por resíduos do subdomínio Tudor 1 (FIG. 4F) onde é estabilizada por interações cátions-n de um modo semelhante ao descrito anteriormente para os módulos de ligação da lisina metilada (Taverna et al., 2007). Os complexos H3K9me3-SAWADEE e H3K9me1-SAWADEE também posicionam as lisinas metiladas dentro da mesma gaiola aromática. Sem pretender se limitar pela teoria, acredita- se que a capacidade do domínio SAWADEE de se ligar igualmente contra todos os três estados de metilação de H3K9 pode ser bem explicada por observações estruturais: o reconhecimento da lisina metilada da gaiola aromática pode acomodar ambas cadeias laterais H3K9me2 e H3K9me3 através de interações hidrofóbicas comuns com a gaiola aromática, o que resulta em uma falta de discriminação entre estes dois estados de metilação. No complexo H3K9me1, embora o estado mais baixo de metilação da lisina tenha uma interação hidrofóbica diminuída com a gaiola aromática, a cadeia lateral de His169 sofre uma alteração conformacional pequena, mas significativa, para o hidrogênio ligar-se ao próton do amônio de K9me1, contribuindo, assim, para a recuperação da afinidade de ligação. Esta falta de especificidade para o estado de metilação de K9 está em contraste com o nível mais elevado de especificidade de metilação observada para o domínio Tudor em tandem de UHRF1, que tem uma gaiola aromática ligeiramente mais larga ligando-se ao bolso composto por uma combinação diferente de resíduos de Phe e Tyr. Sem pretender se limitar pela teoria, acredita-se que isto resulta em requisitos de diferente forma de complementaridade. A análise estrutural indica como as mudanças muito sutis na dobra do domínio Tudor em tandem podem resultar em um ajuste fino de especificidade da metil- lisina.
[0235] A estrutura do domínio SAWADEE em um complexo com um peptídeo H3(1-15)K4me1K9me1 também foi resolvido. No geral, esta estrutura se assemelha à estrutura com o peptídeo H3K9me2, com o K4me1 acomodado no interior do mesmo bolso de ligação de K4. No entanto, o grupo metil forma uma interação hidrofóbica de estabilização com Leu201 no lugar da ligação de hidrogênio que é formada entre o próton do amônio de K4 não metilado e a cadeia lateral de Glu130 (FIG. 4G). Uma vez que este bolso de ligação de K4 é relativamente estreito e fechado, estados de metilação mais elevados de K4 provavelmente introduziriam conflitos estéricos e/ou interromperiam todas as interações por ligações de hidrogênio. Sem pretender ficar limitado pela teoria, acredita-se que isto explica as diminuições observadas na afinidade de ligação.
[0236] Para testar a significância biológica da atividade de ligação de metil-H3K9 observada para o domínio SAWADEE de SHH1, mutações pontuais foram criadas dentro dos dois bolsos de ligação de lisina bem como do motivo de ligação ao zinco. Foi analisado o impacto destas mutações na metilação do DNA, níveis de siRNA, e recrutamento da Pol-IV in vivo. Especificamente, estas mutações pontuais foram engenheiradas em um construto SHH1-3xMyc-BLRP e transformadas em um fundoo de mutante shh1. Níveis de metilação de DNA foram avaliados em um locus bem caracterizado, MEA-ISR, por southern blotting e o genoma inteiro por experimentos BS-seq (FIG. 4H). A adição de um transgene SHH1-3xMyc-BLRP do tipo selvagem restaurou a metilação do DNA, mas construtos abrigando mutações nos bolsos de H3K9 ou H3K4 foram incapazes de completar totalmente o defeito de metilação observado no mutante shh1 (FIG. 4H) apesar de ser expresso em níveis comparáveis à proteína SHH1-3xMyc-BLRP do tipo selvagem. As mutações em resíduos de coordenação de zinco resultaram em níveis quase indetectáveis de proteínas e, assim, não foram adicionalmente caracterizados.
[0237] Semelhante ao mutante shh1 nulo, os defeitos de metilação do DNA nos mutantes de bolso de ligação de lisina de SHH1 são mais pronunciados na subclasse shh1/drm2/pol-v de clusters de siRNA afetados (FIG. 4H) e consistentes com as suas posições e contribuições previstas para a afinidade de ligação do domínio SAWADEE de SHH1, mutantes F162AF165A e D141A exibem fortes defeitos de metilação de DNA (Fig. 4H). De acordo com as reduções observadas na metilação do DNA, a avaliação dos níveis de siRNA no bolso de ligação de lisina mutante através experimentos de siRNA-seq revelou um padrão semelhante de defeitos, com mutantes F162AF165A e D141A novamente exibindo um fenótipo mais forte (Fig. 4I). Para determinar se as perdas de siRNAs e da metilação de DNA observadas refletem um defeito na atividade de Pol-IV na cromatina, experimentos de Pol-IV ChIP foram realizados nos fundos mutantes pontuais no domínio SAWADEE. Todos os quatro mutantes pontuais apresentaram níveis reduzidos de ocupação de Pol-IV em duas replicatas biológicas (Fig. 4J). Além disso, a co- imunoprecipitação mostrou que mutantes pontuais no domínio SAWADEE de SHH1 ainda eram capazes de interagir com a Pol IV, demonstrando que a interação entre SHH1 com o complexo Pol IV não é dependente da sua atividade de ligação a H3K9me. Juntos, estes resultados mostram que resíduos dentro de ambos bolsos de ligação de K4 e K9 são críticos para a função de SHH1 in vivo e demonstram um papel para a ligação metil-H3K9 por SHH1 ao nível da associação de Pol IV à cromatina.
[0238] Verificou-se que o bolso de ligação de H3K4 é importante para a função de SHH1 in vivo. O SAWADEE de SHH1 não liga a metilação em H3K4 na ausência de metilação em H3K9 e a adição de um grupo metil em K4 não confere qualquer afinidade de ligação adicional. Sem pretender se limitar pela teoria, acredita-se que a mera presença de uma lisina na posição de cinco resíduos para trás a partir do resíduo H3K9 metilado é necessária para a ligação do domínio SAWADEE. Tal leitura dupla de lisina poderia servir para ajudar a assegurar que apenas o domínio SAWADEE se ligue a metilação de lisina quando ela está presente na posição K9 da cauda H3 em oposição a uma lisina metilada em uma posição diferente na cauda H3 ou mesmo sobre uma histona diferente ou proteína não histona. Experimentos ITC foram conduzidos usando caudas H3 abrigando uma mutação H3K4A com ou sem a presença da modificação H3K9me2. O domínio SAWADEE se liga ao peptídeo H3K4AK9me2 com afinidade aproximadamente 30 vezes mais fraca do que o peptídeo H3K9me2. Além disso, o domínio SAWADEE de SHH1 se liga ao peptídeo H3K4A com afinidade mais fraca do que a cauda H3 tipo selvagem, demonstrando que o resíduo de K4 está contribuindo para ligação independente do estado de metilação do resíduo K9.
[0239] Junt as, estas análises in vivo e in vitro demonstram que o domínio SAWADEE de SHH1 está sondando a cauda H3 em ambas posições K4 e K9 e é muito seletivo para a combinação de modificações de histonas presentes em transposons e outros elementos repetitivos do DNA, nomeadamente H3K4 não modificada e H3K9 metilada. Embora a metilação em H3K9 esteja anti-correlacionada com a metilação em H3K4 de genoma inteiro (Zhang et al., 2009). Sem pretender se limitar pela teoria, acredita-se que a aversão do domínio SAWADEE para a maior ordem de metilação em H3K4 poderia servir para permitir a transcrição, a qual está correlacionada com metilação em H3K4, para superar a metilação do DNA, e modificações a metil em H3K9 repressivas associadas em uma maneira de desenvolvimento ou locus específica. Da mesma forma, a especificidade do domínio SAWADEE poderia inibir a criação de siRNA em corpos metilados do gene que contêm metilação CG e modificações metil em H3K4, mas a falta de CHG e metilação CHH, bem como os siRNAs (Cokus et al., 2008; Zhang et al., 2009; Zhang et al., 2006).
[0240] Em resumo, foi demonstrado que SHH1 é uma nova proteína de ligação da cromatina que funciona na RdDM para permitir o recrutamento e/ou a estabilidade de Pol-IV nos loci genômicos mais ativamente tidos como alvos, a fim de promover a biogênese de siRNA. Sem pretender se limitar pela teoria, acredita-se que a descoberta de que SHH1 ligase às modificações repressivas de histonas, em conjunto com a observação de que SHH1 é necessária para a associação de cromatina Pol-IV em um conjunto semelhante de loci como mutantes RdDM à jusante, poderia explicar o loop de auto- reforço previamente observado em que são necessários mutantes RdDM à jusante para a produção de níveis totais de siRNAs a partir de um subconjunto de loci genômicos (Zilberman et al., 2004; Xie et al., 2004; Li et al., 2006; Pontes et al., 2006) uma vez que foi demonstrado que mutantes RdDM à jusante podem causar uma redução de ambas metilação do DNA e metilação em H3K9 em loci de RdDM (Zilberman et al., 2003).
Exemplo 2
[0241] O seguinte Exemplo se refere à caracterização das proteínas SUVH2 e SUVH9 de Arabidopsis thaliana e os seus envolvimentos na promoção da metilação do DNA dirigida por RNA e o silenciamento do gene.
Introdução
[0242] O estabelecimento de toda a metilação do DNA e manutenção da maior parte da metilação não GC envolve a via de metilação do DNA dirigida pelo RNA (RdDM) (Aufsatz et al., 2002; Pelissier e Wassenegger, 2000). Sem pretender se limitar pela teoria, acredita-se que existem duas etapas principais nesta via que são pensadas para direcionar a DNA metiltransferase, DOMÍNIOS REARRANJADOS METITRANSFERASE 2 (DRM2) (Cao and Jacobsen, 2002). A primeira etapa à montante envolve a síntese de RNAs de interferência pequenos de 24 nucleotídeos (siRNAs) pelas ações concertadas de RNA POLIMERASE IV (Pol IV ou NRPD), RNA POLIMERASE 2 DIRIGIDA POR RNA (RDR2) e DICER-LIKE 3 (DCL3) (Pontier et al., 2005). A segunda etapa à jusante compreende a produção de transcrições de estrutura pela RNA POLMERASE V (Pol V ou NRPE) com a ajuda do complexo DDR (DRD1, um remodelador de cromatina SWI/SNF2; DMS3, uma proteína de arquitetura cromossômica; RDM1, função desconhecida). Sem pretender se limitar pela teoria, acredita-se então que ARGONAUTE 4 (AGO4) carregada com um siRNA de 24 nucleotídeos se liga a transcritos de Pol V e, de uma forma desconhecida, atua para dirigir DRM2 ao DNA para a metilação (Law et al., 2010; Pikaard et al., 2008; Wierzbicki et al., 2009).
[0243] Este Exemplo demonstra que a transcrição da Pol V e a sua ligação estável à cromatina são dependentes do genoma completo de SUVH2/SUVH9. Estes sítios de ligação da Pol V são enriquecidos na metilação do DNA e, em muitos casos, com a metilação H3K9 da histona. Além disso, é demonstrado que amarrar a SUVH2 aos epialelos fwa-4 não metilados resulta no estabelecimento da metilação do DNA e silenciamento do gene FWA. Este estabelecimento de metilação coincide com o recrutamento de Pol V, mas não com o enriquecimento imediato da metilação de histonas, o que sugere que a metilação de histonas é secundária ao estabelecimento da metilação do DNA. Uma estrutura de cristal de 2,4 Â de SUVH9 é também mostrada, definindo assim as dobras e as orientações relativas dos domínios de componentes nesta família de enzimas. Um feixe de duas hélices próximo ao N-terminal é posicionado entre e interage com os domínios SRA e pré-SET/SET. Um bolso de ligação ao cofator SAM incompletamente formado, bem como a ausência de uma fenda de ligação ao peptídeo substrato da histona dentro da estrutura de SUVH9 foi observado, refletindo a ausência do domínio pós-SET nesta enzima. Sem pretender se limitar pela teoria, acredita-se que isto possa explicar a sua falta de atividade metiltransferase in vitro. Estes resultados sugerem que SUVH2 e SUVH9 funcionam no recrutamento de Pol V para cromatina, fornecendo Pol V com um meio para ler marcas epigenéticas para dirigir a sua atividade.
Materiais e Métodos Materiais Biológicos
[0244] Todas as plantas utilizadas foram do acessão de Arabidopsis thaliana Columbia (Col-0), com WT referindo- se a cepa parental. As linhagens mutantes nrpe1-12 T-DNA (SALK_033852), suvh2suvh9 duplas e suvh4suvh5suvh6 triplas foram descritas anteriormente (Johnson et al., 2008; Pontier et al., 2005). Plantas transgênicas NRPE1-FLAG (El-Shami et al., 2007) foram cruzadas com mutante duplo de suvh2suvh9 e plantas F2 homozigotas foram identificadas. O epialelo fwa- 4 foi isolado a partir de uma população de segregação met1 em um fundo Columbia. Transcrição de Pol V e Imunoprecipitação de Cromatina
[0245] O RNA total foi isolado a partir de flores, utilizando o reagente TRIzol (Invitrogen) e utilizado para sintetizar a primeira fita de cDNA, usando SuperScript III (Invitrogen). PCR em Tempo Real foi realizado utilizando o SYBR Green SuperMix (Bio-Rad) na máquina MxPro3000 qPCR (Stratagene), seguindo as instruções do fabricante. ChIPs foram feitas usando 1-2 gramas de plantas ou flores de 3 semanas de idade e foram reticuladas in vivo ou in vitro com formaldeído 1% como anteriormente descrito (Zhong et al., 2012). Anti-H3K9me1 foi obtido a partir do Upstate (#07- 450), anti-H3K9me2 foi obtido a partir de Abcam (ab1220), e anti-NRPE1 foi um presente de Craig Pikaard. Geração de bibliotecas
[0246] Bibliotecas para histona de ChIP-seq foram criadas usando regentes paired-end da NEB e adaptadores da Illumina. As bibliotecas para NRPE ChIP foram criadas utilizando os kits multiplex NuGen. Bibliotecas BS-seq foram criadas tal como anteriormente descrito (Feng, 2011). Todas as bibliotecas foram sequenciadas utilizando a plataforma HiSeq 2000 seguindo as instruções do fabricante (Illumina) com um comprimento de 50 pb. Alinhamento
[0247] Leituras Bissulfito-Seq e ChIP-seq foram alinhadas à versão TAIR8 do genoma de referência de Arabidopsis thaliana usando BS-seeker e bowtie, respectivamente, permitindo até 2 desemparelhamentos. Apenas leituras exclusivamente mapeadas foram consideradas. Bibliotecas ChIP-seq foram normalizadas de modo a que todas as bibliotecas conteriam um número igual de leituras. Enriquecimento de NRPE1-Flag sobre sítios NRPE1 (Zhong et al., 2012) foi normalizado para Flag ChIP em Columbia (controle negativo). Metilação de histonas sobre sítios NRPE foi normalizada para 80 sítios determinados para conter níveis basais de metilação de histonas. Estes sítios escolhidos a dedo estavam em regiões que eram claramente mapeadas, mas também tinham outros sinais característicos de baixa metilação de histonas, tais como a proximidade de genes e baixa metilação do DNA. Construtos de dedo de Zn
[0248] O peptídeo contendo 6 dedos de Zn foi designado tal como descrito em Segal et al (Segal et al., 2003) e clonado em pUC57 com sítios Xho I em ambas extremidades (Genewiz). Este fragmento de Xho I foi excisado e inserido no único sítio de Xho I localizado entre o peptídeo BLRP e o tag HA no construto pENTR-SUVH2 (Johnson et al., 2008), que codifica um HÁ-tagged de SUVH2 impulsionado pelo promotor endógeno de SUVH2. Este ZF-SUVH2 foi então recombinado em JP726 (Johnson et al., 2008) e introduzido em fwa-4, utilizando a transformação mediada por agrobacterium. Linhagens transformadas foram selecionadas com BASTA. Tempo de florescimento
[0249] O tempo de florescimento das plantas cultivadas sob condições de dia curto foi determinado contando todas as roseta e folhas caulinares até a flor terminal. Determinou-se o número médio de folhas entre 2030 plantas. Preparação de proteína
[0250] O SUVH9 N-terminal truncado (resíduos 134 - 650) foi clonado num vetor pFastBacHT B (Invitrogen), que funde um tag de hexa-histidina seguido por um sítio de clivagem de TEV para o N-terminal do gene alvo. O plasmídeo foi transformado em E. coli cepa DH10Bac (Invitrogen) para gerar o bacmid. Baculovírus foi gerado por transfecção de células Sf9 com o bacmid seguindo o protocolo padrão Bac-to- Bac (Invitrogen). O vírus colhido foi subsequentemente utilizado para infectar as células Hi5 suspensas para a expressão da proteína recombinante. A proteína recombinante foi inicialmente purificada utilizando a coluna de cromatografia de afinidade de níquel (GE Healthcare). O tag de hexa-histidina foi clivado pela TEV protease. A proteína alvo foi ainda purificada utilizando uma coluna Q Sepharose e uma coluna de filtração em gel Superdex G200 (GE Healthcare). A proteína purificada foi concentrada a 15 mg/mL e armazenada a -80°C. Cristalização
[0251] Antes da triagem do cristal, a proteína SUVH9 foi misturada com o cofator putativo S-adenosil-L- homocisteína (SAH) em uma razão molar de 1:3 ou com SAH e um peptídeo H3 de histona (1-15) numa relação molar de 1:3:3, a 4°C durante 2 horas. A cristalização de SUVH9 foi realizada a 20°C utilizando o método de difusão de vapor de gota de suspensão através da mistura de 1 μL de amostra de proteína a uma concentração de 11,5 mg/mL e 1 μL de solução reservatório e equilibrando contra 500 μL de solução reservatório. SUVH9 foi cristalizado na condição de tiocianato de potássio 0,2 M, Bis-Tris propano 0,1 M pH 7,5, e PEG 3350 20% no estado livre, bem como na presença de SAH ou na presença de SAH e peptídeo H3 (1-15). Cristais em forma de quadrados apareceram em 2 semanas. Todos os cristais foram embebidos em uma solução reservatório suplementada com 15% de glicerol e prontamente resfriados em nitrogênio líquido para coleta de dados de difração. Os dados de difração foram coletados em beamline X29A, National Synchrothron Light Source (NSLS) em Brookhaven National Laboratory (BNL), Nova Iorque no comprimento de onda do pico de zinco. Os dados foram indexados, integrados e ainda escalados com o programa HKL2000 (Otwinowski and Minor, 1997). Determinação e refinamento da estrutura
[0252] A estrutura de SUVH9 no estado livre foi resolvida utilizando o método da dispersão anômala de comprimento de onda único implementado no programa Phenix (Adams et al., 2010). A construção do modelo foi realizada utilizando o programa Coot (Emsley et al., 2010) e o refinamento estrutural usando o programa Phenix (Adams et al., 2010). Durante todo o refinamento, um fator R livre foi calculado usando 5% de reflexões escolhidas ao acaso. A estereoquímica dos modelos estruturais foi analisada utilizando o programa Procheck (Laskowski et al., 1993). Os dados são indicativos de que cristais de SUVH9 em presença de SAH e na presença de SAH e peptídeo H3 (1-15) são de fato o cristal de SUVH9 no estado livre. Todos os gráficos moleculares foram gerados com o programa PyMOL (DeLano Scientific LLC).
Resultados
[0253] A síntese de RNAs não codificantes por Pol V é importante para a etapa à jusante no RdDM. Para determinar se SUVH2/SUVH9 atua antes ou após a síntese destes transcritos, a transcrição da Pol V foi ensaiada em diversos sítios caracterizados (IGN22 e P6 mostrados na FIG 5A) (Wierzbicki et al., 2008; Zhong et al., 2012). Verificou-se que o mutante duplo suvh9 suvh2 reduziu os transcritos da Pol V na mesma extensão que a Pol V mutante, nrpe1 (FIG. 5A). Estes resultados sugerem que SUVH2/SUVH9 são necessárias para a atividade de Pol V ou o seu recrutamento para cromatina. Usando imunoprecipitações de cromatina (ChIPs) de uma Pol V Flag-tagged, observou-se que apenas os níveis de fundo de ligação da Pol V foram encontrados em IGN5 e IGN22 no duplo mutante suvh2 suvh9 em comparação a um enriquecimento de 6 vezes no tipo selvagem (FIG. 5B). Dados de ChIP foram ainda analisados por sequenciamento da geração seguinte (ChIP-SEQ) e verificou-se que a ligação da Pol V em todos os sítios anteriormente identificados (Zhong et al., 2012) foi significativamente diminuída em um fundo de suvh2 suvh9 (FIG. 5C, 5D). Portanto, SUVH2 e SUVH9 são necessários não só para a atividade de Pol V, mas também para sua associação estável com a cromatina.
[0254] Para determinar o nível de metilação do DNA em sítios de ligação de Pol V em vários mutantes, o sequenciamento bissulfito do genoma inteiro foi realizado. Verificou-se que uma linhagem mutante suvh2 suvh9 reduziu a metilação CHH em 85%, que foi próxima a redução da metilação medida na linhagem mutante nrpe1 (FIG. 5E). Estas mesmas linhagens mutantes reduziram a metilação CHG em mais de 50% ressaltando que a via RdDM também é parcialmente responsável pela metilação CHG (Law and Jacobsen, 2010). Estes resultados demonstram que a metilação do DNA dirigida por RNA nos sítios de Pol V de genoma inteiro é dependente de SUVH2 e SUVH9. Verificou-se que a metilação em sítios de Pol V também foi parcialmente dependente da via SUVH4/SUVH5/SUVH6/CMT3, uma vez que o mutante triplo suvh4 suvh5 suvh6 reduziu a metilação CHG em sítios de Pol V em cerca de 75% (FIG. 5E; reduções similares foram observadas com um mutante cmt3).
[0255] Como SUVH2/SUVH9 estão na mesma família de proteínas SET como SUVH4/SUVH5/SUVH6, a metilação em H3K9 de histona de genoma inteiro por ChIP-seq foi analisada utilizando anticorpos específicos para H3K9me1 e H3K9me2. Foi observada uma alta correlação entre a metilação não CG do DNA e ambos H3K9me1 e H3K9me2. O duplo mutante suvh9 suvh2 não afetou de forma significativa os níveis de genoma inteiro de H3K9me1 ou H3K9me2, enquanto que o triplo mutante suvh4 suvh5 suvh6 teve uma redução significativa em ambos H3K9me1 e H3K9me2. Ambos H3K9me1 e H3K9me2 foram mapeados sobre sítios de ligação de Pol V e verificou-se que ambos estão enriquecidos em relação à média do genoma, embora H3K9me1 foi encontrado em níveis mais elevados do que H3K9me2. H3K9me1 foi reduzido em plantas triplo mutante suvh4 suvh5 suvh6 para os níveis de fundo em todos os sítios de Pol V, enquanto o duplo mutante suvh2 suvh9 resultou em perdas significativas de metilação de histonas (FIG. 5F). H3K9me2 não foi significativamente alterado em qualquer um dos mutantes.
[0256] Sem pretender se limitar pela teoria, acredita-se que as perdas observadas no duplo mutante suvh2 suvh9 podem ser diretas, mas várias linhas de evidência suportam que estas reduções na metilação de histona são uma consequência secundária da metilação de DNA reduzida. Em primeiro lugar, em alguns sítios, H3K9me1 faz parte de um patch maior de heterocromatina e não afetado por suvh9 suvh2, enquanto em outros, a metilação do DNA e H3K9me1 está perdido. Além disso, uma terceira classe de sítios foi encontrada com H3K9me1 não detectável, mas que tinha metilação do DNA dependente de SUVH2/SUVH9. Em segundo lugar, uma diminuição semelhante da metilação de histona foi observada nestes mesmos sítios em outro RdDM mutante, rdr2. Assim, é provável que SUVH2/SUVH9 funcione para recrutar Pol V resultando em RdDM, que recruta então as metiltransferases de histona ativas de SUVH4, SUVH5 e SUVH6. Estas enzimas se ligam ao DNA metilado por meio de seus domínios SRA e metilam as histonas associadas. Sem pretender se limitar pela teoria, acredita-se que o mais provável é que as perdas de metilação em H3K9 em duplos mutantes suvh2 suvh9 é uma consequência indireta da perda de metilação do DNA dirigida por RNA.
[0257] Para test ar diretamente se a ação de SUVH2/SUVH9 pode ser suficiente para direcionar a metilação do DNA dirigida por RNA, foi engenheirado um dedo de zinco específico (ZF) para amarrar SUVH2 a um epialelo não metilado de FWA, fwa-4 (fwa-4 é o epialelo não metilado de FWA em Columbia, fwa-1 é o epialelo não metilado no ecotipo Landsberg erecta). O gene FWA codifica um fator de transcrição homeodomínio que é normalmente silenciado devido à metilação do DNA no seu promotor (Soppe et al., 2000). O epialelo FWA perdeu toda a metilação do DNA, conduzindo à expressão ectópica de FWA e um florescimento tardio hereditário (Kakutani, 1997; Soppe et al., 2000). Os siRNAs normalmente envolvidos no direcionamento da metilação do DNA ainda existem no epialelo FWA mas parecem incapazes de dirigir fatores à jusante para metilar o promotor (Chan et al., 2006). Sem pretender se limitar pela teoria, acredita- se que um modelo em que, embora os siRNAs estejam presentes, o transcrito em estrutural de Pol V está faltando. A região promotora FWA contém duas pequenas repetições diretas seguidas por duas repetições maiores (Kinoshita et al., 2007). Um peptídeo contendo seis ZFs foi designado para reconhecer uma sequência encontrada em cada uma das duas pequenas repetições (CGGAAAGATGTATGGGCT) (SEQ ID NO: 141) (Kolb et al., 2005; Segal et al., 2003). A região de codificação para este peptídeo foi então inserida em um transgene SUVH2 HA-tagged conduzido pelo promotor endógeno SUVH2 (ZF-SUVH2) e introduzido numa linhagem de fwa-4, utilizando a transformação mediada por Agrobacterium (FIG. 6A).
[0258] Em plantas T1, aproximadamente 75% dos transformantes ZF-SUVH2 floresceram mais cedo em comparação com a linhagem parental fwa-4. Os transformantes da linhagem SUVH2 HA-tagged de controle (HA-SUVH2) que não continham o dedo de Zn floresceram ao mesmo tempo em que o parente fwa- 4, mostrando que o efeito foi específico para a fusão ZF- SUVH2. Plantas T1 contendo o ZF-SUVH2 ou HA-SUVH2 foram levadas para a geração T2 e o tempo de florescimento foi determinado (FIG. 6A, 6B). A linhagem contendo ZF-SUVH2 floresceu apenas um pouco mais tarde do que o controle Columbia (WT), enquanto HA-SUVH2 sem um dedo Zn floresceu aproximadamente ao mesmo tempo em que o parente fwa-4. Estes resultados sugerem que ZF-SUVH2 está, de fato, sendo orientada para o promotor FWA e causando repressão de transcrição.
[0259] A metilação de DNA na região promotora FWA foi analisada utilizando o sequenciamento bissulfito. Na linhagem do tipo selvagem é detectada uma grande região de metilação do DNA, com níveis particularmente elevados de metilação CG (FIG. 6D). Em fwa-4, esta região foi completamente desprovida de metilação do DNA. Em três linhagens T1 independentes contendo o ZF-SUVH2 em fwa-4, foi observado um perfil de metilação que era distinto do WT. A metilação do DNA estava em um alto nível imediatamente em torno dos sítios de ligação do dedo Zn em todos os três contextos de sequência. A metilação do DNA, em seguida, gradualmente reduziu-se na região transcrita à jusante (FIG. 6E). Nas plantas T1 HA-SUVH2 de controle, nenhuma metilação do DNA foi observada em FWA. Estes resultados indicam que o direcionamento de SUVH2 para FWA com o ZF é suficiente para induzir a metilação do DNA e o silenciamento do gene.
[0260] Para determinar se a Pol V esteve presente no FWA do epimutante fwa-4, anticorpos endógenos para NRPE1 foram utilizados em experimentos ChIP do tipo selvagem, linhagens nrpe1 e fwa-4. Enriquecimento de Pol V em dois sítios conhecidos da Pol V, IGN5 e IGN22, foi observado no tipo selvagem e linhagens fwa-4, mas não nas plantas mutantes nrpe1 (FIG. 7A). Quando o locus FWA foi examinado, observou- se o enriquecimento no tipo selvagem nas regiões promotoras e transcritas, mas não em nrpe1 ou fwa-4 (FIG. 7A). Assim, a Pol V está presente no locus FWA quando está no seu estado DNA metilado e silente no tipo selvagem, mas não quando está num estado não metilado no epialelo fwa-4. Para determinar se a ligação do ZF-SUVH2 ao promotor FWA recruta a Pol V, NRPE1 ChIP em uma linhagem T2 contendo ZF-SUVH2 em fwa-4 foi realizada. Ao contrário da linhagem parental fwa-4, na presença de ZF-SUVH2, um enriquecimento da Pol V em FWA foi observada (FIG. 7A), indicando que o direcionamento de ZF- SUVH2 agiu para recrutar ou estabilizar a Pol V em FWA.
[0261] O estado de metilação da histona de FWA nas diferentes linhagens também foi testado. Na linhagem do tipo selvagem, um ligeiro enriquecimento de H3K9me1 na região promotora FWA e um enriquecimento de 4 vezes na região transcrita de FWA foi observado (Fig. 7B). Na linhagem de fwa-4, nenhum enriquecimento foi observado. Nenhum enriquecimento de H3K9me1 em florescimento precoce de plantas T1 ZF-SUVH2/fwa-4 foi detectado (FIG. 7B). No entanto, na geração seguinte a partir destas plantas (T2), foi observado um ligeiro enriquecimento de H3K9me1, ligeiramente mais forte sobre a região promotora do que a região transcrita (FIG. 7C). Estes resultados sugerem que, embora ZF-SUVH2 recrute Pol V e metilação do DNA imediatamente na primeira geração, a metilação de histona não é restaurada imediatamente, mas se acumula nas plantas que são cruzadas para uma geração adicional.
[0262] Para ganhar insights adicionais na função de SUVH2/SUVH9 uma análise estrutural de ambas as proteínas foi realizada. Através da cristalização de proteínas, a estrutura de um construto SUVH9 N-terminal truncado (resíduos 134 - 650), que representa a primeira vista estrutural das proteínas contendo cassete SRA-SET da família SUVH de Arabidopsis foi resolvida. Os primeiros 130 resíduos de SUVH9 estão previstos para serem desordenados e sem homologia com quaisquer domínios conhecidos, enquanto que os resíduos restantes contêm todos os domínios funcionais conhecidos de SUVH9 (os domínios SRA, pré-SET, e SET) (FIG. 8A). A estrutura de SUVH9 foi determinada utilizando o método da dispersão anômala a comprimento de onda único e refinada para a resolução de 2,4 Â com um fator R de 18,7% e um R livre de 22,3% (FIG. 8B). A estrutura de SUVH9 é composta de três segmentos: um feixe de duas hélices em direção ao N- terminal (resíduos 138 - 194), o domínio SRA (resíduos 195 - 379), e os domínios pré-SET/SET (resíduos 380-637) (FIG. 8B).
[0263] Uma característica única da estrutura de SUVH9 é a formação e a localização de um feixe de duas hélices em direção ao N-terminal, que é imprensada entre o domínio SRA e os domínios pré-SET/SET, interagindo assim com ambos dos mesmos. A interface entre as duas α-helices é enriquecida com resíduos hidrofóbicos, que participam nas extensivas interações de van der Waals, complementadas pela formação de ponte salina após a inserção de Glu166 da primeira hélice mais longa entre Arg178 e Lys182 da segunda hélice mais curta (FIG. 8C). Estas interações hidrofóbicas e pontes salinas estabilizam a posição relativa das duas hélices, e servem como uma estrutura para a ancoragem do domínio SRA e dos domínios pré-SET/SET em ambos os lados do feixe de duas hélices, resultando assim na formação de uma rígida topologia global para toda a proteína.
[0264] O feixe de duas hélices está profundamente enterrado na interface do domínio SRA e domínios pré-SET/SET, cujos alinhamentos relativos estão estabilizados através da formação de extensas interações hidrofóbicas e hidrofílicas. A primeira hélice mais longa (resíduos 138-169) do feixe de duas hélices insere-se na interface entre os domínios SRA e pré-SET/SET. O segmento N-terminal da hélice longa é muito mais hidrofílico e faz vários pares de pontes salinas e ligações de hidrogênio com os resíduos circundantes (FIG. 8D). Em contrapartida, a parte C-terminal desta hélice contém uma superfície grande e continuamente hidrofóbica que interage com a segunda hélice mais curta (FIG. 8C) e outros domínios da proteína (FIG. 8E). Uma longa alça estende-se para fora do domínio SET (FIG. 8E) e cobre a superfície exterior da hélice mais longa. A ponta desta alça contém vários resíduos hidrofóbicos (Leu559, Val562, e Leu563) que formam extensivas interações de van der Waals com resíduos hidrofóbicos (Ile154, Leu158, Phe161, e Leu162) sobre uma face da hélice mais longa. Sem pretender se limitar pela teoria, acredita-se que o segmento helicoidal mais longo pode desempenhar um papel importante na estabilização da arquitetura geral da proteína SUVH9. A segunda hélice mais curta interage principalmente com a parte C-terminal da hélice mais longa (FIG. 8B, 8C), suplementada por poucas ligações de hidrogênio e interações hidrofóbicas com o domínio SRA (FIG. 8F).
[0265] O domínio SRA de SUVH9 assemelha-se às estruturas relatadas de domínios SRA de UHRF1 e SUVH5 (Arita et al., 2008; Avvakumov et al., 2008; Hashimoto et al., 2008; Rajakumara et al., 2011). A superposição de domínios SRA de SUVH9 e SUVH5 produz um RMSD de 1,2 Â para 145 átomos de Cα alinhados e consistentes com dobradura quase idêntica das duas proteínas, cujos elementos centrais são compostos de um β-barril de 6 fitas retorcidas e duas a-hélices. Ao contrário da alça desordenada observada no domínio SRA de SUVH5, o C- terminal do domínio SRA de SUVH9 forma uma a-hélice, que é seguida por uma volta curta e, em seguida, liga-se diretamente ao domínio pré-SET.
[0266] A orientação relativa entre os domínios SRA e pré-SET/SET é estabilizada por extensas interações diretas entre eles e através de interações com o feixe de duas hélices. A interação direta entre o domínio SRA e os domínios pré-SET/SET é principalmente dominada por interações hidrofóbicas (FIG. 8G). Em particular, a a-hélice C-terminal estendida do domínio SRA utiliza uma superfície hidrofóbica para interagir com uma superfície hidrofóbica contínua dos domínios pré-SET/SET, com os resíduos flanqueando a a-hélice do domínio SRA contribuindo ainda para a formação da interface hidrofóbica. A estrutura dos domínios pré-SET/SET de SUVH9 é semelhante às estruturas publicadas de metiltransferase H3K9 de histonas, tais como Dim5, G9a, e GLP (Wu et al., 2010; Zhang et al., 2002; Zhang et al., 2003). Sobreposição dos domínios pré-SET/SET de SUVH9 e H3K9 metiltransferase GLP humanas produz um RMSD de 1,8 Â para 252 átomos de Cα alinhados, embora eles só compartilhem uma identidade de sequência de 34%. Como habitualmente observado em outras proteínas de domínio SET, nove resíduos conservados Cys do domínio pré-SET de SUVH9 coordenam três íons Zn2+ para formar um cluster de triângulo equilátero (FIG. 8B).
[0267] Embora SUVH9 contenha histona metiltransferase como domínios pré-SET e SET, não exibe atividade de histona metiltransferase detectável, nem capacidade de ligação para o cofator SAM in vitro (Johnson et al., 2008). Na sequência primária, embora SUVH9 retenha dois resíduos Tyr (Tyr522 e Tyr636, que correspondem a Tyr1124 e Tyr1211 de GLP humana, que contribuem para a atividade da metiltransferase (Wu et al., 2010; Zhang et al., 2002; Zhang et al., 2003), esta não tem o domínio pós- SET, que é importante para ligação do cofator e substrato peptídeo, bem como a catálise. Os domínios pré-SET e SET da GLP e SUVH9 humanas adotaram topologias de dobras semelhantes (Wu et al., 2010). Na GLP humana, o bolso de ligação à SAH é relativamente estreito e exibe pronunciada complementaridade estrutural e química para SAH (FIG. 9A). Além disso, a existência de um domínio pós-SET com a capacidade para cobrir a fração de adenina de SAH atua para estabilizar a ligação desta molécula de cofator. Em contrapartida, o bolso de ligação de SAH putativo de SUVH9 é muito aberto (FIG. 9B) e não pode reter uma molécula de SAH ligada, especialmente na ausência da função de estabilização do domínio pós-SET. Além disso, geralmente metiltransferases ativas da família SUV utilizam um resíduo de Cys a partir do domínio SET em conjunto com três resíduos Cys a partir do domínio pós-SET para coordenar um íon Zn2+ para estabilizar a posição relativa e a conformação da região em alça enriquecida no domínio pós-SET. Em contrapartida, o resíduo Cys é substituído por uma Thr no domínio SET de SUVH9, de modo que, mesmo se uma proteína parceira trouxesse três resíduos Cys, ainda não seria possível formar um centro de coordenação de Zn2+ estabilizado.
[0268] Em H3K9 metiltransferases contendo domínio SET, o substrato peptídeo está posicionado entre os domínios SET e pós-SET (FIG. 9C), e estabilizado através da formação de extensas interações intermoleculares da cadeia principal e cadeia lateral com a enzima. Em H3K9 metiltransferase GLP humana, uma região ácida de alça (resíduos 1145 - 1153) do domínio SET está envolvida no reconhecimento do substrato peptídeo (FIG. 9C). Em contrapartida, o segmento correspondente na SUHV9 contém uma alça de inserção de 25 resíduos, enriquecida com resíduos hidrofóbicos (FIG. 8H). A alça de inserção adota uma topologia bem definida, pois é estabilizada através da formação de extensas interações hidrofóbicas com resíduos a partir dos domínios SET e pós- SET (FIG. 8H), especialmente a ponta da alça, que cobre e interage bastante com o feixe de duas hélices (FIG. 8H). Um exame da estrutura SUVH9 identifica o potencial de choque estérico entre a alça de inserção e um substrato peptídeo ligado putativamente, prevenindo deste modo o acesso do substrato peptídeo na fenda de ligação ao peptídeo da proteína SUVH9 (FIG. 9D).
[0269] Este exemplo demonstra que SUVH2 e SUVH9 são necessárias para o recrutamento de Pol V para regiões contendo a metilação do DNA. Além disso, uma fusão ZF-SUVH2 foi usada para mostrar que o direcionamento SUVH2 é suficiente para o recrutamento de Pol V e metilação do DNA para um gene alvo não metilado. Sem pretender se limitar pela teoria, acredita-se que o mecanismo de ação de SUVH2 e SUVH9 fornece uma alça de reforço entre a metilação do DNA pré-existente e novos ciclos de metilação do DNA dirigida por RNA.
Exemplo 3
[0270] O seguinte Exemplo se refere à produção e caracterização de uma proteína SHH1 modificada de A. thaliana que é engenheirada para conter um domínio de ligação de ácido nucleico para direcionar a proteína SHH1 modificada para uma sequência específica de ácido nucleico. Neste exemplo, o direcionamento de SHH1 para as regiões promotoras do locus
APETALA1 foi associado ao enriquecimento de siRNAs em APETALA1. Materiais e Métodos Construção de TAL-SHH1
[0271] O clone de entrada Gateway contendo SHH1 incluindo 1,4 kb da região promotora e a ORF com C-terminal BLRP e tags 3xMyc foi previamente descrito (Law et al., 2011). Os sítios de reconhecimento BsaI foram removidos a partir do clone de entrada SHH1 por mutagênese sítio dirigida (Quickchange II, Agilent) usando iniciadores SHH1deltaBsaI_fo, 5’-GGGAGAGTGAACGTTGGTGACCTGCTTCTATGTTT-3’ (SEQ ID NO: 142), SHH1deltaBsaI_re e 5’-AAACATAGAAGCAGGTCACCAACGTTCACTCTCCC-3’ (SEQ ID NO: 143). Após a remoção de sítios BsaI, o clone de entrada foi linearizado por digestões de restrição com Xhol. A fim de inserir a sequência de DNA que codifica um efetor semelhante ao ativador de transcrição baseado em Hax3 modificado (TALE) (Sanjana et al., 2012) excluindo o sinal de localização nuclear do C-terminal e o domínio de ativação ácido flanqueado por ligantes GSSGSS em região entre o BLRP C- terminal e tags 3xMyc de SHH1, 2,8 kb da estrutura TALE incluindo o cassete de seleção ccdB foram amplificados a partir do plasmídeo ativador de transcrição TALE (TALE-TF) (Addgene) usando iniciadores TALETFintotag_fo, 5’-CCAAGGACCTCTCGAGGGATCTTCAGGTTCATCTTCGCGGACCCGGCTCCCT-3’ (SEQ ID NO: 144) e TALETFintoSHH1Myc_re, 5’-CATAGATCCCTCGAGTGAAGAACCAGATGATCCGCTAGCTGACGCGCGA-3’ (SEQ ID NO: 145). O produto de amplificação foi fundido com o clone de entrada linearizado usando sistema de clonagem Fusion HD (Clontech). Domínio de ligação ao DNA de TALE tendo como alvo a sequência 5’-TTAGGATTTGCGTGTCGAC-3’ (SEQ ID NO: 146) correspondendo ao cromossomo 1 das posições de nucleotídeos 25986363 a 25986381 na região promotora de APETALA1 (AT1G69120) foi montado a partir de repetições de 18 monômeros (Addgene) por clonagem Golden Gate e inserido entre os sítios BsaI flanqueando o cassete de seleção ccdB (Sanjana et al., 2012). A sequência de DNA que codifica as repetições alvo de TALE são listadas (SEQ ID NO: 140). A fim de facilitar a ligação das proteínas de fusão TAL-SHH1 à citosina metilada a variável de repetição “diresíduo” (RVD) N* foi utilizada (Valton et al., 2012). Plasmídeos que codificam monômeros RVDs N* e NH foram criados por mutagênese sítio dirigida (Quickchange II, Agilent) do plasmídeo molde pNN_v2 de monômero TALE (Addgene) usando iniciadores NN>N*_fo, 5’-GTGGCAATTGCGAGCAACGGGGGAAAGCAG-3’ (SEQ ID NO: 147), NN>N*_re, 5’-CTGCTTTCCCCCGTTGCTCGCAATTGCCAC-3’ (SEQ ID NO: 148), NN>NH_fo, 5’-GGCAATTGCGAGCAACCATGGGGGAAAGCAGGCAC-3’ (SEQ ID NO: 149) e NN>NH_re, 5’-GTGCCTGCTTTCCCCCATGGTTGCTCGCAATTGCC-3’ (SEQ ID NO: 150), respectivamente. Plasmídeo TALE-TF que codifica RVD N* foi criado por mutagênese sítio dirigida (Quickchange II, Agilent) de pTALE-TF_v2 (NN) (Addgene) usando iniciadores TALETF_NN>N*_fo, 5’-TGGCTATTGCATCCAACGGGGGCAGACC-3’ (SEQ ID NO: 151) e TALETF_NN>N*_re, 5’-GGTCTGCCCCCGTTGGATGCAATAGCCA-3’ (SEQ ID NO: 152). Vetores binários foram criados utilizando LR clonase II (Life Technologies) e vetores de destino pEarlyGate302 modificados contendo marcador de seleção hph (Law et al., 2011). Material Vegetal
[0272] Construtos TAL-SHH1 foram transformados em shh1 (SALK_074540) de ecotipo Col-0 pela Agrobacterium tumefaciens cepa ABL0 usando o método de mergulho floral (Clough and Bent, 1998). Foram selecionadas plantas T1 com higromicina B e a expressão das proteínas quiméricas TAL- SHH1 foi testada por isolamento das proteínas e Western blot com anticorpos contra o 3xMyc, respectivamente. Foram selecionadas plantas T1 que mostram forte expressão do transgene.
Resultados
[0273] Depois de selecionar uma planta contendo o TAL-SHH1 dirigido contra o gene APETALA1, pequenas bibliotecas de RNA foram geradas e profundamente sequenciadas utilizando protocolos estabelecidos (Law et al., 2013) para detectar a presença de pequenos RNAs produzidos pelo gene APETALA1 em resposta ao direcionamento de SHH1 ao promotor. Como um controle, pequenos RNAs foram sequenciados a partir de uma planta do tipo selvagem, nos quais não eram previstos conter os siRNAs presentes na região promotora de APETALA1. Como mostrado na FIG. 18, pequenos RNAs foram detectados correspondentes a ambas fitas do DNA nas plantas TAL-SHH1, mas não nas plantas do tipo selvagem, indicando que a proteína SHH1 modificada poderia direcionar pequenos RNAs ao promotor AP1.
Exemplo 4
[0274] O seguinte Exemplo destaca a relação entre a metilação do DNA e ligação Pol V via SUVH2/SUVH9 e demonstra que SUVH2 interage com DRD1.
Materiais e Métodos Procedimentos Experimentais em Arabidopsis
[0275] Imunoprecipitações de cromatina (ChIPs) foram realizadas como em Bernatavichute et al. (2008), exceto que o tecido no chão foi reticulado com formaldeído no seguinte tampão: HEPES 10 mM pH 8,0, Sacarose 1 M, KCl 5 mM, MgCl2 5 mM, EDTA5 mM, e Triton X-100 0,6%. Todos os iniciadores utilizados são listados na Tabela 12 abaixo. Bibliotecas para NRPE1 ChIP-Seq foram criadas usando o Sistema Ovation Ultralow DR Multiplex (NuGen). Sequenciamento bissulfito seguido por amplificação por PCR e clonagem dos fragmentos de FWA foi feito utilizando o kit EZ DNA Methylation-Gold (Zymo Research), como realizado em Johnson et al. (2008). Bibliotecas BS-seq foram criadas como descrito no Exemplo 1, e todas as bibliotecas foram sequenciadas utilizando a plataforma HiSeq 2000 seguindo as instruções do fabricante (Ilumina) a um comprimento de 50 pb. Construtos de dedo de zinco foram gerados como descrito no Exemplo 2. Tabela 12: Lista de Iniciadores
Figure img0014
Análise de Dados
[0276] Leituras de Bissulfito-Seq (BS-Seq) foram alinhadas à versão TAIR10 do genoma de referência de Arabidopsis thaliana usando BS-seeker. Para BS-Seq até 2 desemparelhamentos foram autorizados e apenas leituras exclusivamente mapeadas foram usadas. Experimentos de Co-imunoprecipitação
[0277] Nicotiana benthamiana foi infiltrada com pLJ322 (ZF-HA-SUVH2 em JP7468) e folhas foram coletadas após 3 dias. As folhas que não foram infiltradas foram usadas como um controle negativo. 3 g de tecido foram moídos em N2 líquido e foram ressuspendidos em 12 mL de tampão IP (Tris 50 mM pH 8,0, NaCl 150 mM, MgCl2 5 mM, glicerol 10%, e NP40 0,1%) com 1 μg/mL de pepstatina, PMSF 1 mM, e 1X de tab-EDTA inibidor completo de protease (Roche). Os extratos foram filtrados através de miracloth e centrifugados durante 5 min a 3.000 g. 200 μL de grânulos magnéticos HA (MRL) foram adicionados e a girados a 4°C durante 45 min. Após 3 lavagens com tampão IP, estes foram então incubados com extratos de flores Arabidopsis DRD1-Flag preparados da mesma forma. A incubação continuou durante 45 min de rotação a 4°C. Os grânulos foram lavados 3 vezes com tampão IP e levados à ebulição em 60 μL de corantes SDS. Western blots foram sondados com anticorpos anti-Flag-HRP ou anti-HA-HRP. O experimento co-IP em Arabidopsis foi realizado começando com 2 g de flores de plantas que expressam HA-SUVH2, Flag-DRD1 ou plantas T2 contendo HA-SUVH2 e Flag-DRD1. Os extratos foram feitos tal como descrito acima e foram adicionados 100 μL de grânulos magnéticos Flag (Sigma) e incubados com rotação a 4°C durante 45 min. As lavagens e western blot foram realizados tal como descrito acima.
Resultados
[0278] Os resultados apresentados no Exemplo 2 ilustram como uma proteína SUVH fundida com os motivos do domínio de ligação ao DNA pode ser dirigida a um gene alvo não metilado e recrutar Pol V e metilação de DNA para o gene alvo não metilado. Alinhamentos de sequência de várias proteínas SUVH são apresentados na FIG. 11. Exemplo 2 também estabelece que SUVH2 e SUVH9 são necessárias não só para a atividade de Pol V, mas também para sua associação estável com cromatina ao longo do genoma.
[0279] Para determinar o efeito de SUVH2 e SUVH9 na metilação do DNA em sítios de ligação à Pol V definidos, o sequenciamento bissulfito de genoma inteiro (Seq-BS) foi utilizado, como visto no Exemplo 2. Os resultados BS-Seq de mutantes simples suvh2 e suvh9 também foram analisados para determinar se SUVH2/SUVH9 agem de forma redundante em todos os sítios ou têm sítios não sobrepostos, onde eles funcionam. Verificou-se que suvh2 teve um efeito mais forte do que suvh9 em sítios da Pol V, bem como em regiões diferencialmente metiladas (DMRs) definidas em quaisquer mutantes simples suvh2 ou suvh9, ou em duplo mutante suvh2 suvh9 (FIG. 12). Estes resultados indicam que SUVH2 e SUVH9 agem de forma redundante por todo o genoma para controlar a metilação do DNA dirigida por RNA.
[0280] Sem pretender se limitar pela teoria, os resultados apresentados no Exemplo 2 sugerem também que uma alça de reforço existe entre a metilação do DNA e ligação de Pol V via SUVH2/SUVH9. Para investigar ainda mais isto, uma mutação na metiltransferase MET1 de manutenção que elimina a metilação CG do genoma inteiro e também reduz a metilação CHG e CHH (Aufsatz et al., 2004; Stroud et al., 2013; Lister et al., 2008) foi utilizada (FIG. 13B). Utilizando anticorpos endógenos para NRPE1, ChIP-seq revelou que a ocupação de Pol V foi praticamente eliminada em met1 comparada ao do tipo selvagem em sítios normalmente ocupados por Pol V (FIG. 13C). Em contraste, em uma série de sítios previamente identificados como ganhadores de metilação em met1 (Stroud et al., 2013), um aumento foi observado na ligação de Pol V (FIG. 13D e FIG. 13E). Estes resultados sugerem que a metilação do DNA é um componente importante de recrutamento de Pol V. Mutações pontuais nos domínios SRA de ambas SUVH2 e SUVH9 demonstraram causar uma perda da metilação do DNA dirigida por RNA, indicando que os domínios SRA contribuem para a função (Johnson et al., 2008). Juntos, e sem pretender se limitar pela teoria, estes resultados sugerem que a ligação de SUVH2/SUVH9 ao DNA metilado recruta Pol V, proporcionando assim uma ligação entre a metilação do DNA pré-existente e o recrutamento de outra metilação pela via RdDM.
[0281] Verificou-se ainda que uma proteína KYP fundida a um dedo de zinco direcionando FWA em um fundo fwa-4 (ZF-KYP/fwa-4) floresceu com o tempo semelhante ao mutante fwa-4 (florescimento tardio em comparação com o do tipo selvagem), em contraste com os resultados observados para linhagens de planta ZF-SUVH2/FWA-4. ZF-KYP foi incluído como um controle negativo adicional, pois KYP (também conhecido como SUVH4), é uma proteína SUVH não requerida para RdDM. A presença do controle ZF-KYP em FWA também foi mostrado pelo ChIP (FIG. 15A).
[0282] Para investigar ainda mais este direcionamento, utilizando as linhagens de plantas, tal como descrito na FIG. 6 a partir do Exemplo 2, sequenciamento bissulfito foi usado para determinar se o silenciamento do gene FWA foi associado com metilação de DNA. Na linhagem do tipo selvagem é detectada uma grande região de metilação do DNA, com níveis particularmente elevados de metilação CG (FIG. 14A). Em ambos fwa-4 e transformantes com ZF-KYP ou HA-SUVH2, esta região foi completamente desprovida de metilação de DNA (ver ZF-KYP; FIG. 14A). Em três linhagens T1 independentes analisadas, contendo o ZF-SUVH2 em fwa-4, a metilação do DNA em um alto nível imediatamente em torno dos sítios de ligação do dedo de Zn em todos os contextos de sequência de citosina foi observada, que então gradualmente reduziu-se na região transcrita à jusante (Exemplo 2, FIG. 6E). Uma das linhagens foi passada (ZF-SUVH2-2) para as gerações T2 e T3, e BS-Seq foi usado para determinar a extensão de espalhamento de metilação (FIG. 14A). Verificou- se que a metilação se estendeu aproximadamente 150 pares de bases em qualquer uma das direções a partir dos sítios de ligação e não se expandiu significativamente entre gerações. Observou-se também que esta metilação do DNA e silenciamento foram mantidos em secretadores T2 que tinham perdido o transgene ZF-SUVH2 (FIG. 15B). Estes resultados indicam que o direcionamento SUVH2 para FWA é suficiente para induzir a metilação de DNA e o silenciamento de gene, e que este estado silente epigenético pode ser mantido na ausência de ZF-SUVH2.
[0283] A partir do Exemplo 2, experimentos foram designados para testar se o ZF-SUVH2 estava recrutando Pol V. NRPE1 ChIP foi usado para analisar os níveis de Pol V em FWA de linhagens tipo selvagem, nrpe1, e fwa-4. Enriquecimento de Pol V em dois sítios conhecidos de Pol V, IGN5 e IGN22, nas linhagens de tipo selvagem e fwa-4, mas não nas plantas mutantes nrpe1 foi observado (FIG. 7A). No FWA, enriquecimento de Pol V do tipo selvagem em ambos os promotores e de regiões transcritas, mas não foi observada em nrpe1 ou fwa-4 (FIG. 7A). Assim, Pol V está presente em FWA no seu estado DNA metilado e silente no tipo selvagem, mas não no seu estado não metilado no epialelo fwa-4. Para determinar se a ligação do ZF-SUVH2 ao FWA recruta Pol V, NRPE1 ChIP foi realizada numa linhagem T2 contendo ZF-SUVH2 em fwa-4. Ao contrário da linhagem fwa-4 parental, a linhagem ZF-SUVH2 apresentou enriquecimento de Pol V em FWA (FIG. 7A). Juntos, estes resultados indicam que SUVH2 é suficiente para localizar a Pol V no promotor FWA, levando a metilação do DNA e o silenciamento do gene.
[0284] A fim de abordar o mecanismo potencial pelo qual SUVH2 ou SUVH9 direciona RdDM, conjuntos de dados de espectrometria de massa gerados por imunoprecipitação de complexos de proteínas que utilizam vários fatores RdDM epítopo-tagged foram consultados. Embora peptídeos SUVH2/9 em vários estudos de espectrometria de massa IP a partir de purificação de Pol V (utilizando NRPE1-Flag) não terem sido observados, foram identificados peptídeos SUVH2 em dois conjuntos de dados de espectrometria de massa independentes para DRD1 (FIG. 16). DRD1 é um componente do complexo da DDR (também contendo DMS3 e RDM1) que interage com Pol V (Law et al., 2010) e é necessário para a ocupação de Pol V ao longo do genoma (Zhong et al., 2012). O número de peptídeos SUVH2 observado foi inferior aos das proteínas DMS3 e RDM1 que são componentes estequiométricos do complexo DDR, e também inferiores ao nível de peptídeos da maioria dos componentes do complexo Pol V, o que sugere que a interação entre SUVH2 e DRD1 é mais fraca ou mais transitória do que a interação entre os componentes DDR ou entre DDR e Pol V. Para confirmar a interação entre DRD1 e SUVH2, SUVH2 epítopo-tagged foi expresso em folhas de Nicotiana benthamiana e purificado em grânulos magnéticos HA. Utilizando isto como uma fonte de SUVH2, DRD1-Flag foi especificamente e de forma reprodutível derrubado a partir de extratos proteicos de Arabidopsis transgênicos (FIG. 14B: grânulos SUVH2). Como um controle negativo, o mesmo ensaio foi realizado utilizando N. benthamiana que não estava expressando SUVH2-tagged, e DRD1- Flag não pode ser detectado neste ensaio (FIG. 14B: grânulos simulados). Além disso, os experimentos de co- imunoprecipitação foram realizados com SUVH2 HA-tagged e DRD1 Flag-tagged em plantas transgênicas Arabidopsis e uma interação entre estas proteínas também foi observada (FIG. 15C). Estes resultados confirmam que as observações de espectrometria de massa IP e, sem pretender ficar restringido pela teoria, são consistentes com um modelo no qual SUVH2 atua indiretamente através de uma interação transitória com componentes do complexo DDR, incluindo DRD1 para recrutar Pol V.
Exemplo 5
[0285] Este Exemplo demonstra o direcionamento de diferentes componentes da via de metilação do DNA dirigida por RNA para recrutar Pol V a loci específicos.
Introdução
[0286] A via de metilação do DNA dirigida por RNA (RdDM) medeia a metilação de novo de DNA em plantas. Exemplos 2 e 4 demonstram o uso de ZF-SUVH2 para direcionar especificamente a metilação alvo e silenciamento de um locus alvo. Isto foi conseguido através da utilização do gene FWA como um alvo. Expressão de FWA provoca um forte fenótipo final de florescimento em Arabidopsis. A metilação no promotor deste gene, como está presente em plantas do tipo selvagem, provoca o silenciamento de transcrição de FWA e resulta num fenótipo de florescimento precoce em relação aos mutantes fwa-4. O mutante epigenético fwa-4 de Arabidopsis não mostra a metilação no promotor do gene de FWA e, assim, mostra o fenótipo de florescimento tardio característico (em relação ao tipo selvagem). Exemplos 2 e 4 descrevem uma proteína quimérica SUVH2 fundida a uma proteína de Dedo de Zinco (ZF) designada para direcionar o promotor de FWA em Arabidopsis, ZF108, e demonstra que esta proteína de fusão pode promover a metilação neste sítio genômico em plantas fwa-4. Este direcionamento de metilação é acompanhado pelo recrutamento de Pol V a este sítio (FWA) e resulta na produção de RNA não codificador necessário para desencadear a metilação, o silenciamento de genes e, portanto, produzir um fenótipo de florescimento precoce.
Materiais e Métodos Construção de Proteínas de Fusão
[0287] Para criar as diferentes proteínas de fusão descritas neste exemplo, o fragmento ZF108 no plasmídeo pUC57 descrito no Exemplo 2 foi digerido com a enzima de restrição XhoI e inserido diretamente no sítio único de XhoI em diferentes genes, ou inserido em um plasmídeo pCR2, contendo fusões de Flag-BLRP ou HA-BLRP que contêm um sítio de XhoI localizado entre o tag e BLRP e que estão flanqueados por sítios de restrição de AscI. Construtos individuais foram construídos como descrito abaixo.
[0288] DRD1-HA-ZF: A fusão HA-ZF108-BLRP no plasmídeo pCR2 foi digerida com AscI e inserida no sítio único de AscI do plasmídeo pENTR-DRD1 (Law et al, 2010), localizado 6 pares de base após o fim da sequência de codificação de DRD1.
[0289] DMS3-Flag-ZF: A fusão Flag-ZF108-BLRP no plasmídeo pCR2 foi digerida com AscI e inserida no sítio único de AscI do plasmídeo pENTR-DMS3 (Law et al, 2010), localizado 6 pares de base após o fim da sequência de codificação de DMS3.
[0290] RDM1-Flag-ZF: Para este propósito, o plasmídeo pENTR-RDM1 foi criado, o qual contém uma sequência genômica de RDM1 incluindo 350 pares de bases da sequência promotora 5'. A fusão Flag-ZF108-BLRP no plasmídeo pCR2 foi então digerida com AscI e inserida no sítio único de AscI de um plasmídeo pENTR-RDM1, localizado 6 pares de base após o fim da sequência de codificação de RDM1.
[0291] RDM1-HA-ZF: Para este propósito, o plasmídeo pENTR-RDM1 foi criado, o qual contém uma sequência genômica de RDM1 incluindo 350 pares de bases da sequência promotora 5'. A fusão HA-ZF108-BLRP no plasmídeo pCR2 foi então digerida com AscI e inserida no sítio único de AscI de um plasmídeo pENTR-RDM1, localizado 6 pares de base após o fim da sequência de codificação de RDM1.
[0292] HA-ZF-DRM3: Para este propósito, o plasmídeo pENTR-BLRP-HA-DRM3 foi usado, o qual contém uma sequência genômica de DRM3 incluindo 2500 pares de bases da sequência promotora 5' e a fusão BLRP-HA logo antes do códon de iniciação. O fragmento ZF108 no plasmídeo pUC57 foi então digerido com XhoI e inserido no sítio único de XhoI do plasmídeo pENTR-BLRP-HA-DRM3, localizado entre o BLRP e o tag HA.
[0293] HA-2XZF-DRM3: Para este propósito, o plasmídeo pENTR-BLRP-HA-DRM3 foi usado, o qual contém uma sequência genômica de DRM3 incluindo 2500 pares de bases da sequência promotora 5' e a fusão BLRP-HA logo antes do códon de iniciação. O fragmento ZF108 no plasmídeo pUC57 foi então digerido com XhoI e duas cópias de ZF108 foram inseridas em tandem no sítio único de XhoI do plasmídeo pENTR-BLRP-HA- DRM3, localizado entre o BLRP e o tag HA.
[0294] ZF-3F9M-DRM2: Um fragmento ZF108 flanqueado por sítios de EcoRI em um pUC57 foi digerido com EcoRI e inserido no sítio único de EcoRI no plasmídeo pENTR-3F9M- DRM2 (Henderson et al., 2010), localizado no início 5’ do tag 3xFlag-9xMyc.
[0295] FRG-Flag-ZF: Para este propósito, o plasmídeo pENTR-FRG foi usado, o qual contém uma sequência genômica de FRG incluindo 800 pares de bases da sequência promotora 5'. A fusão Flag-ZF108-BLRP no plasmídeo pCR2 foi digerida com AscI e inserida no sítio único de AscI do plasmídeo pENTR- FRG, localizado 6 pares de base após o fim da sequência de codificação de FRG.
[0296] SUVR2-Flag-ZF: O plasmídeo pENTR-SUVR2 foi usado, o qual contém uma sequência genômica de SUVR2 incluindo 2000 pares de bases da sequência promotora 5'. A fusão Flag-ZF108-BLRP no plasmídeo pCR2 foi digerida com AscI e inserida no sítio único de AscI de um plasmídeo pENTR- SUVR2, localizado 6 pares de base após o fim da sequência de codificação de SUVR2.
[0297] SUVR2-HA-ZF: O plasmídeo pENTR-SUVR2 foi usado, o qual contém uma sequência genômica de SUVR2 incluindo 2000 pares de bases da sequência promotora 5'. A fusão HA-ZF108-BLRP no plasmídeo pCR2 foi digerida com AscI e inserida no sítio único de AscI de um plasmídeo pENTR- SUVR2, localizado 6 pares de base após o fim da sequência de codificação de SUVR2.
[0298] MORC6-HA-ZF: O plasmídeo pENTR-MORC6 foi usado, o qual contém uma sequência genômica de MORC6 incluindo 2463 pares de bases da sequência promotora 5'. A fusão HA-ZF108-BLRP no plasmídeo pCR2 foi digerida com AscI e inserida no sítio único de AscI de um plasmídeo pENTR- MORC6, localizado 6 pares de base após o fim da sequência de codificação de MORC6.
[0299] Flag-ZF-CMT2: O plasmídeo pENTR-Flag-CMT2 foi gerado, o qual contém uma sequência genômica de CMT2 incluindo 1032 pares de bases da sequência promotora 5' e uma fusão BLRP-Flag logo antes do códon de iniciação. O fragmento ZF108 no plasmídeo pUC57 foi digerido com XhoI e inserido no sítio único de XhoI do plasmídeo pENTR-BLRP- Flag-CMT2, localizado entre o BLRP e o tag Flag. Introdução de Proteínas de Fusão em fwa-4
[0300] Todos os construtos de proteínas de fusão ZN- 108 descritos acima foram recombinados no vetor JP726 e introduzidos no fwa-4, utilizando a transformação mediada por Agrobacterium. Linhagens transformadas foram selecionadas com BASTA.
Resultados
[0301] Para explorar se várias outras proteínas RdDM têm a capacidade de acionar a metilação de DNA de novo no locus FWA no mutante fwa-4, uma série de experimentos foi realizada em uma tentativa para direcionar diferentes componentes da via RdDM para o promotor do gene FWA de Arabidopsis. Várias proteínas envolvidas em RdDM foram selecionadas e foram fundidas com o dedo de zinco ZF108, que tem como alvo o promotor FWA (ver Exemplo 2), e transformadas no mutante fwa-4. Linhagens tendo como alvo o ZF foram construídas tal como descrito acima, de um modo análogo ao descrito nos Exemplos 2 e 4. O tempo de floração de ~30 linhagens transgênicas independentes foi marcado. A lista dos diferentes componentes RdDM escolhidos e os resultados no momento de floração são apresentados abaixo na Tabela 13. Tabela 13: Florescimento precoce em linhagens T1 comparado a fwa-4
Figure img0015
Figure img0016
[0302] Os resultados apresentados na Tabela 13 demonstram que DMS3-ZF e MORC6-ZF podem promover eficazmente um florescimento precoce em um fundo de mutante fwa-4. O direcionamento de SUVR2-Flag-ZF produziu 3 de 30 plantas de florescimento precoce, mas essas plantas não floresceram tão cedo quanto as plantas direcionadas por DMS3 ou MORC6. Além disso, SUVR2-HA-ZF não produziu plantas de florescimento precoce. Os resultados de SUVR2 sugerem que SUVR2 tem pelo menos uma capacidade parcial, quando fundido com um domínio de ligação de DNA tendo como alvo o FWA, para atingir e silenciar FWA. Principalmente, das três proteínas do complexo DDR (DRD1, DMS3 e RDM1), apenas DMS3 foi eficaz na indução eficiente de florescimento precoce em relação ao fwa-4 nestas plantas T1 de primeira geração. Além disso, o direcionamento direto de DRM2 não foi eficaz. Assim, os resultados sugerem que nem todos os componentes RdDM são eficazes no direcionamento da metilação de DNA, pelo menos em plantas T1 de primeira geração.
[0303] Como também pode ser visto na Tabela 13, MORC6-HA-ZF foi eficaz na indução do florescimento precoce em mutante fwa-4. MORC1 (At4g36290) e MORC2 (AT4G36280) são proteínas relacionadas ao MORC6 e candidatos que mostraram que eles formam heterodímeros estáveis com MORC6. MORC6 são MORC1 que foram anteriormente mostrados pelos requerentes estarem envolvidos no silenciamento de gene (Moissiard et al., 2012). Os requerentes também mostraram que um duplo mutante MORC1 MORC2 tem um fenótipo muito semelhante aos mutantes MORC6. Assim, pensa-se que MORC1 e MORC1b são também muito propensos de direcionar com sucesso a Pol V, a metilação do DNA, e o silenciamento do gene.
[0304] A fim de analisar se o fenótipo de florescimento precoce das linhagens de florescimento precoce descritos na Tabela 13 foi devido à metilação do promotor FWA, um ensaio de sequenciamento bissulfito de genoma inteiro foi realizado em duas linhagens DMS3-ZF independentes e 3 linhagens independentes MORC6-ZF que mostravam o fenótipo de florescimento precoce em relação ao fwa-4. Experimentos de sequenciamento bissulfito foram realizados de forma análoga ao método descrito no Exemplo 4. Os resultados mostraram que a metilação do DNA foi restabelecida em FWA de uma maneira muito semelhante àquela anteriormente demonstrada para SUVH2 no Exemplo 4 (FIG. 17). Assim, DMS3 e MORC6 foram eficazes no direcionamento da metilação no promotor FWA. Como descrito acima, as linhagens ZF-SUVR2 foram pouco eficazes na indução de florescimento precoce em mutantes fwa-4, e, assim, também são propensos a direcionar a metilação do DNA ao FWA.
[0305] A fim de analisar melhor a estabilidade do silenciamento de FWA nestas plantas transgênicas, e para testar se algumas proteínas de fusão podem mostrar um efeito apenas em gerações posteriores, um número de plantas T1 para cada linhagem foi deixado se auto-polinizar e o tempo de florescimento foi ensaiado na geração T2, como mostrado na Tabela 14. Plantas T2 derivadas de plantas T1 de florescimento precoce a partir dos transformantes DMS3-ZF mostraram 100% de plantas de florescimento precoce na geração T2, demonstrando a eficácia e a estabilidade do silenciamento do gene FWA. Plantas T2 derivadas de plantas T1 de florescimento precoce a partir dos transformantes MORC6-ZF mostraram alguma variabilidade, mas ainda a maioria mostrou 100% de plantas de florescimento precoce na geração T2. Plantas T2 derivadas de plantas T1 de florescimento precoce a partir dos transformantes SUVR2-ZF mostraram maior variabilidade e apenas uma apresentou 100% de plantas de florescimento precoce na geração T2. Tabela 14: Florescimento Precoce em linhagens T2
Figure img0017
Figure img0018
Figure img0019
Figure img0020
Figure img0021
[0306] Análise da geração T2 para outras proteínas de fusão mostrou que, mesmo para alguns fatores RdDM que não mostraram nenhum efeito na geração T1, um efeito parcial pode ser visto na geração T2. Isto foi encontrado para construtos de fusão DRD1-ZF, RDM1-ZF, DRM3-ZF, DRM2-ZF, e FRG-ZF (FRG é o gene At3g20010 que requerentes demonstraram que é envolvido em RdDM). Isto demonstra que os genes DRD1, RDM1, DRM3, DRM2, e FRG podem também ser úteis para o direcionamento de Pol V, metilação do DNA, e o silenciamento de gene, embora a eficácia destes genes possa ser mais baixa e possa necessitar de múltiplas gerações de plantas para observar um efeito. Como controle, a proteína CMT2 que não está envolvida na RdDM foi incluída, e observou-se que todas as plantas T2 apresentaram 100% do florescimento tardio, mostrando que CMT2 não é eficaz no direcionamento de silenciamento de FWA.
[0307] Os requerentes demonstraram que diferentes proteínas RdDM podem ser direcionadas para silenciar loci específicos com graus variados de eficiência de silenciamento. Pode haver alguma vantagem de ter um conjunto de proteínas que pode proporcionar uma gama de diferentes eficiências de silenciamento do gene. Por exemplo, dependendo do ácido nucleico alvo a ser silenciado, pode ser vantajoso selecionar proteínas recombinantes da presente divulgação com diferentes eficiências de silenciamento. Por exemplo, pode ser uma vantagem silenciar completamente a expressão de um gene alvo, selecionando um componente RdDM muito eficiente para direcionar a metilação tanto quanto possível para o gene alvo. Em outros casos, pode ser uma vantagem direcionar um componente RdDM menos eficiente para direcionar menos metilação a um gene para provocar apenas um efeito parcial de silenciamento. Os genes apresentam frequentemente efeitos diferentes no fenótipo da planta quando eles são expressos em diferentes níveis, e há uma probabilidade de haver situações em que o silenciamento parcial de um gene da planta é mais vantajoso.
Exemplo 6
[0308] O seguinte Exemplo se refere à produção e caracterização de uma proteína SHH1 modificada de A. thaliana que é engenheirada para conter um domínio de ligação de ácido nucleico para direcionar a proteína SHH1 modificada para uma sequência específica de ácido nucleico, e para a produção e caracterização de uma proteína SUVH2 modificada de A. thaliana que é engenheirada para conter um domínio de ligação de ácido nucleico para direcionar a proteína SUVH2 modificada para uma sequência específica de ácido nucleico. Neste exemplo, o direcionamento de SHH1 e SUVH2 simultaneamente para a região promotora SUPERMAN foi associado com o enriquecimento da metilação de DNA em SUPERMAN.
Materiais e Métodos Construção de quimera de TAL-SHH1 e TAL-SUVH2
[0309] O clone de entrada Gateway contendo SUVH2 incluindo 1,4 kb da região promotora e a ORF com tags N- terminal 3xHA e BLRP foi previamente descrito (Johnson et al., 2008). O clone de entrada Gateway contendo SHH1 incluindo 1,4 kb da região promotora e a ORF com BLRP C- terminal e tags 3xMyc foi descrito anteriormente (Law et al., 2011). Os sítios de reconhecimento BsaI foram removidos a partir do clone de entrada SUVH2 por mutagênese sítio dirigida (Quickchange multi, Agilent) usando iniciadores SUVH2deltaBsaI1, 5’-TCGTTGTCTCGCCGAAATTCGAAAGACCGAGAGAG-3’ (SEQ ID NO: 168), SUVH2deltaBsaI2, 5’-TCATCATAGTGTTGTTATATCTTTGGTGTCTCTGTCTTGCTTC-3’ (SEQ ID NO: 175) e SUVH2deltaBsaI3, 5’-CCTTTAATTTCCTTTTTTGTTTGCGTCTCTACTCTCTACAATCTATA-3’ (SEQ ID NO: 169). Os sítios de reconhecimento BsaI foram removidos a partir do clone de entrada SHH1 por mutagênese sítio dirigida (Quickchange II, Agilent) usando iniciadores SHH1deltaBsaI_fo, 5’-GGGAGAGTGAACGTTGGTGACCTGCTTCTATGTTT-3’ (SEQ ID NO: 170), SHH1deltaBsaI_re, 5’-AAACATAGAAGCAGGTCACCAACGTTCACTCTCCC-3’ (SEQ ID NO: 171). Após a remoção sítios BsaI, os clones de entrada foram linearizados por digestões de restrição com XhoI. A fim de inserir a sequência de DNA que codifica um efetor ativador de transcrição do tipo baseado em Hax3 modificado (TALE) (Sanjana et al., 2012) excluindo o sinal de localização nuclear do C-terminal e o domínio de ativação ácido flanqueado por ligantes GSSGSS em região entre o BLRP C- terminal e tags 3xMyc de SHH1 ou o 3xHA N-terminal e tags BLRP de SUVH2, 2,8 kb da estrutura TALE incluindo o cassete de seleção ccdB foram amplificados a partir do ativador de transcrição TALE (TALE-TF) de plasmídeos (Addgene) utilizando iniciadores TALETFintotag_fo, 5’-CCAAGGACCTCTCGAGGGATCTTCAGGTTCATCTTCGCGGACCCGGCTCCCT-3’ (SEQ ID NO: 144) e TALETFintoSHH1Myc_re, 5’-CATAGATCCCTCGAGTGAAGAACCAGATGATCCGCTAGCTGACGCGCGA-3’ (SEQ ID NO: 145) ou TALETFintoSUVH2tag_re, 5’-G GTATCCCATCTCGAGTGAAGAACCAGATGATCCGCTAGCTGACGCGCGA-3’ (SEQ ID NO: 172), respectivamente. Amplicons foram fundidos com os clones de entrada linearizados usando sistema de clonagem Fusion HD (Clontech). Dois domínios de ligação TALE direcionando a sequência 5’-GGGGATTTGATAATGCGTC-3’ (SEQ ID NO: 173) (SUP_D) correspondendo ao cromossomo 3 das posições de nucleotídeos 8242204 a 8242222 e 5’-GTTAAGACTGTGAAAGAGA-3’ (SEQ ID NO: 174) (SUP_P) correspondendo ao cromossomo 3 das posições de nucleotídeos 8242251 a 8242233 na região promotora de SUPERMAN (AT3G23130) foram montados a partir da repetição de 18 monômeros (Addgene) por clonagem Golden Gate e inseridos entre os sítios BsaI flanqueando o cassete de seleção ccdB (Sanjana et al., 2012). As sequências de DNA que codificam as repetições alvos de TALE correspondentes a SUP_D (SEQ ID NO: 138) e SUP_P (SEQ ID NO: 139) são listadas. A fim de facilitar a ligação das proteínas de fusão TALE à citosina metilada a variável de repetição “diresíduo” (RVD) N* foi utilizada (Valton et al., 2012). Plasmídeos que codificam monômeros RVDs N* e NH foram criados por mutagênese sítio dirigida (Quickchange II, Agilent) do plasmídeo modelo pNN_v2 de monômero TALE (Addgene) usando iniciadores NN>N*_fo, 5’-GTGGCAATTGCGAGCAACGGGGGAAAGCAG-3’ (SEQ ID NO: 147), NN>N*_re, 5’-CTGCTTTCCCCCGTTGCTCGCAATTGCCAC-3’ (SEQ ID NO: 148), NN>NH_fo, 5’-GGCAATTGCGAGCAACCATGGGGGAAAGCAGGCAC-3’ (SEQ ID NO: 149) e NN>NH_re, 5’-GTGCCTGCTTTCCCCCATGGTTGCTCGCAATTGCC-3’ (SEQ ID NO: 150), respectivamente. Plasmídeo TALE-TF que codifica RVD N* foi criado por mutagênese sítio dirigida (Quickchange II, Agilent) de pTALE-TF_v2 (NN) (Addgene) usando iniciadores TALETF_NN>N*_fo, 5’-TGGCTATTGCATCCAACGGGGGCAGACC-3’ (SEQ ID NO: 151) e TALETF_NN>N*_re, 5’-GGTCTGCCCCCGTTGGATGCAATAGCCA-3’ (SEQ ID NO: 152). Vetores binários foram criados utilizando LR clonase II (Life Technologies) e vetores de destino pEarlyGate302 modificado contendo marcadores de seleção Bar ou hph (Law et al., 2011). Material da planta
[0310] Construtos de TAL-SHH1 foram transformados em shh1 (SALK_074540), e TAL-SUVH2 em suvh2 (SALK_079574) do ecotipo Col-0 pela Agrobacterium tumefaciens cepa ABL0 usando o método de mergulho floral (Clough and Bent, 1998). Foram selecionadas plantas T1 com Clufosinato ou Higromicina B e a expressão das proteínas quiméricas TAL-SHH1 ou TAL- SUVH2 foi testada por isolamento das proteínas e Western blot com anticorpos contra 3xMyc ou 3xHA, respectivamente. Plantas T1 mostrando forte expressão de transgene foram cruzadas a fim de combinar TAL-SUVH2 com TAL-SHH1 ou construtos hairpin para a região alvo do gene SUPERMAN (At3g23130). As plantas F1 foram genotipadas por PCR para determinar a presença dos transgenes.
Resultados
[0311] Depois de selecionar plantas F1 contendo o TAL-SHH1 direcionado contra o gene SUPERMAN, um TAL-SUVH2 direcionado contra o gene SUPERMAN, ou uma planta contendo ambos os transgenes TAL-SHH1 e TAL-SUVH2, bibliotecas bissulfito do genoma completo foram preparadas utilizando protocolos estabelecidos (Law et al., 2013). Estas bibliotecas foram profundamente sequenciadas e as leituras foram mapeadas para o genoma de Arabidopsis tal como descrito anteriormente (Law et al., 2013). Como mostrado na FIG. 19, a metilação CHH do DNA foi detectada no gene SUPERMAN em plantas contendo ambos os transgenes TAL-SHH1 e TAL-SUVH2, mas não em plantas contendo os transgenes TAL-SHH1 ou TAL- SUVH2 isolados. Estes resultados sugerem que o direcionamento de SHH1 e SUVH2 à região promotora SUPERMAN foi suficiente para causar metilação CHH do DNA. Referências Law, J. A. & Jacobsen, S. E. Establishing, maintaining and modifying DNA methylation patterns in plants and animals. Nat Rev Genet 11, 204-220 (2010). Haag, J. R. & Pikaard, C. S. Multisubunit RNA polymerases IV and V: purveyors of non-coding RNA for plant gene silencing. Nat Rev Mol Cell Biol 12, 483-492, doi:10.1038/nrm3152 (2011). Law, J. A., Vashisht, A. A., Wohlschlegel, J. A. & Jacobsen, S. E. SHH1, a Homeodomain Protein Required for DNA Methylation, As Well As RDR2, RDM4, and Chromatin Remodeling Factors, Associate with RNA Polymerase IV. PLoS Genet 7, e1002195, doi:10.1371/journal.pgen.1002195 (2011). Liu, J. et al. An atypical component of RNA-directed DNA methylation machinery has both DNA methylation-dependent and -independent roles in locus-specific transcriptional gene silencing. Cell Res 21, 1691-1700, doi:10.1038/cr.2011.173 (2011). Olovnikov, I., Aravin, A. A. & Fejes Toth, K. Small RNA in the nucleus: the RNA-chromatin ping-pong. Curr Opin Genet Dev 22, 164-171, doi:10.1016/j.gde.2012.01.002 (2012). Mosher, R. A., Schwach, F., Studholme, D. & Baulcombe, D. C. PolIVb influences RNA-directed DNA methylation independently of its role in siRNA biogenesis. Proc Natl Acad Sci U S A 105, 3145-3150 (2008). Zhang, X., Henderson, I. R., Lu, C., Green, P. J. & Jacobsen, S. E. Role of RNA polymerase IV in plant small RNA metabolism. Proc Natl Acad Sci U S A 104, 4536-4541 (2007). Cokus, S. J. et al. Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNA methylation patterning. Nature 452, 215-219 (2008). Cao, X. et al. Role of the DRM and CMT3 methyltransferases in RNA-directed DNA methylation. Curr Biol 13, 2212-2217 (2003). Du, J. et al. Dual Binding of Chromomethylase Domains to H3K9me2-containing Nucleosomes Directs DNA Methylation in Plants. Cell Accepted (2012). Zhong, X. et al. DDR complex facilitates global association of RNA polymerase V to promoters and evolutionarily young transposons. Nat Struct Mol Biol, doi:10.1038/nsmb.2354 (2012). Mukherjee, K., Brocchieri, L. & Burglin, T. R. A comprehensive classification and evolutionary analysis of plant homeobox genes. Mol Biol Evol 26, 2775-2794 (2009). Cedar, H. & Bergman, Y. Linking DNA methylation and histone modification: patterns and paradigms. Nat Rev Genet 10, 295-304 (2009). Zhang, X., Bernatavichute, Y. V., Cokus, S., Pellegrini, M. & Jacobsen, S. E. Genome-wide analysis of mono-, di- and trimethylation of histone H3 lysine 4 in Arabidopsis thaliana. Genome Biol 10, R62 (2009). Bian, C. et al. Sgf29 binds histone H3K4me2/3 and is required for SAGA complex recruitment and histone H3 acetylation. EMBO J 30, 2829-2842, doi:10.1038/emboj.2011.193 (2011). Holm, L. & Rosenstrom, P. Dali server: conservation mapping in 3D. Nucleic Acids Res 38, W545-549, doi:10.1093/nar/gkq366 (2010). Nady, N. et al. Recognition of multivalent histone states associated with heterochromatin by UHRF1 protein. Journal of Biological Chemistry 286, 24300-24311, doi:10.1074/jbc.M111.234104 (2011). Bernatavichute, Y. V., Zhang, X., Cokus, S., Pellegrini, M. & Jacobsen, S. E. Genome-wide association of histone H3 lysine nine methylation with CHG DNA methylation in Arabidopsis thaliana. PLoS ONE 3, e3156 (2008). Taverna, S. D., Li, H., Ruthenburg, A. J., Allis, C. D. & Patel, D. J. How chromatin-binding modules interpret histone modifications: lessons from professional pocket pickers. Nat Struct Mol Biol 14, 1025-1040, doi:10.1038/nsmb1338 (2007). Zhang, X. et al. Genome-wide high-resolution mapping and functional analysis of DNA methylation in arabidopsis. Cell 126, 1189-1201 (2006). Zilberman, D. et al. Role of Arabidopsis ARGONAUTE4 in RNA-directed DNA methylation triggered by inverted repeats. Curr Biol 14, 1214-1220 (2004). Xie, Z. et al. Genetic and functional diversification of small RNA pathways in plants. PLoS Biol 2, E104 (2004). Li, C. F. et al. An ARGONAUTE4-containing nuclear processing center colocalized with Cajal bodies in Arabidopsis thaliana. Cell 126, 93-106 (2006). Pontes, O. et al. The Arabidopsis chromatin-modifying nuclear siRNA pathway involves a nucleolar RNA processing center. Cell 126, 79-92 (2006). Zilberman, D., Cao, X. & Jacobsen, S. E. ARGONAUTE4 control of locus-specific siRNA accumulation and DNA and histone methylation. Science 299, 716-719 (2003). Adams, P.D., Afonine, P.V., Bunkoczi, G., Chen, V.B., Davis, I.W., Echols, N., Headd, J.J., Hung, L.W., Kapral, G.J., Grosse-Kunstleve, R.W., et al. (2010). PHENIX: a comprehensive Python-based system for macromolecular structure solution. Acta crystallographica Section D, Biological crystallography 66, 213-221. Arita, K., Ariyoshi, M., Tochio, H., Nakamura, Y., and Shirakawa, M. (2008). Recognition of hemi-methylated DNA by the SRA protein UHRF1 by a base-flipping mechanism. Nature 455, 818-821. Aufsatz, W., Mette, M.F., van der Winden, J., Matzke, A.J., and Matzke, M. (2002). RNA-directed DNA methylation in Arabidopsis. Proceedings of the National Academy of Sciences of the United States of America 99 Suppl 4, 16499-16506. Aufsatz, W., Mette, M. F., Matzke, A. J. & Matzke, M. The role of MET1 in RNA-directed de novo and maintenance methylation of CG dinucleotides. Plant Molecular Biology 54, 793-804 (2004). Avvakumov, G.V., Walker, J.R., Xue, S., Li, Y., Duan, S., Bronner, C., Arrowsmith, C.H., and Dhe-Paganon, S. (2008). Structural basis for recognition of hemi-methylated DNA by the SRA domain of human UHRF1. Nature 455, 822-825. Bernatavichute, Y.V., Zhang, X., Cokus, S., Pellegrini, M., and Jacobsen, S.E. (2008). Genome-wide association of histone H3 lysine nine methylation with CHG DNA methylation in Arabidopsis thaliana. PloS one 3, e3156. Black, J.C., Van Rechem, C., and Whetstine, J.R. (2012). Histone lysine methylation dynamics: establishment, regulation, and biological impact. Molecular cell 48, 491507. Bostick, M., Kim, J.K., Esteve, P.O., Clark, A., Pradhan, S., and Jacobsen, S.E. (2007). UHRF1 plays a role in maintaining DNA methylation in mammalian cells. Science 317, 1760-1764. Brzeski, J., and Jerzmanowski, A. (2003). Deficient in DNA methylation 1 (DDM1) defines a novel family of chromatinremodeling factors. The Journal of biological chemistry 278, 823-828. Cao, X., and Jacobsen, S.E. (2002). Role of the arabidopsis DRM methyltransferases in de novo DNA methylation and gene silencing. Current biology : CB 12, 1138-1144. Chan, S.W., Zhang, X., Bernatavichute, Y.V., and Jacobsen, S.E. (2006). Two-step recruitment of RNA-directed DNA methylation to tandem repeats. PLoS biology 4, e363. Du, J., Zhong, X., Bernatavichute, Y.V., Stroud, H., Feng, S., Caro, E., Vashisht, A.A., Terragni, J., Chin, H.G., Tu, A., et al. (2012). Dual Binding of Chromomethylase Domains to H3K9me2-Containing Nucleosomes Directs DNA Methylation in Plants. Cell 151, 167-180. Ebbs, M.L., and Bender, J. (2006). Locus-specific control of DNA methylation by the Arabidopsis SUVH5 histone methyltransferase. The Plant cell 18, 1166-1176. El-Shami, M., Pontier, D., Lahmy, S., Braun, L., Picart, C., Vega, D., Hakimi, M.A., Jacobsen, S.E., Cooke, R., and Lagrange, T. (2007). Reiterated WG/GW motifs form functionally and evolutionarily conserved ARGONAUTE-binding platforms in RNAi-related components. Genes & development 21, 2539-2544. Emsley, P., Lohkamp, B., Scott, W.G., and Cowtan, K. (2010). Features and development of Coot. Acta crystallographica Section D, Biological crystallography 66, 486-501. Feng, S., Rubbi, L., Jacobsen,S.E., and Pellegrini, P. (2011). Determining DNA Methylation Profiles Using Sequencing. Methods in Molecular Biology 733, 223-238. Finnegan, E.J., and Dennis, E.S. (1993). Isolation and identification by sequence homology of a putative cytosine methyltransferase from Arabidopsis thaliana. Nucleic acids research 21, 2383-2388. Gouet, P., Courcelle, E., Stuart, D.I., and Metoz, F. (1999). ESPript: analysis of multiple sequence alignments in PostScript. Bioinformatics 15, 305-308. Greenberg, M.V., Ausin, I., Chan, S.W., Cokus, S.J., Cuperus, J.T., Feng, S., Law, J.A., Chu, C., Pellegrini, M., Carrington, J.C., et al. (2011). Identification of genes required for de novo DNA methylation in Arabidopsis. Epigenetics : official journal of the DNA Methylation Society 6, 344-354. Hashimoto, H., Horton, J.R., Zhang, X., Bostick, M., Jacobsen, S.E., and Cheng, X. (2008). The SRA domain of UHRF1 flips 5-methylcytosine out of the DNA helix. Nature 455, 826-829. Jackson, J.P., Lindroth, A.M., Cao, X., and Jacobsen, S.E. (2002). Control of CpNpG DNA methylation by the KRYPTONITE histone H3 methyltransferase. Nature 416, 556560. Johnson, L.M., Bostick, M., Zhang, X., Kraft, E., Henderson, I., Callis, J., and Jacobsen, S.E. (2007). The SRA methyl-cytosine-binding domain links DNA and histone methylation. Current biology : CB 17, 379-384. Johnson, L.M., Law, J.A., Khattar, A., Henderson, I.R., and Jacobsen, S.E. (2008). SRA-domain proteins required for DRM2-mediated de novo DNA methylation. PLoS genetics 4, e1000280. Jones, P.A. (2012). Functions of DNA methylation: islands, start sites, gene bodies and beyond. Nature reviews Genetics 13, 484-492. Kakutani, T. (1997). Genetic characterization of late- flowering traits induced by DNA hypomethylation mutation in Arabidopsis thaliana. The Plant journal : for cell and molecular biology 12, 1447-1451. Kinoshita, Y., Saze, H., Kinoshita, T., Miura, A., Soppe, W.J., Koornneef, M., and Kakutani, T. (2007). Control of FWA gene silencing in Arabidopsis thaliana by SINE-related direct repeats. The Plant journal : for cell and molecular biology 49, 38-45. Kolb, A.F., Coates, C.J., Kaminski, J.M., Summers, J.B., Miller, A.D., and Segal, D.J. (2005). Site-directed genome modification: nucleic acid and protein modules for targeted integration and gene correction. Trends in biotechnology 23, 399-406. Kuhlmann, M., and Mette, M.F. (2012). Developmentally non-redundant SET domain proteins SUVH2 and SUVH9 are required for transcriptional gene silencing in Arabidopsis thaliana. Plant molecular biology. Larkin, M.A., Blackshields, G., Brown, N.P., Chenna, R., McGettigan, P.A., McWilliam, H., Valentin, F., Wallace, I.M., Wilm, A., Lopez, R., et al. (2007). Clustal W and Clustal X version 2.0. Bioinformatics 23, 2947-2948. Laskowski, R.A., Macarthur, M.W., Moss, D.S., and Thornton, J.M. (1993). PROCHECK: a program to check the stereochemical quality of protein structures. J Appl Crystallogr 26, 283-291. Law, J.A., Ausin, I., Johnson, L.M., Vashisht, A.A., Zhu, J.K., Wohlschlegel, J.A., and Jacobsen, S.E. (2010). A protein complex required for polymerase V transcripts and RNA- directed DNA methylation in Arabidopsis. Current biology : CB 20, 951-956. Law, J.A., and Jacobsen, S.E. (2010). Establishing, maintaining and modifying DNA methylation patterns in plants and animals. Nature reviews Genetics 11, 204-220. Lindroth, A.M., Cao, X., Jackson, J.P., Zilberman, D., McCallum, C.M., Henikoff, S., and Jacobsen, S.E. (2001). Requirement of CHROMOMETHYLASE3 for maintenance of CpXpG methylation. Science 292, 2077-2080. Lindroth, A.M., Shultis, D., Jasencakova, Z., Fuchs, J., Johnson, L., Schubert, D., Patnaik, D., Pradhan, S., Goodrich, J., Schubert, I., et al. (2004). Dual histone H3 methylation marks at lysines 9 and 27 required for interaction with CHROMOMETHYLASE3. The EMBO journal 23, 4286-4296. Lister, R. et al. Highly integrated single-base resolution maps of the epigenome in Arabidopsis. Cell 133, 523-536 (2008). Malagnac, F., Bartee, L., and Bender, J. (2002). An Arabidopsis SET domain protein required for maintenance but not establishment of DNA methylation. The EMBO journal 21, 6842-6852. Otwinowski, Z., and Minor, W. (1997). Processing of X- ray diffraction data collected in oscillation mode. Methods Enzymol 276, 307-326. Pelissier, T., and Wassenegger, M. (2000). A DNA target of 30 bp is sufficient for RNA-directed DNA methylation. RNA 6, 55-65. Pikaard, C.S., Haag, J.R., Ream, T., and Wierzbicki, A.T. (2008). Roles of RNA polymerase IV in gene silencing. Trends in plant science 13, 390-397. Pontier, D., Yahubyan, G., Vega, D., Bulski, A., Saez- Vasquez, J., Hakimi, M.A., Lerbs-Mache, S., Colot, V., and Lagrange, T. (2005). Reinforcement of silencing at transposons and highly repeated sequences requires the concerted action of two distinct RNA polymerases IV in Arabidopsis. Genes & development 19, 2030-2040. Rajakumara, E., Law, J.A., Simanshu, D.K., Voigt, P., Johnson, L.M., Reinberg, D., Patel, D.J., and Jacobsen, S.E. (2011). A dual flip-out mechanism for 5mC recognition by the Arabidopsis SUVH5 SRA domain and its impact on DNA methylation and H3K9 dimethylation in vivo. Genes & development 25, 137-152. Rincon-Arano, H., Halow, J., Delrow, J.J., Parkhurst, S.M., and Groudine, M. (2012). UpSET Recruits HDAC Complexes and Restricts Chromatin Accessibility and Acetylation at Promoter Regions. Cell 151, 1214-1228. Segal, D.J., Beerli, R.R., Blancafort, P., Dreier, B., Effertz, K., Huber, A., Koksch, B., Lund, C.V., Magnenat, L., Valente, D., et al. (2003). Evaluation of a modular strategy for the construction of novel polydactyl zinc finger DNA-binding proteins. Biochemistry 42, 2137-2148. Smith, E., and Shilatifard, A. (2010). The chromatin signaling pathway: diverse mechanisms of recruitment of histone-modifying enzymes and varied biological outcomes. Molecular cell 40, 689-701. Soppe, W.J., Jacobsen, S.E., Alonso-Blanco, C., Jackson, J.P., Kakutani, T., Koornneef, M., and Peeters, A.J. (2000). The late flowering phenotype of fwa mutants is caused by gain-of-function epigenetic alleles of a homeodomain gene. Molecular cell 6, 791-802. Springer, N.M., Napoli, C.A., Selinger, D.A., Pandey, R., Cone, K.C., Chandler, V.L., Kaeppler, H.F., and Kaeppler, S.M. (2003). Comparative analysis of SET domain proteins in maize and Arabidopsis reveals multiple duplications preceding the divergence of monocots and dicots. Plant physiology 132, 907-925. Stroud, H., Greenberg, M.V., Feng, S., Bernatavichute, Y.V., and Jacobsen, S.E. (2013). Comprehensive analysis of silencing mutants reveals complex regulation of the Arabidopsis methylome. Cell 152, 352-364. Wierzbicki, A.T., Haag, J.R., and Pikaard, C.S. (2008). Noncoding transcription by RNA polymerase Pol IVb/Pol V mediates transcriptional silencing of overlapping and adjacent genes. Cell 135, 635-648. Wierzbicki, A.T., Ream, T.S., Haag, J.R., and Pikaard, C.S. (2009). RNA polymerase V transcription guides ARGONAUTE4 to chromatin. Nature genetics 41, 630-634. Woo, H.R., Dittmer, T.A., and Richards, E.J. (2008). Three SRA-domain methylcytosine-binding proteins cooperate to maintain global CpG methylation and epigenetic silencing in Arabidopsis. PLoS genetics 4, e1000156. Wu, H., Min, J., Lunin, V.V., Antoshenko, T., Dombrovski, L., Zeng, H., Allali-Hassani, A., Campagna- Slater, V., Vedadi, M., Arrowsmith, C.H., et al. (2010). Structural biology of human H3K9 methyltransferases. PloS one 5, e8570. Zhang, X., Tamaru, H., Khan, S.I., Horton, J.R., Keefe, L.J., Selker, E.U., and Cheng, X. (2002). Structure of the Neurospora SET domain protein DIM-5, a histone H3 lysine methyltransferase. Cell 111, 117-127. Zhang, X., Yang, Z., Khan, S.I., Horton, J.R., Tamaru, H., Selker, E.U., and Cheng, X. (2003). Structural basis for the product specificity of histone lysine methyltransferases. Molecular cell 12, 177-185. Zhong, X., Hale, C.J., Law, J.A., Johnson, L.M., Feng, S., Tu, A., and Jacobsen, S.E. (2012). DDR complex facilitates global association of RNA polymerase V to promoters and evolutionarily young transposons. Nature structural & molecular biology. Clough, S.J., and Bent, A.F. (1998). Floral dip: a simplified method for Agrobacterium-mediated transformation of Arabidopsis thaliana. The Plant journal : for cell and molecular biology 16, 735-743. Law, J.A., Du, J., Hale, C.J., Feng, S., Krajewski, K., Palanca, A.M., Strahl, B.D., Patel, D.J., and Jacobsen, S.E. (2013). Polymerase IV occupancy at RNA-directed DNA methylation sites requires SHH1. Nature 498, 385-389. Sanjana, N.E., Cong, L., Zhou, Y., Cunniff, M.M., Feng, G., and Zhang, F. (2012). A transcription activator-like effector toolbox for genome engineering. Nature protocols 7, 171-192. Valton, J., Dupuy, A., Daboussi, F., Thomas, S., Marechal, A., Macmaster, R., Melliand, K., Juillerat, A., and Duchateau, P. (2012). Overcoming transcription activator-like effector (TALE) DNA binding domain sensitivity to cytosine methylation. The Journal of biological chemistry 287, 38427-38432. Guillaume Moissiard, Shawn J. Cokus, Joshua Cary, Suhua Feng, Allison C. Billi, Hume Stroud, Dylan Husmann, Ye Zhan, Bryan R. Lajoie, Rachel Patton McCord, Christopher J. Hale, Wei Feng, Scott D. Michaels, Alison R. Frand, Matteo Pellegrini, Job Dekker, John K. Kim, and Steven E. Jacobsen. (2012) MORC Family ATPases Required for Heterochromatin Condensation and Gene Silencing. Science, 336:1448-1451. Ian R. Henderson, Angelique Deleris, William Wong, Xuehua Zhong, Hang Gyeong Chin, Gregory A. Horwitz, Krystyna A. Kelly, Sriharsa Pradhan, Steven E. Jacobsen. (2010) The De Novo Cytosine Methyltransferase DRM2 Requires Intact UBA Domains and a Catalytically Mutated Paralog DRM3 during RNA- Directed DNA Methylation in Arabidopsis thaliana. PLoS Genetics, (6) 10: e1001182. DECLARAÇÕES DE MODALIDADES 1. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SHH1 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 2. Método da modalidade 1, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 3. Método da modalidade 2, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 4. Método da modalidade 2, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 5. Método da modalidade 2, em que o domínio de dedo de zinco é selecionado dentre o grupo consistindo em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína e um domínio do cluster binuclear de zinco. 6. Método da modalidade 1, em que o domínio de ligação ao DNA é selecionado é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 7. Método da modalidade 1, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 8. Método da modalidade 1, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 9. Método de qualquer uma das modalidades 1-8, em que a segunda sequência de aminoácidos compreende pelo menos um de um homeodomínio ou um domínio SAWADEE. 10. Método da modalidade 1, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75% em menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 1. 11. Método da modalidade 1, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 1. 12. Método de qualquer uma das modalidades 1-11, em que o polipeptídeo recombinante interage com uma RNA polimerase. 13. Método da modalidade 12, em que a RNA polimerase é RNA polimerase IV. 14. Método de qualquer uma das modalidades 1-13, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 15. Método de qualquer uma das modalidades 1-14, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 16. Método de qualquer uma das modalidades 1-14, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 17. Método de qualquer uma das modalidades 1-16, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 18. Ácido nucleico recombinante que codifica uma proteína semelhante à SHH1 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SHH1 ou fragmento do mesmo. 19. Ácido nucleico recombinante da modalidade 18, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 1. 20. Ácido nucleico recombinante da modalidade 18, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 1. 21. Ácido nucleico recombinante, de qualquer uma das modalidades 18-20, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 22. Ácido nucleico recombinante da modalidade 21, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 23. Ácido nucleico recombinante da modalidade 21, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 24. Ácido nucleico recombinante da modalidade 21, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 25. Ácido nucleico recombinante de qualquer uma das modalidades 18-20, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 26. Ácido nucleico recombinante de qualquer uma das modalidades 18-20, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 27. Ácido nucleico recombinante de qualquer uma das modalidades 18-20, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 28. Ácido nucleico recombinante da modalidade 27, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 29. Ácido nucleico recombinante da modalidade 27, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 30. Ácido nucleico recombinante da modalidade 27, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 31. Ácido nucleico recombinante de qualquer uma das modalidades 27-30, em que a proteína semelhante à SHH1 reduz a expressão de um ou mais ácidos nucleicos alvos. 32. Ácido nucleico recombinante de qualquer uma das modalidades 27-30, em que proteína semelhante à SHH1 silencia a expressão da proteína de um ou mais ácidos nucleicos alvos. 33. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 18-32, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 34. Célula hospedeira compreendendo o vetor de expressão da modalidade 33. 35. Célula hospedeira da modalidade 34, em que a célula hospedeira é uma célula vegetal. 36. Planta recombinante compreendendo o ácido nucleico recombinante de qualquer uma das modalidades 18-32. 37. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SUVH2 ou fragmento do mesmo, ou um polipeptídeo SUVH9 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 38. Método da modalidade 37, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 39. Método da modalidade 38, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 40. Método da modalidade 38, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 41. Método da modalidade 38, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 42. Método da modalidade 37, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 43. Método da modalidade 37, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 44. Método da modalidade 37, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 45. Método das modalidades 37-45, em que a segunda sequência de aminoácidos compreende um domínio selecionado a partir do grupo que consiste em um domínio de feixe de duas hélices, um domínio SRA, um domínio pré-SET, e um domínio SET. 46. Método da modalidade 37, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75% em menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. 47. Método da modalidade 37, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. 48. Método de qualquer uma das modalidades 37-47, em que o polipeptídeo recombinante interage com uma RNA polimerase. 49. Método da modalidade 48, em que a RNA polimerase é RNA polimerase V. 50. Método de qualquer uma das modalidades 37-49, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 51. Método de qualquer uma das modalidades 37-50, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 52. Método de qualquer uma das modalidades 37-50, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 53. Método de qualquer uma das modalidades 37-52, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 54. Ácido nucleico recombinante que codifica uma proteína semelhante à SUVH2 ou uma proteína semelhante à SUVH9 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SUVH2 ou fragmento do mesmo, ou um polipeptídeo SUVH9 ou fragmento do mesmo. 55. Ácido nucleico recombinante, de acordo com a reivindicação 54, caracterizado pelo fato de que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75% pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. 56. Ácido nucleico recombinante da modalidade 54, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 14 ou SEQ ID NO: 27. 57. Ácido nucleico recombinante qualquer uma das modalidades 54-56, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 58. Ácido nucleico recombinante da modalidade 57, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 59. Ácido nucleico recombinante da modalidade 57, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 60. Ácido nucleico recombinante da modalidade 57, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 61. Ácido nucleico recombinante qualquer uma das modalidades 54-56, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família de hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 62. Ácido nucleico recombinante qualquer uma das modalidades 54-56, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 63. Ácido nucleico recombinante qualquer uma das modalidades 54-62, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 64. Ácido nucleico recombinante da modalidade 63, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 65. Ácido nucleico recombinante da modalidade 63, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 66. Ácido nucleico recombinante da modalidade 63, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 67. Ácido nucleico recombinante qualquer uma das modalidades 63-66, em que a proteína semelhante à SUVH2 ou proteína semelhante à SUVH9 reduz a expressão de um ou mais ácidos nucleicos alvos. 68. Vetor compreendendo o ácido nucleico recombinante de qualquer uma das modalidades 54-67, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 69. Célula hospedeira compreendendo o vetor de expressão da modalidade 68. 70. Célula hospedeira da modalidade 69, em que a célula hospedeira é uma célula vegetal. 71. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 54-67. 72. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta compreendendo: um primeiro ácido nucleico recombinante que codifica um primeiro polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SHH1 ou fragmento do mesmo, e um segundo ácido nucleico recombinante que codifica um segundo polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos que compreende um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SUVH2 ou fragmento do mesmo, ou um polipeptídeo SUVH9 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o primeiro polipeptídeo recombinante codificado pelo primeiro ácido nucleico recombinante e o segundo polipeptídeo recombinante codificado pelo segundo ácido nucleico recombinante são expressos e se ligam a um ou mais ácidos nucleicos alvos, reduzindo assim a expressão do um ou mais ácidos nucleicos alvos. 73. Método da modalidade 72, em que pelo menos um dos primeiro ou segundo polipeptídeos recombinantes induz metilação de DNA dirigida por RNA. 74. Método de qualquer uma das modalidades 72-73, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 75. Método de qualquer uma das modalidades 72-73, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 76. Método de qualquer uma das modalidades 72-75, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 77. Célula hospedeira compreendendo os vetores de expressão de qualquer uma das modalidades 33 e 68. 78. Célula hospedeira da modalidade 77, em que a célula hospedeira é uma célula vegetal. 79. Planta recombinante compreendendo o ácido nucleico recombinante de qualquer uma das modalidades 18-32 e qualquer uma das modalidades 54-67. 80. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante que codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DMS3 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 81. Método da modalidade 80, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 82. Método da modalidade 81, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 83. Método da modalidade 81, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 84. Método da modalidade 81, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 85. Método da modalidade 80, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio de alvo efetor TAL, domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio TBP, um dímero do domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 86. Método da modalidade 80, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 87. Método da modalidade 80, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 88. Método da modalidade 80, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 41. 89. Método da modalidade 80, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 41. 90. Método de qualquer uma das modalidades 80-89, em que o polipeptídeo recombinante interage com uma RNA polimerase. 91. Método de qualquer uma das modalidades 80-90, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 92. Método de qualquer uma das modalidades 80-91, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 93. Método de qualquer uma das modalidades 80-91, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 94. Método de qualquer uma das modalidades 80-93, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 95. Ácido nucleico recombinante que codifica uma proteína semelhante à DMS3 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DMS3 ou fragmento do mesmo. 96. Ácido nucleico recombinante da modalidade 95, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico ao SEQ ID NO: 41. 97. Ácido nucleico recombinante da modalidade 96, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 41. 98. Ácido nucleico recombinante de qualquer uma das modalidades 95-97, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 99. Ácido nucleico recombinante da modalidade 98, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 100. Ácido nucleico recombinante da modalidade 98, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 101. Ácido nucleico recombinante da modalidade 98, em que o domínio de dedo de zinco é selecionado a partir do grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 102. Ácido nucleico recombinante de qualquer uma das modalidades 95-97, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família de hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 103. Ácido nucleico recombinante de qualquer uma das modalidades 95-97, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 104. Ácido nucleico recombinante de qualquer uma das modalidades 95-97, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 105. Ácido nucleico recombinante da modalidade 104, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 106. Ácido nucleico recombinante da modalidade 104, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 107. Ácido nucleico recombinante da modalidade 104, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 108. Ácido nucleico recombinante de qualquer uma das modalidades 104-107, em que a proteína semelhante à DMS3 reduz a expressão de um ou mais ácidos nucleicos alvos. 109. Ácido nucleico recombinante de qualquer uma das modalidades 104-107, em que a proteína semelhante à DMS3 silencia a expressão de um ou mais ácidos nucleicos alvos. 110. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 95-109, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 111. Célula hospedeira compreendendo a expressão do vetor da modalidade 110. 112. Célula hospedeira da modalidade 111, em que a célula hospedeira é uma célula vegetal. 113. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 95-112. 114. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo MORC6 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 115. Método da modalidade 114, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 116. Método da modalidade 115, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 117. Método da modalidade 115, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 118. Método da modalidade 115, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 119. Método da modalidade 114, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família de hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 120. Método da modalidade 114, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 121. Método da modalidade 114, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 122. Método da modalidade 114, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 53. 123. Método da modalidade 114, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 53. 124. Método de qualquer uma das modalidades 114-123, em que o polipeptídeo recombinante interage com uma RNA polimerase. 125. Método de qualquer uma das modalidades 114-123, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 126. Método de qualquer uma das modalidades 114-125, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 127. Método de qualquer uma das modalidades 114-125, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 128. Método de qualquer uma das modalidades 114-127, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 129. Ácido nucleico recombinante codifica uma proteína semelhante à MORC6 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo MORC6 ou fragmento do mesmo. 130. Ácido nucleico recombinante da modalidade 129, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 53. 131. Ácido nucleico recombinante da modalidade 130, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 53. 132. Ácido nucleico recombinante de qualquer uma das modalidades 129-131, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 133. Ácido nucleico recombinante da modalidade 132, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 134. Ácido nucleico recombinante da modalidade 132, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 135. Ácido nucleico recombinante da modalidade 132, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 136. Ácido nucleico recombinante de qualquer uma das modalidades 129-131, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família de hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 137. Ácido nucleico recombinante de qualquer uma das modalidades 129-131, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 138. Ácido nucleico recombinante de qualquer uma das modalidades 129-131, em que o domínio de ligação ao DNA se liga de um ou mais ácidos nucleicos alvos. 139. Ácido nucleico recombinante da modalidade 138, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 140. Ácido nucleico recombinante da modalidade 138, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 141. Ácido nucleico recombinante da modalidade 138, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 142. Ácido nucleico recombinante de qualquer uma das modalidades 138-141, em que a proteína semelhante à MORC6 reduz a expressão de um ou mais ácidos nucleicos alvos. 143. Ácido nucleico recombinante de qualquer uma das modalidades 138-141, em que a proteína semelhante à MORC6 silencia a expressão de um ou mais ácidos nucleicos alvos. 144. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 114-143, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 145. Célula hospedeira compreendendo o vetor de expressão da modalidade 144. 146. Célula hospedeira da modalidade 145, em que a célula hospedeira é uma célula vegetal. 147. Planta recombinante compreendendo ácido nucleico recombinante qualquer uma das modalidades 114-143. 148. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SUVR2 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 149. Método da modalidade 148, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 150. Método da modalidade 149, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 151. Método da modalidade 149, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 152. Método da modalidade 149, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 153. Método da modalidade 148, em que o domínio de ligação ao DNA em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família de hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 154. Método da modalidade 148, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 155. Método da modalidade 148, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 156. Método da modalidade 148, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 66. 157. Método da modalidade 148, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 66. 158. Método de qualquer uma das modalidades 148-157, em que o polipeptídeo recombinante interage com uma RNA polimerase. 159. Método de qualquer uma das modalidades 148-157, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 160. Método de qualquer uma das modalidades 148-159, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 161. Método de qualquer uma das modalidades 148-159, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 162. Método de qualquer uma das modalidades 148-161, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 163. Ácido nucleico recombinante que codifica uma proteína semelhante à SUVR2 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SUVR2 ou fragmento do mesmo. 164. Ácido nucleico recombinante da modalidade 163, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 66. 165. Ácido nucleico recombinante da modalidade 164, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 66. 166. Ácido nucleico recombinante de qualquer uma das modalidades 163-165, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 167. Ácido nucleico recombinante da modalidade 166, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 168. Ácido nucleico recombinante da modalidade 166, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 169. Ácido nucleico recombinante da modalidade 166, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 170. Ácido nucleico recombinante de qualquer uma das modalidades 163-165, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40 e um domínio MBD. 171. Ácido nucleico recombinante de qualquer uma das modalidades 163-165, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 172. Ácido nucleico recombinante de qualquer uma das modalidades 163-165, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 173. Ácido nucleico recombinante da modalidade 172, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 174. Ácido nucleico recombinante da modalidade 172, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 175. Ácido nucleico recombinante da modalidade 172, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 176. Ácido nucleico recombinante de qualquer uma das modalidades 172-175, em que a proteína semelhante à SUVR2 reduz a expressão de um ou mais ácidos nucleicos alvos. 177. Ácido nucleico recombinante de qualquer uma das modalidades 172-175, em que a proteína semelhante à SUVR2 silencia a expressão de um ou mais ácidos nucleicos alvos. 178. Vetor compreendendo ácido nucleico recombinante, de qualquer uma das modalidades 163-177, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 179. Célula hospedeira compreendendo o vetor de expressão da modalidade 178. 180. Célula hospedeira da modalidade 179, em que a célula hospedeira é uma célula vegetal. 181. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 163-177. 182. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta compreendendo: um primeiro ácido nucleico recombinante codifica um primeiro polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SHH1 ou fragmento do mesmo, e um ou mais ácidos nucleicos recombinantes que codificam um ou mais polipeptídeos adicionais, cada um dos um ou mais polipeptídeos que compreendem uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo selecionado a partir do grupo que consiste em um SUVH2 polipeptídeo ou fragmento do mesmo, um polipeptídeo SUVH9 ou fragmento do mesmo, um polipeptídeo DMS3 ou fragmento do mesmo, um polipeptídeo MORC6 ou um fragmento deste, e um polipeptídeo SUVR2 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o primeiro polipeptídeo recombinante codificado pelo primeiro ácido nucleico recombinante e a um ou mais polipeptídeos codificados por um ou mais ácidos nucleicos recombinantes adicionais são expressos e se ligam a um ou mais ácidos nucleicos alvos, reduzindo assim a expressão de um ou mais ácidos nucleicos alvos. 183. Método da modalidade 182, em que pelo menos um dos polipeptídeos recombinantes induz metilação de DNA dirigida por RNA. 184. Método de qualquer uma das modalidades 182-183, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 185. Método de qualquer uma das modalidades 182-183, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 186. Método de qualquer uma das modalidades 182-185, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 187. Célula hospedeira compreendendo os vetores de expressão que compreendem os ácidos nucleicos recombinantes que codificam os polipeptídeos recombinantes da modalidade 182. 188. Célula hospedeira da modalidade 187, em que a célula hospedeira é uma célula vegetal. 189. Planta recombinante, compreendendo os ácidos nucleicos recombinantes da modalidade 182. 190. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DRD1 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 191. Método da modalidade 190, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 192. Método da modalidade 191, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 193. Método da modalidade 191, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 194. Método da modalidade 191, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 195. Método da modalidade 190, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 196. Método da modalidade 190, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 197. Método da modalidade 190, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 198. Método da modalidade 190, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 79. 199. Método da modalidade 100, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 79. 200. Método de qualquer uma das modalidades 190-199, em que o polipeptídeo recombinante interage com uma RNA polimerase. 201. Método de qualquer uma das modalidades 190-199, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 202. Método de qualquer uma das modalidades 190-201, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 203. Método de qualquer uma das modalidades 190-201, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 204. Método de qualquer uma das modalidades 190-203, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 205. Ácido nucleico recombinante codifica uma proteína semelhante à DRD1 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DRD1 ou fragmento do mesmo. 206. Ácido nucleico recombinante da modalidade 205, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico ao SEQ ID NO: 79. 207. Ácido nucleico recombinante da modalidade 206, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 79. 208. Ácido nucleico recombinante de qualquer uma das modalidades 205-207, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 209. Ácido nucleico recombinante da modalidade 208, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 210. Ácido nucleico recombinante da modalidade 208, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 211. Ácido nucleico recombinante da modalidade 208, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 212. Ácido nucleico recombinante de qualquer uma das modalidades 205-207, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio de fita- hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 213. Ácido nucleico recombinante de qualquer uma das modalidades 205-207, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 214. Ácido nucleico recombinante de qualquer uma das modalidades 205-207, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 215. Ácido nucleico recombinante da modalidade 214, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 216. Ácido nucleico recombinante da modalidade 214, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 217. Ácido nucleico recombinante da modalidade 214, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 218. Ácido nucleico recombinante de qualquer uma das modalidades 214-217, em que a proteína semelhante à DRD1 reduz a expressão de um ou mais ácidos nucleicos alvos. 219. Ácido nucleico recombinante de qualquer uma das modalidades 214-217, em que a proteína semelhante à DRD1 silencia a expressão de um ou mais ácidos nucleicos alvos. 220. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 205-219, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 221. Célula hospedeira compreendendo o vetor de expressão da modalidade 220. 222. Célula hospedeira da modalidade 221, em que a célula hospedeira é uma célula vegetal. 223. Planta recombinante compreendendo ácido nucleico recombinante qualquer uma das modalidades 205-219. 224. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo RDM1 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 225. Método da modalidade 224, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 226. Método da modalidade 225, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 227. Método da modalidade 225, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 228. Método da modalidade 225, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 229. Método da modalidade 224, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 230. Método da modalidade 224, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 231. Método da modalidade 224, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 232. Método da modalidade 224, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75% em menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 91. 233. Método da modalidade 232, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 91. 234. Método de qualquer uma das modalidades 224-233, em que o polipeptídeo recombinante interage com uma RNA polimerase. 235. Método de qualquer uma das modalidades 224-233, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 236. Método de qualquer uma das modalidades 224-235, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 237. Método de qualquer uma das modalidades 224-235, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 238. Método de qualquer uma das modalidades 224-237, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 239. Ácido nucleico recombinante codifica uma proteína semelhante à RDM1 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo RDM1 ou fragmento do mesmo. 240. Ácido nucleico recombinante da modalidade 239, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 91. 241. Ácido nucleico recombinante da modalidade 240, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 91. 242. Ácido nucleico recombinante de qualquer uma das modalidades 239-241, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 243. Ácido nucleico recombinante da modalidade 242, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 244. Ácido nucleico recombinante da modalidade 242, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 245. Ácido nucleico recombinante da modalidade 242, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 246. Ácido nucleico recombinante de qualquer uma das modalidades 239-241, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família de hélice-volta-hélice de ligação ao DNA, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 247. Ácido nucleico recombinante de qualquer uma das modalidades 239-241, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 248. Ácido nucleico recombinante de qualquer uma das modalidades 239-241, em que o domínio de ligação ao DNA se liga de um ou mais ácidos nucleicos alvos. 249. Ácido nucleico recombinante da modalidade 248, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 250. Ácido nucleico recombinante da modalidade 248, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 251. Ácido nucleico recombinante da modalidade 248, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 252. Ácido nucleico recombinante de qualquer uma das modalidades 248-251, em que a proteína semelhante à RDM1 reduz a expressão de um ou mais ácidos nucleicos alvos. 253. Ácido nucleico recombinante de qualquer uma das modalidades 248-251, em que a expressão da proteína semelhante à RDM1 silencia um ou mais ácidos nucleicos alvos. 254. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 239-253, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 255. Célula hospedeira compreendendo o vetor de expressão da modalidade 254. 256. Célula hospedeira da modalidade 255, em que a célula hospedeira é uma célula vegetal. 257. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 239-253. 258. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, que compreende: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DRM3 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 259. Método da modalidade 258, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 260. Método da modalidade 259, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 261. Método da modalidade 259, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 262. Método da modalidade 259, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 263. Método da modalidade 258, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 264. Método da modalidade 258, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 265. Método da modalidade 258, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 266. Método da modalidade 258, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 101. 267. Método da modalidade 266, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 101. 268. Método de qualquer uma das modalidades 258-267, em que o polipeptídeo recombinante interage com uma RNA polimerase. 269. Método de qualquer uma das modalidades 258-267, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 270. Método de qualquer uma das modalidades 258-269, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 271. Método de qualquer uma das modalidades 258-269, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 272. Método de qualquer uma das modalidades 258-271, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 273. Ácido nucleico recombinante que codifica uma proteína semelhante à DRM3 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DRM3 ou fragmento do mesmo. 274. Ácido nucleico recombinante da modalidade 273, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 101. 275. Ácido nucleico recombinante da modalidade 274, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 101. 276. Ácido nucleico recombinante de qualquer uma das modalidades 273-275, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 277. Ácido nucleico recombinante da modalidade 276, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 278. Ácido nucleico recombinante da modalidade 276, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 279. Ácido nucleico recombinante da modalidade 276, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 280. Ácido nucleico recombinante de qualquer uma das modalidades 273-275, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 281. Ácido nucleico recombinante de qualquer uma das modalidades 273-275, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 282. Ácido nucleico recombinante de qualquer uma das modalidades 273-275, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 283. Ácido nucleico recombinante da modalidade 282, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 284. Ácido nucleico recombinante da modalidade 282, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 285. Ácido nucleico recombinante da modalidade 282, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 286. Ácido nucleico recombinante de qualquer uma das modalidades 282-285, em que a proteína semelhante à DRM3 reduz a expressão de um ou mais ácidos nucleicos alvos. 287. Ácido nucleico recombinante de qualquer uma das modalidades 282-285, em que a expressão da proteína semelhante à DRM3 silencia um ou mais ácidos nucleicos alvos. 288. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 273-287, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 289. Célula hospedeira compreendendo o vetor de expressão da modalidade 288. 290. Célula hospedeira da modalidade 289, em que a célula hospedeira é uma célula vegetal. 291. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 273-287. 292. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, que compreende: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DRM2 ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expresso e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 293. Método da modalidade 292, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 294. Método da modalidade 293, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 295. Método da modalidade 293, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 296. Método da modalidade 293, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 297. Método da modalidade 292, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 298. Método da modalidade 292, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 299. Método da modalidade 292, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 300. Método da modalidade 292, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 113. 301. Método da modalidade 300, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 113. 302. Método de qualquer uma das modalidades 292-301, em que o polipeptídeo recombinante interage com uma RNA polimerase. 303. Método de qualquer uma das modalidades 292-301, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 304. Método de qualquer uma das modalidades 292-303, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 305. Método de qualquer uma das modalidades 292-303, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 306. Método de qualquer uma das modalidades 292-305, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 307. Ácido nucleico recombinante que codifica uma proteína semelhante à DRM2 compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DRM2 ou fragmento do mesmo. 308. Ácido nucleico recombinante da modalidade 307, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntico ao SEQ ID NO: 113. 309. Ácido nucleico recombinante da modalidade 308, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 113. 310. Ácido nucleico recombinante de qualquer uma das modalidades 307-309, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 311. Ácido nucleico recombinante da modalidade 310, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 312. Ácido nucleico recombinante da modalidade 310, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 313. Ácido nucleico recombinante da modalidade 310, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 314. Ácido nucleico recombinante de qualquer uma das modalidades 307-309, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 315. Ácido nucleico recombinante de qualquer uma das modalidades 307-309, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 316. Ácido nucleico recombinante de qualquer uma das modalidades 307-309, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 317. Ácido nucleico recombinante da modalidade 316, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 318. Ácido nucleico recombinante da modalidade 316, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 319. Ácido nucleico recombinante da modalidade 316, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 320. Ácido nucleico recombinante de qualquer uma das modalidades 316-319, em que a proteína semelhante à DRM2 reduz a expressão de um ou mais ácidos nucleicos alvos. 321. Ácido nucleico recombinante de qualquer uma das modalidades 316-319, em que a expressão da proteína semelhante à DRM2 silencia um ou mais ácidos nucleicos alvos. 322. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 307-321, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 323. Célula hospedeira compreendendo o vetor de expressão da modalidade 322. 324. Célula hospedeira da modalidade 323, em que a célula hospedeira é uma célula vegetal. 325. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 307-321. 326. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, que compreende: (a) fornecer uma planta que compreende um ácido nucleico recombinante, em que o ácido nucleico recombinante codifica um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo FRG ou fragmento do mesmo; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante codificado pelo ácido nucleico recombinante é expressa e se liga a um ou mais ácidos nucleicos alvos, reduzindo deste modo a expressão de um ou mais ácidos nucleicos alvos. 327. Método da modalidade 326, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 328. Método da modalidade 327, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 329. Método da modalidade 327, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 330. Método da modalidade 327, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco Cys2His2 (C2H2), um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi-cisteína, e um domínio do cluster binuclear de zinco. 331. Método da modalidade 326, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 332. Método da modalidade 326, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 333. Método da modalidade 326, em que o domínio de ligação ao DNA compreende três domínios de dedo de zinco C2H2. 334. Método da modalidade 326, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 125. 335. Método da modalidade 334, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 125. 336. Método de qualquer uma das modalidades 326-335, em que o polipeptídeo recombinante interage com uma RNA polimerase. 337. Método de qualquer uma das modalidades 326-335, em que o polipeptídeo recombinante induz metilação de DNA dirigida por RNA. 338. Método de qualquer uma das modalidades 326-337, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 339. Método de qualquer uma das modalidades 326-337, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 340. Método de qualquer uma das modalidades 326-339, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 341. Ácido nucleico recombinante codifica uma proteína semelhante à FRG compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo FRG ou fragmento do mesmo. 342. Ácido nucleico recombinante da modalidade 341, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é pelo menos 50%, pelo menos 55%, pelo menos 60%, pelo menos 65%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 125. 343. Ácido nucleico recombinante da modalidade 342, em que a segunda sequência de aminoácidos compreende uma sequência de aminoácidos que é 100% idêntica à SEQ ID NO: 125. 344. Ácido nucleico recombinante de qualquer uma das modalidades 341-343, em que o domínio de ligação ao DNA compreende um domínio de dedo de zinco. 345. Ácido nucleico recombinante da modalidade 344, em que o domínio de dedo de zinco compreende dois, três, quatro, cinco, seis, sete, oito ou nove dedos de zinco. 346. Ácido nucleico recombinante da modalidade 344, em que o domínio de dedo de zinco é um arranjo de dedo de zinco. 347. Ácido nucleico recombinante da modalidade 344, em que o domínio de dedo de zinco é selecionado de entre o grupo que consiste em um domínio de dedo de zinco C2H2, um domínio de dedo de zinco CCCH, um domínio de dedo de zinco de multi- cisteína, e um domínio do cluster binuclear de zinco. 348. Ácido nucleico recombinante de qualquer uma das modalidades 341-343, em que o domínio de ligação ao DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio de ligação ao DNA da família hélice-volta-hélice, um domínio básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Cromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD. 349. Ácido nucleico recombinante de qualquer uma das modalidades 341-343, em que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL. 350. Ácido nucleico recombinante de qualquer uma das modalidades 341-343, em que o domínio de ligação ao DNA se liga a um ou mais ácidos nucleicos alvos. 351. Ácido nucleico recombinante da modalidade 350, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos que codificam polipeptídeos. 352. Ácido nucleico recombinante da modalidade 350, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos de planta endógenos. 353. Ácido nucleico recombinante da modalidade 350, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 354. Ácido nucleico recombinante de qualquer uma das modalidades 350-353, em que a proteína semelhante à FRG como reduz a expressão de um ou mais ácidos nucleicos alvos. 355. Ácido nucleico recombinante de qualquer uma das modalidades 350-353, em que a proteína semelhante à FRG silencia expressão de um ou mais ácidos nucleicos alvos. 356. Vetor compreendendo ácido nucleico recombinante de qualquer uma das modalidades 341-355, em que o ácido nucleico recombinante está operativamente ligado a uma sequência reguladora. 357. Célula hospedeira compreendendo o vetor de expressão da modalidade 356. 358. Célula hospedeira da modalidade 357, em que a célula hospedeira é uma célula vegetal. 359. Planta recombinante compreendendo ácido nucleico recombinante de qualquer uma das modalidades 341-355. 360. Método para reduzir a expressão de um ou mais ácidos nucleicos alvos em uma planta, compreendendo: (a) fornecer uma planta compreendendo: um primeiro ácido nucleico recombinante codifica um primeiro polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo SHH1 ou fragmento do mesmo, e um ou mais ácidos nucleicos recombinantes que codificam um ou mais polipeptídeos adicionais, cada um dos um ou mais polipeptídeos adicionais que compreendem uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo selecionado a partir do grupo que consiste em um polipeptídeo SUVH2 ou fragmento do mesmo, um polipeptídeo SUVH9 ou fragmento do mesmo, um polipeptídeo DMS3 ou fragmento do mesmo, um polipeptídeo MORC6 ou fragmento do mesmo, um polipeptídeo SUVR2 ou fragmento do mesmo, um polipeptídeo DRD1 ou fragmento do mesmo; um polipeptídeo RDM1 ou fragmento do mesmo; um polipeptídeo DRM3 ou fragmento do mesmo; um polipeptídeo DRM2 ou fragmento do mesmo; e um polipeptídeo FRG ou fragmento do mesmo, e (b) cultivar a planta sob condições em que o primeiro polipeptídeo recombinante codificado pelo primeiro ácido nucleico recombinante e a um ou mais polipeptídeos adicionais codificados por um ou mais ácidos nucleicos recombinantes adicionais são expressos e se ligam a um ou mais ácidos nucleicos alvos, reduzindo assim a expressão de um ou mais ácidos nucleicos alvos. 361. Método da modalidade 360, em que pelo menos um dos polipeptídeos recombinantes induz metilação de DNA dirigida por RNA. 362. Método de qualquer uma das modalidades 360-361, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos endógenos. 363. Método de qualquer uma das modalidades 360-361, em que o um ou mais ácidos nucleicos alvos são ácidos nucleicos heterólogos. 364. Método de qualquer uma das modalidades 360-363, em que a expressão de um ou mais ácidos nucleicos alvos é silenciada. 365. Célula hospedeira compreendendo os vetores de expressão que compreendem os ácidos nucleicos recombinantes que codificam os polipeptídeos recombinantes da modalidade 360. 366. Célula hospedeira da modalidade 365, em que a célula hospedeira é uma célula vegetal. 367. Planta recombinante, compreendendo os ácidos nucleicos recombinantes da modalidade 360. 368. Planta tendo a expressão reduzida de um ou mais ácidos nucleicos alvos, como consequência do método de qualquer uma das modalidades 1-17, 37-53, 80-94, 114-128, 148-162, 190-204, 224-238, 258-272, 292-306 e 326-340. 369. Progênie da planta da planta da modalidade 368. 370. Progênie da planta da modalidade 369, em que a progênie da planta reduziu a expressão de um ou mais ácidos nucleicos alvos e não compreende o ácido nucleico recombinante. 371. Planta tendo a expressão reduzida de um ou mais ácidos nucleicos alvos, como consequência do método de qualquer uma das modalidades 72-76. 372. Progênie da planta da planta da modalidade 371. 373. Progênie da planta da modalidade 372, em que a progênie da planta reduziu a expressão de um ou mais ácidos nucleicos alvos e não compreende o primeiro ou segundo ácido nucleico recombinante. 374. Planta tendo a expressão reduzida de um ou mais ácidos nucleicos alvos, como consequência do método de qualquer uma das modalidades 182-186 e 360-364. 375. Progênie da planta da planta da modalidade 374. 376. Progênie da planta da modalidade 375, em que a progênie da planta reduziu a expressão de um ou mais ácidos nucleicos alvos e não compreende o primeiro ácido nucleico recombinante ou o um ou mais ácidos nucleicos recombinantes adicionais.

Claims (8)

1. Método para reduzir a expressão de um ácido nucleico alvo em uma planta caracterizado pelo fato de que compreende: (a) fornecer uma planta que compreende um polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DMS3, em que a segunda sequência de aminoácidos consiste nas SEQ ID NOs: 41; 42; 43; 44 45; 46; 47; 48; 49; 50 ou 51; e (b) cultivar a planta sob condições em que o polipeptídeo recombinante é expresso e se liga ao ácido nucleico alvo, reduzindo deste modo a expressão do ácido nucleico alvo quando comparado a um controle.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o domínio de ligação ao DNA compreende um domínio dedo de zinco.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o domínio de ligação do DNA é selecionado a partir do grupo que consiste em um domínio tendo como alvo o efetor TAL, um domínio da família hélice- volta-hélice de ligação ao DNA, um domínio de básico, um domínio fita-hélice-hélice, um domínio de TBP, um dímero de domínio barril, um domínio de homologia real, um domínio BAH, um domínio SANT, um Chromodomínio, um domínio Tudor, um Bromodomínio, um domínio PHD, um domínio WD40, e um domínio MBD.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o domínio de ligação ao DNA compreende um domínio tendo como alvo o efetor TAL.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o ácido nucleico alvo é um ácido nucleico endógeno.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o ácido nucleico alvo é um ácido nucleico heterólogo.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a expressão do ácido nucleico alvo é silenciada.
8. Célula hospedeira bacteriana caracterizada pelo fato de que compreende polipeptídeo recombinante compreendendo uma primeira sequência de aminoácidos compreendendo um domínio de ligação ao DNA e uma segunda sequência de aminoácidos compreendendo um polipeptídeo DMS3, em que a segunda sequência de aminoácidos consiste nas SEQ ID NOs: 41; 42; 43; 44; 45; 46; 47; 48; 49; 50 ou 51.
BR112015021210A 2013-03-01 2014-02-28 Método para reduzir a expressão de um ácido nucleico alvo em uma planta e ácido nucleico recombinante BR112015021210B8 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361771743P 2013-03-01 2013-03-01
US61/771,743 2013-03-01
US201461929414P 2014-01-20 2014-01-20
US61/929,414 2014-01-20
PCT/US2014/019666 WO2014134567A1 (en) 2013-03-01 2014-02-28 Methods and compositions for targeting rna polymerases and non-coding rna biogenesis to specific loci

Publications (3)

Publication Number Publication Date
BR112015021210A2 BR112015021210A2 (pt) 2017-10-10
BR112015021210B1 true BR112015021210B1 (pt) 2022-10-18
BR112015021210B8 BR112015021210B8 (pt) 2022-11-16

Family

ID=51428873

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015021210A BR112015021210B8 (pt) 2013-03-01 2014-02-28 Método para reduzir a expressão de um ácido nucleico alvo em uma planta e ácido nucleico recombinante

Country Status (5)

Country Link
US (2) US10351867B2 (pt)
EP (2) EP2961845A4 (pt)
CN (2) CN106995820B (pt)
BR (1) BR112015021210B8 (pt)
WO (1) WO2014134567A1 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014134567A1 (en) * 2013-03-01 2014-09-04 The Regents Of The University Of California Methods and compositions for targeting rna polymerases and non-coding rna biogenesis to specific loci
EP3463484A4 (en) * 2016-05-27 2019-10-30 The Regents of the University of California METHOD AND COMPOSITIONS FOR TARGETING RNA POLYMERASES AND NON-CODING RNA BIOGENESIS AT SPECIFIC LOCI
AU2017355507B2 (en) 2016-11-04 2023-09-21 Flagship Pioneering Innovations V. Inc. Novel plant cells, plants, and seeds
SG11201906795SA (en) 2017-01-28 2019-08-27 Inari Agriculture Inc Novel plant cells, plants, and seeds
US11926835B1 (en) 2018-01-29 2024-03-12 Inari Agriculture Technology, Inc. Methods for efficient tomato genome editing
US11866719B1 (en) 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
JP6915820B2 (ja) * 2018-07-25 2021-08-04 国立研究開発法人産業技術総合研究所 植物における標的dnaのメチル化を抑制する方法
EP3894566A4 (en) * 2018-12-13 2022-08-31 Synthetic Genomics, Inc. AVOIDING EPIGENETIC SILENCING OF EXOGENE NUCLEIC ACID IN ALGAE
CN110054670A (zh) * 2019-04-04 2019-07-26 华中农业大学 一种可减小作物叶夹角的蛋白及其应用
CN114835816B (zh) * 2021-01-14 2023-12-22 中国科学院遗传与发育生物学研究所 一种调控植物基因组dna特定区域甲基化水平的方法
WO2023028598A1 (en) * 2021-08-26 2023-03-02 Donald Danforth Plant Science Center Engineering disease resistance by editing the epigenome

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
ES2187497T3 (es) 1990-04-12 2003-06-16 Syngenta Participations Ag Promotores preferentemente en tejidos.
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
JPH06510187A (ja) 1991-08-27 1994-11-17 ノバルティス アクチエンゲゼルシャフト 同翅類昆虫に対する殺虫性質を有したタンパク質及び植物保護におけるそれらの用法
JP2952041B2 (ja) 1992-07-27 1999-09-20 パイオニア ハイ−ブレッド インターナショナル,インコーポレイテッド 培養ダイズ細胞のagrobacterium媒介形質転換の改良法
US5470353A (en) 1993-10-20 1995-11-28 Hollister Incorporated Post-operative thermal blanket
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5750868A (en) 1994-12-08 1998-05-12 Pioneer Hi-Bred International, Inc. Reversible nuclear genetic system for male sterility in transgenic plants
US5967213A (en) 1998-02-11 1999-10-19 Springs Window Fashions Division, Inc. Window cornice assembly
CA2359749A1 (en) * 1999-02-09 2000-08-17 Rhobio A method for inhibiting the expression of target genes in plants
GB0117964D0 (en) * 2001-07-24 2001-09-19 Imp College Innovations Ltd Control of gene expression
US20080276333A1 (en) * 2004-06-09 2008-11-06 Mcgonigle Brian Recombinant Constructs for Use in Reducing Gene Expression
KR101034562B1 (ko) * 2009-06-03 2011-05-12 경희대학교 산학협력단 배추 유래의 su(var)3―9 호몰로그 2 단백질 및 이를 코딩하는 유전자
RU2568056C2 (ru) * 2009-10-22 2015-11-10 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Конструируемые белки с цинковыми пальцами, направленные на гены растений, вовлеченные в биосинтез жирных кислот
ES2809679T3 (es) 2010-03-08 2021-03-05 Monsanto Technology Llc Moléculas polinucleotídicas para la regulación génica en plantas
WO2014134567A1 (en) * 2013-03-01 2014-09-04 The Regents Of The University Of California Methods and compositions for targeting rna polymerases and non-coding rna biogenesis to specific loci

Also Published As

Publication number Publication date
CN105189760A (zh) 2015-12-23
EP2961845A1 (en) 2016-01-06
US11479781B2 (en) 2022-10-25
EP2961845A4 (en) 2016-08-10
US20190390211A1 (en) 2019-12-26
BR112015021210A2 (pt) 2017-10-10
WO2014134567A1 (en) 2014-09-04
BR112015021210B8 (pt) 2022-11-16
CN106995820B (zh) 2020-12-01
US20160017348A1 (en) 2016-01-21
US10351867B2 (en) 2019-07-16
EP3181694A1 (en) 2017-06-21
CN106995820A (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
US11479781B2 (en) Methods and compositions for targeting RNA polymerases and non-coding RNA biogenesis to specific loci
Manavski et al. An essential pentatricopeptide repeat protein facilitates 5′ maturation and translation initiation of rps3 mRNA in maize mitochondria
EP2981166B1 (en) Methods and compositions for integration of an exogenous sequence within the genome of plants
Arce et al. Uncharacterized conserved motifs outside the HD-Zip domain in HD-Zip subfamily I transcription factors; a potential source of functional diversity
US9624502B2 (en) Methods of controlling plant seed and organ size
Liu et al. SET DOMAIN GROUP701 encodes a H3K4‐methytransferase and regulates multiple key processes of rice plant development
Kang et al. A WRKY transcription factor recruits the SYG1-like protein SHB1 to activate gene expression and seed cavity enlargement
US20220275386A1 (en) Methods and compositions for targeting rna polymerases and non-coding rna biogenesis to specific loci
Wang et al. OspTAC2 encodes a pentatricopeptide repeat protein and regulates rice chloroplast development
Wang et al. Empty Pericarp21 encodes a novel PPR-DYW protein that is required for mitochondrial RNA editing at multiple sites, complexes I and V biogenesis, and seed development in maize
BRPI0613141A2 (pt) polinucleotìdios isolados, construção de dna, célula de planta, planta transgênica, madeira e polpa de madeira
BRPI0715161B1 (pt) Plants with growth and size increased.
ZENG et al. OsHemA gene, encoding glutamyl-tRNA reductase (GluTR) is essential for chlorophyll biosynthesis in rice (Oryza sativa)
Lu et al. A dominant point mutation in a RINGv E3 ubiquitin ligase homoeologous gene leads to cleistogamy in Brassica napus
Daras et al. LEFKOTHEA regulates nuclear and chloroplast mRNA splicing in plants
US9587247B2 (en) Plants with altered phytochromes
BR112016008172B1 (pt) Método para modulação do crescimento de plantas
US11629356B2 (en) Regulating lignin biosynthesis and sugar release in plants
US10570404B2 (en) Enhanced stability engineered WRINKLED1 transcription factor
Wang et al. OsTHA8 encodes a pentatricopeptide repeat protein required for RNA editing and splicing during rice chloroplast development
Yu et al. Genome-Wide Analysis of Almond Skp1 Family Members And Identification of Self-Incompatibility-Related PsdSSK1
WO2023102530A1 (en) Tools for gene silencing
US20150150156A1 (en) Methods and compositions for reducing gene expression in plants
Blunt Investigation of Nuclear Architectural Proteins in Arabidopsis and Tomato
BR112020023773A2 (pt) molécula de ácido nucleico, polipeptídeo, gene quimérico, células vegetais e métodos para produzir uma célula vegetal, para converter uma planta, para selecionar uma planta, para restaurar a fertilidade, para identificar e/ou selecionar uma planta, para produzir uma planta, para produzir sementes, para aumentar a expressão de um polipeptídeo, usos de ácidos nucleicos e de uma planta

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 28/02/2014, OBSERVADAS AS CONDICOES LEGAIS

B16C Correction of notification of the grant [chapter 16.3 patent gazette]

Free format text: REF. RPI 2702 DE 18/10/2022 QUANTO AO INVENTOR POR ERRO MATERIAL DO TITULAR.