BR112020012064A2 - regulação transcricional direcionada usando fatores de transcrição sintéticos - Google Patents

regulação transcricional direcionada usando fatores de transcrição sintéticos Download PDF

Info

Publication number
BR112020012064A2
BR112020012064A2 BR112020012064-2A BR112020012064A BR112020012064A2 BR 112020012064 A2 BR112020012064 A2 BR 112020012064A2 BR 112020012064 A BR112020012064 A BR 112020012064A BR 112020012064 A2 BR112020012064 A2 BR 112020012064A2
Authority
BR
Brazil
Prior art keywords
transcription factor
sequence
crispr
synthetic transcription
gene
Prior art date
Application number
BR112020012064-2A
Other languages
English (en)
Inventor
Aaron Hummel
Mathias LABS
Original Assignee
KWS SAAT SE & Co. KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE & Co. KGaA filed Critical KWS SAAT SE & Co. KGaA
Publication of BR112020012064A2 publication Critical patent/BR112020012064A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H4/00Plant reproduction by tissue culture techniques ; Tissue culture techniques therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8206Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated
    • C12N15/8207Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated by mechanical means, e.g. microinjection, particle bombardment, silicon whiskers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8217Gene switch
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Botany (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

A presente invenção refere-se à regulação direcionada de expressão gênica e, mais especificamente, a fatores de transcrição sintéticos (STFs) que compreendem pelo menos um domínio de reconhecimento manipulado altamente específico para o alvo e que inclui ainda pelo menos um domínio de ativação ou silenciamento para modular a expressão de um gene de interesse, de preferência para modular a transcrição de um gene morfogênico de um eucariota. São descritos ainda métodos que usam os STFs para aumentar as frequências de transformação, otimizar abordagens bem-sucedidas de edição genômica, fornecer organismos haploides ou haploides duplos e/ou fornecer composições adequadas para transformação em geral, mas também para fins de melhoramento.

Description

Relatório Descritivo da Patente de Invenção para "REGULA-
ÇÃO TRANSCRICIONAL DIRECIONADA USANDO FATORES DE TRANSCRIÇÃO SINTÉTICOS". Campo Técnico
[0001] A presente invenção se refere à regulação direcionada de expressão gênica e, mais especificamente, a fatores de transcrição sin- téticos (Synthetic Transcription Factors, STFs) que compreendem pelo menos um domínio de reconhecimento manipulado altamente especí- fico para o alvo e que compreendem ainda pelo menos um domínio de ativação ou silenciamento para modular a expressão de um gene de interesse, de preferência para modular a transcrição de um gene mor- fogênico de um eucariota. São descritos ainda métodos que usam os STFs para aumentar as frequências de transformação, otimizar aborda- gens de edição genômica com sucesso, fornecer organismos haploides ou haploides duplos e/ou fornecer composições adequadas para trans- formação em geral, mas também para fins de melhoramento. Estes mé- todos e usos dependem da interação sinérgica do STF que compreende um domínio de modulação de expressão gênica, por exemplo, um do- mínio de ativação ou um domínio de silenciamento, permitindo a repro- gramação de uma célula e a indução de divisão celular e/ou regenera- ção simultânea à transformação da dita célula ou edição do genoma da dita célula. Antecedentes da Invenção
[0002] A capacidade de transformar e modificar com eficiência o material genético em células eucariotas permite uma ampla variedade de aplicações de alto valor no desenvolvimento de produtos agrícolas, pesquisa básica e outros campos técnicos. Fundamentalmente, a enge- nharia genômica ou edição gênica (Gene Editing, GE) confere esta ca- pacidade ao introduzir variações genéticas predefinidas em locais espe- cíficos nos genomas de eucariotas, assim como procariotas. Entretanto,
há uma infinidade de métodos para transformar diferentes células euca- riotas ou procariotas em estágios de desenvolvimento específicos. Ainda, a eficiência de transformação ou transfecção algumas vezes per- manece muito baixo para determinados tipos de células ou genótipos e métodos altamente específicos sintonizados para diferentes células ori- ginárias de diferentes genótipos têm de ser estabelecidos.
[0003] Além disso, a capacidade não apenas de modificar, mas também de modular especificamente, isto é, ativar ou inibir, a expressão gênica de uma maneira altamente direcionada, tem um alto valor em biotecnologia de plantas.
[0004] Por exemplo, embora a transformação das principais cultu- ras de monocotiledôneas seja possível atualmente, o processo normal- mente permanece restrito a um ou dois genótipos por espécie, geral- mente com pouca agronomia e eficiências que colocam estes métodos fora do alcance da implementação agrícola.
[0005] Tendo em vista que o aumento da população humana global exigirá duplicar a produção mundial de alimentos nas próximas décadas e, ao mesmo tempo, as mudanças climáticas causam novos desafios para os produtores, há uma grande necessidade de plantas de safra otimizadas que tenham resistência ao estresse biótico e abiótico, por exemplo, resistência a patógenos de planta emergentes ou resistência à seca. Contar com tecnologias de melhoramento e seleção clássicas provavelmente não será suficientemente eficaz para lidar com a de- manda dramaticamente crescente e para estabelecer um abasteci- mento sustentável perante as mudanças eco-sociológicas nas décadas futuras. Portanto, novas estratégias e medidas biotecnológicas devem ser desenvolvidas para estabelecer traços com os quais as plantas pos- sam se adaptar melhor a condições ambientais adversas.
[0006] Atualmente, o milho é uma das safras de alimento e ração mais importantes, além de fonte de bioenergia em todo o mundo. Ao mesmo tempo, o milho se tornou uma das mais importantes culturas alvo para a inovação biotecnológica desde a criação dos primeiros pro- dutos de milho transgênicos para Bacillus thuringiensis (Bt) em meados da década de 1990. Apesar da complexidade do genoma do milho (em comparação com plantas modelo), entretanto, há mais traços biotecno- lógicos disponíveis no mercado de milho do que em qualquer outra planta agrícola. A produção transgênica de milho fez um tremendo pro- gresso desde o primeiro relatório bem-sucedido, usando o método de transformação de protoplastos que consome muito tempo e é trabalhoso (Rhodes et a/., 1988a). O desenvolvimento de tecnologias de transfor- mação de bombardeamento de micropartículas (Fromm et a/., 1990; Gordon-Kamm et a/., 1990) e tecnologias de transformação mediada por Agrobacterium (Ishida et a/., 1996) tornou a geração de milho transgê- nico mais simples e mais confiável. Sistemas de transformação biolística altamente produtivos foram estabelecidos em Hi-ll com BAR como mar- cador selecionável (Frame et al., 2000) e na linhagem de elite endó- gama CG00526 com PMI como marcador selecionável (Wright et al., 2001). Sistemas eficientes de transformação mediada por Agrobacte- rium foram relatados usando a linhagem endógama A188 (Ishida et al. 1996; Negrotto et a/., 2000), Hi-Il (Zhao et a/., 2001) e híbridos A188/Hi- Il (Li et a/., 2003). Nos últimos anos, o progresso nas tecnologias de engenharia genômica tornou possível fazer modificações e inserir trans- genes em locais cromossômicos alvo específicos no genoma do milho (Shukla et a/., 2009; Gao et a/., 2010; Liang et a/., 2014; para uma revi- são: Que et al., Front. Plant. Sci., 2014, 5, 379). Ainda assim, nenhuma das técnicas acima fornece resultados confiáveis e transferíveis aplicá- veis em diferentes genótipos, muito menos em uma planta diferente.
[0007] O progresso no campo biotecnológico de plantas nas últimas décadas foi baseado no estabelecimento de plantas transgênicas. Fa- tores socioeconômicos e regulatórios, no entanto, sugerem cada vez mais que o desenvolvimento de plantas e produtos vegetais não trans- gênicos se torna cada vez mais importante para determinados países e territórios.
[0008] A morfogênese geralmente significa o processo biológico que faz com que um organismo desenvolva seu formato. Ele é um dos três aspectos fundamentais da biologia do desenvolvimento, juntamente com o controle de crescimento celular e diferenciação celular, unificados na biologia evolutiva do desenvolvimento. Uma classe importante de moléculas envolvidas na morfogênese são as proteínas fatores de trans- crição que determinam o destino das células ao interagir com o DNA. Estas podem ser codificadas por genes reguladores mestre e ativam ou desativam a transcrição de outros genes; por sua vez, estes produtos gênicos secundários podem regular a expressão de ainda outros genes em uma cascata reguladora de redes reguladoras gênicas. Ao final desta cascata, há classes de moléculas que controlam comportamentos celulares, tal como migração celular ou, de maneira mais geral, suas propriedades, tais como adesão celular ou motilidade celular, prolifera- ção celular e apoptose.
[0009] Recentemente, o grupo de Lowe et a/. (2016) relatou uma abordagem de transformação que envolve a superexpressão dos genes morfogênicos de milho (Zea mays) Baby boom (BBM) e genes Wuschel (WUS) de milho, a qual produziu altas frequências de transformação em numerosas linhagens de milho anteriormente não transformáveis. Lowe et al. descobriram que a superexpressão de BBM e WUS em linhagens difíceis de transformar resultou em um aumento na capacidade de re- generação de calos transgênicos. O papel de WUS e BBM no desenvol- vimento das plantas já foi descrito anteriormente (documento US
7.256.322 B2 ou documento US 2013/0254935 A1).
[0010] No entanto, as abordagens acima e posteriores atualmente dependem da superexpressão heteróloga de genes morfogênicos, por exemplo, em compartimentos celulares onde estes genes geralmente não são expressos ou do fornecimento de plantas transgênicas porta- doras dos respectivos genes incorporados de maneira estável em seus genomas. Outra estratégia é a expressão temporal ou espacialmente regulada de um gene-alvo, por exemplo, usando promotores indutíveis e/ou específicos para tecido. A superexpressão descontrolada, no en- tanto, pode causar mudanças fenotípicas que podem afetar a aptidão e a eficiência de rendimento das plantas, tornando o uso de tais aborda- gens em agricultura menos atraente. Portanto, ainda há uma grande ne- cessidade em identificar novas estratégias para explorar as funções de genes endógenos, incluindo fatores morfogenéticos, de modo direcio- nado, evitando a necessidade de superexpressar genes heterólogos em uma célula ou sistema celular de interesse.
[0011] Muitas células vegetais têm a capacidade de regenerar um organismo completo a partir de apenas células ou tecidos individuais. Este processo é, em geral, denominado de totipotência. Este processo de regeneração de uma planta inteira parece estar intimamente relacio- nado ao processo de morfogênese. A capacidade de tecidos e células vegetais cultivados in vitro de sofrerem morfogênese, resultando na for- mação de órgãos distintos ou mesmo plantas inteiras, ofereceu oportu- nidades para inúmeras aplicações de biologia vegetal in vitro em estu- dos de botânica básica, bioquímica, melhoramento e desenvolvimento de novas plantas de safra.
[0012] Haploides são plantas que contêm um número de cromosso- mas gamético (n). Eles podem se originar espontaneamente na natu- reza ou como um resultado de várias técnicas de indução. O desenvol- vimento espontâneo de plantas haploides é conhecido desde 1922, quando Blakeslee descreveu este fenômeno pela primeira vez em Da- tura stramonium (Blakeslee et a/l., 1922); isto foi seguido subsequente- mente por relatórios similares em Nicotiana tabacum, Triticum aestivum e várias outras espécies (Forster et a/., 2007). No entanto, a ocorrência espontânea de haploides é um evento raro e, portanto, de valor prático limitado.
[0013] Os haploides produzidos a partir de espécies diploides, co- nhecidos como monoploides, contêm apenas um conjunto de cromos- somas na fase esporofítica. Eles são menores e exibem menor vigor da planta comparado com os doadores e são estéreis em virtude da inca- pacidade de seus cromossomas emparelharem durante a meiose. Para propagá-los através de sementes e incluí-los em programas de melho- ramento, sua fertilidade deve ser restaurada com duplicação espontâ- nea ou induzida de cromossomas. Os haploides ou haploides duplos obtidos são homozigóticos em todos os /oci e podem representar uma nova variedade (culturas de autopolinização) ou uma linhagem progeni- tora para a produção de variedades híbridas (culturas de polinização cruzada). Na verdade, espécies com polinização cruzada geralmente expressam um alto grau de depressão por endogamia. Para estas es- pécies, o processo de indução em si pode servir não apenas como um método rápido para a produção de linhagens homozigóticas, mas tam- bém como uma ferramenta de seleção para a eliminação de genótipos que expressam forte depressão por endogamia. Pode-se esperar a se- leção de traços causados por genes deletérios recessivos associados ao crescimento vegetativo. Portanto, sistemas de plantas haploides e, da mesma forma, haploides duplos, são de grande importância para es- tratégias de melhoramento de plantas, mas pouco se sabe sobre a inte- ração entre as vias de desenvolvimento, tais como vias morfogênicas, e a influência potencial das mesmas na geração de sistemas de plantas haploides.
[0014] Além disso, há problemas graves na transformação de ger- moplasma de elite portador de um genótipo altamente valioso, uma vez que as respectivas plantas ou partes de plantas ou células cultiváveis in vitro deriváveis das ditas plantas de elite são, em geral, altamente recal- citrantes à transformação e/ou transfecção. Este fato torna o desenvol- vimento ou o melhoramento direcionado de plantas altamente compli- cado, demorado e caro, pois muitas etapas adicionais de melhoramento e/ou biologia molecular devem ser aplicadas para transferir com êxito um evento de elite para um contexto genético de interesse.
[0015] Portanto, foi um objetivo da presente invenção desenvolver novas estratégias para a indução de genes endógenos, de preferência genes morfogênicos, em seu ambiente celular natural, a fim de melhorar a regeneração de plantas as quais, de outra forma, são difíceis de trans- formar, ou mesmo altamente recalcitrantes à transformação/transfecção por meio de técnicas conhecidas. Além disso, o objetivo foi unificar a alta precisão disponível com as recentes tecnologias de edição gênica para fornecer uma abordagem ajustável e regulável para regular genes morfogênicos, de preferência de maneira transitória, para permitir me- lhores capacidades de transformação e regeneração nas células ou te- cidos alvo sem influenciar indevidamente o sistema de morfogênese en- dógena de uma célula, em que as abordagens devem ser configuradas para permitir um aumento independente de genótipo nas taxas de trans- formação/transfecção.
[0016] Com base na exploração da regulação artificial de expressão gênica, principalmente regulação transcricional, um outro objetivo foi fornecer fatores de transcrição sintéticos com capacidade de silencia- mento em relação ao controle transcricional para fornecer composições eficientes para controlar a transcrição e expressão de genes expressos de forma aberrante.
[0017] O objetivo foi estabelecer novas estratégias para fornecer células de plantas haploides e haploides duplos, sistemas celulares e organismos inteiros com base na modificação direcionada de genes morfogênicos para fornecer um material inicial para a produção de ha- ploides duplos para uma variedade de plantas relevantes, os ditos ha- ploides duplos, como linhagens completamente homozigóticas, repre- sentando uma ferramenta valiosa no melhoramento de plantas e biotec- nologia de plantas. Sumário da Invenção
[0018] Os objetivos acima foram conseguidos ao fornecer, em um primeiro aspecto, um fator de transcrição sintético, ou uma sequência de nucleotídeos que codifica o mesmo, que compreende pelo menos um domínio de reconhecimento e pelo menos um domínio de modula- ção de expressão gênica, em particular um domínio de ativação, em que o fator de transcrição sintético é configurado para modular a expressão de um gene morfogênico em um sistema celular.
[0019] Além disso, é fornecido um fator de transcrição sintético, em que o pelo menos um domínio de reconhecimento é, ou é um fragmento, de uma molécula selecionada a partir do grupo que consiste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease de- sarmado, pelo menos um de domínio de dedo de zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer combinação dos mesmos.
[0020] Em outra modalidade, é fornecido um fator de transcrição sintético, em que o pelo menos um sistema CRISPR/nuclease desar- mado é selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/ dCasY, ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado compreende pelo menos um RNA guia.
[0021] Em ainda outra modalidade, é fornecido um fator de transcri- ção sintético, em que o pelo menos um domínio de ativação é selecio-
nado a partir do grupo que consiste em um domínio de ativação trans- cricional ácido, de preferência em que o pelo menos um domínio de ati- vação é de um gene efetor TAL de Xanthomonas oryzae, VP16 (SEQ ID NO: 259) ou VP64 tetramérica (SEQ ID NO: 260) de Herpes simplex, VPR (SEQ ID NO: 261), SAM (SEQ ID NO: 262; SEQ ID NO: 263), Scaf- fold (SEQ ID NO: 264; SEQ ID NO: 265), Suntag (SEQ ID NO: 266; SEQ ID NO: 267), P300 (SEQ ID NO: 268), VP160 (SEQ ID NO: 269) ou qualquer combinação dos mesmos. Em uma modalidade preferida da presente invenção, o domínio de ativação é VP64.
[0022] Em ainda outra modalidade, é fornecido um fator de transcri- ção sintético, em que o pelo menos um domínio de ativação está locali- zado no N-término e/ou C-término em relação ao pelo menos um domí- nio de reconhecimento.
[0023] Em uma modalidade, é fornecido um fator de transcrição sin- tético, em que o gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLT5, PLT7, IPT, IPT2, Knotted1 e RKDA4.
[0024] Em uma modalidade adicional, é fornecido um fator de trans- crição sintético, em que o gene morfogênico compreende uma sequên- cia de nucleotídeos selecionada a partir do grupo que consiste em (i) uma sequência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (ii) uma sequência de nucleotídeos que tem as se- quências codificadoras da sequência de nucleotídeos apresentadas em qualquer uma de SEQ ID NOs: 199 a 237, (ili) uma sequência de nucle- otídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 96 %, 97 %, 98 % ou 99 % de Identidade, de preferência em todo o compri-
mento, com a sequência de nucleotídeos de (i), (ii) ou (iii), (v) uma se- quência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (iii) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vil) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0025] Em outra modalidade, é fornecido um fator de transcrição sintético, em que o fator de transcrição sintético é configurado para mo- dular a expressão, de preferência a transcrição, do gene morfogênico através de ligação a uma região reguladora localizada a uma determi- nada distância em relação ao códon inicial.
[0026] Em ainda outra modalidade, é fornecido um fator de transcri- ção sintético, em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhecimento compreende uma sequência apresen- tada em qualquer uma de SEQ ID NOs: 1 a 94 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 1 a 94 ou em que o fator de transcrição sintético e/ou pelo menos um domínio de reconhe- cimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou a uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ
ID NOs: 95 a 190.
[0027] Em uma modalidade adicional, é fornecido um fator de trans- crição sintético, em que o sistema celular é selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo euca- riota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
[0028] Em um aspecto, é fornecido um método para aumentar a efi- ciência da transformação em um sistema celular, em que o método com- preende as etapas de: (a) fornecer um sistema celular; (b) introduzir no sistema celular pelo menos um fator de transcrição sintético ou uma se- quência de nucleotídeos que codifica o mesmo; e (c) introduzir no sis- tema celular pelo menos uma sequência de nucleotídeos de interesse; (d) opcionalmente: cultivar o sistema celular sob condições para obter uma progênie transformada do sistema celular; em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo menos um domínio de reconheci- mento e pelo menos um domínio de modulação de expressão gênica, em particular pelo menos um domínio de ativação, em que o fator de transcrição sintético está configurado para modular a expressão, de pre- ferência a transcrição, de pelo menos um gene morfogênico no sistema celular; e em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo é introduzida em pa- ralelo ou sequencialmente com a introdução de pelo menos uma se- quência de nucleotídeos de interesse.
[0029] Em uma modalidade, é fornecido um método em que (a) o pelo menos um fator de transcrição sintético ou a sequência que codifica o mesmo; e (b) a pelo menos uma sequência de nucleotídeos de inte- resse é/são introduzido(s) no sistema celular através de meios indepen-
dentemente selecionados a partir de meios biológicos e/ou físicos, in- cluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de preferência Agrobacterium tumefaciens, um ve- tor viral, bombardeamento biolístico, transfecção usando agentes quí- micos, incluindo transfecção com polietileno glicol, eletroporação, fusão celular ou qualquer combinação dos mesmos.
[0030] Em ainda outra modalidade, é fornecido um método em que o pelo menos um domínio de reconhecimento é, ou é um fragmento de, uma molécula selecionada a partir do grupo que consiste em pelo me- nos um efetor TAL, pelo menos um sistema CRISPR/nuclease desar- mado, em pelo menos um domínio de dedo de zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer combinação dos mes- mos.
[0031] Em outra modalidade, é fornecido um método em que o pelo menos um sistema CRISPR/nuclease desarmado é selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/dCasY ou qualquer combina- ção dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado compreende pelo menos um RNA guia.
[0032] Em outra modalidade, é fornecido um método em que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene efetor TAL de Xanthomonas ory- zae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Scaf- fold, Suntag, P300, VP160 ou qualquer combinação dos mesmos. Em uma modalidade preferida da presente invenção, o domínio de ativação é VP64.
[0033] Em ainda outra modalidade, é fornecido um método em que o pelo menos um domínio de ativação do pelo menos um fator de trans- crição sintético está localizado no N-término e/ou no C-término em rela- ção ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
[0034] Em uma modalidade adicional, é fornecido um método em que o pelo menos um gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um ho- mólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKDA4.
[0035] Em uma modalidade adicional, é fornecido um método em que o pelo menos um gene morfogênico compreende uma sequência de nucleotídeos selecionada a partir do grupo que consiste em (i) uma sequência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (li) uma sequência de nucleotídeos que tem as sequên- cias codificadoras das sequências de nucleotídeos apresentadas em qualquer uma de SEQ ID NOs: 199 a 237, (iii) uma sequência de nucle- otídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 96 %, 97 %, 98 % ou 99 % de identidade, de preferência em todo o compri- mento, com a sequência de nucleotídeos de (i), (ii) ou (iii), (v) uma se- quência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (iii) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vii) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que compreende a sequên- cia de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0036] Em outra modalidade, é fornecido um método em que o fator de transcrição sintético é configurado para modular a expressão, de pre- ferência a transcrição, do gene morfogênico através de ligação a uma região reguladora localizada a uma determinada distância em relação ao códon inicial.
[0037] Em uma modalidade, é fornecido um método em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconheci- mento compreende uma sequência apresentada em qualquer uma de SEQ ID NOs: 1 a 94 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 1 a 94 ou em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhecimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou a uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 95 a 190.
[0038] Em outra modalidade, é fornecido um método em que o sis- tema celular é selecionado a partir do grupo que consiste em pelo me- nos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
[0039] Em um aspecto adicional, é fornecido um método para mo- dificar o material genético de um sistema celular em uma localização predeterminada, em que o método compreende as seguintes etapas: (a)
fornecer um sistema celular; (b) introduzir pelo menos um fator de trans- crição sintético, ou uma sequência que codifica o mesmo, no sistema celular; (c) introduzir ainda no sistema celular (i) pelo menos uma nu- clease específica para localização, ou uma sequência que codifica a mesma, em que a nuclease específica para localização induz a uma ruptura de fita dupla do DNA na localização predeterminada; (ii) opcio- nalmente: pelo menos uma sequência de nucleotídeos de interesse, de preferência flanqueada por uma ou mais sequências de homologia com- plementares a uma ou mais sequências de nucleotídeos adjacentes à localização predeterminada no material genético do sistema celular; e; (e) opcionalmente: determinar a presença da modificação na localiza- ção predeterminada no material genético do sistema celular; e (f) obter um sistema celular que compreende uma modificação na localização predeterminada do material genético do sistema celular; em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo menos um domínio de reco- nhecimento e pelo menos um domínio de ativação, em que o pelo me- nos um fator de transcrição sintético está configurado para modular a expressão, de preferência a transcrição, de pelo menos um gene mor- fogênico no sistema celular; e em que o pelo menos um fator de trans- crição sintético, ou a sequência de nucleotídeos que codifica o mesmo, é introduzido em paralelo ou sequencialmente com a introdução de pelo menos uma nuclease específica para localização, ou a sequência que codifica a mesma, e a pelo menos uma sequência de nucleotídeos de interesse opcional.
[0040] Em outra modalidade deste aspecto, é fornecido um método em que o método compreende ainda a etapa de cultura do sistema ce- lular sob condições para obter uma progênie geneticamente modificada do sistema celular modificado.
[0041] Em outra modalidade dos métodos de modificação do mate- rial genético de um sistema celular em uma localização predeterminada, é fornecido um método em que (i) o pelo menos um fator de transcrição sintético ou a sequência que codifica o mesmo; e (ii) a pelo menos uma nuclease específica para localização ou a sequência que inclui a mesma; e opcionalmente (ili) a pelo menos uma sequência de nucleotí- deos de interesse é/são introduzido(s) no sistema celular através de meios independentemente selecionados a partir de meios biológicos e/ou físicos, incluindo transfecção, transformação, incluindo transforma- ção por Agrobacterium spp., de preferência por Agrobacterium tumefa- ciens, um vetor viral, bombardeamento biolístico, transfecção usando agentes químicos, incluindo transfecção com polietileno glicol, eletropo- ração, fusão celular ou qualquer combinação dos mesmos.
[0042] Em uma modalidade, é fornecido um método em que o pelo menos um domínio de reconhecimento é, ou é um fragmento de, uma molécula selecionada a partir do grupo que consiste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease desarmado, pelo menos um domínio de dedo de zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer combinação dos mesmos.
[0043] Em uma modalidade adicional, é fornecido um método em que o pelo menos um sistema CRISPR/nuclease desarmado é selecio- nado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/ nuclease desarmado compreende pelo menos um RNA guia.
[0044] É fornecida ainda uma modalidade dos métodos acima, em que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene efetor TAL de Xanthomo- nas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Scaffold, Suntag, P300, VP160 ou qualquer combinação dos mesmos. Em uma modalidade preferida da presente invenção, o domínio de ati- vação é VP64.
[0045] Em uma modalidade, é fornecido aqui um método em que pelo menos um domínio de ativação do pelo menos um fator de trans- crição sintético está localizado no N-término e/ou no C-término em rela- ção ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
[0046] Em uma modalidade adicional, é fornecido um método em que o pelo menos um gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um ho- mólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKDA4.
[0047] Em uma outra modalidade, é fornecido um método em que o pelo menos um gene morfogênico compreende uma sequência de nu- cleotídeos selecionada a partir do grupo que consiste em (i) uma se- quência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (ii) uma sequência de nucleotídeos que tem as sequên- cias codificadoras das sequências de nucleotídeos apresentadas em qualquer uma de SEQ ID NOs: 199 a 237, (iii) uma sequência de nucle- otídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 96 %, 97 %, 98 % ou 99 % de identidade, de preferência em todo o compri- mento, com a sequência de nucleotídeos de (i), (ii) ou (iii), (v) uma se- quência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (iii) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vii) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que compreende a sequên- cia de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0048] Em outra modalidade, é fornecido um método em que o fator de transcrição sintético é configurado para modular a expressão, de pre- ferência a transcrição, do gene morfogênico através de ligação a uma região reguladora localizada a uma determinada distância em relação ao códon inicial.
[0049] Em ainda outra modalidade, é fornecido um método em que o fator de transcrição sintético e/ou o pelo menos um domínio de reco- nhecimento compreende uma sequência apresentada em qualquer uma de SEQ ID NOs: 1 a 94 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qual- quer uma de SEQ ID NOs: 1 a 94 ou em que o fator de transcrição sin- tético e/ou o pelo menos um domínio de reconhecimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou uma se- quência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 95 a 190.
[0050] Em uma outra modalidade, é fornecido um método em que o sistema celular é selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
[0051] Em ainda uma outra modalidade, é fornecido um método em que a uma ou mais sequências de nucleotídeos que flanqueiam a pelo menos uma sequência de nucleotídeos de interesse na localização pre- determinada é/são pelo menos 85 % -100 % complementares à uma ou mais sequências de nucleotídeos adjacentes à localização predetermi- nada, a montante e/ou a jusante da localização predeterminada, ao longo de todo o comprimento da(s) respectiva(s) região(ões) adja- cente(s).
[0052] Em outro aspecto da presente invenção, é fornecido um mé- todo para produzir um sistema ou organismo celular haploide ou haplo- ide duplo, em que o método compreende as seguintes etapas: (a) for- necer um sistema celular haploide; (b) introduzir no sistema celular ha- ploide pelo menos um fator de transcrição sintético ou uma sequência de nucleotídeos que codifica o mesmo; (c) cultivar o sistema celular ha- ploide sob condições para obter pelo menos um organismo haploide ou haploide duplo; e (d) opcionalmente, selecionar o pelo menos um orga- nismo haploide ou haploide duplo obtido na etapa (c), em que pelo me- nos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo menos um domínio de reco- nhecimento e pelo menos um domínio de ativação, em que o pelo me- nos um fator de transcrição sintético está configurado para modular a expressão, de preferência a transcrição, de pelo menos um gene mor- fogênico no sistema celular haploide.
[0053] Em uma modalidade, é fornecido um método em que o sis- tema celular haploide da etapa (a) do método acima é um embrião ha- ploide ou em que pelo menos um organismo haploide ou haploide duplo da etapa (c) do método acima é obtido através de uma etapa intermedi- ária de geração de pelo menos um embrião haploide a partir do sistema celular haploide de (b).
[0054] Em uma modalidade, é fornecido um método em que pelo menos um fator de transcrição sintético, ou uma sequência que codifica o mesmo, é introduzido no sistema celular haploide através de meios independentemente selecionados a partir de meios biológicos e/ou físi- cos, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de preferência por Agrobacterium tumefaciens, um vetor viral, bombardeamento biolístico, transfecção usando agentes quíi- micos, incluindo transfecção com polietileno glicol, eletroporação, fusão celular ou qualquer combinação dos mesmos.
[0055] Em uma outra modalidade, é fornecido um método em que o pelo menos um domínio de reconhecimento é, ou é um fragmento de, uma molécula selecionada a partir do grupo que consiste em pelo me- nos um efetor TAL, pelo menos um sistema CRISPR/nuclease desar- mado, pelo menos um domínio dedo de zinco e pelo menos uma endo- nuclease "homing" desarmada ou qualquer combinação dos mesmos.
[0056] Em ainda uma outra modalidade, é fornecido um método em que o pelo menos um sistema CRISPR/nuclease desarmado é selecio- nado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/ nuclease desarmado compreende pelo menos um RNA guia.
[0057] Em outra modalidade, é fornecido um método em que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene efetor TAL de Xanthomonas ory- zae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Scaf- fold, Suntag, P300, VP160 ou qualquer combinação dos mesmos. Em uma modalidade preferida da invenção, o domínio de ativação é VP64.
[0058] Em uma outra modalidade, é fornecido um método em que o pelo menos um domínio de ativação do pelo menos um fator de trans- crição sintético está localizado no N-término e/ou no C-término em rela- ção ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
[0059] Em ainda uma outra modalidade, é fornecido um método em que o pelo menos um gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um ho- mólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKDA4.
[0060] Em uma outra modalidade, é fornecido um método em que o pelo menos um gene morfogênico compreende uma sequência de nu- cleotídeos selecionada a partir do grupo que consiste em (i) uma se- quência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (li) uma sequência de nucleotídeos que tem as sequên- cias codificadoras das sequências de nucleotídeos apresentadas em qualquer uma de SEQ ID NOs: 199 a 237, (iii) uma sequência de nucle- otídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 96 %, 97 %, 98 % ou 99 % de identidade, de preferência em todo o compri- mento, com a sequência de nucleotídeos de (i), (ii) ou (iii), (v) uma se- quência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (ili) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vii) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID
NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que compreende a sequên- cia de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0061] Em uma modalidade, é fornecido um método em que o fator de transcrição sintético é configurado para modular a expressão, de pre- ferência a transcrição, do gene morfogênico através de ligação a uma região reguladora localizada a uma determinada distância em relação ao códon inicial.
[0062] Em uma outra modalidade, é fornecido um método em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhe- cimento compreende uma sequência apresentada em qualquer uma de SEQ ID NOs: 1 a 94 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 1 a 94 ou em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhecimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 95 a 190.
[0063] Em ainda uma outra modalidade, é fornecido um método em que pelo menos um sistema celular haploide é selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula de planta e/ou em que o pelo menos um orga- nismo eucariota é uma planta ou parte de uma planta.
[0064] Além disso, é fornecido o sistema celular ou uma progênie do mesmo obtida através de qualquer um dos métodos fornecidos aqui.
[0065] Em outro aspecto, é fornecido um sistema ou organismo ce- lular haploide ou haploide duplo obtido através de qualquer um dos mé- todos fornecidos aqui.
[0066] Em outro aspecto, é fornecido o uso de um fator de transcri- ção sintético conforme fornecido aqui ou uma sequência que codifica o mesmo, em qualquer um dos métodos fornecidos aqui.
[0067] Outros aspectos e modalidades da presente invenção po- dem ser derivados a partir da descrição detalhada subsequente, dos desenhos, da listagem de sequências, bem como do quadro reivindica- tório em anexo. Breve Descrição dos Desenhos e Sequências
[0068] Figura 1. Exemplos ilustrativos de fatores de transcrição sin- téticos (STFs) para modificação de ativação do gene-alvo. (A) É mos- trada a ativação do gene-alvo via o fator de transcrição TAL. Os fatores de transcrição TAL consistem em um domínio de ativação (por exemplo, VP64) fundido ao domínio de ligação a DNA, por exemplo, de efetores do tipo ativador de transcrição (Transcription Activator-Like Effectors, TALEs). (B) É mostrada a ativação do gene-alvo através do sistema de transcrição CRISPR/dCas 9 e/ou CRISPR/dCpf1. Os sistemas de trans- crição CRISPR/dCas 9 e/ou CRISPR/dCpfi compreendem uma nu- clease desarmada (por exemplo, dCas9 ou dCpf1) fundida com um do- mínio de ativação (por exemplo, VP64). A ligação a DNA é mediada por um RNA guia associado à nuclease desarmada. Quando de ligação ao sítio genômico alvo próximo ao sítio de início de transcrição de um gene morfogênico de interesse, os STFs recrutam o complexo de RNA poli- merase || (isto é, o complexo de transcrição) através do domínio de ati- vação na região promotora do gene morfogênico, onde a transcrição do gene é iniciada.
[0069] Figura 2. Representação esquemática da edição gênica aprimorada por cotransfecção de um mecanismo de edição gênica com fatores de transcrição sintéticos (STFs) exemplificativos específicos para genes morfogênicos. Modificações tais como INDELs ou substitui- ção de um gene-alvo por um modelo de reparo através de um meca- nismo de edição gênica (por exemplo, CRSPR/Cpf1 ou CRSIPR/Cas9) resultam em células de planta geneticamente modificadas. A cotrans- fecção transitória do mecanismo de edição gênica com um ou mais STFs específicos para BBM e WUS assegura a recuperação da célula alvo e o aumento da regeneração de uma planta editada.
[0070] Figura 3. Concepção de sítios de ligação de efetores Tal que têm como alvo os genes endógenos Wuschel (WUS) e Babyboom (BBM). Os sítios foram concebidos com distâncias variadas para o có- don inicial. (A) Os sítios de ligação para WUS endógenos têm 18 pares de bases e compreendem ainda uma nucleobase T inicial (TALE 1,2 e 3). (B) Os sítios de ligação para BBM endógeno têm 24 pares de bases e compreendem ainda uma nucleobase T inicial (TALE 4, 5 e 6, SEQID Nos: 270-272).
[0071] Figura 4. Expressão transitória de WUS e BBM endógenos por fatores de transcrição TALE. A indução da expressão gênica por fatores de transcrição TAL foi testada em um sistema de ensaio de pro- toplastos de milho. Os protoplastos de milho foram transformados com construções de vetor que compreendem fatores de transcrição TALE que têm como alvo WUS ou BBM usando um sistema de transformação com base em PEG. Os experimentos foram realizados em triplicatas e repetidos quatro vezes como réplicas biológicas. Após 24 horas, o CcONA foi gerado a partir de RNA de protoplastos extraído usando kits comer- cialmente disponíveis. A expressão de WUS e BBM endógenos foi de- terminada usando uma abordagem de SYBR Green gRT-PCR. (A) Os resultados indicam que o fator de transcrição sintético TALE1 é o indutor mais forte de WUS endógeno, mostrando uma alteração média de 60 vezes na expressão gênica do WUS endógeno. (B) Os resultados indi- cam que o fator de transcrição sintético TALES é o indutor mais forte de BBM endógeno, mostrando uma variação média de 490 na expressão gênica do BBM endógeno.
[0072] Figura 5. Avaliação da função fenotípica de ZMnWUS endó- geno induzida pelo fator de transcrição transitório TALE. A fim de avaliar o efeito dos fatores de transcrição sintéticos sobre a regeneração e em- briogênese, o tecido caloso de milho A188 foi transformado por bombar- deamento de partículas com o marcador fluorescente tdTomato (tdT), TALE1 e PLT7. As construções foram distribuídas a uma única célula e a indução da proliferação de células foi confirmada por meio de micros- copia de fluorescência quando de detecção do sinal fluorescente ver- melho de TdT (consulte círculo branco e seta).
[0073] Figura 6. Mapa da construção pABM-BdEF1 ZmPLT7. O gene PLT7 de milho (ZMPLT7) é controlado pelo promotor constitutivo forte EF1 de Brachypodium (BDEF1).
[0074] Figura 7. Efeito dos ativadores transcricionais sintéticos so- bre a transformação biolística de milho. A emersão do calo embriogê- nico foi avaliada quatro semanas após o bombardeamento. Figura 7A: Cerca de 5,5 % dos embriões imaturos apresentaram calos embriogê- nicos quando tratados de forma simulada (mock). Os genes morfogêni- cos conhecidos foram distribuídos como um controle positivo (média de 12,4 %). A distribuição de ativadores transcricionais sintéticos para BBM e WUS?2 sob diferentes promotores constitutivos e específicos para te- cidos (Pro1, Pro2, Pro3) mostrou um aumento na formação de calos embriogênicos. A Figura 7B mostra as lâminas com os calos transfor- mados do experimento.
[0075] A Figura 8 mostra um mapa da construção repórter do pro- motor WUS?2 de milho (ZMWUS2) pAMK-ZmMWUS2-tDT-nosT (SEQ ID NO: 43). O tDTomato define o gene repórter de fluorescência tDT, o qual é controlado pelo promotor WUSCHEL?2 de milho (pZmWUS?2).
[0076] Figura 9. Indução do promotor ZMWUS?2 pelo ativador trans- cricional sintético no tecido foliar e embrião do genótipo A188 de milho. A indução do promotor ZMWUS?2 foi observada pela expressão da pro- teína fluorescente (tdTomato) (manchas brancas nas figuras). Os pai- néis à esquerda mostram que o promotor WUS?2 não leva ou leva ape- nas a uma intensidade muito baixa de expressão de tdTomato em em- briões imaturos (painel superior) e em tecido foliar (painel inferior). Quando coadministrado com o ativador transcricional sintético TALE1, o tdTomato é expresso fortemente em embriões imaturos (painel supe- rior à direita) e principalmente em folhas (painel inferior à direita).
o To ; ; S & Ô Ô 8 8 go = E | | |E 8 | |êm |az & | |S |S = E [82 | SE |ã é 2 | jog |$S E | E 8 |g & 18 83 23 2 = 2 € |É |85 |88 SE SO o õ 6 ss Do $TETe | SS |8E OE O El HG | E E [57 [SE lo E E > 8 o le a do | E So SS S&aSzo é É |aE 39 2 o 2 or EF E 8 a 2 ES <o So. E > |O | 88 oo Zoo |S3 88 o o o N DS2E S ES TN ON o NnjOo 6 o o E & s E 2 DOIS OU vs z º 5 0/5 o 365 E Fo oS So sEo e? o 2/2 3 8REZ g8/º E os om € SS 2 8.0 NS o 8 o | es om 92) gg o oC ST Fõ $ ss ss =|) 3 go E SSI BE & 8/5 8 o a flo E Sw " v = E Ds S |8 2 ag Ego 8! E Es ES 822/82 $ E sê sê sê s| o Az áNT os ES E Ss E SE Z|= = 2 O o “ " O alo ajo 8 jo 8) E BG 8 BS8EEAQ|ISSSE e 2 ns VU |3 o E | ó « 3 |e ds 5 O neZ O doa oo N o Ee-Zlo o T Ss E = Ss 8 3 ek Zi a al Z | z/3| SN 3 sala es sl a za e) : S PIT /2S/PÍINR E &çN É e e |e e | | : : 2 8 |& |8 |& |8 | E |ê o o o o e Ed s &é E |E E | | 2 | 8 ss |8 |8 |8 |5,/5,/8E| E |e |o o a |ãa |& |E |8 8 8 8 vl8 e Ss o o o o SST 8 S S = 8 E kg E é SE N N 8 E Ss 2 o | | ES El, o = É 2 2 | | | 2828/22 3 E E 8 o ” v o” FNE N| Z 8 o e. o o o o 20/09 2| Mm 2 ” = o E vv v E fo 2 O) m z S S SC S SC S S S S o o S & 8 |& | j6= 60 o o 2 2 o Ss | Ss, ls |s 5852] Ss srjês nl 26 2/6 2/6 ns 2 2 o 3 2/3 2/8 ele a e m/8Z| Ss > a E o E S 2 pe vê pe ve 2d 2, & C <o So = TE 5 ES ES ESTSP] o Ze 2o o PolRT E SE sl 8/8 8| 5 - STE o 3 8/8 S/ Egas ese Ss) 3| 3 |? 8| 58 on SNISNION|oONI5 ol5 o! 2 2 e? o Bo oS8 28 8L8/ 88/75/55 8 Fã oã Ss 2 ESTES 8O 5 S&S 2 2 em om E = 2 a=/ 22/25/05) S & [é$º 4º o | E EE 2223 22/E o|E 8 8 281 õ Zz = = 8 o 8 o 3 Zn 233 Sm 23 ESSES > D 8387 &) 8 | E olEo|É o/ÉEo|8F EFE É Es | Ss 5 Dojo los 50 0 2lo 2) X «“ os ne Ón x Fr vs ê o | ã > 6. é 2 oO ã m ez $
2. 6 S = 8s E & SS : sis a Ss 2 EO Sl sl ENS 2 Sl o o lo 2 |-aã o : 1 e Esc clic | al ló dl = 8 2 Ê Rn 2 2/21/88 &s ? X
É ê 2 ã ze
Z & É
Definições
[0077] Os termos "enzima modificadora de DNA sítio específica", "enzima modificadora de DNA específica para sequência", "enzima de edição gênica", "enzima de edição genômica" e "enzima de manipula- ção de genoma" são usados de forma alternada aqui e se referem a enzimas ou complexos enzimáticos usados realizar modificação espe- cífica, ou direcionada, modificação aleatória, ou direcionada, de qual- quer informação genética ou epigenética ou genoma de um organismo vivo em pelo menos uma posição. A natureza específica da sequência enzimática significa que ela pode ser direcionada para editar genes, mas também editar regiões que não sejam regiões codificadoras de um genoma. Ela compreende ainda a edição ou manipulação da informação nuclear (se presente), bem como outras informações genéticas de uma célula. Além disso, a modificação da informação genética compreende a modificação direcionada de edição, manipulação, mutação ou destrui- ção de bases de ácidos nucleicos contidas em genomas nucleares ou extranucleares, incluindo genomas de DNA ou RNA. Ela também pode incluir a modificação direcionada de mensagens expressas a partir de genomas tal como, por exemplo, mensagens de RNA. Tais enzimas in- cluem, porém sem limitações, exonucleases, endonucleases, nickases, helicases, polimerases, ligases e desaminases, incluindo citidina, ade- nina ou outros editores de base. A modificação da informação epigené- tica compreende a modificação direcionada de metilação, modificação de histona ou de RNAs não codificadores, possivelmente causando al- terações hereditárias na expressão gênica.
[0078] Um "editor de base", conforme usado aqui, se refere a uma proteína ou um complexo que compreende pelo menos uma proteína ou um fragmento da mesma que tem a capacidade de mediar uma modifi- cação de base direcionada, isto é, a conversão de uma base de inte-
resse que resulta em uma mutação pontual de interesse.
De preferên- cia, o pelo menos um editor de base, no contexto da presente invenção, compreende pelo menos um domínio de reconhecimento de ácidos nu- cleicos para direcionar o editor de base para um sítio específico de uma sequência de ácidos nucleicos e pelo menos um domínio de edição de ácidos nucleicos que realiza a conversão de pelo menos uma nucleo- base no sítio alvo específico.
O domínio de reconhecimento de ácidos nucleicos pode compreender adicionalmente pelo menos uma molécula de ácidos nucleicos, por exemplo, um RNA guia ou qualquer outra mo- lécula de ácidos nucleicos fita simples ou dupla.
Uma "edição de base", portanto, se refere a pelo menos um nucleotídeo específico que traz uma nucleobase diferente de anteriormente.
Com base no exposto acima, uma "localização predeterminada" de acordo com a presente in- venção significa a localização ou sítio em um material genômico em um sistema celular ou dentro de um genoma de uma célula de interesse a ser modificado, onde uma edição direcionada deve ser introduzida.
O editor de base pode compreender outros componentes além do domínio de reconhecimento de ácidos nucleicos e do domínio de edição de áci- dos nucleicos, tais como espaçadores, sinais de localização e compo- nentes que inibem os mecanismos de reparo de DNA ou RNA que ocor- rem naturalmente para assegurar o resultado de edição desejado.
O termo "domínio de reconhecimento de ácidos nucleicos" se refere ao componente do editor de base que assegura a especificidade pelo sítio do editor de base, direcionando-o para um sítio de destino dentro da localização predeterminada.
Um domínio de reconhecimento de ácidos nucleicos pode ser baseado em um sistema CRISPR, o qual reconhece especificamente uma sequência alvo na molécula de ácidos nucleicos do sistema celular usando um RNA guia (gRNA) ou RNA guia único (S9RNA), pode ser uma fusão sintética de um RNA de CRISPR (crRNA) e um crRNA de transativação (tracrRNA).
[0079] Uma "nuclease CRISPR", conforme usado aqui, é qualquer nuclease que foi identificada em um sistema CRISPR de ocorrência na- tural, a qual foi subsequentemente isolada de seu contexto natural e que, de preferência, foi modificada ou combinada em uma construção recombinante de interesse a ser adequada como ferramenta para enge- nharia genômica direcionada. Qualquer nuclease CRISPR pode ser usada e opcionalmente reprogramada ou além disso, sofrer mutação para ser adequada para as várias modalidades de acordo com a pre- sente invenção, contanto que a nuclease CRISPR de tipo selvagem ori- ginal forneça reconhecimento de DNA, isto é, propriedades de ligação. O dito reconhecimento de DNA pode ser dependente de um motivo ad- jacente protoespaçador (Protospacer Adjacent Motif, PAM). Nucleases CRISPR que têm padrões de reconhecimento de PAM otimizados e ma- nipulados podem ser usadas e criadas para uma aplicação específica. A expansão do código de reconhecimento de PAM pode ser adequada para direcionar complexos efetores sítio específicos para um sítio alvo de interesse, independente da especificidade original do PAM da nu- clease com base em CRISPR de tipo selvagem. As nucleases CRISPR também compreendem mutantes ou fragmentos ou fusões catalitica- mente ativas de uma sequência efetora CRISPR de ocorrência natural Ou as respectivas sequências que codificam as mesmas. Uma nuclease CRISPR também pode, em particular, se referir a uma nickase CRISPR ou mesmo a uma variante deficiente em nuclease de um polipeptídeo de CRISPR que tem função endonucleolítica em seu ambiente natural.
[0080] O termo "domínio de edição de ácidos nucleicos" se refere ao componente do editor de bases que inicia a conversão de nucleotí- deos para resultar na edição desejada. A função catalítica do domínio de edição de ácidos nucleicos pode ser uma função de citidina-desami- nase ou de adenina-desaminase.
[0081] Em geral, os editores de base são compostos por pelo me- nos um domínio de reconhecimento de ácidos nucleicos e pelo menos um domínio de edição de ácidos nucleicos que desamina a citidina ou a adenina. Os domínios de edição de ácidos nucléicos que desaminizam a citidina são capazes de converter C em T (G em A) e são denomina- dos de BEs; o domínio de edição de ácidos nucléicos que desamina a adenina pode converter A em G (T em C) e são denominados ABEs.
[0082] Os editores de base geralmente são compostos pelo domínio de citidina desaminase (tal como APOBEC1, APOBEC3A, APOBEC3G, PmCDA1, AID), ligante (geralmente XTEN), domínio CRISPR (d/nCas9, dCpf1, CasX, CasY ou outros domínios adequados) e inibidor de uracil DNA glicosilase (Uracil Glycosylase Inhibitor, UGI). Em um sistema mo- dificado, o número de domínios UGI ou NLS pode variar, assim como o comprimento do ligante. Eles também podem incluir outros domínios, tal como Gam (por exemplo, em BE4). Pode haver variantes com mutações pontuais de aminoácidos no domínio de citidina desaminase para dife- rentes janelas de edição, tais como YE-BE3, YEE-BE3, e também mu- tações no domínio CRISPR para diferentes reconhecimentos de PAM, tais como VOR-BE3, EQR-BE3, VRER-BE3 e SaKKH-BE3. No sistema BE-PLUS, o domínio CRISPR e o domínio de citidina desaminase não são expressos como proteína de fusão, mas sim ligados entre si usando um sistema Suntag para ampliar a janela de edição. Mais detalhes sobre editores de base preferidos, incluindo editores de base de DNA com base em citidina desaminase, editores de bases de DNA com base em adenina desaminase, podem ser derivados de Eid A. et al. (Ayman Eid, Sahar Alshareef e Magdy M. Mahfouz (2018), CRISPR Base Editors: Genome Editing Without Double-Strand Breaks, Biochemical Journal (2018) 475 1955-1964).
[0083] Os termos "associado a" ou "em associação com" de acordo com a presente invenção devem ser interpretados de maneira ampla e,
portanto, de acordo com a presente invenção implica que uma molécula (DNA, RNA, aminoácido que compreende blocos de construção naturais e/ou sintéticos) seja fornecida em associação física com outra molécula, a associação sendo de natureza covalente ou não covalente. Por exem- plo, um modelo de reparo pode ser associado a um gRNA de uma nu- clease CRISPR, em que a associação pode ser de natureza não cova- lente (emparelhamento complementar de bases) ou as moléculas po- dem ser fisicamente ligadas umas às outras através de uma ligação co- valente.
[0084] O termo "fragmento cataliticamente ativo", conforme usado aqui em referência a sequências de aminoácidos denota a sequência central derivada de uma determinada sequência de aminoácidos mo- delo ou uma sequência de ácidos nucleicos que codifica a mesma que compreende todo ou parte do sítio ativo da sequência modelo, contanto que o fragmento cataliticamente ativo resultante ainda tenha a atividade que caracteriza a sequência modelo pela qual o sítio ativo da enzima nativa ou uma variante da mesma é responsável. As ditas modificações são adequadas para gerar sequências de aminoácidos menos volumo- sas que ainda têm a mesma atividade que uma sequência-padrão, tor- nando o fragmento cataliticamente ativo uma ferramenta mais versátil ou mais estável, sendo menos exigente em termos estéricos.
[0085] Uma "fixação covalente" ou "ligação covalente" é uma liga- ção química que envolve o compartilhamento de pares de elétrons entre átomos das moléculas ou sequências covalentemente ligadas entre si. Uma interação "não covalente" difere de uma ligação covalente, pois não envolve o compartilhamento de elétrons, mas envolve variações mais dispersas de interações eletromagnéticas entre moléculas/se- quências ou dentro de uma molécula/sequência. Interações ou ligações não covalentes compreendem, assim, interações eletrostáticas, forças de van der Waals, Tr -efeitos e efeitos hidrofóbicos. De importância es- pecial no contexto das moléculas de ácido nucleico são as ligações de hidrogênio como interação eletrostática. Uma ligação de hidrogênio (li- gação H) é um tipo específico de interação dipolo-dipolo que envolve a interação entre um átomo de hidrogênio parcialmente positivo e um átomo de oxigênio, nitrogênio, enxofre ou flúor parcialmente eletronega- tivo e altamente eletronegativo, não covalentemente ligado ao dito átomo de hidrogênio. Qualquer "associação" ou "associação física" con- forme usado aqui implica, portanto, em uma interação ou ligação cova- lente ou não covalente. No caso de complexos moleculares, por exem- plo, um complexo formado por uma nuclease CRISPR, um gRNA e um modelo de reparo (Repair Template, RT), interações mais covalentes e não covalentes podem estar presentes para ligar e, assim, associar os diferentes componentes de um complexo molecular de interesse.
[0086] Os termos "polipeptíideco de CRISPR", "endonuclease CRISPR", "huclease CRISPR", "proteína CRISPR", "efetor CRISPR" ou "enzima CRISPR" são usados aqui de forma alternada e se referem a qualquer sequência de aminoácidos que ocorre natural ou artificial- mente ou à sequência de ácidos nucleicos que codifica a mesma que atua como DNA nuclease ou nickase, em que o "polipeptídeo de CRISPR" é derivado de um sistema CRISPR de qualquer organismo o qual pode ser clonado e usado para engenharia genômica direcionada. Os termos "nuclease CRISPR" ou "polipeptídeo de CRISPR" também compreendem mutantes ou fragmentos ou fusões cataliticamente ativas de sequências efetoras de um CRISPR de ocorrência natural ou as res- pectivas sequências que codificam as mesmas. Uma "nuclease CRISPR" ou "polipeptídeo de CRISPR" também pode assim, por exemplo, se re- ferir a uma nickase CRISPR ou mesmo a uma variante deficiente em nuclease de um polipeptídeo de CRISPR que tem função endonucleolí- tica em seu ambiente natural. De preferência, a descrição da presente invenção se baseia em nucleases CRISPR deficientes em nuclease que têm ainda suas propriedades de reconhecimento e ligação a DNA ine- rentes assistidas por um RNA de CRISPR cognato.
[0087] Sequências de ácidos nucleicos descritas aqui têm "códons otimizados". "Otimização de códons" implica que um DNA ou RNA pro- duzido sinteticamente ou isolado de um organismo doador seja adap- tado ao uso de códons de diferentes organismos aceitadores para me- lhorar as taxas de transcrição, processamento e/ou estabilidade do MRNA e/ou taxas de tradução e/ou subsequente dobramento de prote- ínas do dito ácido nucleico recombinante na célula ou organismo de in- teresse. Aqueles versados na técnica estão bem cientes do fato de que um ácido nucleico alvo pode ser modificado em uma posição em virtude da degeneração de códons, ao mesmo tempo em que esta modificação ainda levará à mesma sequência de aminoácidos nesta posição após tradução, o que é alcançado pela otimização de códons levando em consideração o uso de códons específicos para a espécie de uma célula ou organismo alvo. Por sua vez, as sequências de ácidos nucleicos con- forme definido aqui podem ter um determinado grau de identidade com uma sequência diferente que codifica a mesma proteína, mas que teve os códons otimizados.
[0088] "Complementar" ou "complementaridade", conforme usado aqui, descreve a relação entre dois (c)DNAs, dois RNAs ou entre um RNA e uma região de ácido nucleico do (c)DNA. Definidas pelas nucleo- bases do DNA ou RNA, duas regiões de ácido nucleico podem hibridizar entre si de acordo com o modelo "lock-and-key". Para esta finalidade, os princípios do emparelhamento de bases de Watson-Crick têm a base adenina e timina/uracila, bem como guanina e citosina, respectiva- mente, como bases complementares. Além disso, também o empare- lhamento não Watson-Crick, tal como o emparelhamento reverso de
Watson-Crick, Hoogsteen, reverso-Hoogsteen e Wobble são compreen- didos pelo termo "complementar", conforme usado aqui, contanto que os respectivos pares de bases possam construir ligações de hidrogênio entre si, ou seja, duas fitas de ácidos nucleicos diferentes podem hibri- dizar entre si com base na dita complementaridade.
[0089] Conforme usado no contexto do presente pedido, o termo "cerca de" pode significar +/- 10 % do valor citado, de preferência +/- 5 % do valor citado. Por exemplo, cerca de 100 nucleotídeos (nt) devem, então, ser entendidos como um valor entre 90 e 110 nt, de preferência entre 95 e 105.
[0090] O termo "derivado" ou "descendente" ou "progênie", con- forme usado aqui no contexto de uma célula procariota ou eucariota, de preferência uma célula animal e, mais preferivelmente, uma planta ou célula de planta ou material vegetal de acordo com a presente invenção, se refere aos descendentes desta célula ou material resultante da pro- pagação reprodutiva natural, incluindo a propagação sexual e assexu- ada. É bem sabido por aqueles versados na técnica na técnica que a dita propagação pode levar à introdução de mutações no genoma de um organismo resultante de fenômenos naturais que resultam em um descendente ou progênie que é genomicamente diferente do organismo ou célula progenitora, no entanto, ainda pertence ao mesmo gênero/es- pécie e tem principalmente as mesmas características da célula hospe- deira recombinante progenitora. Tais derivados ou descendentes ou progênies resultantes de fenômenos naturais durante a reprodução ou regeneração são, portanto, compreendidos pelo termo da presente in- venção e podem ser facilmente identificados por aqueles versados na técnica quando de comparação do "derivado" ou "descendente" ou "pro- gênie" com o respectivo progenitor ou ancestral. Além disso, o termo "derivado", no contexto de uma substância ou ácido nucleico ou molé-
cula de aminoácidos e não se referindo a uma célula ou organismo re- plicante, pode implicar uma substância ou molécula derivada da subs- tância ou molécula original através de meios químicos e/ou biotecnoló- gicos. O derivado resultante terá características que permitem àqueles versados na técnica definir claramente a molécula original ou progeni- tora da qual o derivado se origina. Além disso, o derivado pode ter fun- cionalidades biológicas adicionais ou variáveis, ainda que um derivado ou um "fragmento ativo" de uma molécula original ainda compartilhe pelo menos uma função biológica da molécula progenitora, mesmo que o derivado ou fragmento ativo possa ser mais curto/mais longo do que a sequência progenitora e pode compreender determinadas mutações, eliminações ou inserções comparado com a respectiva sequência pro- genitora.
[0091] Uma "célula eucariota", conforme usado aqui, se refere a uma célula que tem um núcleo verdadeiro, uma membrana nuclear e organelas pertencentes a qualquer um dos reinos Protista, Plantae, Fungi ou Animalia. Organismos eucariotas podem compreender orga- nismos monocelulares e multicelulares. Células e organismos eucario- tas preferidos de acordo com a presente invenção são células de planta.
[0092] Conforme usado aqui, "fusão" pode se referir a uma proteína e/ou ácido nucleico que compreende uma ou mais sequências não na- tivas (por exemplo, porções). Qualquer sequência de ácidos nucleicos ou sequência de aminoácidos de acordo com a presente invenção pode, assim, ser fornecida na forma de uma molécula de fusão. Uma fusão pode estar na extremidade N-terminal ou C-terminal da proteína modifi- cada, ou ambas, ou dentro da molécula como um domínio separado. Para moléculas de ácidos nucleicos, a molécula de fusão pode ser co- nectada na extremidade 5' ou 3' ou em qualquer posição interveniente adequada. Uma fusão pode ser uma fusão transcricional e/ou traducio-
nal.
Uma fusão pode compreender uma ou mais das mesmas sequên- cias não nativas.
Uma fusão pode compreender uma ou mais de dife- rentes sequências não nativas.
Uma fusão pode ser uma quimera.
Uma fusão pode compreender uma etiqueta (tag) de afinidade de ácido nu- cleico.
Uma fusão pode compreender um código de barras.
Uma fusão pode compreender uma etiqueta (tag) de afinidade peptídica.
Uma fu- são pode permitir a localização subcelular do pelo menos um fator de transcrição sintético, conforme descrito aqui (por exemplo, um sinal de localização nuclear (Nuclear Localization Signal, NLS) que tem como alvo (por exemplo, uma nuclease específica para localização ) o núcleo, um sinal de localização mitocondrial que tem como alvo as mitocôndrias, um sinal de localização de cloroplasto que tem como alvo um cloro- plasto, um sinal de retenção de retículo endoplasmático (Endoplasmic Reticulum, ER) e assim por diante). Uma fusão pode fornecer uma se- quência não nativa (por exemplo, etiqueta (tag) de afinidade) que pode ser usada para rastreamento ou purificação.
Uma fusão pode ser uma pequena molécula, tal como biotina ou um corante, tais como corantes Alexa Fluor, corante Cyanine3, corante Cyanine5. A fusão pode conferir maior ou menor estabilidade.
Em algumas modalidades, uma fusão pode compreender uma etiqueta (tag) detectável, incluindo uma porção que pode fornecer um sinal detectável.
Marcadores detectáveis e/ou porções que podem fornecer um sinal detectável adequados podem in- cluir, porém sem limitações, uma enzima, um radioisótopo, um membro de um par de ligação específico; um fluoroforo; um repórter fluorescente ou proteína fluorescente; um ponto quântico; e assim por diante.
Uma fusão pode compreender um membro de um par FRET ou um par de fluoroforo/ponto quântico doador/aceitador.
Uma fusão pode compreen- der uma enzima.
Enzimas adequadas podem incluir, porém sem limita- ções, peroxidase de rabanete, luciferase, galactosidase beta-25 e assim por diante.
Uma fusão pode compreender uma proteína fluorescente.
Proteínas fluorescentes adequadas podem incluir, porém sem limita- ções, uma proteína fluorescente verde (Green Fluorescent Protein, GFP), (por exemplo, uma GFP de Aequoria victoria, proteínas fluores- centes de Anguilla japonica ou um mutante ou derivado das mesmas), uma proteína fluorescente vermelha, uma proteína fluorescente ama- relo, uma proteína fluorescente verde-amarela (por exemplo, mNeon- Green derivada de uma proteína fluorescente tetramérica do cefalocor- dato Branchiostoma lanceolatum), qualquer uma de uma variedade de proteínas fluorescentes e coloridas.
Uma fusão pode compreender uma nanopartícula.
Nanopartículas adequadas podem incluir nanopartículas fluorescentes ou luminescentes e nanopartículas magnéticas, ou nano- diamantes, opcionalmente ligados a uma nanopartícula.
Qualquer pro- priedade ou característica óptica ou magnética das nanopartículas pode ser detectada.
Uma fusão pode compreender uma helicase, uma nu- clease (por exemplo, Fokl), uma endonuclease, uma exonuclease (por exemplo, uma exonuclease 5' e/ou exonuclease 3'), uma ligase, uma nickase, uma nuclease-helicase (por exemplo, Cas3), uma DNA metil- transferase (por exemplo, Dam) ou DNA desmetilase, uma histona me- tiltransferase, uma histona desmetilase, uma acetilase (incluindo, por exemplo, sem limitação, uma histona acetilase), uma desacetilase (in- cluindo, por exemplo, sem limitação, uma histona desacetilase), uma fosfatase, uma quinase, um (co)ativador de transcrição, um (co)fator de transcrição, uma subunidade de RNA polimerase, um repressor de transcrição, uma proteína de ligação a DNA, uma proteína de estrutura- ção de DNA, um RNA longo não codificador, uma proteína de reparo de DNA (por exemplo, uma proteína envolvida no reparo de rupturas de fita simples e/ou dupla, por exemplo, proteínas envolvidas no reparo atra- vés de excisão de base, reparo através de excisão de nucleotídeos, re- paro através de incompatibilidade, NHEJ, HR, união de extremidades mediada por micro-homologia (Microhomology-Mediated End Joining,
MMEUJ) e]/ou união de extremidades não homóloga alternativa (Alterna- tive Non-Homologous End-Joining, ANHEJ) tal como, por exemplo e sem limitação, reguladores de HR e sinais de montagem do complexo HR), uma proteína marcadora, uma proteína repórter, uma proteína flu- orescente, uma proteína de ligação a ligante (por exemplo, mCherry ou uma proteína de ligação a metal pesado), um peptídeo sinalizador (por exemplo, sequência sinalizadora Tat), uma proteína ou peptídeo alvo, uma sequência de localização subcelular (por exemplo, sequência de localização nuclear, uma sequência de localização de cloroplasto) e/ou um epítopo de anticorpo ou qualquer combinação dos mesmos.
[0093] Um "gene", conforme usado aqui, se refere a uma região de DNA que codifica um produto gênico, bem como a todas as regiões de DNA que regulam a produção do produto gênico, independentemente destas sequências reguladoras serem adjacentes ou não às sequências codificadoras e/ou transcritas. Consequentemente, um gene inclui, po- rém sem limitações, sequências promotoras, terminadores, sequências reguladoras de tradução, tais como sítios de ligação a ribossomo e sítios de entrada em ribossomo internos, intensificadores, silenciadores, iso- lantes, elementos limítrofes, origens de replicação, sítios de fixação de matriz e regiões de controle de locus.
[0094] O termo "expressão gênica" ou "expressão", conforme usado aqui, se refere à conversão da informação contida em um gene em um "produto gênico". Um "produto gênico" pode ser o produto transcricional direto de um gene (por exemplo, mRNA, tRNA, rRNA, RNA antissenso, ribozima, RNA estrutural ou qualquer outro tipo de RNA) ou uma prote- ína produzida pela tradução de um mRNA. Os produtos gênicos também incluem RNAs que são modificados por processos tais como capea- mento, poliadenilação, metilação e edição e proteínas modificadas, por exemplo, através de metilação, acetilação, fosforilação, ubiquitinação, ADP-ribosilação, miristilação e glicosilação.
[0095] O termo "ativação gênica" ou "aumento/aumento/ativa- ção/regulação positiva (de) expressão gênica" se refere a qualquer pro- cesso que resulte em um aumento na produção de um produto gênico.
Um produto gênico pode ser RNA (incluindo, porém sem limitações, MRNA, rRNA, tRNA e RNA estrutural) ou uma proteína.
Consequente- mente, a ativação gênica inclui processos que aumentam a transcrição de um gene e/ou tradução de um MRNA.
Exemplos de processos de ativação gênica que aumentam a transcrição incluem, porém sem limi- tações, aqueles que facilitam a formação de um complexo de início de transcrição, aqueles que aumentam a taxa de início de transcrição, aqueles que aumentam a taxa de alongamento de transcrição, aqueles que aumentam a processabilidade de transcrição e aqueles que aliviam a repressão transcricional (ao bloquear, por exemplo, a ligação de um repressor transcricional). A ativação gênica pode constituir, por exem- plo, inibição de repressão, bem como estimulação de expressão acima de um nível existente.
Exemplos de processos de ativação gênica que aumentam a tradução incluem aqueles que aumentam o início de tradu- ção, aqueles que aumentam o alongamento de tradução e aqueles que aumentam a estabilidade do MRNA.
Em geral, a ativação gênica com- preende qualquer aumento detectável na produção de um produto gê- nico, de preferência um aumento na produção de um produto gênico de cerca de 2 vezes, mais preferivelmente a partir de cerca de 2 a cerca de vezes ou qualquer valor integral entre os mesmos, mais preferivel- mente entre cerca de 5 e cerca de 10 vezes ou qualquer valor integral entre os mesmos, ainda mais preferivelmente entre cerca de 10 e cerca de 20 vezes ou qualquer valor integral entre os mesmos, ainda mais preferivelmente entre cerca de 20 e cerca de 50 vezes ou qualquer valor integral entre os mesmos, mais preferivelmente entre cerca de 50 e cerca de 100 vezes ou qualquer valor integral entre os mesmos, mais preferivelmente 100 vezes ou mais.
[0096] Em contraste, os termos "repressão gênica" ou "inibição/ini- bição/repressão/silenciamento/regulação negativa de expressão gê- nica" se referem a qualquer processo que resulte em uma diminuição na produção de um produto gênico.
Um produto gênico pode ser RNA (incluindo, porém sem limitações, MRNA, rRNA, tRNA e RNA estrutural) ou proteína.
Consequentemente, a repressão gênica inclui processos que diminuem a transcrição de um gene e/ou tradução de um mMRNA.
Exemplos de processos de repressão gênica que diminuem a transcri- ção incluem, porém sem limitações, aqueles que inibem a formação de um complexo de início de transcrição, aqueles que diminuem a taxa de início de transcrição, aqueles que diminuem a taxa de alongamento de transcrição, aqueles que diminuem a processabilidade de transcrição e aqueles que antagonizam a ativação transcricional (ao bloquear, por exemplo, a ligação de um ativador transcricional). A repressão gênica pode constituir, por exemplo, evitar a ativação, bem como inibir a ex- pressão abaixo de um nível existente.
Exemplos de processos de re- pressão gênica que diminuem a tradução incluem aqueles que dimi- nuem o início de tradução, aqueles que diminuem o alongamento de tradução e aqueles que diminuem a estabilidade do MRNA.
A repressão transcricional inclui inativação reversível e irreversível de transcrição gê- nica.
Em geral, a repressão gênica compreende qualquer diminuição detectável na produção de um produto gênico, de preferência uma re- dução na produção de um produto gênico de cerca de 2 vezes, mais preferivelmente a partir de cerca de 2 a cerca de 5 vezes ou qualquer valor integral entre os mesmos, mais preferivelmente entre cerca de 5 e cerca de 10 vezes ou qualquer valor integral entre os mesmos, mais preferivelmente entre cerca de 10 e cerca de 20 vezes ou qualquer valor integral entre os mesmos, ainda mais preferivelmente entre cerca de 20 e cerca de 50 vezes ou qualquer valor integral entre os mesmos, mais preferivelmente entre cerca de 50 e cerca de 100 vezes ou qualquer valor integral entre os mesmos, mais preferivelmente 100 vezes ou mais. Mais preferivelmente, a repressão gênica resulta em inibição com- pleta de expressão gênica, de modo que nenhum produto gênico é de- tectável.
[0097] Os termos "construção genética" ou "construção recombi- nante", "vetor" ou "plasmídeo (vetor)" (por exemplo, no contexto de pelo menos uma sequência de ácidos nucleicos a ser introduzida em um sis- tema celular) são usados aqui para se referir a uma construção que compreende, inter alia, plasmídeos ou vetores (plasmídeos), cosmí- deos, cromossomas artificiais de leveduras ou bactérias (YACs e BACs), fagomídeos, vetores com base em fagos bacterianos, um cas- sete de expressão, sequências isoladas de ácidos nucleicos fita simples ou dupla que compreendem sequências de DNA e RNA na forma linear ou circular ou sequências de aminoácidos, vetores virais, incluindo vírus modificados, e uma combinação ou uma mistura dos mesmos, para in- trodução ou transformação, transfecção ou transdução em qualquer cé- lula alvo procariota ou eucariota, incluindo uma planta, célula de planta, tecido, órgão ou material vegetal de acordo com a presente invenção. "Recombinante", no contexto de um material biológico, por exemplo, uma célula ou vetor, implica um material produzido artificialmente. Uma construção recombinante de acordo com a presente invenção pode compreender um domínio efetor na forma de uma sequência de ácidos nucleicos ou aminoácidos, em que um domínio efetor representa uma molécula que pode exercer um efeito em uma célula alvo e inclui um transgene, uma molécula de RNA fita simples ou dupla, incluindo (um) RNA(s) guia(s), um miRNA ou um siRNA ou uma sequência de amino- ácidos incluindo, inter alia, uma enzima ou um fragmento cataliticamente ativo da mesma, uma proteína de ligação, um anticorpo, um fator de transcrição, uma nuclease, de preferência uma nuclease específica para localização e assim por diante.
Além disso, a construção recombi- nante pode compreender sequências reguladoras e/ou sequências de localização.
A construção recombinante pode ser integrada a um vetor, incluindo um vetor de plasmídeo, e/ou pode estar presente isolada de uma estrutura de vetor, por exemplo, na forma de uma sequência poli- peptídica ou como um ácido nucleico fita simples ou fita dupla não ligado ao vetor.
Após sua introdução, por exemplo, através de transformação ou transfecção por meios biológicos ou físicos, a construção genética pode persistir extracromossomicamente, isto é, não integrada no ge- noma da célula alvo, por exemplo, na forma de um DNA fita dupla ou fita simples, um RNA fita dupla ou fita simples ou como uma sequência de aminoácidos.
Alternativamente, a construção genética, ou partes da mesma, de acordo com a presente invenção pode ser integrada de forma estável no genoma de uma célula alvo, incluindo o genoma nu- clear ou outros elementos genéticos de uma célula alvo, incluindo o ge- noma de plastídeos, tais como mitocôndrias ou cloroplastos.
O termo vetor de plasmídeo, conforme usado neste contexto, se refere a uma construção genética originalmente obtida a partir de um plasmídeo.
Um plasmídeo geralmente se refere a um elemento extracromossômico cir- cular de replicação autônoma na forma de uma sequência de ácidos nucleicos fita dupla.
No campo da engenharia genética, estes plasmí- deos são rotineiramente submetidos a modificações direcionadas ao in- serir, por exemplo, genes que codificam resistência a um antibiótico ou um herbicida, um gene que codifica uma sequência de ácidos nucleicos alvo, uma sequência de localização, uma sequência reguladora, uma sequência marcadora, um gene marcador, incluindo um marcador anti- biótico ou um marcador fluorescente, uma sequência opcionalmente co- dificadora prontamente identificável e assim por diante.
Os componen- tes estruturais do plasmídeo original, tal como a origem de replicação, são mantidos.
De acordo com determinadas modalidades da presente invenção, a sequência de localização pode compreender uma sequên- cia de localização nuclear (NLS), uma sequência de localização em plastídeos, de preferência uma sequência de localização em mitocôn- drias ou uma sequência de localização em cloroplastos. As ditas se- quências de localização estão disponíveis para aqueles versados na técnica de biotecnologia de plantas. Uma variedade de vetores de plas- mídeo para uso em diferentes células alvo de interesse está comercial- mente disponível e a sua modificação é conhecida por aqueles versados no respectivo campo.
[0098] Um "genoma", conforme usado aqui, inclui tanto genes (as regiões codificadoras), como o DNA não codificador e, se presente, o material genético das mitocôndrias e/ou cloroplastos ou o material ge- nômico que codifica um vírus ou parte de um vírus. O "genoma" ou "ma- terial genético" de um organismo geralmente consiste em DNA, em que o genoma de um vírus pode ser constituído por RNA (fita simples ou fita dupla).
[0099] Os termos "edição genômica", "edição gênica" e "engenharia genômica" são usados aqui de forma alternada e se referem a estraté- gias e técnicas para a modificação específica direcionada de qualquer informação genética ou genoma de um organismo vivo em pelo menos uma posição. Como tal, os termos compreendem edição gênica, mas também a edição de regiões que não as regiões codificadoras de um genoma. Eles compreendem ainda a edição ou manipulação da infor- mação nuclear (se presente), bem como outras informações genéticas de uma célula. Além disso, os termos "edição genômica", "edição gê- nica" e "engenharia genômica" também compreendem uma edição ou engenharia epigenética, ou seja, a modificação direcionada, por exem- plo, metilação, modificação de histonas ou RNAs não codificadores, possivelmente causando alterações hereditárias na expressão gênica.
[0100] "Germoplasma", conforme usado aqui, é um termo usado para descrever os recursos genéticos ou, mais precisamente, o DNA de um organismo e as coleções deste material. Na tecnologia de melhora- mento, o termo germoplasma é usado para indicar a coleção de material genético a partir do qual uma nova planta ou variedade de plantas pode ser criada.
[0101] Os termos "RNA guia", "gRNA", "sequência de ácidos nuclei- cos de CRISPR", "RNA guia individual" ou "saRNA"" são usados de forma alternada aqui e se referem a uma fusão sintética de um RNA de CRISPR (crRNA) e um crRNA de transativação (tracr»RNA) ou o termo se refere a uma única molécula de RNA que consiste apenas de um crRNA e/ou um tracrRNA ou o termo se refere a um gRNA que compre- ende individualmente uma porção de crRNA ou tracr»RNA. Uma porção tracr»RNA e uma crRNA, se presente, conforme requerido pelo respec- tivo polipeptídeo de CRISPR, não precisa necessariamente estar pre- sente em uma molécula de RNA covalentemente ligada, mas também pode ser composta por duas moléculas de RNA individuais as quais po- dem se associar ou podem ser associadas através de interação não co- valente ou covalente para fornecer um gRNA de acordo com a presente invenção. No caso de endonucleases individuais guiadas por RNA, tal como Cpf1i (consulte Zetsche et al/., 2015), por exemplo, um cr»RNA como sequência de ácidos nucleicos guia individual pode ser suficiente para mediar o direcionamento de DNA.
[0102] O termo "hibridização", conforme usado aqui, se refere ao emparelhamento de ácidos nucleicos complementares, isto é, DNA e/ou RNA, que usam qualquer processo pelo qual uma fita de ácidos nuclei- cos se junte a uma fita complementar através do emparelhamento de bases para formar um complexo hibridizado. A hibridização e a intensi- dade de hibridização (ou seja, a intensidade da associação entre os áci- dos nucleicos) são afetadas por fatores tais como o grau e o compri-
mento da complementaridade entre os ácidos nucleicos, o rigor das con- dições envolvidas, a Tm do híbrido formado e a proporção G:C dentro dos ácidos nucleicos.
O termo complexo hibridizado se refere a um com- plexo formado entre duas sequências de ácidos nucleicos em virtude da formação de limites de hidrogênio entre bases G e C complementares e entre bases A e T/U complementares.
Um complexo hibridizado ou uma construção híbrida correspondente pode ser formada entre duas molé- culas de ácidos nucleicos do DNA, entre duas moléculas de ácidos nu- cleicos do RNA ou entre uma molécula de ácidos nucleicos do DNA e uma molécula de ácidos nucleicos do RNA.
Para todos os casos, as moléculas de ácidos nucleicos podem ser moléculas de ácidos nuclei- cos de ocorrência natural geradas in vitro ou in vivo e/ou moléculas de ácidos nucleicos artificiais ou sintéticas.
A hibridização conforme deta- lhado acima, por exemplo, pares de bases de Watson-Crick que podem se formar entre sequências de DNA, RNA e DNA/RNA, é controlada por um padrão de ligação de hidrogênio específico que representa uma forma de ligação não covalente de acordo com a presente invenção.
No contexto da hibridização, o termo "condições de hibridização rigorosas" deve ser entendido como aquelas condições sob as quais uma hibridi- zação ocorre principalmente apenas entre moléculas de ácidos nuclei- cos homólogas.
O termo "condições de hibridização", a este respeito, se refere não apenas às condições reais prevalecentes durante a aglo- meração real dos ácidos nucleicos, mas também às condições prevale- centes durante as etapas subsequentes de lavagem.
Exemplos de con- dições de hibridização rigorosas são condições sob as quais principal- mente apenas as moléculas de ácidos nucleicos que possuem pelo me- nos 70 %, de preferência pelo menos 75 %, pelo menos 80 %, pelo me- nos 85 %, pelo menos 90 %, pelo menos 91 %, pelo menos 92 %, pelo menos 93 %, pelo menos 94 %, pelo menos 95 %, pelo menos 96 %, pelo menos 97 %, pelo menos 98 %, pelo menos 99 % ou pelo menos
99,50 % de identidade de sequência sofrem hibridização. Condições de hibridização rigorosas são, por exemplo: 4 x SSC a 65 ºC e lavagens múltiplas subsequentes em 0,1 x SSC a 65 ºC durante aproximada- mente 1 hora. O termo "condições de hibridização rigorosas", conforme usado aqui, também pode significar: hibridização a 68 *C em fosfato de sódio a 0,25 M, pH de 7,2, SDS a 7%, EDIAa 1mMeBSAa 1% durante 16 horas e, subsequentemente, lavagem duas vezes com 2 x SSC e SDS a 0,1 % a 68 ºC. De preferência, a hibridização ocorre sob condições rigorosas.
[0103] Os termos "morfogênico" e "morfogenético" são usados aqui de forma alternada, geralmente no contexto de um gene, em que o pro- duto gênico codificado pelo dito gene está envolvido na morfogênese, isto é, o processo biológico que faz com que um organismo desenvolva seu formato. Os termos também são usados no contexto de qualquer fator, incluindo fatores de transcrição sintéticos ou naturais, envolvidos direta ou indiretamente no processo de morfogênese em uma célula ou organismo. Além disso, os termos são usados no contexto das vias ce- lulares que levam à regeneração de plantas inteiras.
[0104] Os termos "nucleotídeo" e "ácido nucléico", com referência a uma sequência ou molécula, são usados aqui de forma alternada e se referem a um DNA ou RNA fita simples ou dupla de origem natural ou sintética. O termo sequência de nucleotídeos é, assim, usado para qual- quer sequência de DNA ou RNA independente de seu comprimento, de modo que o termo compreenda qualquer sequência de nucleotídeos que compreende pelo menos um nucleotídeo, mas também qualquer tipo de oligonucleotídeo ou polinucleotídeo maior. O(s) termo(s) se refere, as- sim, a sequências de ácidos desoxirribonucleicos (DNA) e/ou ácido ri- bonucleico (RNA) naturais e/ou sintéticos que podem opcionalmente compreender análogos de ácido nucleico sintéticos. Um ácido nucleico de acordo com a presente invenção pode opcionalmente ter códons oti- mizados.
A otimização de códons implica que o uso de códons de um DNA ou RNA seja adaptado àquele de uma célula ou organismo de in- teresse para melhorar a taxa de transcrição do dito ácido nucleico re- combinante na célula ou organismo de interesse.
Aqueles versados na técnica estão bem cientes do fato de que um ácido nucleico alvo pode ser modificado em uma posição em virtude da degeneração de códon, enquanto esta modificação ainda levará à mesma sequência de amino- ácidos nesta posição após a tradução, o que é alcançado pela otimiza- ção de códons levando em consideração o uso de códons específico para espécie de uma célula ou organismo alvo.
As sequências de ácidos nucleicos de acordo com o presente pedido podem realizar otimização de códons específica para a seguinte lista não limitativa de organismos: Hordeum vulgare, Sorghum bicolor, Secale cereale, Triticale, Saccharum officinarium, Zea mays, Setaria italic, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Hordeum bulbosum, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Malus domestica, Beta vulgaris, Helianthus annuus, Daucus glochidiatus, Daucus pusillus, Daucus muricatus, Daucus carota, Eu- calyptus grandis, Erythranthe guttata, Genlisea aurea, Nicotiana sylves- tris, Nicotiana tabacum, Nicotiana tomentosiformis, Nicotiana benthami- ana, Solanum Ilycopersicum, Solanum tuberosum, Coffea canephora, Vi- tis vinifera, Cucumis sativus, Morus notabilis, Arabidopsis thaliana, Ara- bidopsis lyrata, Arabidopsis arenosa, Crucihimalaya himalaica, Crucihi- malaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olmarabidopsis pumila, Arabis hirsuta, Brassica napus, Brassica oleracea, Brassica rapa, Brassica juncacea, Brassica nigra, Raphanus sativus, Eruca vesicaria sativa, Citrus sinensis, Jatropha cur- cas, Glycine max, Gossypium ssp. ou Populus trichocarpa.
[0105] Conforme usado aqui, "não nativo" ou "não natural" ou "arti- ficial" ou "sintético" pode se referir a uma sequência de ácidos nucleicos ou polipeptídeo ou a qualquer outra biomolécula, tal como biotina ou fluoresceína, que não é encontrada em um ácido nucleico ou proteína nativa. Não nativo pode se referir a etiquetas (tags) de afinidade. Não nativo pode se referir a fusões. Não nativo pode se referir a uma se- quência de ácidos nucleicos ou polipeptídeo de ocorrência natural que compreende mutações, inserções e/ou eliminações. Uma sequência não nativa pode exibir e/ou codificar uma atividade (por exemplo, ativi- dade enzimática, atividade de metiltransferase, atividade de acetiltrans- ferase, atividade de quinase, atividade de ubiquitinase, etc.) que tam- bém pode ser exibida pela sequência de ácidos nucleicos e/ou polipep- tídeo à qual a sequência não nativa é fundida. Uma sequência de ácidos nucleicos ou polipeptídeo não nativo pode ser ligado a uma sequência de ácidos nucleicos ou polipeptídeo de ocorrência natural (ou uma vari- ante do mesmo) através de engenharia genética para gerar uma se- quência de ácidos nucleicos e/ou polipeptídeo quimérico que codifica um ácido nucleico e/ou polipeptídeo quimérico. Uma sequência não na- tiva pode se referir a uma sequência de extensão de hibridização 3' ou um sinal de localização nuclear (NLS) ligado a uma molécula. Um "fator de transcrição sintético", conforme usado aqui, se refere a uma molé- cula que compreende pelo menos dois domínios, um domínio de reco- nhecimento e um domínio de ativação, os quais não ocorrem natural- mente na natureza.
[0106] Um "organismo", conforme usado aqui, se refere a uma forma de vida eucariota ou procariota individual incluindo, inter alia, um animal, planta, fungo ou uma forma de vida unicelular. No contexto da presente invenção, um organismo é, de preferência, uma planta ou parte de uma planta.
[0107] O termo "bombardeamento de partículas", conforme usado aqui, também denominado "transfecção biolística" ou "bombardeamento biolístico" ou "transferência gênica mediada por micropartículas", se re- fere a um método de distribuição física para transferir uma micropartíi- cula ou nanopartícula revestida que compreende um ácido nucleico ou uma construção genética de interesse para uma célula ou tecido alvo. A micropartícula ou nanopartícula funciona como projétil e é disparada sobre a estrutura alvo de interesse sob alta pressão usando um dispo- sitivo adequado, geralmente denominado de "pistola gênica". A trans- formação via bombardeamento de partículas usa um microprojétil me- tálico coberto com o gene de interesse o qual é, então, disparado sobre as células alvo usando um equipamento conhecido como "pistola gê- nica" (Sandford et al. 1987) em alta velocidade, rápido o suficiente para penetrar na parede celular de um tecido alvo, mas não suficientemente agressivo para causar a morte celular. Para protoplastos, cuja parede celular é totalmente removida, as condições são diferentes logicamente. O ácido nucleico precipitado ou a construção genética de pelo menos um microprojétil é liberado na célula após bombardeamento e integrado ao genoma ou expresso transitoriamente de acordo com a definição for- necida acima. A aceleração dos microprojéteis é realizada por uma des- carga elétrica de alta tensão ou gás comprimido (hélio). Em relação às partículas metálicas usadas, é obrigatório que elas não sejam tóxicas, não reativas e que tenham um diâmetro menor do que a célula alvo. Os mais usados são ouro ou tungstênio. Há muitas informações publica- mente disponíveis pelos fabricantes e fornecedores de pistolas gênicas e sistemas associados referentes ao seu uso geral.
[0108] Os termos "planta" ou "célula de planta", conforme usado aqui, se referem a um organismo vegetal, um órgão vegetal, tecidos ve- getais diferenciados e indiferenciados, células vegetais, sementes e de- rivados e sua progênie. Células de planta incluem, sem limitação, por exemplo, células de sementes, células ou órgãos maduros e imaturos,
incluindo embriões, tecidos meristemáticos, mudas, tecidos de calos em diferentes estados de diferenciação, folhas, flores, raízes, brotos, game- tófitos masculinos ou femininos, esporófitos, pólen, tubos e micrósporos de pólen, protoplastos, macroalgas e microalgas. As diferentes células eucariotas, por exemplo, células de planta, podem ter qualquer grau de ploidia, isto é, podem ser haploides, diploides, tetraploides, hexaploides ou poliploides. De preferência, uma célula de planta, planta ou parte de uma planta, conforme usado aqui, se origina ou pertence a uma espécie vegetal selecionada a partir do grupo que consiste em Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Bra- chypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosifor- mis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante gquttata, Genlisea aurea, Cu- cumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, OI- marabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oelera- cia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Ci- cer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulo- sum, Allium sativum e Allium tuberosum.
[0109] Um "promotor" se refere a uma sequência de DNA capaz de controlar a expressão de uma sequência codificadora, isto é, um gene ou parte do mesmo ou um RNA funcional, isto é, um RNA que é ativo sem ser traduzido, por exemplo, um miRNA, um siRNA, um RNA repe- tido invertido ou um RNA que forma um grampo.
Um promotor geral- mente está localizado na parte 5' de um gene.
As estruturas promotoras ocorrem em todos os reinos da vida, isto é, em bactérias, arqueias e eucariotas, onde eles têm arquiteturas diferentes.
A sequência promo- tora geralmente consiste em elementos proximais e distais em relação à sequência regulada, a última sendo frequentemente denominada como intensificadores.
Os promotores podem ter um amplo espectro de atividade, mas também podem ter atividade específica para tecido ou estágio de desenvolvimento.
Por exemplo, eles podem ser ativos em células de raízes, sementes e células meristemáticas, etc.
Um promotor pode ser ativo de maneira constitutiva ou indutível.
A indução pode ser estimulada por uma variedade de condições e estímulos ambientais.
Há promotores fortes, os quais podem permitir uma transcrição elevada da sequência regulada, e promotores fracos.
Muitas vezes, os promotores são altamente regulados.
Um promotor da presente invenção pode in- cluir um promotor endógeno nativamente presente em uma célula ou um promotor artificial ou transgênico de outra espécie ou um promotor artificial ou quimérico, ou seja, um promotor que não ocorre natural- mente na natureza nesta composição e é composto por diferentes ele- mentos promotores.
O processo de transcrição começa com a ligação da RNA polimerase (RNAP) ao DNA na região promotora, a qual fica na proximidade imediata do sítio de início de transcrição (Transcription Start Site, TSS). Acredita-se que uma sequência promotora típica com- preende alguns motivos de sequência posicionados em sítios especiífi- cos em relação ao TSS.
Por exemplo, foi observado que um promotor procariota tem dois motivos hexaméricos centralizados em ou próximo das posições -10 (caixa Pribnow) e -35 em relação ao TSS.
Além disso, pode haver um elemento UP ("a montante") rico em AT a montante da região -35. Os promotores procariotas são reconhecidos por fatores sigma como fatores de transcrição. A estrutura dos promotores eucari- otas é geralmente mais complexa e eles têm vários motivos de sequên- cia diferentes, tais como caixa TATA, caixa INR, BRE, caixa CCAAT e caixa GC (Bucher P., J. Mol. Biol. 20 de abril de 1990; 212 (4): 563-78.). As células eucariotas possuem três RNAPs, RNA polimerase |, Il e Ill, respectivamente. RNAP | gera RNA ribossômico (rRNA), RNAP || gera RNA mensageiro (mMRNA) e pequeno RNA nuclear (snRNA), e RNAP Ill gera RNA de transferência (tRNA), snRNA e 5S-RNA.
[0110] O termo "sequência reguladora", conforme usado aqui, se refere a uma sequência de ácidos nucleicos ou aminoácidos que pode controlar a transcrição e/ou tradução e/ou modificação de uma sequên- cia de ácidos nucleicos de interesse. Sequências reguladoras podem compreender sequências de cis atuação ou trans atuação. Sequências reguladoras exemplificativas compreendem promotores, intensificado- res, terminadores, operadores, fatores de transcrição, sítios de ligação ao fator de transcrição, íntrons e assim por diante.
[0111] O termo "terminador", conforme usado aqui, se refere a se- quências de DNA localizadas a jusante, ou seja, na direção 3' de uma sequência codificadora e pode incluir um sinal de poliadenilação e ou- tras sequências, ou seja, outras sequências que codificam sinais regu- ladores que são capazes de afetar o processamento de mRNA e/ou ex- pressão gênica. O sinal de poliadenilação é geralmente caracterizado por adicionar poli-A-nucleotídeos na extremidade 3' de um precursor de MRNA.
[0112] Os termos "transitória" ou "introdução transitória", conforme usado aqui, se referem à introdução transitória de pelo menos uma se- quência de ácidos nucleicos e/ou aminoácidos de acordo com a pre- sente invenção, de preferência incorporada em um vetor de distribuição e/ou em uma construção recombinante, com ou sem o auxílio de um vetor de distribuição, em uma estrutura alvo, por exemplo, uma célula de planta ou sistema celular, em que a pelo menos uma sequência de ácidos nucleicos ou nucleotídeos é introduzida sob condições de reação adequadas, de modo que nenhuma integração da pelo menos uma se- quência de ácidos nucleicos ocorra no material de ácido nucleico endó- geno de uma estrutura alvo, no genoma como um todo, de modo que a pelo menos uma sequência de ácidos nucleicos não seja integrada no DNA endógeno da célula alvo. Como uma consequência, no caso de introdução transitória, a construção genética introduzida não será her- dada por uma progênie da estrutura alvo, por exemplo, uma célula de planta. A pelo menos uma sequência de ácidos nucleicos e/ou aminoá- cidos ou os produtos resultantes da transcrição, tradução, processa- mento, modificações pós-traducionais ou construção complexa dos mesmos só estão presentes temporariamente, ou seja, de maneira tran- sitória, na forma constitutiva ou indutível, e, portanto, só podem ser ati- vos na célula alvo ao exercer seu efeito por um tempo limitado. Portanto, a pelo menos uma sequência introduzida através de introdução transi- tória não será herdada pela progênie de uma célula. O efeito mediado por pelo menos uma sequência ou efetor introduzido de maneira transi- tória pode, no entanto, ser potencialmente herdado pela progênie da célula alvo. Uma introdução "estável" envolve, portanto, a integração de uma sequência de ácidos nucleicos ou nucleotídeos no genoma de uma célula alvo ou sistema celular de interesse, em que o genoma compre- ende o genoma nuclear, bem como o genoma compreendido por outras organelas.
[0113] O termo "variante(s)", conforme usado aqui no contexto de sequências de aminoácidos ou de ácidos nucleicos, se destina a signi- ficar sequências substancialmente similares. Para sequências de ácidos nucleicos, uma variante compreende uma eliminação e/ou adição de um ou mais nucleotídeos em um ou mais locais internos dentro do polinu- cleotídeo nativo e/ou uma substituição de um ou mais nucleotídeos em um ou mais locais no polinucleotídeo nativo. Conforme usado aqui, um polinucleotídeo ou polipeptídeo "nativo" compreende uma sequência de nucleotídeos ou uma sequência de aminoácidos de ocorrência natural, respectivamente. Para sequências de ácidos nucleicos, variantes con- servativas incluem aquelas as quais, em virtude da degeneração do có- digo genético, codificam a mesma sequência de aminoácidos que uma sequência de referência da presente invenção. Uma variante de uma dada sequência de ácidos nucleicos também incluirá sequências de áci- dos nucleicos derivadas sinteticamente, tais como aquelas geradas, por exemplo, usando mutagênese sítio dirigida, mas que ainda codificam a mesma proteína que a sequência de referência. Em geral, variantes de um polinucleotídeo particular da invenção terão pelo menos cerca de 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % ou mais de identidade de sequência com aquela sequência de ácidos nucleicos específica, conforme determi- nado por programas e parâmetros de alinhamento de sequência descri- tos mais adiante nesta seção.
[0114] Uma sequência de aminoácidos, polipeptídeo ou proteína (os ditos termos sendo usados alternadamente aqui) "variante", significa uma sequência de aminoácidos derivada a partir da sequência de ami- noácidos nativa por supressão ou adição de um ou mais aminoácidos em um ou mais locais internos na proteína nativa e/ou substituição de um ou mais aminoácidos em um ou mais locais na proteína nativa. As sequências de aminoácidos variantes de acordo com a presente inven- ção são biologicamente ativas, ou seja, continuam a ter a atividade bio- lógica desejada da proteína nativa. As variantes ativas de uma sequên- cia de aminoácidos nativa da invenção terão pelo menos cerca de 65 %, 7O %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %,
97 %, 98 %, 99 % ou mais de identidade de sequência com a sequência de aminoácidos para a sequência de aminoácidos nativa, conforme de- terminado pelos programas e parâmetros de alinhamento de sequência descritos mais adiante nesta seção.
[0115] Sempre que a presente invenção se referir à porcentagem de identidade de sequências de ácidos nucleicos ou aminoácidos entre si, estes valores são definidos como obtidos usando o programa EMBOSS Water Pairwise Sequence Alignments (nucleotídeos) (www.ebi.ac.uk/ Tools/psa/emboss water/nucleotide.html) ou o programa EMBOSS Wa- ter Pairwise Sequence Alignments (proteínas) (www.ebi.ac.uk/To- ols/psa/emboss water/) para sequências de aminoácidos. Alinhamen- tos ou comparações de sequências, conforme usado aqui, se refere a um alinhamento em todo o comprimento de duas sequências compara- das entre si. Estas ferramentas fornecidas pelo European Bioinformatics Institute (EBI) do European Molecular Biology Laboratory (EMBL) para alinhamentos de sequências locais usam um algoritmo de Smith-Water- man modificado (consulte www.ebi.ac.uk/Tools/psa/ e Smith, T.F. & Wa- terman, M.S. "Identification of Common Molecular Subsequences", Journal of Molecular Biology, 1981 147 (1): 195-197). Ao realizar um alinhamento, são usados os parâmetros padrão definidos pelo EMBL- EBI. Estes parâmetros são (i) para sequências de aminoácidos: Matriz = BLOSUMG6?2, penalidade por abertura de lacuna = 10 e penalidade de extensão de lacuna = 0,5 ou (ii) para sequências de ácidos nucleicos: Matriz = DNAfull, penalidade por abertura de lacuna = 10 e penalidade por lacuna = 0,5. Aqueles versados na técnica estão bem cientes do fato de que, por exemplo, uma sequência que codifica uma proteína pode ter "códons otimizados" se a respectiva sequência for usada em outro organismo comparado com o organismo original de onde uma molécula se origina.
Descrição Detalhada
[0116] Aqueles versados na técnica entenderão os aspectos e mo- dalidades descritos aqui não devem ser interpretados como limitados ao contexto particular no qual são descritos, mas sim que os aspectos e modalidades descritos ao longo do presente relatório descritivo podem ser combinados entre si independentemente de seu contexto específico.
[0117] A presente invenção se baseia na constatação de que a mo- dulação seletiva da expressão gênica de genes endógenos usando fa- tores de transcrição sintéticos (STFs) especificamente definidos consti- tui uma ferramenta adequada para regulação temporal e espacial espe- cífica de um gene de interesse. Por sua vez, isto constitui a base para a otimização das abordagens de transformação e edição genômica e, por- tanto, permite maiores frequências na transformação/edição o que, por sua vez, permite métodos aprimorados em biotecnologia agrícola.
[0118] Por exemplo, em vez de usar as sequências de nucleotídeos que codificam os genes morfogênicos, por exemplo, BBM e WUS, como cassetes de expressão isolados ou heterólogos, é possível usar modu- ladores de transcrição sintéticos concebidos especificamente, tais como efetores TAL ou sistemas CRISPR/nuclease desarmados e outros para induzir à expressão dos genes morfogênicos endógenos para reprogra- mar a célula e induzir à divisão e regeneração celular em um ponto es- pecífico do tempo de maneira transitória, sem a necessidade de intro- duzir um efetor morfogênico transgênico ou a sequência que codifica o mesmo na célula ou planta de interesse. Estas principais conclusões foram expandidas para estabelecer fatores de transcrição artificiais (TFS) que compreendem pelo menos um domínio de ativação ou silen- ciamento para regular positiva ou negativamente de forma específica a expressão de um gene-alvo de forma indutível. Por sua vez, o efeito direto dos ditos STFs artificiais concebidos especificamente foi, então, usado em uma variedade de métodos de biologia molecular para atuar sinergicamente com o efeito de modulação para otimizar a transforma- ção, edição gênica ou silenciamento direcionado, em que estes méto- dos podem ser empregados para melhoramento genético de plantas e possíveis aplicações terapêuticas.
[0119] Em um aspecto da presente invenção, foram estabelecidas abordagens para gerar plantas usando os fatores de transcrição sintéti- cos específicos para BBM e WUS para induzir à divisão celular e rege- neração de células de planta, cujos resultados foram extrapolados para outros métodos e usos com base em uma variedade de fatores de trans- crição sintéticos. Por sua vez, estes fatores de transcrição específicos permitem o fornecimento de métodos para melhorar a eficiência da transformação e/ou regeneração de plantas transgênicas usando fato- res de transcrição sintéticos específicos para genes morfogênicos en- dógenos que podem reprogramar a célula e induzir à divisão celular em uma grande variedade de espécies de plantas, incluindo aquelas espé- cies ou variedades conhecidas por serem difíceis de transformar e re- generar, para aumentar drasticamente a eficiência de transformação de uma variedade de espécies e, além disso, uma variedade de diferentes tipos de células, incluindo aquelas que são recalcitrantes à transforma- ção em ambientes padrão. A presente invenção se refere, assim, a fer- ramentas moleculares específicas para um gene morfogênico de inte- resse o qual é direcionado à modulação, de preferência ativação, ou seja, a presente invenção se refere a fatores de transcrição sintéticos específicos e a sequências que codificam os mesmos, bem como a mé- todos de uso destes fatores de transcrição sintéticos ou artificiais espe- cíficos de uma maneira direcionada para otimizar métodos de biotecno- logia de plantas com base em transformação e transfecção, em particu- lar métodos com base em edição genômica ou métodos para otimizar as taxas de transformação de células de planta recalcitrantes à trans- formação.
[0120] Em um aspecto, é descrito um fator de transcrição sintético (STF) ou uma sequência de nucleotídeos que codifica o mesmo que pode compreende pelo menos um domínio de reconhecimento e pelo menos um domínio de modulação de expressão gênica, em particular pelo menos um domínio de ativação, em que o fator de transcrição sin- tético pode ser configurado para modular a expressão de um gene mor- fogênico em um sistema celular.
[0121] Uma "modulação" da expressão de qualquer gene endó- geno, de preferência um gene morfogênico, conforme descrito aqui, in- clui tanto ativação quanto repressão gênica, conforme definido acima. Esta modulação pode ser testada ao determinar qualquer parâmetro que seja indireta ou diretamente afetado pela expressão do gene-alvo. Tais parâmetros incluem, por exemplo, alterações nos níveis de RNA ou proteína; alterações na atividade de proteína; alterações nos níveis de produto; alterações na expressão gênica a jusante; alterações na transcrição ou atividade de genes repórteres tais como, por exemplo, luciferase, CAT, beta-galactosidase ou GFP (consulte, por exemplo, Mistili & Spector, (1997) Nature Biotechnology 15: 961-964). Para genes morfogênicos, uma modulação de expressão gênica também pode ser monitorada por meios visuais, incluindo microscopia, observação de de- senvolvimento da planta e assim por diante para monitorar alterações em qualquer efeito funcional da expressão gênica. De acordo com os vários aspectos da presente invenção, um fator de transcrição sintético, conforme descrito aqui, de preferência atuará ao nível transcricional e, assim, modulará a transcrição de pelo menos um gene de interesse, de preferência um gene morfogênico de interesse. Em determinadas mo- dalidades, o pelo menos um fator de transcrição sintético pode ser es- pecificamente concebido para regular positivamente a transcrição de um gene de interesse, de preferência um gene morfogênico de inte- resse.
[0122] Um "sistema celular", conforme usado aqui, se refere a pelo menos um elemento que compreende todo ou parte do genoma de uma célula de interesse a ser modificada. O sistema celular pode, assim, ser qualquer sistema in vivo ou in vitro, incluindo também um sistema sem células. O sistema celular compreende e fornece o genoma alvo ou se- quência genômica a ser modificada de maneira adequada, isto é, em uma forma acessível a uma modificação ou manipulação genética. Por- tanto, o sistema celular pode ser selecionado, por exemplo, a partir de uma célula eucariota, incluindo uma célula de planta, ou o sistema ce- lular pode compreender uma construção genética conforme definido acima que compreende todo ou partes do genoma de uma célula euca- riota a ser modificada em um ambiente altamente maneira direcionada. O sistema celular pode ser fornecido como célula ou vetor isolado ou o sistema celular pode ser composto por uma rede de células em um te- cido, órgão, material ou organismo inteiro, in vivo ou como sistema iso- lado in vitro. Neste contexto, o "material genético" de um sistema celular pode, portanto, ser entendido como todo ou parte do genoma de um organismo cujo material genético está presente no sistema celular a ser modificado, no todo ou em parte, no organismo.
[0123] Em um aspecto, a presente invenção fornece um sistema ce- lular que pode ser obtido por meio de um método de acordo com qual- quer um dos aspectos e modalidades acima.
[0124] Em uma modalidade de acordo com os vários aspectos da presente invenção, o fator de transcrição sintético pode ser concebido para modular a transcrição de um gene morfogênico, em que o gene morfogênico pode ser selecionado a partir do grupo que consiste em BBM, WUS (Zuo et a/., 2002, Plant J., 30 (3): 349-359), incluindo WUS2 (Nardmann e Werr, 2006, Mol. Biol. Evol., 23: 22492-22502), um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5 ou PLT7, IPT, IPT2, Knotted1 e RKDA4.
[0125] De acordo com os vários aspectos e modalidades da pre- sente invenção, o gene morfogênico pode ser selecionado a partir de sequências que têm sequências codificadoras de NM 001112491.1 (SEQ ID NO: 199), NM 127349.4 (SEQ ID NO: 200), NC 025817.2, KT285832.1 (SEQ ID NO: 201), KT285833.1 (SEQ ID NO: 202), KT285834.1 (SEQ ID NO: 203), KT285835.1 (SEQ ID NO: 204), KT285836.1 (SEQ ID NO: 205), KT285837.1 (SEQ ID NO: 206), XM 008676474.2 (SEQID NO: 207), CMO07649.1, NM 103997 .4 (SEQ ID NO: 208), XM 010675298.2 (SEQ ID NO: 209), XM 010675704.2 (SEQ ID NO: 210), AB458519.1 (SEQ ID NO: 211), AB458518.1 (SEQ ID NO: 212), AK451358.1 (SEQ ID NO: 213), AK335319.1 (SEQ ID NO: 214), KUS93504.1 (SEQ ID NO: 215) ou KU593503.1 (SEQ ID NO: 216).
[0126] Em uma outra modalidade, é fornecido um fator de transcri- ção sintético, em que o gene morfogênico compreende uma sequência de nucleotídeos selecionada a partir do grupo que consiste em (i) uma sequência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (li) uma sequência de nucleotídeos que tem as sequên- cias codificadoras das sequências de nucleotídeos apresentadas em qualquer uma de SEQ ID NOs: 199 a 237, (iii) uma sequência de nucle- otídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 96 %, 97 %, 98 % ou 99 % de Identidade, de preferência em todo o compri- mento, com a sequência de nucleotídeos de (i), (li) ou (iii), (v) uma se- quência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (iii) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vii) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos em pelo menos 50 %, 60 %, 70 %, 75 %,
80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0127] Em particular, o polipeptídeo de Wuschel (WUS) foi identifi- cado como um participante-chave no início e manutenção do meristema apical, o qual contém um conjunto de células-tronco pluripotentes (En- drizzi et al., 1996, Plant Journal 10: 967-979). Plantas Arabidopsis mu- tantes para o gene WUS contêm células-tronco que são mal especifica- das e que parecem sofrer diferenciação. O WUS codifica uma proteína de homeodomínio a qual funciona como um regulador de transcrição (Mayer et a/., 1998, Cell 95: 805-815, documento US 2004/166563 A1). Acredita-se que a população de células-tronco dos meristemas de bro- tos de Arabidopsis seja mantida por um circuito regulatório entre os ge- nes CLAVATA (CLV), os quais promovem o início de órgãos, e o gene WUS necessário para a identidade das células-tronco, com os genes CLV reprimindo o WUS ao nível de transcrição. A expressão de WUS pode ser suficiente para induzir à identidade das células do meristema e a expressão do marcador de célula-tronco CLV3 (Brand et a/. (2000) Science 289: 617-619; Schoof et a/. (2000) Cell 100: 635-644). Foi de- monstrado que a expressão constitutiva de WUS em Arabidopsis leva à proliferação adventícia de folhas (in planta) (documento US 2004/ 166563 A1).
[0128] Outros polipeptídeos da homeocaixa WUS/WOX e genes que codificam os mesmos são conhecidos por aqueles versados na téc- nica e podem ser direcionados pelos fatores de transcrição sintéticos e/ou usando os métodos descritos aqui. Um polipeptídeo de homeo- caixa WUS pode ser selecionado a partir de polipeptídeos WUS 1,
WUS?2, WUS 3, WOX2A, WOX4, WOXS5 ou WOXS9 (van der Graaff et al., 2009, Genome Biology 10: 248) ou homólogos dos mesmos. O polipep- tídeo da homeocaixa WUS pode ser um polipeptídeo da homeocaixa WUSAVOX de monocotiledôneas. Em vários aspectos, o polipeptídeo da homeocaixa WUS pode ser um polipeptídeo da homeocaixa WUSA- VOX de cevada, milho, painço, aveia, arroz, centeio, Setaria sp., sorgo, cana-de-açúcar, switchgrass, triticale, relva ou trigo. Como alternativa, o polipeptídeo da homeocaixa WUS pode ser um polipeptídeo da home- ocaixa WUS de dicotiledôneas (consulte documento WO 2017/074547 AI).
[0129] Além disso, a família de proteínas AP2/ERF é uma classe específica para plantas de fatores de transcrição putativos que foi de- monstrado regular uma ampla variedade de processos de desenvolvi- mento e são caracterizadas pela presença de um domínio de ligação a DNA de AP2/ERF. As proteínas AP2/ERF foram subdivididas em duas subfamílias distintas com base no fato de conterem um (subfamília ERF) ou dois (subfamília AP2) domínios de ligação a DNA. Um membro da família AP2 que foi implicado em uma variedade de funções celulares vegetais críticas é a proteína Baby Boom (BBM). A proteína BBM de Arabidopsis é, de preferência, expressa em sementes e foi demonstrado desempenhar um papel central na regulação de vias específicas de em- briões. Foi mostrado que a superexpressão de BBM induz à formação espontânea de embriões somáticos e estruturas similares ao cotilédone em mudas. Consulte Boutiler et a/. (2002) The Plant Cell 14: 1737-1749. Assim, membros da família das proteínas AP2 (APETALA2) promovem a proliferação e morfogênese celular durante a embriogênese. Tal ativi- dade encontra uso potencial na promoção de apomixia em plantas.
[0130] Outro alvo morfogênico de acordo com a presente invenção é a proteína de desenvolvimento de óvulos 2 (ODP2). Ela também é um membro da família de proteínas AP2. Os polipeptídeos ODP2 da inven- ção contêm dois domínios previstos de APETALA2 (AP2) e são mem- bros da família de proteínas AP2 (Acesso PEAM PFOO847). Os domí- nios AP2 do polipeptídeo ODP2 de milho estão localizados entre os ami- noácidos S273 e N343 e entre S375 e R437 de SEQ ID NO: 2. Foi mos- trado que a família AP2 de fatores de transcrição putativos regula uma ampla variedade de processos de desenvolvimento, e os membros da família são caracterizados pela presença de um domínio de ligação a DNA de AP2. É previsto que este núcleo conservado forme uma alfa hélice anfipática que se liga ao DNA. O domínio AP? foi identificado pela primeira vez em APETALA?2, uma proteína de Arabidopsis que regula a identidade do meristema, a especificação de órgãos florais, o desenvol- vimento do revestimento de sementes e a expressão gênica de homeó- ticos florais. O domínio AP2 foi encontrado em uma variedade de prote- Ínas.
[0131] Portanto, os efetores morfogênicos da família AP2 desempe- nham papéis críticos em uma variedade de eventos biológicos impor- tantes, incluindo desenvolvimento, regeneração de plantas, divisão ce- lular, etc. Estes efetores morfogênicos são valiosos para o campo do desenvolvimento agronômico para identificar e caracterizar novos mem- bros da família AP? e desenvolver novos métodos para modular a em- briogênese, a eficiência de transformação e traços relacionados ao ren- dimento, incluindo teor de óleo, teor de amido e assim por diante em uma planta, e são alvos relevantes dos fatores de transcrição sintéticos e dos métodos associados da presente invenção.
[0132] Muitas tentativas foram feitas para usar a modulação de WUS, BBM e outros genes morfogênicos para melhorar a eficiência da transformação, estimular o crescimento de células de planta, incluindo células-tronco, estimular a organogênese, estimular a embriogênese so- mática, induzir à apomixia e fornecer uma seleção positiva para células e assim por diante. A capacidade de estimular a organogênese e/ou embriogênese somática pode ser usada para gerar uma planta apomí- tica. A apomixia tem potencial econômico porque pode fazer com que qualquer genótipo, independentemente de quão heterozigótico, se torne verdadeiro. Ela é um processo reprodutivo que ignora a meiose e a si- namia femininas para produzir embriões geneticamente idênticos aos pais maternos. Com a reprodução apomítica, a progênie de genótipos adaptativos ou híbridos manteria sua fidelidade genética ao longo de ciclos de vida repetidos. Além de fixar o vigor ao híbrido, a apomixia pode possibilitar a produção comercial de híbridos em culturas onde não estão disponíveis sistemas eficientes de esterilidade masculina ou de restauração da fertilidade para a produção de híbridos. A apomixia pode tornar o desenvolvimento de híbridos mais eficiente. Ela também simpli- fica a produção de híbridos e aumenta a diversidade genética em espé- cies vegetais com boa esterilidade masculina.
[0133] Ainda, todas as abordagens atuais de modulação da reserva de genes morfogênicos endógenos de células de planta atualmente de- pendem do fornecimento de genes que codificam o gene morfogênico de interesse para superexpressar o respectivo gene morfogênico. Por- tanto, os métodos atuais dependem da introdução estável ou transitória e/ou superexpressão de um gene morfogênico de interesse. Em con- traste, a presente invenção identificou uma solução para conceber es- pecificamente um fator de transcrição sintético para modular o nível de transcrição de um gene morfogênico de interesse, de preferência de maneira transitória e/ou regulável, sem a necessidade de introduzir uma sequência transgênica exógena de um produto gênico morfogênico ou a sequência que codifica o mesmo. Isto abre caminho para fornecer mé- todos para aumentar a eficiência da transformação em plantas, por exemplo, para métodos complexos de edição genômica, mesmo em plantas recalcitrantes à transformação, e fornecer métodos para forne- cer organismos haploides ou haploides duplos ou sistemas celulares.
[0134] Uma variedade de moléculas diferentes pode ser usada como pelo menos um domínio de reconhecimento de acordo com a pre- sente invenção. De acordo com os vários aspectos e modalidades des- critos aqui, um domínio de reconhecimento representa um domínio de proteína, opcionalmente como uma molécula de fusão, que tem reco- nhecimento de DNA sítio específico e, portanto, atividade de ligação e/ou interação. Um domínio de reconhecimento pode ser um domínio de uma proteína que ocorre naturalmente ou o domínio de reconheci- mento pode ser um fragmento desta proteína. De preferência, o pelo menos um domínio de reconhecimento foi especificamente concebido para otimizar a especificidade do alvo para a ligação a uma região de um gene morfogênico de interesse ou a uma região que circunda um gene morfogênico de interesse.
[0135] Mais de um domínio de reconhecimento pode ser usado de acordo com a presente invenção para aumentar a especificidade do alvo e/ou características de ligação para otimizar a modulação do pelo me- nos um gene morfogênico de interesse.
[0136] Em uma modalidade, o fator de transcrição sintético pode compreender pelo menos um domínio de reconhecimento, ou um frag- mento, de uma molécula selecionada a partir do grupo que consiste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease desarmado, pelo menos um domínio de dedo de zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer combinação dos mesmos.
[0137] Em uma outra modalidade, o fator de transcrição sintético pode compreender pelo menos um sistema CRISPR/nuclease desar- mado selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/
dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado, se presente, compreende pelo menos um RNA guia.
[0138] Os fatores de transcrição de ligação a DNA de ocorrência natural geralmente contêm um mínimo de dois domínios: um domínio de ligação a DNA (DNA-Binding Domain, DBD) e um domínio de ativa- ção transcricional (Transcriptional Activation Domain, TAD) (Latchman, 2008; Ptashne e Gann, 2002).
[0139] Os efetores TAL de bactérias patogênicas de plantas do gê- nero Xanthomonas desempenham papéis importantes na doença ou de- sencadeiam a defesa, ligando o DNA do hospedeiro e ativando genes específicos para o efetor (consulte, por exemplo, Gu et a/. (2005) Nature 435: 1122; Rôómer et al. (2007) Science 318: 645). A especificidade de- pende de um número variável de imperfeições em efetor, tipicamente 34 repetições de aminoácidos (Schornack et a/. (2006) J. Plant Physiol. 163: 256). Os polimorfismos estão primariamente nas posições de re- petição 12 e 13, as quais são denominadas aqui como di-resíduos vari- áveis de repetição (Repeat Variable-Diresidue, RVD). Os RVDs dos efe- tores TAL correspondem aos nucleotídeos em seus sítios alvo de ma- neira direta e linear, um RVD a um nucleotídeo, com alguma degenera- ção e nenhuma dependência aparente do contexto. Esta descoberta re- presenta um mecanismo valioso para o reconhecimento de proteína- DNA que permite a previsão do sítio-alvo para o novo efetor TAL espe- cífico para o alvo. Portanto, os efetores TAL não apenas são úteis em pesquisa e biotecnologia como nucleases quiméricas direcionadas que podem facilitar a recombinação homóloga para abordagens de GE. Os efetores TAL em si não compreendem um domínio de nuclease. As as- sim denominadas endonucleases efetoras do tipo ativador de transcri- ção (Transcription Activator-Like Effector Endonucleases, TALENs) re- presentam moléculas artificiais ou sintéticas que combinam a função efetora de TAL com uma função de nuclease para permitir a inserção de uma clivagem de DNA sítio específica. Por exemplo, o efetor TAL pode entrar no núcleo da célula hospedeira através de um domínio de localização nuclear C-terminal e pode ativar especificamente o gene hospedeiro correspondente através de ligação a um elemento de liga- ção efetor na região promotora do gene hospedeiro. O domínio central de repetições altamente conservadas de 33-35 aminoácidos, cada uma contendo dinucleotídeos hipervariáveis ou RVDs nas posições 12 e 13, é responsável pelo reconhecimento de sequências específicas de pro- motores gênicos hospedeiros. Cada efetor TAL envolve o DNA em torno de uma super-hélice à direita, posicionando o segundo resíduo de cada RVD no sulco principal, onde ele contata um nucleotídeo individual na fita direta. Estas interações definem a especificidade de cada efetor TAL. Um domínio de ativação ácido C-terminal, então, ativa ou aprimora a expressão do gene endógeno correspondente, presumivelmente se acoplando diretamente ao complexo de RNA polimerase do hospedeiro.
[0140] O mecanismo modular pelo qual os efetores TAL reconhe- cem sequências de DNA específicas permite a identificação e a concep- ção de matrizes de repetição artificiais no domínio de reconhecimento de um efetor TAL, deste modo, concebendo efetores TAL que são ca- pazes de induzir especificamente à expressão de um gene endógeno de interesse.
[0141] A análise computacional dos sítios genômicos alvo de TALES naturais mostrou uma ocorrência preferencial nas regiões promotoras do núcleo aparente de -300 a +200 pb em torno do sítio de início de transcrição (TSS) (Grau et al., PLoS Comput Biol. 2013; 9). Estudos an- teriores com base nas TALEs AvrBs3, AvrXa7 e AvrXa27 mostraram que elas alteram o TSS natural dos genes alvo em torno de 40 a 60 pb a jusante da posição na qual a TALE se liga ao DNA. Mover a caixa AvrBs3 no promotor Bs3 para uma posição mais a montante resultou em uma alteração a montante concomitante do TSS. Estas observações levaram à impressão de que as TALEs controlam o início e o sítio de transcrição funcionalmente análogo à proteína de ligação TATA (Kay et al., Science. 2007; 318: 648-651).
[0142] Portanto, os domínios de ligação do efetor TAL representam domínios de reconhecimento adequados de acordo com os vários as- pectos e modalidades da presente invenção, uma vez que as especifi- cidades de ligação e reconhecimento podem ser ajustadas para um sítio de interesse. Portanto, a expressão, de preferência a transcrição, de um gene morfogênico de interesse pode ser modulada de maneira alta- mente direcionada, uma vez que pelo menos um efetor TAL personali- zado pode ser concebido como o pelo menos um domínio de reconhe- cimento de um fator de transcrição sintético.
[0143] Funcionando como fatores de transcrição heterólogos em seu ambiente natural, os efetores TAL (Yang et a/., 2006) são distribuí- dos através do sistema de secreção bacteriana de tipo Ill nas células hospedeiras (Szurek et a/., 2002), onde os sinais de localização nuclear C-terminais os direcionam ao núcleo (Gurlebeck et a/., 2005; Szurek et al., 2001, 2002; Van den Ackerveken et a/., 1996; Yang e Gabriel, 1995). O domínio central de repetições altamente conservadas de 33 a 35 ami- noácidos, cada uma contendo resíduos hipervariáveis nas posições 12 e 13 (o RVD), controla o reconhecimento de sequências específicas para promotores gênicos hospedeiros, denominadas de elementos de ligação a efetores (Effector Binding Elements, EBEs) (Boch et a/., 2009; Moscou e Bogdanove, 2009). Cada efetor TAL envolve o DNA em uma super-hélice à direita, posicionando o segundo resíduo de cada RVD no sulco principal, onde ele contata um nucleotídeo individual na fita direta (Deng et al., 2012; Mak et a/., 2012). Coletivamente, estas interações definem, de maneira previsível, o número e a identidade dos nucleotí-
deos adjacentes que constituem o EBE. Um domínio de ativação (Acti- vation Domain, AD) ácido C-terminal ativa ou aprimora a transcrição, presumivelmente pelo envolvimento direto do complexo de RNA polime- rase do hospedeiro (cf. Hummel et al., Molecular Plant Pathology, 2017, 18 (1), 55-66).
[0144] Em contraste com o ensinamento do estado da técnica, a presente invenção se baseia parcialmente na constatação de que fato- res de transcrição sintéticos com base em efetores TAL, fatores de transcrição desarmados com base em ZFP ou fatores de transcrição desarmados com base em CRISPR específicos para sequências de nu- cleotídeos endógenas localizadas em uma posição específica a mon- tante ou a jusante em relação ao códon inicial de um gene de interesse, de preferência um gene morfogênico, por exemplo, BBM e WUS, pode induzir à transcrição e expressão dos ditos genes em uma célula de planta, deste modo, aumentando a frequência de regeneração desta planta. Particularmente, esta eficiência pode ser aprimorada no caso de regiões reguladoras não clássicas fora de uma caixa TATA ou da região promotora, enquanto fatores de transcrição que ocorrem naturalmente e fatores de transcrição comercialmente disponíveis geralmente exer- cem sua função ao se ligar a uma região dentro da região promotora de um gene de interesse. Há evidências de que a ativação transcricional é maior na proximidade da caixa TATA comparado com o direcionamento direto à região TATA. Os fatores de transcrição da presente invenção com base nos vários domínios diferentes de reconhecimento com base em efetor TAL, CRISPR, dedo de zinco ou endonuclease "homing" in- cluem, assim, uma arquitetura diferente, permitindo uma modulação e regulação melhor e mais precisa de um gene morfogênico de interesse.
[0145] Portanto, pode ser uma vantagem dos fatores de transcrição sintéticos e dos métodos da presente invenção que os fatores de trans- crição sintéticos também possam atuar em genes sem TATA ou fora de uma região TATA, se corretamente concebidos para compreender regi- ões de reconhecimento e ativação ideais. Em determinadas modalida- des, pelo menos um domínio de reconhecimento também pode ter como alvo uma região TATA de um gene de interesse.
[0146] Por exemplo, um domínio de ligação a DNA de efetor TAL pode ser específico para um DNA alvo, em que o domínio de ligação a DNA compreende uma pluralidade de repetições de ligação a DNA, cada repetição compreendendo um RVD que determina o reconheci- mento de um par de bases no DNA alvo, em que cada repetição de ligação a DNA é responsável por reconhecer um par de bases no DNA alvo e em que a TALEN compreende um ou mais dos seguintes RVDs: HD para reconhecimento de C; NG para reconhecimento de T; NI para reconhecimento de A; NN para reconhecimento de G ou A; NS para re- conhecimento de A ou C ou G ou T; N* para reconhecimento de C ou T; HG para reconhecimento de T; H* para reconhecimento de T; IG para reconhecimento de T; NK para reconhecimento de G; HA para reconhe- cimento de C; ND para reconhecimento de C; HI para reconhecimento de C; HN para reconhecimento de G; NA para reconhecimento de G; SN para reconhecimento de G ou A; e YG para reconhecimento de T. À TALEN pode compreender um ou mais dos seguintes RVDs: HA para reconhecimento de C; ND para reconhecimento de C; HI para reconhe- cimento de C; HN para reconhecimento de G; NA para reconhecimento de G; SN para reconhecimento de G ou A; YG para reconhecimento de T; e NK para reconhecimento de G, e um ou mais de: HD para reconhe- cimento de C; NG para reconhecimento de T; NI para reconhecimento de A; NN para reconhecimento de G ou A; NS para reconhecimento de A ou C ou G ou T; N* para reconhecimento de C ou T; HG para reco- nhecimento de T; H* para reconhecimento de T; e IG para reconheci- mento de T.
[0147] As proteínas dos dedos de zinco (Zinc Finger Proteins,
ZFPs) são proteínas que podem se ligar ao DNA de uma maneira espe- cífica para sequência. Os dedos de zinco foram identificados pela pri- meira vez no fator de transcrição TFIIIA a partir dos oócitos do sapo Africano Xenopus laevis. Um motivo exemplificativo que caracteriza uma classe destas proteínas (classe Cys2His2) é Xaa-Cys-Xaa-Cys- Xaa-His-Xaa-His, onde Xaa é qualquer aminoácido. Dedos individuais destas proteínas têm uma estrutura BBa simples que se dobra em torno de um fon de zinco central, e conjuntos de dedos em tandem podem contatar sítios secundários próximos de 3 a 4 pares de bases ao longo do sulco principal do DNA (Pabo et a/. (2001) "Design and Selection of Novel Cys2His2 Zinc Finger Proteins". Ann. Rev. Biochem. 70: 31340). Um único domínio de dedo de zinco tem cerca de 30 aminoácidos e vários estudos estruturais demonstraram que ele contém uma beta curva (contendo os dois resíduos invariáveis de cisteína) e uma alfa hé- lice (contendo os dois resíduos invariáveis de histidina), os quais são mantidos em uma conformação particular através da coordenação de um átomo de zinco pelas duas cistinas e as duas histidinas. Várias ou- tras classes de proteínas de dedo de zinco são conhecidas, por exem- plo, a classe de clave de sol (treble-clef) que compreende um motivo que consiste em um B grampo no N-término e um a hélice no C-término que contribuem, cada um, com dois ligantes para a ligação de zinco, embora um laço e um segundo B grampo de comprimento e conforma- ção variáveis possam estar presentes entre o N-terminal do B-grampo e o C-término de a hélice ou ZFPs de tipo fita de zinco que têm uma dobra que é caracterizada por dois beta grampos que formam dois sítios se- cundários de ligação ao zinco estruturalmente similares.
[0148] Para fins de edição genômica (GE), técnicas de biologia mo- lecular podem ser usadas para alterar a especificidade de ligação a DNA dos dedos de zinco e repetições em tandem destes dedos de zinco ma-
nipulados podem ser usadas para direcionar as sequências de DNA ge- nômicas desejadas (Jamieson et a/., "Drug Discovery With Engineered Zinc-Finger Proteins", Nature Reviews. Drug Discovery 2 (5): 361-8.). À fusão de um segundo domínio de proteína, tal como um ativador ou re- pressor de transcrição, a uma matriz de dedos de zinco manipulados que se liga próximo ao promotor de um determinado gene pode ser usada para alterar a transcrição deste gene. Fusões entre arranjos de dedos de zinco manipulados e domínios de proteínas que clivam ou mo- dificam o DNA também podem ser usadas para direcionar estas ativida- des para os loci genômicos desejados. As aplicações mais comuns para matrizes de dedo de zinco concebidas incluem fatores de transcrição para dedo de zinco e nucleases de dedo de zinco. Os arranjos típicos de dedos de zinco manipulados têm entre 3 e 6 motivos individuais de dedos de zinco e se ligam a sítios alvo que variam a partir de 9 pares de bases (pb) a 18 pb de comprimento.
[0149] Meganucleases são endodesoxirribonucleases caracteriza- das por um grande sítio de reconhecimento (sequências de DNA fita dupla de 12 a 40 pares de bases). Como um resultado, este sítio geral- mente ocorre apenas uma vez em qualquer genoma. As meganuclea- ses podem ser usadas para atingir níveis muito altos de eficiência de direcionamento de genes em células e plantas de mamíferos (Rouet et al., Mol. Cell Biol., 1994, 14, 8096-106; Choulika et al., Mol. Cell Biol., 1995, 15, 1968-73). Dentre as meganucleases, a família LAGLIDADG de endonucleases "homing" se tornou uma ferramenta valiosa para o estudo de genomas e engenharia genômica nos últimos anos.
[0150] Endonucleases "homing" (HEs) desarmadas, isto é, deficien- tes em nuclease, representam uma classe adequada de domínios de reconhecimento de acordo com a presente invenção. HEs são uma fa- mília generalizada de meganucleases naturais, incluindo centenas de proteínas (Chevalier e Stoddard, Nucleic Acids Res., 2001, 29, 3757-
74). Estas proteínas são codificadas por elementos genéticos móveis que se propagam por meio de um processo denominado "homing": a endonuclease cliva um alelo cognato do qual o elemento móvel está ausente, deste modo, estimulando um evento de recombinação homó- loga que duplica o DNA móvel no local receptor (Kostriken et a/l., Cell; 1983, 35, 167-74; Jacquier e Dujon, Cell, 1985, 41, 383-94). Dada sua função natural e suas excepcionais propriedades de clivagem em ter- mos de eficácia e especificidade, as HEs constituem estruturas ideais para derivar novas endonucleases para engenharia genômica.
Uma fa- mília de HEs é denominada a família LAGLIDADG.
A LAGLIDADG se refere à única sequência realmente conservada em toda a família e é encontrada em uma ou (mais frequentemente) duas cópias da proteína.
Proteínas com um único motivo, tal como |-Crel, formam homodímeros e clivam sequências de DNA palindrômicas ou pseudo-palindrômicas, enquanto que proteínas com motivo duplo maiores, tal como |-Scel, são monômeros e clivam alvos não palindrômicos.
Sete proteínas LAGLI- DADG diferentes foram cristalizadas e exibem uma conservação muito impressionante da estrutura do núcleo, o que contrasta com a falta de similaridade ao nível da sequência primária (Jurica et al., Mol.
Cell., 1998, 2, 469- 76); Chevalier et al., Nat.
Struct.
Biol., 2001, 8, 312-6; Chevalier et al., J.
Mol.
Biol., 2003, 329, 253-69). A análise da estrutura de |-Cre ligada ao seu alvo natural mostra que, em cada monômero, oito resíduos (Y33, Q38, N30, K28, 026, Q44, R68 e R70) estabelecem in- terações diretas com sete bases nas posições + 3, 4, 5, 6,7, 96 10 (Jurica et a/., 1998). Além disso, alguns resíduos estabelecem contato mediado pela água com várias bases; por exemplo, S40 e N30 com o par de bases nas posições 8 e -8 (Chevalier et a/., 2003). O núcleo ca- talítico é central, com uma contribuição tanto de monômeros/domínios simétricos.
HEs que têm um sítio de clivagem modificado são conheci- das por aqueles versados na técnica e podem ser usadas para definir uma HE desarmada como o pelo menos um domínio de reconhecimento de acordo com a presente invenção.
[0151] De acordo com os vários aspectos e modalidades de acordo com a presente invenção, proteínas de dedo de zinco e domínios deri- vados das mesmas podem ser usados como pelo menos um domínio de reconhecimento, pelo menos um domínio de reconhecimento o qual pode ser concebido para atender às propriedades de reconhecimento de um fator de transcrição sintético de acordo com a presente invenção.
[0152] Além dos efetores TAL, ZFPs desarmados e meganuclea- ses, sistemas CRISPR/nuclease não funcionais podem ser usados para direcionar especificamente genes morfogênicos e estimular a regenera- ção de células de planta. Nestes sistemas, é usada uma nuclease CRISPR, tal como Cas9, Cfp1, CasX e/ou CasY, em que a atividade da nuclease foi desativada para evitar a clivagem das sequências genômi- cas alvo. A especificidade alvo do sistema CRISPR/nuclease não funci- onal é determinada por crRNAs e/ou sgRNAs específicos para a região promotora de nucleotídeos a montante de um gene morfogênico endó- geno de interesse. Um domínio de ativação que é fundido ao sistema CRISPR/nuclease recruta a maquinaria de transcrição para o /ocus do gene, deste modo, induzindo à expressão do gene morfogênico endó- geno de interesse. Particularmente, o uso de pelo menos um RNA guia pode aumentar drasticamente a especificidade do alvo, uma vez que esta sequência de ácidos nucleicos de CRISPR contribui adicional- mente para o reconhecimento do DNA genômico alvo de interesse. Além disso, as propriedades de reconhecimento duplas de uma nu- clease CRISPR desarmada e o RNA guia permitem um maior grau de flexibilidade na concepção de domínios de reconhecimento de fator de transcrição sintético de acordo com a presente invenção o que, por sua vez, permite um melhor reconhecimento e, assim, atividade de modula- ção de um gene morfogênico de interesse.
[0153] Um sistema CRISPR, em seu ambiente natural, se refere um complexo molecular que compreende pelo menos um pequeno RNA não codificador e individual em combinação com uma nuclease Cas ou outra nuclease CRISPR, tal como uma nuclease Cpf1 (Zetsche et al., 2015, supra) que pode produzir uma ruptura de fita dupla específica do DNA.
Atualmente, os sistemas CRISPR são classificados em 2 classes, as quais compreendem cinco tipos de sistemas CRISPR, o sistema de tipo Il, por exemplo, que usa Cas9 como efetor, e o sistema de tipo V que usa Cpf1 como molécula efetora (Makarova et al., Nature Rev.
Mi- crobiol., 2015). Em sistemas CRISPR artificiais, um RNA sintético não codificador e uma nuclease CRISPR e/ou opcionalmente uma nuclease CRISPR manipulada, modificada para atuar como nickase ou sem qual- quer função de nuclease, podem ser usados em combinação com pelo menos um RNA guia sintético ou artificial ou gRNA que combina a fun- ção de um crRNA e/ou um tracrRNA (Makarova et a/., 2015, supra). À resposta imune mediada por CRISPR/Cas em sistemas naturais requer CRISPR-RNA (crRNA), em que a maturação deste RNA guia, o qual controla a ativação específica da nuclease CRISPR, varia significativa- mente entre os vários sistemas CRISPR que foram caracterizados até o momento.
Primeiramente, o DNA invasor, também conhecido como um espaçador, é integrado entre duas regiões de repetição adjacentes na extremidade proximal do locus CRISPR.
Os sistemas CRISPR de tipo Il, por exemplo, podem codificar uma nuclease Cas9 como enzima essencial para a etapa de interferência, sistema que contém um cr»RNA e também um RNA transativador (tracr»RNA) como motivo guia.
Estes hibridizam e formam regiões de RNA fita dupla (ds) que são reconheci- das pela RNAse Ill e podem ser clivadas para formar crº»RNAs maduros.
Estes, por sua vez, se associam à molécula de Cas, a fim de direcionar a nuclease especificamente para a região de ácidos nucleicos alvo.
As moléculas de gRNA recombinante podem compreender a região variá- vel de reconhecimento de DNA e também a região de interação de Cas e, portanto, podem ser concebidas especificamente, independente- mente do ácido nucleico alvo específico e da nuclease Cas desejada.
Como mecanismo de segurança adicional, PAMs (motivos protoespa- çadores adjacentes) devem estar presentes na região de ácidos nuclei- cos alvo; estas são sequências de DNA que seguem diretamente o DNA reconhecido pelo complexo Cas9/RNA.
A sequência PAM para Cas9 de Streptococcus pyogenes foi descrita como "NGG" ou "NAG" (código pa- drão de nucleotídeos IUPAC) (Jinek et a/.) A sequência PAM para Cas9 de Staphylococcus aureus é "NNGRRT" ou "NNGRR(N)". São conheci- dos outros sistemas CRISPR/Cas9 variantes.
Assim, uma Cas9 de Neisseria meningitidis cliva na sequência PAM NNNNGATT.
Uma Cas9 de Streptococcus thermophilus cliva na sequência PAM NNAGAAW.
Recentemente, um outro motivo PAM NNNNRYAC foi descrito para um sistema CRISPR de Campylobacter (documento WO 2016/021973 A1). Para nucleases Cpf1, foi descrito que o complexo Cpf1-crRNA, sem um tracrRNA, reconhece e cliva eficientemente o DNA alvo procedido por um PAM rico em T curto, em contraste com os PAM;s ricos em G geral- mente reconhecidos pelos sistemas Cas9 (Zetsche et al. supra). Além disso, que usam polipeptídeos CRISPR modificados, podem ser obtidas quebras de cadeia simples.
O uso combinado de Cas nickases com vá- rios gRNAs recombinantes também pode induzir quebras de fita dupla de DNA altamente específicas por meio de dupla penetração de DNA.
Além disso, ao usar dois gRNAs, a especificidade da ligação do DNA e, portanto, a clivagem do DNA, podem ser otimizadas.
Entretanto, outros efetores CRISPR, tais como CasX e CasY descritos originalmente para bactérias, estão disponíveis e representam outros efetores que podem ser usados para fins de engenharia genômica (Burstein et a/., "New CRISPR-Cas Systems from Uncultivated Microbes", Nature, 2017, 542,
237-241).
[0154] Atualmente, por exemplo, os sistemas de tipo Il que depen- dem de Cas9 ou uma variante ou qualquer forma quimérica dos mes- mos, tal como endonuclease, foram modificados para engenharia genô- mica. Sistemas CRISPR sintéticos que consistem em dois componen- tes, um "RNA guia" (gRNA), também denominado "RNA guia individual" (S9RNA) ou "sequência de ácidos nucleicos de CRISPR" aqui, e uma endonuclease não específica associada a CRISPR podem ser usados para gerar células com silenciamento (knock-out) ou animais que coex- pressam um mRNA específico para o gene a ser direcionado e capazes de se associar à endonuclease Cas9. Particularmente, o gRNA é uma molécula artificial que compreende um domínio ao interagir com a Cas ou qualquer outra proteína efetora CRISPR ou uma variante ou frag- mento cataliticamente ativo da mesma e outro domínio ao interagir com o ácido nucleico alvo de interesse e, portanto, representando uma fusão sintética de crRNA e tracrRNA (tal como "RNA único individual" (SgaRNA) ou simplesmente "gRNA"). O alvo pode ser qualquer sequência de DNA genômica de —-20 nucleotídeos, contanto que o alvo esteja presente a montante imediatamente de uma sequência PAM. A sequência PAM é de grande importância para a ligação ao alvo e a sequência exata de- pende das espécies de Cas9 e, por exemplo, lê 5' NGG 3' ou 5' NAG 3' (código-padrão de nucleotídeos IUPAC) (Jinek et a/., Science 2012, su- pra) para uma Cas9 derivada de Streptococcus pyogenes. A sequência PAM para Cas9 de Staphylococcus aureus é NNGRRT ou NNGRR(N). São conhecidos muitos outros sistemas variantes CRISPR/Cas9 inclu- indo, inter alia, Cas9 de Neisseria meningitidis, a qual cliva a sequência PAM NNNNGATT. Uma Cas9 de Streptococcus thermophilus cliva a se- quência PAM NNAGAAW. Usando nucleases Cas modificadas, rupturas de fita simples direcionadas podem ser introduzidas em uma sequência alvo de interesse. O uso combinado de tal nickase Cas com diferentes gRNAs recombinantes com rupturas de fita dupla de DNA altamente sí- tio específica pode ser introduzido ao usar um sistema de corte (nicking) duplo. O uso de um ou mais gRNAs pode aumentar ainda mais a espe- cificidade geral e reduzir os efeitos fora do alvo.
[0155] Uma terceira variante de uma nuclease Cas ou Cpf1 de inte- resse particular para fins da presente invenção é uma Cas9 deficiente em nuclease (dCas9) ou dCpf1 (Qui et a/., 2013, Cell, 154, 442-451). Mutações H840A no domínio HNH e D10A no domínio RuvC de Cas9 inativam a atividade de clivagem, mas não impedem a ligação ao DNA (Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA, 111, E2579-2586). Portanto, estas variantes, se configuradas corretamente, podem ser re- direcionadas para atingir especificamente uma sequência de uma re- gião do genoma sem clivagem.
[0156] Em uma modalidade de acordo com os vários aspectos da presente invenção, o domínio de reconhecimento pode compreender pelo menos um gRNA de um complexo CRISPR. Em determinadas mo- dalidades, mais de um gRNA pode estar presente. A expressão de múl- tiplos RNAs guia em uma única célula ou sistema celular, por exemplo, a expressão de dois, três, quatro, cinco ou mais gRNAs, pode permitir uma modulação sinérgica de alvos genéticos endógenos, permitindo o controle combinatório da expressão gênica endógena sobre uma vasta faixa dinâmica, em virtude do fato de que o pelo menos um gRNA serve como porção de reconhecimento se um STF de acordo com a presente invenção pode conferir especificidade pelo alvo adicional ao STF e re- duzir efeitos fora do alvo, particularmente quando os STFs são conce- bidos para direcionar um gene em um enorme genoma eucariota. Cada gRNA pode ter como alvo uma região reguladora/de reconhecimento independente.
[0157] Em uma modalidade de acordo com os vários aspectos da presente invenção, o fator de transcrição sintético pode ser configurado para modular a expressão, de preferência a transcrição, do gene mor- fogênico através de ligação a uma região reguladora localizada a uma determinada distância em relação ao códon inicial.
[0158] A "região reguladora", conforme usado aqui, se refere ao sí- tio de ligação de pelo menos um domínio de reconhecimento de uma sequência alvo no genoma em ou próximo de um gene morfogênico de interesse. Pode haver duas regiões reguladoras distintas ou regiões re- guladoras sobrepostas, dependendo da natureza do pelo menos um do- mínio de ativação e do pelo menos um domínio de reconhecimento, con- forme ainda descrito aqui, cujos diferentes domínios do fator de trans- crição sintético da presente invenção podem ser montados de maneira modular.
[0159] Em determinadas modalidades, o pelo menos um domínio de reconhecimento pode ter como alvo pelo menos uma sequência (sítio de reconhecimento) em relação ao códon inicial de um gene de inte- resse, cuja sequência pode estar pelo menos 1.000 pb a montante (-) ou a jusante (+), -700 pb a +700 pb, -550 pb a +500 pb ou - 550 pb a +425 pb em relação ao códon inicial de um gene de interesse. Domínios de reconhecimento próximos do promotor podem ser preferíveis em de- terminadas modalidades, considerando que constitui uma vantagem dos STFs específicos da presente invenção que a faixa de direciona- mento dos STFs seja altamente expandida em relação aos TFs conven- cionais ou de ocorrência natural, uma vez que os domínios de reconhe- cimento e/ou ativação podem ser especificamente concebidos e cons- truídos para identificar e direcionar especificamente os pontos de acesso da modulação.
[0160] Em determinadas modalidades, o pelo menos um sítio de re- conhecimento pode ter -169 pb a -4 pb, -101 pb a -48 pb, -104 a 42 pb ou -175 a + 450 pb (a montante (-) ou a jusante (+), respectivamente) em relação ao códon inicial de um gene de interesse para fornecer um ambiente de ligação estérica ideal, permitindo melhor atividade de mo- dulação, de preferência ativação transcricional. Em particular, para fa- tores de transcrição sintéticos com base em CRISPR de acordo com a presente invenção, os quais atuam em conjunto com um RNA guia como porção de reconhecimento, o sítio de ligação também pode residir na região codificadora de um gene de interesse (a jusante do códon inicial de um gene interesse).
[0161] Em outras modalidades dos fatores de transcrição sintéticos da presente invenção, o domínio de reconhecimento pode se ligar à re- gião não traduzida (UnTranslated Region, UTR) 5' e/ou 3' de um gene de interesse. Em modalidades, onde diferentes domínios de reconheci- mento são empregados, os pelo menos dois domínios de reconheci- mento podem se ligar a diferentes regiões alvo de um gene morfogênico de interesse, incluindo UTRs 5' e/ou 3', mas também podem se ligar fora da região gênica, mas ainda a uma determinada distância de no máximo 1 a 1. 500 pb. Uma região preferida onde um domínio de reconheci- mento pode se ligar reside em cerca de -4 pb a cerca de -300, de pre- ferência cerca de -40 pb a cerca de -170 pb a montante do códon inicial de um gene morfogênico de interesse. Particularmente, há mais flexibi- lidade do sítio de reconhecimento para determinados STFs descritos aqui, em particular para STFs com base em CRISPR em virtude das funções adicionais de pelo menos um gRNA nos ditos STFs.
[0162] De acordo com os vários aspectos e modalidades apresen- tados aqui, o comprimento de um domínio de reconhecimento e, por- tanto, do sítio de reconhecimento correspondente em um genoma de interesse pode, assim, variar dependendo do STF e da natureza do do- mínio de reconhecimento aplicado. Com base nas características mole- culares de pelo menos um domínio de reconhecimento, isto também de- terminará o comprimento do pelo menos um sítio de reconhecimento correspondente. Por exemplo, onde o dedo de zinco individual pode ter cerca de 8 pb a cerca de 20 pb, em que matrizes de três a seis motivos de dedo de zinco podem ser preferidas, os sítios de reconhecimento indicativos de TALE podem ter 11 a 30 pb ou mais. Os sítios de reco- nhecimento de gRNAs de um STF com base em CRISPR compreendem a sequência alvo ou "espaçador" de um gRNA que hibridiza com uma região genômica de interesse, enquanto que o gRNA compreende do- mínios adicionais, incluindo um domínio de interação com um efetor de CRISPR desarmado de acordo com a presente invenção. O sítio de re- conhecimento de um STF com base em um efetor CRISPR desarmado compreenderá um motivo PAM, uma vez que a sequência PAM é ne- cessária para a ligação ao alvo de qualquer efetor CRISPR e a sequên- cia exata depende das espécies do efetor CRISPR, ou seja, um efetor CRISPR desarmado conforme descrito aqui.
[0163] Em uma modalidade dos vários aspectos da presente inven- ção, o fator de transcrição sintético pode compreender pelo menos um domínio de ativação, em que o pelo menos um domínio de ativação pode ser selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação pode ser de um gene efetor TAL de Xanthomonas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Scaf- fold, Suntag, P300, VP160 ou qualquer combinação dos mesmos. Para aprimorar a modulação de pelo menos um gene morfogênico de inte- resse, dois, três, quatro, cinco ou mais de cinco domínios de ativação podem estar presentes. Em uma modalidade preferida da presente in- venção, o domínio de ativação é VP64.
[0164] VP16 é um fator de transcrição originalmente encontrado no vírus do herpes simplex (HSV) de tipo 1 que está envolvido na ativação dos genes virais imediatos e precoces (Flint e Shenk, 1997; Wysocka e Herr, 2003). A sequência de VP16 de tipo selvagem tem 490 aminoáci-
dos com um domínio central em sua região central necessário para |i- gação indireta ao DNA e um TAD carbóxi terminal localizado em seus últimos 81 aminoácidos (Greaves e O'Hare, 1989; Triezenberg et al., 1988). O VP16 está originalmente contido no vírion (partícula viral) do HSV e liberado nas células animais quando de infecção. O VP16 pri- meiro se liga à proteína nuclear hospedeira HCF através de seu domínio central e subsequentemente se liga à outra proteína nuclear hospedeira Oct-1 para formar um complexo proteico de três componentes. Este complexo se liga à sequência de DNA alvo TAATGARAT (R é uma pu- rina) nos promotores dos genes imediatos e precoces. Isto é conseguido através de interações entre a Oct-1 e a sequência de DNA alvo ou um motivo octamérico de consenso que se sobrepõe à porção 5' desta se- quência. A HCF, então, estabiliza a interação entre VP16 e Oct1. Uma vez recrutado para genes imediatamente imediatos, o VP16 ativa os ge- nes por meio de interações entre o TAD e outros fatores de transcrição (Hirai et a/., Int. J. Dev. Biol., 2010, 54 (11-12): 1589-1596). Entretanto, o domínio VP16 original foi extensivamente explorado para uma varie- dade de estudos usando fatores de transcrição sintéticos ou artificiais. Normalmente, um domínio central que compreende o domínio de ativa- ção mínimo do VP16 na forma simples ou como, por exemplo, tripla (VP48) ou como cópias em tandem 10x do VP16 (VP160) é usado para estas finalidades.
[0165] O domínio de ativação natural dos genes de efetores TAL de Xanthomonas oryzae é o domínio de ativação mais óbvio para uso com em fatores de transcrição TAL e também representa um domínio de ati- vação, o qual pode ser usado, individualmente ou em combinação, de acordo com os vários aspectos da presente invenção, mas também tem sido usado em outras configurações. Eles pertencem a uma família de domínios de ativação ácidos (transcricionais).
[0166] O domínio de ativação do mediador de ativação sinérgica
(Synergistic Activation Mediator, SAM) geralmente consiste em três componentes: uma CRISPR nuclease nucleoliticamente inativa/inati- vada, normalmente em combinação com uma fusão de VP64, um RNA guia que incorpora dois aptâmeros de RNA MS?2 no tetraloop e haste- alça e a proteína auxiliar de ativação MS2-P65-HSF1 (Konermann et al., 2015, "Genome-Scale Transcriptional Activation by an Engineered CRISPR-Cas9 Complex". Nature 517: 583-588). Portanto, o RNA guia pode conter duas cópias de um grampo de RNA do bacteriófago MS2, o qual interage com a proteína de ligação a RNA (RNA-Binding Protein, RBP) MCP (proteína do envoltório MS2).
[0167] O sistema SAM emprega vários ativadores de transcrição para criar um efeito sinérgico, o que torna o sistema SAM um domínio de ativação altamente versátil usado individualmente ou em combina- ção com outros domínios de ativação para os fatores de transcrição sin- téticos de acordo com a presente invenção. Em uma modalidade prefe- rida em que o fator de transcrição sintético usa um domínio de reconhe- cimento com base em CRISPR, o RNA guia pode ser adicionalmente manipulado para otimizar a interação entre os domínios de ativação e de reconhecimento.
[0168] Um domínio de ativação adicional a ser usado individual- mente ou em combinação de acordo com a presente invenção é o efetor tripartido VPR (VP64, p65 e Rta) fundido com um domínio de reconhe- cimento de interesse ligados em tandem (Russa e Qi, Mol. Cell. Biol. Novembro de 2015; 35 (22): 3800-3809).
[0169] Ainda um outro domínio de ativação a ser usado individual- mente ou em combinação de acordo com a presente invenção é o "Scaf- fold" que recruta múltiplas cópias, por exemplo, de VP64, para um RNA guia especial, opcionalmente junto com outros ativadores (Chavez et al., Nat. Methods, 2016, 13 (7), 563-567).
[0170] Outro domínio de ativação a ser usado individualmente ou em combinação de acordo com a presente invenção é "Suntag", o qual compreende um arranjo peptídico com repetição de uma sequência que pode recrutar múltiplas cópias de uma proteína de fusão de anticorpos para criar um fator de transcrição sintético potente ao recrutar várias cópias de um domínio de ativação de transcrição para um domínio de reconhecimento deficiente em nuclease de um fator de transcrição sin- tético da presente invenção (Tanenbaum et a/., Cell, 2014, 159 (3): 635- 46).
[0171] Em outra modalidade, o sistema de domínio de ativação SAM pode ser empregado, em particular para um RNA guia modificado por SAM, juntamente com um domínio de ativação Suntag para recrutar simultaneamente um fragmento variável com uma única cadeia (scFv) que tem uma especificidade desejada acoplado, por exemplo, a VP64, para uma extremidade de um domínio de reconhecimento, e p65-hsf1 para o RNA guia para fatores de transcrição sintéticos com base em CRISPR. Os scFvs, os quais não representam ativadores propriamente ditos, com sua especificidade e versatilidade extremamente altas de re- conhecimento de alvo que podem ser concebidos são, portanto, alta- mente adequados para recrutar múltiplas cópias de um ativador de in- teresse para uma posição de interesse, ou seja, o scFv pode ser usado como amplificador de acordo com os vários aspectos e modalidades da presente invenção, juntamente com um domínio de ativação, conforme descrito aqui.
[0172] Ainda outro domínio de ativação a ser usado individualmente ou em combinação de acordo com a presente invenção é p300 ou EP300 ou E1A (usado aqui de forma alternada) ou CBP (também co- nhecido como proteína de ligação a CREB ou CREBBP). Tanto o p300 quanto o CBP interagem com numerosos fatores de transcrição e atuam para aumentar a expressão de seus genes alvo (Kasper et al., 2006, Mol. Cell. Biol., 26 (3), 789-809). P300 e CBP têm estruturas similares.
Ambos contêm cinco domínios de interação de proteína: o domínio de interação do receptor nuclear (Receptor Interaction Domain, RID), o do- mínio KIX (domínio de interação com CREB e MYB), as regiões de cis- teína/histidina (TAZ1I/CH1 e TAZ2/CH3) e o domínio de ligação de res- posta ao interferon (IBiD). Os últimos quatro domínios, KIX, TAZ1, TAZ2 e IBIiD do p300 se ligam, cada um, firmemente a uma sequência que abrange os dois domínios de transativação 9aaTADs do fator de trans- crição p53. Além disso, o p300 e o CBP contêm, cada um, um domínio de proteína ou histona acetiltransferase (PAT/HAT) e um bromodomínio que se liga a lisinas acetiladas e um motivo de dedo PHD com função desconhecida. Os domínios conservados são conectados por longos trechos de ligantes não estruturados. P300 e CBP podem aumentar a expressão gênica de três maneiras: relaxando a estrutura da cromatina no promotor gênico através de sua atividade intrínseca de histona ace- tiltransferase (HAT); recrutando a maquinaria de transcrição basal, in- cluindo RNA polimerase Il, para o promotor; e/ou atuando como molé- culas adaptadoras.
[0173] De acordo com as várias modalidades da presente invenção, o pelo menos um domínio de reconhecimento e o pelo menos um domí- nio de ativação do fator de transcrição sintético da presente invenção podem ser otimizados individualmente para permitir uma perfeita ativi- dade de ligação e modulação. Portanto, um número específico de do- mínios de ativação pode ser adequado para um determinado domínio de reconhecimento, adequadamente posicionado na construção do fa- tor de transcrição sintético, para permitir a atividade de modulação ideal, de preferência ativação transcricional. Portanto, o pelo menos um domí- nio de ativação de acordo com os vários aspectos da presente invenção pode compreender determinadas modificações para otimizar o pelo me- nos um domínio de ativação para interagir com pelo menos um domínio de reconhecimento de uma maneira ideal, de modo que ambos os do- mínios tenham acesso a um sítio alvo de interesse a ser modulado.
[0174] Em uma modalidade, pelo menos um domínio de ativação pode estar localizado no N-término e/ou no C-término em relação ao pelo menos um domínio de reconhecimento dentro de um fator de trans- crição sintético da presente invenção. Esta configuração pode ser a me- lhor configuração para moléculas de fusão entre pelo menos um domí- nio de reconhecimento e pelo menos um domínio de ativação. De acordo com várias modalidades, o pelo menos um domínio de reconhe- cimento e o pelo menos um domínio de ativação podem ser separados por uma sequência ligante adequada para permitir flexibilidade ideal e evitar impedimentos estéricos dos domínios para cumprir suas funções.
[0175] Em uma modalidade, o fator de transcrição sintético pode compreender pelo menos um elemento adicional, incluindo pelo menos um sinal de localização nuclear (NLS), um sinal de localização em orga- nelas incluindo, por exemplo, um sinal de localização em mitocôndrias ou um sinal de localização em cloroplastos para direcionar o STF a um compartimento dentro de uma célula ou sistema celular, onde o STF pode exercer sua função. Além disso, o fator de transcrição sintético pode compreender pelo menos uma etiqueta (tag), por exemplo, para visualizar o fator de transcrição sintético, para rastrear a localização subcelular do fator de transcrição e/ou para fornecer uma porção ativa dentro do fator de transcrição sintético, por exemplo, um sítio de ligação a scFv, ligar moléculas adicionais ao fator de transcrição sintético, um domínio de translocação, por exemplo, um domínio de translocação conforme presente nas moléculas de TALE, e assim por diante, con- forme descrito aqui e conforme conhecido por aqueles versados na téc- nica. O pelo menos um domínio adicional pode ser posicionado no N- término e/ou no C-término em relação ao pelo menos um domínio de reconhecimento, incluindo um posicionamento entre pelo menos um do- mínio de reconhecimento e pelo menos um domínio de ativação, por exemplo, pelo menos um NLS pode ser posicionado entre um domínio de reconhecimento e outro domínio de reconhecimento e/ou um domí- nio de ativação. Se fornecido como um vetor passível de transcrição/tra- dução, o STF pode compreender pelo menos um promotor para trans- crição ideal dentro de uma célula alvo ou sistema celular de interesse. Aqueles versados na técnica são capazes de definir promotores ade- quados, de preferência promotores fortes, com expressão indutível ou constitutiva, dependendo do sistema celular de interesse. Um exemplo de um promotor constitutivo muito forte no sistema de plantas, por exemplo, Zea mays, é o BdUbi10. Um promotor mais fraco seria o BdEF1, por exemplo. Promotores indutíveis de plantas são os promoto- res indutíveis de tetraciclina, dexametasona e ácido salicílico. Outros promotores adequados de acordo com a presente invenção são um CaMV (vírus do mosaico da couve-flor) 358 ou um promotor 358 duplo. Outros promotores eucariotas constitutivos são CMV (citomegalovírus), EF1a, TEF1, SV40, PGK1 (humano ou de camundongo), Ubc (ubiqui- tina 1), beta-actina humana, GDS, GAL1 ou 2 (para um sistema de le- vedura), CAG (que compreende um Estimulador de CMV, promotor de beta-actina de frango e aceitador de junção de beta-globina de coelho), H1 ou U6. Uma variedade de promotores indutíveis é conhecida por aqueles versados na técnica.
[0176] Portanto, uma variedade de arquiteturas diferentes pode es- tar presente nos STFs de acordo com a presente invenção. Uma vez que os STFs do presente pedido têm um caráter modular, vários STFs com uma arquitetura de domínio diferente podem ser concebidos para um determinado alvo e podem ser avaliados de forma comparativa in vitro para deduzir a arquitetura, conferindo o melhor efeito de modula- ção.
[0177] Em uma modalidade da presente invenção, o STF compre- ende um domínio de reconhecimento TAL no N-término e um domínio de ativação de VP64 no C-término, em que o STF compreende ainda um sinal de localização nuclear (NLS) de SV40 entre o domínio de re- conhecimento no N-término e o domínio de ativação no C-término.
[0178] Em ainda outra modalidade da presente invenção, o STF compreende um domínio de reconhecimento de CRISPR/dCas9 ou CRISPR/dCpf1 no N-término e um domínio de ativação de VP64 no C- término associado a um sinal de localização nuclear de SV40 (NLS) em seu C-término, em que o STF compreende ainda dois NLSs de SV40 entre o domínio de reconhecimento no N-término e o domínio de ativa- ção no C-término.
[0179] Em determinadas modalidades, os STFs, ou as sequências que codificam os mesmos, de acordo com a presente invenção, podem ser fornecidos como sistemas multiplex para atingir mais de um gene de interesse. Por exemplo, TALE e STFs com base em CRISPR desarma- dos podem ser concebidos para permitir o direcionamento de 2 a 7 ou mais loci genéticos de interesse ou permitir o direcionamento de um gene de interesse usando dois ou mais STFs diferentes concebidos es- pecificamente para modular o dito gene de interesse, fornecendo veto- res multiplex ou fornecendo STFs multiplex montados in vitro para se- rem transformados ou transfectados em uma célula ou sistema celular de interesse.
[0180] Em uma modalidade, o fator de transcrição sintético da pre- sente invenção, ou a sequência que codifica o mesmo, pode compreen- der pelo menos uma sequência de nucleotídeos, de aminoácidos ou sin- tética não natural ou uma combinação dos mesmos, covalente ou não covalentemente ligada a pelo menos uma sequência de aminoácidos do fator de transcrição sintético. Esta modalidade é particularmente ade- quada no caso em que o fator de transcrição sintético é distribuído como um complexo pré-montado em um sistema celular de interesse e, em particular, para fatores de transcrição sintéticos com base em CRISPR desarmados, em que o domínio de reconhecimento compreende adici- onalmente um componente de gRNA. Uma vez que o ácido ribonucleico é bastante instável, a porção de reconhecimento de gRNA pode ser es- tabilizada por uma porção que não ocorre naturalmente, por exemplo, um esqueleto de fosforotioato ou qualquer outro nucleotídeo estabiliza- dor. Além disso, o fator de transcrição sintético, de preferência, em mo- dalidades nas quais um complexo de proteína pré-montado é distribuído a uma célula ou sistema celular de interesse, pode compreender modi- ficações químicas para estabilizar, derivatizar ou funcionalizar o com- plexo e/ou adicionar pelo menos um modelo de reparo de DNA ao com- plexo para modalidades que visam um método para modificar o material genético de um sistema celular de maneira direcionada.
[0181] Um desafio para qualquer abordagem com base em CRISPR é o fato de que a porção de RNA (gRNA) e o respectivo polipeptídeo de CRISPR devem ser transportados para o núcleo ou qualquer outro com- partimento que compreenda DNA genômico, ou seja, a sequência de DNA alvo, de forma funcional (não degradada)). Uma vez que o RNA é menos estável do que um polipeptídeo ou DNA fita dupla e tem uma rotatividade maior, especialmente porque pode ser facilmente degra- dado por nucleases, em algumas modalidades, uma sequência de RNA de CRISPR e/ou a sequência de ácidos nucleicos do modelo de reparo de DNA, se presente em determinadas modalidades da presente inven- ção, compreende pelo menos um nucleotídeo que não ocorre natural- mente. Modificações de esqueleto preferidas de acordo com a presente invenção que aumentam a estabilidade do RNA de CRISPR e/ou au- mentam a estabilidade de uma sequência de ácidos nucleicos de mo- delo de reparo de DNA, se presente, são selecionadas a partir do grupo que consiste em uma modificação de fosforotioato, uma modificação de metil fosfonato, um modificação de ácido nucleico bloqueado, modifica- ção de O-(2-metoxietila), uma modificação de di-fosforotioato e uma mo- dificação de ácido nucleico peptídico. Particularmente, todas as ditas modificações do esqueleto ainda permitem a formação de emparelha- mento de bases complementares entre duas fitas de ácido nucleico, mas são mais resistentes à clivagem por nucleases endógenas. Depen- dendo do efetor CRISPR desarmado usado em combinação com uma sequência de ácidos nucleicos de RNA/DNA de acordo com a presente invenção, pode ser necessário não modificar estas posições nucleotídi- cas de uma sequência de ácidos nucleicos de CRISPR envolvidas na interação independente de sequência com o polipeptídeo de CRISPR. A dita informação pode ser derivada a partir da informação estrutural disponível, tal como disponível para os complexos de sequências de ácidos nucleicos de nuclease CRISPR/CRISPR e para efetores CRISPR desarmados, por exemplo, dCas9.
[0182] Em determinadas modalidades da presente invenção, consi- dera-se que pelo menos uma sequência de ácidos nucleicos de CRISPR (gRNA) e/ou pelo menos uma sequência de ácidos nucleicos de modelo de reparo de DNA opcionalmente presente possa compreender uma modificação de nucleotídeo e/ou base, de preferência em posições se- lecionadas, mas nem todas, da sequência de nucleotídeos. Estas modi- ficações são selecionadas a partir do grupo que consiste na adição de acridina, amina, biotina, Cascade Blue, colesterol, Cy3, Cy5, Cy5.5, Daboyl, digoxigenina, dinitrofenila, Edans, 6-FAM, fluoresceína, 3'-glice- rila, HEX, IRD-700, IRD-800, JOE, psoraleno fosfato, rodamina, ROX, tiol (SH), espaçadores, TAMRA, TET, AMCA-SGO, SE, BODIPYGE, Ma- rina BlueG&, Pacific BlueG, Oregon Green&, Rhodamine Green&, Rho- damine Red&, Rhodol Green& e Texas RedE. De preferência, as ditas adições são incorporadas na extremidade 3' ou 5' da sequência de áci- dos nucleicos da CRISPR e/ou na sequência de ácidos nucleicos do modelo de reparo de DNA. A modificação tem os efeitos vantajosos de que a localização celular da sequência de ácidos nucleicos de CRISPR e/ou a sequência de ácidos nucleicos do modelo de reparo de DNA op- cionalmente presente dentro de uma célula pode ser visualizada para estudar a distribuição, concentração e/ou disponibilidade da respectiva sequência, a interação do fator de transcrição sintético de interesse e o comportamento de ligação pode ser estudado. Métodos para estudar estas interações ou para visualização de uma sequência de nucleotí- deos modificada ou marcada conforme detalhado acima estão disponí- veis para aqueles versados no respectivo campo.
[0183] Em uma modalidade, qualquer nucleotídeo da pelo menos uma sequência de ácidos nucleicos de CRISPR ou qualquer outro com- ponente da sequência que codifica pelo menos um fator de transcrição sintético da presente invenção pode compreender uma das modifica- ções acima como um marcador ou ligante. Conforme usado aqui, "nu- cleotídeo" pode, portanto, geralmente se referir a uma combinação de base-açúcar-fosfato. Um nucleotídeo pode compreender um nucleotí- deo sintético. Um nucleotídeo pode compreender um análogo de nucle- otídeo sintético. Os nucleotídeos podem ser unidades monoméricas de uma sequência de ácidos nucleicos (por exemplo, ácido desoxirribonu- cleico (DNA) e ácido ribonucleico (RNA)). O termo nucleotídeo pode in- cluir os trifosfatos de ribonucleosídeo trifosfato de adenosina (ATP), tri- fosfato de uridina (UTP), trifosfato de citosina (CTP), trifosfato de gua- nosina (GTP) e trifosfatos de desoxirribonucleosídeo, tais como dATP, dCTP, dITP, dUTP, dGTP, dGTP, dGP. Tais derivados podem incluir, por exemplo e sem limitação, [aS]dATP, derivados de nucleotídeos 7- desaza-dGTP e 7-desaza-dATP, e conferem resistência à nuclease à molécula de ácidos nucleicos que os contêm. O termo nucleotídeo, con- forme usado aqui, pode se referir a trifosfatos de didesoxirribonucleosí- deos (ddNTPs) e seus derivados. Exemplos ilustrativos de trifosfatos de didesoxirribonucleosídeos podem incluir, porém sem limitações, ddATP, ddCTP, ddGTP, ddITP e ddTTP. Um nucleotídeo pode ser não marcado ou marcado de forma detectável por meio de técnicas bem conhecidas. A marcação também pode ser realizada com pontos quânticos. Etique- tas (tags) detectáveis podem incluir, por exemplo, isótopos radioativos, etiquetas fluorescentes, etiquetas quimioluminescentes, etiquetas biolu- minescentes e etiquetas enzimáticas. Os marcadores fluorescentes de nucleotídeos podem incluir, porém sem limitações, fluoresceína, 5-car- boxifluoresceína (FAM), 2'7'-5 dimetóxi-4'5-dicloro-6-carboxifluoresce- ína (JOE), rodamina, 6-carboxirrodamina (R6G), N,N,N' N'-tetrametil-6- carboxirrodamina (TAMRA), 6-carbóxi-X-rodamina (ROX), ácido 4-(4'- dimetilaminofenilazo)benzoico (DABCYL), Cascade Blue, Oregon Green, Texas Red, cianina e ácido 5-(2'-aminoetil)aminonaftaleno-1-sulfônico (EDANS).
[0184] Marcadores ou ligantes também podem compreender por- ções adequadas para a química Click para ligar pelo menos uma se- quência de ácidos nucleicos guia de CRISPR ou uma porção da mesma e/ou uma sequência de ácidos nucleicos de modelo de reparo de DNA e/ou pelo menos um domínio de reconhecimento de um fator de trans- crição sintético e/ou pelo menos um domínio de ativação de um fator de transcrição sintético entre si.
[0185] Das reações que compreendem o campo da química Click adequada para modificar qualquer ácido nucleico ou aminoácido de acordo com a presente invenção para construir um complexo molecular, in vitro ou in vivo, um exemplo é a cicloadição 1,3-dipolar de Huisgen de alcinos a azidas para formar 1,2,3-triazóis 1,4-dissubstituídos. A reação catalisada por cobre (1) é leve e muito eficiente, não exigindo grupos de proteção e não requerendo purificação em muitos casos. Os grupos fun- cionais azida e alcino são, em geral, inertes a moléculas biológicas e ambientes aquosos. O triazol tem similaridades com a porção de amida onipresente encontrada na natureza, porém, diferentemente das ami- das, não é suscetível à clivagem. Além disso, é quase impossível de oxidar ou reduzir.
[0186] Conforme é de conhecimento daqueles versados na técnica, determinadas reações de química Click adequadas para reações in vivo dependem de grupos reativos, tais como azidas, alcinos terminais ou alcinos tensionados (por exemplo, dibenzociclo-octila (DBCO)), grupos reativos que podem ser introduzidos em qualquer forma de RNA ou DNA via nucleotídeos modificados que são incorporados em vez de seus equivalentes naturais. Os marcadores podem ser introduzidos enzimá- tica ou quimicamente. O DNA funcionalizado resultante de CLICK pode ser subsequentemente processado por meio de reações de química Click de alcino-azida isentas de Cu(l) catalisada por Cu (IACA) ou Cu (Il) alcino-azida isentas de Cu (1) (SPAAC), em que as reações isentas de cobre são preferíveis para aplicações dentro de uma célula ou sistema vivo. Estas reações podem ser usadas de acordo com a presente inven- ção para introduzir um grupo de biotina para tarefas subsequentes de purificação (via azidas, alcinos de biotina ou reagentes de biotinilação que contêm DBCO) para introduzir um grupo fluorescente para subse- quentes imagiologia microscópica (via azidas fluorescentes, alcinos flu- orescentes ou corantes fluorescentes que contêm DBCO) ou reticulação em biomoléculas, por exemplo, pelo menos um domínio ou pelo menos um fator de transcrição sintético da presente invenção e, opcionalmente, um modelo de reparo de DNA, se presente, para ligar covalentemente e/ou fornecer biomoléculas funcionalizadas.
[0187] Em uma modalidade, uma sequência de ácidos nucleicos de CRISPR marcada com química Click 5' ou 3' opcionalmente purificada e funcionalmente associada, de acordo com a presente invenção, pode ser distribuída através de qualquer método de transformação ou trans- fecção a uma célula ou sistema celular que expresse de forma estável ou transitória um polipeptídeo de CRISPR desarmado correspondente. Deste modo, à medida que a sequência de ácidos nucleicos de CRISPR interage e, assim, direciona o polipeptídeo de CRISPR para atuar como um domínio de reconhecimento de acordo com a presente invenção, isto permite que o domínio de ativação module com precisão a expres- são de pelo menos um gene morfogênico de interesse.
[0188] Uma variedade de reações químicas adicionais e as modifi- cações correspondentes estão disponíveis para aqueles versados na técnica de ligação a ácidos nucleicos de acordo com a presente inven- ção entre si ou qualquer domínio de reconhecimento e/ou ativação de aminoácidos de uma maneira covalente. Estas modificações incluem uma variedade de reticuladores, tais como modificações de tiol, como um éster de N-hidroxissuccinimida de ácido tiocítico (NHS), grupos quíi- micos que reagem com aminas primárias (-NH2). Estas aminas primá- rias são positivamente carregadas em pH fisiológico; portanto, ocorrem predominantemente sobre as superfícies externas das estruturas terci- árias de proteínas nativas, onde são facilmente acessíveis aos reagen- tes de conjugação introduzidos no meio aquoso. Além disso, dentre os grupos funcionais disponíveis em amostras biológicas ou de proteínas típicas, as aminas primárias são especialmente nucleofílicas; isto as torna fáceis de direcionar para conjugação com vários grupos reativos. Há numerosos grupos químicos sintéticos que formarão ligações quími- cas com aminas primárias. Estes incluem isotiocianatos, isocianatos, acil azidas, ésteres de NHS, ésteres de sulfo-NHS que contêm um grupo sulfonato (-SO3), por exemplo, suberato de bis(sulfossuccinimidila) (BS3), cloretos de sulfonila, aldeídos, glioxais, epóxidos, oxiranos, car- bonatos, halogenetos de arila, imidoésteres, carbodiimidas tais como, por exemplo, 1-etil-3-(3-dimetilaminopropil)carbodiimida (EDC) ou dici- clo-hexilcarbodiimida (DCC), anidridos e ésteres de fluorofenila.
[0189] Em determinadas modalidades, qualquer sequência de áci- dos nucleicos de acordo com os vários aspectos da presente invenção pode ter códons otimizados para adaptar a sequência para desempenho ideal em um organismo ou célula alvo de interesse. Por exemplo, uma sequência pode ter códons otimizados para permitir uma alta taxa de transcrição em uma célula de planta de interesse de um gênero de planta de interesse ou as sequências podem ter códons otimizados para uso em mamíferos, por exemplo, uma célula de murino ou humana.
[0190] De acordo com as várias modalidades da presente invenção, o fator de transcrição sintético e/ou o pelo menos um domínio de reco- nhecimento pode compreender uma sequência apresentada em qual- quer uma de SEQ ID NOs: 1 a 94 ou uma sequência que tem pelo me- nos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 1 a 94 ou em que o fator de trans- crição sintético e/ou o pelo menos um domínio de reconhecimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de iden- tidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 95 a 190.
[0191] Os ativadores de transcrição sintéticos de acordo com a pre- sente invenção, de preferência específicos para WUS e/ou BBM, podem ser facilmente distribuídos com mecanismos de edição gênica e/ou T- DNAs para melhorar a eficiência de transformação em uma célula de planta e induzir à regeneração da planta transgênica. A presente inven- ção, portanto, se refere ainda a métodos para induzir à regeneração de células de planta transformadas ao promover a expressão de genes es- timuladores de crescimento (genes morfogênicos) tais como, por exem- plo, BBM e WUS.
[0192] De acordo com as várias modalidades e aspectos descritos aqui, o sistema celular pode ser selecionado a partir do grupo que con- siste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota pode ser pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota pode ser uma planta ou parte de uma planta.
[0193] Em determinadas modalidades descritas aqui, o sistema ce- lular a ser modulado, transformado e/ou transfectado pode ser selecio- nado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma cé- lula eucariota pode ser pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
[0194] Em determinadas modalidades de acordo com as várias mo- dalidades e aspectos descritos aqui, pelo menos uma parte da planta pode ser selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pó- len, pólen tubos, filamentos de anteras, ovos, sacos embrionários, óvu- los, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, pericílios, sementes, raízes e es- tacas.
[0195] Em modalidades em que o sistema celular é ou se origina de uma célula de planta, pelo menos uma planta ou pelo menos uma parte de uma planta pode se originar de uma espécie de planta selecionada a partir do grupo que consiste em Hordeum vulgare, Hordeum bulbu- som, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria ita- lica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulga- ris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana taba- cum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Mo- rus notabilis, Arabidopsis arenosa, Arabidopsis Iyrata, Arabidopsis thali- ana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexu- osa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pu- mila, Arabis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaícum, Cajanus cajanifolius, Cajanus scara- baeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sati- vum e Allium tuberosum.
[0196] Em um aspecto adicional, a presente invenção fornece um método para aumentar a eficiência de transformação em um sistema celular, em que o método pode compreender as etapas de: (a) fornecer um sistema celular; (b) introduzir no sistema celular pelo menos um fator de transcrição sintético ou uma sequência de nucleotídeos que codifica o mesmo; e (c) introduzir no sistema celular pelo menos uma sequência de nucleotídeos de interesse; (d) opcionalmente: cultivar o sistema ce- lular sob condições para obter uma progênie transformada do sistema celular; em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo me- nos um domínio de reconhecimento e pelo menos um domínio de ativa- ção, em que o fator de transcrição sintético é configurado para modular a expressão, de preferência a transcrição, de pelo menos um gene mor- fogênico no sistema celular; e em que o pelo menos um fator de trans- crição sintético, ou a sequência de nucleotídeos que codifica o mesmo, é introduzido em paralelo ou sequencialmente com a introdução de pelo menos uma sequência de nucleotídeos de interesse.
[0197] A presente invenção descreve, portanto, métodos para me- lhorar a eficiência da transformação ou transfecção e/ou regeneração de plantas usando fatores de transcrição sintéticos específicos para ge- nes morfogênicos endógenos que podem reprogramar a célula e induzir à divisão celular em uma grande variedade de espécies de plantas para fornecer métodos confiáveis de transformação de sistemas celulares, incluindo aqueles conhecidos por serem difíceis de modificar e/ou trans- formar por meio dos métodos atualmente disponíveis. Em particular, de- terminadas linhagens de elite que compreendem um evento de elite al- tamente valioso (ou seja, eventos muito raramente alcançados e, se é que derivam de um evento extraordinário e, portanto, surpreendente) e o germoplasma destas linhagens de elite podem ser altamente recalci- trantes a tentativas de cultura e transformação in vitro. Tais genótipos geralmente não produzem uma resposta de cultura embriogênica ou or- ganogênica apropriada em meios de cultura desenvolvidos para obter tais respostas de explantes tipicamente adequados, tais como embriões imaturos. Além disso, quando DNA exógeno ou outras biomoléculas são introduzidas nestes embriões imaturos, nenhum evento de modificação bem-sucedido pode ser recuperado após ciclos complicadas de seleção Ou apenas poucos eventos podem ser recuperados, tornando impraticá- vel a transformação de um genótipo deste tipo.
[0198] Em uma modalidade, o método pode compreender que (a) o pelo menos um fator de transcrição sintético ou a sequência que codifica o mesmo e (b) a pelo menos uma sequência de nucleotídeos de inte- resse é/são introduzidos no sistema celular através de meios indepen- dentemente selecionados a partir de meios biológicos e/ou físicos, in- cluindo transfecção, transformação, incluindo transformação por Agro- bacterium spp., de preferência Agrobacterium tumefaciens, um vetor vi- ral, bombardeamento biolístico, transfecção usando agentes químicos,
incluindo transfecção com polietileno glicol, eletroporação, fusão celular ou qualquer combinação dos mesmos.
[0199] Portanto, uma "introdução" ou o processo de "introdução" pode compreender qualquer meio biológico, químico e/ou físico de in- trodução ou distribuição de uma biomolécula em um sistema celular de interesse. Particularmente, qualquer combinação de técnicas de intro- dução ou distribuição pode ser aplicada. Além disso, diferentes compo- nentes a serem introduzidos em um sistema celular de interesse podem ser introduzidos por meio da mesma técnica, simultânea ou subsequen- temente, por exemplo, através de cobbombardeamento ou podem ser in- troduzidos simultânea ou subsequentemente por meio de diferentes téc- nicas de introdução.
[0200] O aumento na eficiência de transformação de acordo com os vários aspectos e modalidades da presente invenção pode compreen- der qualquer aumento estatisticamente significativo quando comparado com uma planta ou sistema celular de controle. Por exemplo, um au- mento na eficiência da transformação pode compreender um aumento de cerca de 0,2 %, 0,5 %, 5 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 120 %, 125 % ou mais quando comparado com uma planta de controle ou uma parte da planta de controle ou um sistema celular de controle. Alternativamente, o aumento na eficiência da transformação pode incluir um aumento de cerca de 0,2 vezes, 0,5 vezes, | vezes, 2 vezes, 4 vezes, 8 vezes, 16 vezes ou 32 vezes ou mais na eficiência da transformação na planta, parte da planta ou sistema celular quando comparado com uma planta ou parte de planta ou sistema celular de controle.
[0201] Em uma modalidade, os métodos da presente invenção po- dem compreender que a pelo menos uma sequência de nucleotídeos de interesse seja fornecida como parte de pelo menos um vetor ou como pelo menos uma molécula linear.
[0202] Em uma modalidade dos métodos descritos aqui, a pelo me- nos uma sequência de nucleotídeos de interesse pode ser selecionada a partir do grupo que consiste em um transgene, um gene endógeno modificado, uma sequência sintética, uma sequência intrônica, uma se- quência codificadora ou uma sequência reguladora.
[0203] Em uma modalidade dos métodos descritos aqui, a pelo me- nos uma sequência de nucleotídeos de interesse pode ser um trans- gene, em que o transgene pode compreender uma sequência de nucle- otídeos que codifica um gene de um genoma de um organismo de inte- resse ou pelo menos uma parte do dito gene.
[0204] Em uma modalidade, uma sequência reguladora de acordo com a presente invenção pode ser uma sequência promotora, em que a edição, mutação ou modulação do promotor compreende a substitui- ção do promotor ou fragmento do promotor por um promotor diferente (também conhecido como promotor substituto) ou fragmento de promo- tor (também conhecido como fragmento de promotor substituto), em que a substituição do promotor resulta em qualquer um dos seguintes ou em qualquer combinação dos seguintes: uma atividade promotora aumen- tada, uma especificidade aumentada do promotor pelo tecido, uma ati- vidade promotora reduzida, uma especificidade reduzida do promotor pelo tecido, uma nova atividade promotora, uma atividade promotora in- dutível, uma janela estendida de expressão gênica, uma modificação do tempo ou progresso do desenvolvimento da expressão gênica na mesma camada celular ou outra camada celular, por exemplo, esten- dendo o tempo da expressão gênica no tapetum das anteras, uma mu- tação dos elementos de ligação a DNA e/ou uma exclusão ou adição de elementos de ligação a DNA. O promotor (ou fragmento de promotor) a ser modificado pode ser um promotor (ou fragmento de promotor) que é endógeno, artificial, preexistente ou transgênico para a célula que está sendo editada. O promotor substituto ou fragmento do mesmo pode ser um promotor ou fragmento do mesmo que é endógeno, artificial, pree- xistente ou transgênico para a célula que está sendo editada. Qualquer outra sequência reguladora de acordo com a presente invenção pode ser modificada conforme detalhado para um promotor ou fragmento de promotor acima.
[0205] Particularmente no caso de genomas de planta a serem mo- dificados, pode ser desejável que a modificação, mediada por meio dos métodos da presente invenção, não resulte em um organismo genetica- mente modificado, integrando DNA estranho ao genoma progenitor de uma maneira imprecisa, uma vez que questões ambientais, regulatórias e políticas devem ser consideradas. Portanto, as modalidades de acordo com a presente invenção que fornecem métodos para introduzir um material genético de interesse em um sistema celular de maneira transitória são particularmente adequadas para fornecer um sistema ce- lular que compreende uma modificação em uma localização predeter- minada sem inserir DNA estranho e, portanto, sem fornecer uma célula ou organismo considerado um organismo geneticamente modificado, uma vez que todas as ferramentas necessárias para executar os méto- dos da presente invenção podem ser fornecidas ao sistema celular de maneira transitória na forma ativa.
[0206] Em uma modalidade dos métodos descritos aqui, a ativação de transcrição é combinada com a modificação do genoma de uma planta de uma forma totalmente transitoriamente, deste modo, obtendo um organismo vegetal que compreende uma modificação em uma loca- lização genética predeterminada sem inserção de DNA estranho no ge- noma da planta e, assim, fornecendo um organismo vegetal que não é considerado um organismo geneticamente modificado. Os métodos descritos aqui, portanto, fornecem meios para modificar o genoma de plantas que não requerem procedimentos de desregulação trabalhosos.
Em ainda outra modalidade dos métodos descritos aqui, os STFs e/ou a nuclease específica para localização são fornecidos sem DNA, por exemplo, como proteína ou RNP, deste modo, conferindo um benefício regulatório. Em uma modalidade dos vários métodos descritos aqui, os métodos podem ser realizados de uma maneira totalmente transitória. Em outras modalidades, os métodos podem ser realizados por uma combinação de abordagens estáveis e transitórias. Em ainda uma outra modalidade, os métodos também podem ser realizados através da in- trodução estável de ferramentas de distribuição adequadas a uma cé- lula ou sistema celular de interesse.
[0207] Em outro exemplo dos vários aspectos da presente inven- ção, a pelo menos uma sequência de nucleotídeos de interesse a ser introduzida em um sistema celular pode ser um transgene de um orga- nismo de interesse, em que o transgene ou parte do transgene pode ser selecionado a partir do grupo que consiste em um gene que codifica resistência ou tolerância ao estresse abiótico, incluindo estresse hídrico, estresse osmótico, estresse térmico, estresse pelo frio, estresse oxida- tivo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicidas, in- cluindo resistência ao glifosato, glufosinato/fosfinotricina, higromicina, resistência ou tolerância a 2,4-D, inibidores de protoporfirinogênio oxi- dase (PPO), inibidores de ALS e Dicamba, um gene que codifica resis- tência ou tolerância ao estresse biótico, incluindo um gene de resistên- cia viral, um gene de resistência fúngica, um gene de resistência bacte- riana, um gene de resistência a insetos ou um gene que codifica um traço relacionado ao rendimento, incluindo resistência ao hospedeiro, tempo de floração, resistência ao acamamento, cor da semente, com- posição do endosperma ou teor nutricional.
[0208] Em outra modalidade dos vários aspectos da presente inven- ção, a pelo menos uma sequência de nucleotídeos de interesse pode ser pelo menos parte de um gene endógeno modificado de um orga- nismo de interesse, em que o gene endógeno modificado pode compre- ender pelo menos uma eliminação, inserção e/ou substituição de pelo menos um nucleotídeo comparado com a sequência de nucleotídeos do gene endógeno não modificado.
[0209] Em ainda uma outra modalidade dos vários aspectos da pre- sente invenção, a pelo menos uma sequência de nucleotídeos de inte- resse pode ser pelo menos parte de um gene endógeno modificado de um organismo de interesse, em que o gene endógeno modificado pode compreender pelo menos um de um truncamento, duplicação, substitui- ção e/ou eliminação de pelo menos uma posição de nucleotídeo que codifica um domínio do gene endógeno modificado.
[0210] Em uma modalidade, a pelo menos uma sequência de nu- cleotídeos de interesse pode ser pelo menos parte de uma sequência reguladora, em que a sequência reguladora pode compreender pelo me- nos uma dentre uma sequência promotora central, uma sequência pro- motora proximal, uma sequência cis reguladora, uma sequência trans reguladora, uma sequência de controle de /ocus, uma sequência iso- lante, uma sequência de silenciamento, uma sequência intensificadora, uma sequência terminadora e/ou qualquer combinação das mesmas.
[0211] Qualquer fator de transcrição sintético, conforme descrito aqui abaixo, pode ser usado para os diferentes métodos de acordo com a presente invenção como mediador para modular especificamente a transcrição de um gene morfogênico de interesse. Esta modulação, de preferência uma regulação positiva da transcrição, permite uma melhor eficiência de transformação de um sistema celular, de preferência uma planta ou parte de planta de interesse.
[0212] De acordo com as várias modalidades dos métodos descri- tos aqui, o gene morfogênico preferido para modulação pode ser sele- cionado a partir do grupo que consiste em BBM, WUS, incluindo WUS?2,
um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLT5, PLT7, IPT, IPT2, Knotted1 e RKD4.
[0213] De preferência, o gene morfogênico compreende uma se- quência de nucleotídeos selecionada a partir do grupo que consiste em (i) uma sequência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (ii) uma sequência de nucleotídeos com as sequências codificadoras do conjunto de sequências de nucleotídeos em qualquer uma de SEQ ID NOs: 199 a 237, (iii) uma sequência de nucleotídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, de preferência em todo o compri- mento, com a sequência de nucleotídeos de (i), (ii) ou (iii), (v) uma se- quência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (iii) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vil) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que compreende a sequên- cia de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0214] Em determinadas modalidades, o fator de transcrição sinté- tico usado nos métodos da presente invenção pode ser configurado para modular a expressão, de preferência a transcrição, do gene mor- fogênico através de ligação a uma região reguladora localizada a uma determinada distância em relação ao códon inicial.
[0215] Em determinadas modalidades, o fator de transcrição sinté- tico e/ou o pelo menos um domínio de reconhecimento usado nos mé- todos da presente invenção podem compreender uma sequência apre- sentada em qualquer uma de SEQ ID Nos: 1 a 94 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 1 a 94 ou em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhe- cimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou a uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 95 a 190.
[0216] Em determinadas modalidades dos métodos da presente in- venção, o sistema celular pode ser selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota pode ser pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
[0217] Em outras modalidades dos métodos da presente invenção, pelo menos uma parte da planta pode ser selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, par- tes de flores, pétalas, frutas, pólen, tubos de pólen, outros filamentos, óvulos, sacos embrionários, óvulos, ovários, zigotos, embriões, embri- ões zigóticos, embriões somáticos, meristemas apicais, feixes vascula- res, pericílios, sementes, raízes e estacas.
[0218] Em outras modalidades dos métodos da presente invenção, a pelo menos uma célula de planta, a pelo menos uma planta ou a pelo menos uma parte de uma planta podem se originar de uma espécie de planta selecionada a partir do grupo que consiste em Hordeum vulgare,
Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Bra- chypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosifor- mis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cu- cumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, OI- marabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oelera- cia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Ci- cer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulo- sum, Allium sativum e Allium tuberosum.
[0219] Em um aspecto adicional da presente invenção, independen- temente ou em conjunto com os aspectos adicionais e modalidades des- critos aqui, é fornecido um método para modificar o material genético de um sistema celular em uma localização predeterminada, em que o mé- todo pode compreender as seguintes etapas: (a) fornecer um sistema celular; (b) introduzir pelo menos um fator de transcrição sintético, ou uma sequência que codifica o mesmo, no sistema celular; (c) introduzir ainda no sistema celular (i) pelo menos uma nuclease específica para localização, ou uma sequência que codifica a mesma, em que a nu- clease específica para localização induz a uma ruptura de fita dupla na localização predeterminada; (ii) opcionalmente: pelo menos uma se- quência de nucleotídeos de interesse, de preferência flanqueada por uma ou mais sequências de homologia complementares a uma ou mais sequências de nucleotídeos adjacentes à localização predeterminada no material genético do sistema celular; e; (e) opcionalmente: determi- nar a presença da modificação na localização predeterminada no mate- rial genético do sistema celular; e (f) obter um sistema celular que com- preende uma modificação na localização predeterminada do material genético do sistema celular; em que o pelo menos um fator de transcri- ção sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo menos um domínio de reconhecimento e pelo menos um domínio de ativação, em que o pelo menos um fator de transcrição sintético está configurado para modular a expressão, de preferência a transcrição, de pelo menos um gene morfogênico no sistema celular; e em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, pode ser introduzida em paralelo ou sequencialmente com a introdução de pelo menos uma nuclease es- pecífica para localização, ou a sequência que codifica a mesma, na pelo menos uma sequência de nucleotídeos de interesse.
[0220] Este aspecto e as modalidades associadas combinam siner- gicamente as vantagens da modulação direcionada da taxa de transcri- ção de pelo menos um gene morfogênico de interesse em um sistema celular com um método de edição genômica (GE) altamente direcionado à localização para introduzir determinados efetores na célula. Ao forne- cer um ambiente dentro de um sistema celular que compreende pelo menos um fator de transcrição sintético de acordo com a presente in- venção, é possível modular especificamente a transcrição de pelo me- nos um gene morfogênico no sistema celular antes ou simultaneamente com a introdução de pelo menos uma nuclease específica para locali-
zação (Site-Specific Nuclease, SSN), isto é, uma enzima que compre- ende DNA fita dupla, ou capacidade de clivagem de DNA fita simples, ou uma sequência que codifica a mesma, e, opcionalmente, outras fer- ramentas como reparação modelos (RTS) para fornecer um meio ambi- ente, em que o sistema celular é altamente competente em transforma- ção e tem ainda uma alta capacidade de regeneração. Estes fatores asseguram uma edição e regeneração bem-sucedidas deste material genético editado em um sistema celular de interesse e permitem rege- nerar uma planta ou material vegetal a partir do sistema celular modifi- cado, uma vez que o sistema celular é muito mais tolerante e viável durante o evento de GE com base no cotratamento ou pré-tratamento com pelo menos um fator de transcrição sintético, ou uma sequência que codifica o mesmo.
[0221] Em uma modalidade, o método compreende ainda a etapa de cultura do sistema celular sob condições para obter uma progênie geneticamente modificada do sistema celular modificado.
[0222] O termo "adjacente" ou "adjacente a", conforme usado aqui no contexto da localização predeterminada e uma ou mais regiões de homologia, pode compreender uma região adjacente a montante e a jusante ou ambos. Portanto, a região adjacente é determinada com base no material genético de um sistema celular a ser modificado, o dito ma- terial compreendendo a localização predeterminada.
[0223] Pode haver uma região adjacente a montante e/ou a jusante próximo da localização predeterminada. Para nucleases específicas para localização (SSNs) que induzem a rupturas de fita dupla (Double- Strand Breaks, DSBs) cegas, a "localização predeterminada" represen- tará a localização na qual a DSB é induzida no material genético em um sistema celular de interesse. Para SSNs que deixam saliências após a indução de DSB, a localização predeterminada significa a região entre o corte na extremidade 5' em uma fita e a extremidade 3' na outra fita.
As regiões adjacentes no caso de SSNs terminais aderentes podem, assim, ser calculadas usando as duas fitas de DNA diferentes como re- ferência. O termo "adjacente a uma localização predeterminada" pode, deste modo, envolver as posições de nucleotídeos a montante e/ou a jusante em um material genético a ser modificado, em que a região ad- jacente é definida com base no material genético de um sistema celular antes de induzir a uma DSB ou modificação. Com base nos diferentes mecanismos das SSNs que induzem às DSBs, a "localização predeter- minada", que significa a localização na qual uma modificação é feita em um material genético de interesse, pode envolver uma posição especí- fica na mesma fita para DSBs cegas ou a região em fitas diferentes entre dois locais de corte para DSBs de corte aderentes ou para nickases usadas como SSNs entre o corte na posição 5' em uma fita e na posição 3' na outra fita.
[0224] Se presente, a região adjacente a montante define a região diretamente a montante da extremidade 5' do local de corte de uma nu- clease específica para localização de interesse com referência a uma localização predeterminada antes de iniciar uma ruptura de fita dupla, por exemplo, durante engenharia genômica direcionada. Corresponden- temente, uma região adjacente a jusante define a região diretamente a jusante da extremidade 3' do local de corte de uma SSN de interesse com referência a uma localização predeterminada antes de iniciar uma ruptura de fita dupla, por exemplo, durante engenharia genômica direci- onada. A extremidade 5' e a extremidade 3' podem ser as mesmas, de- pendendo da nuclease específica para localização de interesse.
[0225] Em determinadas modalidades, também pode ser favorável conceber pelo menos uma região de homologia a uma distância da DSB a ser induzida, isto é, não flanquear diretamente a localização predeter- minada/o local da DSB. Neste cenário, a sequência genômica entre a localização predeterminada e a sequência de homologia (o braço de ho- mologia) seria "eliminada" após a ocorrência de recombinação homó- loga, o que pode ser preferido para determinadas estratégias, uma vez que isto permite a eliminação direcionada de sequências próximas da DSB. Diferentes tipos de configuração e concepção de RTs são, assim, considerados de acordo com a presente invenção para aquelas modali- dades que dependem de um RT. Os RTs podem ser usados para intro- duzir mutações específicas para localização ou os RTs podem ser usa- dos para a integração sítio específica de sequências de ácidos nucleicos de interesse ou os RTs podem ser usados para auxiliar uma eliminação direcionada.
[0226] (Uma) sequência(s) de homologia(s) introduzida(s) e a(s) re- gião(ões) adjacente(s) correspondente(s) podem ter comprimentos va- riados e diferentes de cerca de 15 pb a cerca de 15.000 pb, ou seja, uma região de homologia a montante pode ter um comprimento dife- rente comparado com uma região de homologia a jusante. Apenas uma região de homologia pode estar presente. Não há um limite máximo real quanto ao comprimento da(s) região(ões) de homologia, comprimento o qual é determinado por questões práticas e técnicas. De acordo com determinadas modalidades, dependendo da natureza do RT e da modi- ficação direcionada a ser introduzida, regiões de homologia assimétri- cas podem ser preferidas, isto é, regiões de homologia em que as regi- ões de flanqueamento a montante e a jusante têm um comprimento va- riável. Em determinadas modalidades, apenas uma região de flanquea- mento a montante e a jusante pode estar presente.
[0227] Em uma modalidade de acordo com os métodos da presente invenção, a pelo menos uma nuclease específica para localização pode compreender uma nuclease de dedo de zinco, uma nuclease efetora de tipo ativador de transcrição, um sistema CRISPR/Cas, incluindo um sis- tema CRISPR/Cas9, um sistema CRISPR/Cfp1, um sistema CRISPR/
CasX, um sistema CRISPR/CasY, uma endonuclease "homing" mani- pulada e uma meganuclease e/ou qualquer combinação, variante ou fra- gmento cataliticamente ativo dos mesmos.
[0228] Uma vez expressa, a proteína Cas9 e o gRNA formam um complexo de ribonucleoproteínas por meio de interações entre o domí- nio de "armação" de gRNA e os sulcos positivamente carregados na superfície da Cas9. A Cas9 sofre uma alteração conformacional quando de ligação ao gRNA que muda a molécula de uma conformação inativa que não se liga ao DNA para uma conformação ativa que se liga ao DNA. É importante ressaltar que a sequência espaçador do MRNA per- manece livre para interagir com o DNA alvo. O complexo Cas9-9RNA ligará qualquer sequência genômica a um PAM, mas a extensão até a qual o espaçador de gRNA corresponde ao DNA alvo determina se a Cas9 será cortada. Uma vez que o complexo Cas9-g9RNA se liga a um alvo de DNA putativo, uma sequência de 'semente' na extremidade 3' da sequência de direcionamento de gRNA começa a se ligar ao DNA alvo. Se as sequências de DNA semente e alvo coincidirem, o gRNA continuará a se unir ao DNA alvo na direção de 3' para 5' (em relação à polaridade do gRNA).
[0229] CRISPR/Cas, por exemplo, CRISPR/Cas9, e também CRISPR/Cpf1 ou CRISPR/CasX ou CRISPR/CasY e outros sistemas CRISPR são altamente específicos quando os gRNAs são concebidos corretamente, porém, particularmente, a especificidade ainda é uma grande preocupação, principalmente para usos clínicos ou GE direcio- nada a plantas com base na tecnologia CRISPR. A especificidade do sistema CRISPR é determinada em grande parte pela especificidade da sequência de direcionamento do gRNA para o alvo genômico compa- rado com o restante do genoma. Portanto, os métodos de acordo com a presente invenção, quando combinados com o uso de pelo menos uma nuclease CRISPR como nuclease específica para localização e ainda combinados com o uso de um ácido nucleico de CRISPR ade- quado, podem fornecer um resultado significativamente mais previsível de GE. Enquanto o complexo CRISPR pode mediar um corte altamente preciso de um genoma ou material genético de uma célula ou sistema celular em uma localização específica, os métodos apresentados aqui fornecem um mecanismo de controle adicional que assegura um meca- nismo de reparo programável e previsível.
[0230] De acordo com as várias modalidades da presente invenção, a descrição acima em relação à associação ou ligação covalente e não covalente também se aplica às sequências de ácidos nucleicos de CRISPR que podem compreender mais de uma porção, por exemplo, uma porção de crRNA e tracrRNA, as quais podem estar associadas entre si, conforme detalhado acima. Em uma modalidade, uma sequên- cia de ácidos nucleicos de RT da presente invenção pode ser colocada dentro de uma sequência de ácidos nucleicos de CRISPR de interesse para formar uma sequência de ácidos nucleicos híbrida de acordo com a presente invenção, híbrido o qual pode ser formado por meio de as- sociação covalente e não covalente.
[0231] Em ainda uma outra modalidade de acordo com os vários aspectos da presente invenção, a uma ou mais sequências de ácidos nucleicos que flanqueiam pelo menos uma sequência de ácidos nuclei- cos de interesse na localização predeterminada podem ter pelo menos 85 % a 100 % de complementaridade com uma ou mais sequências de ácidos nucleicos adjacente à localização predeterminada, a montante e/ou a jusante da localização predeterminada, ao longo de todo o com- primento da(s) região(ões) adjacente(s).
[0232] Particularmente, um menor grau de homologia ou comple- mentaridade de pelo menos uma região de flanqueamento pode ser usado, por exemplo, pelo menos 70 %, pelo menos 75 %, pelo menos 80 %, pelo menos 81 %, pelo menos 82 %, pelo menos 83 % ou pelo menos 84 % de homologia/complementaridade com pelo menos uma região adjacente no material genético de interesse. Para a GE de alta precisão, a qual depende do modelo HDR, isto é, um RT, conforme des- crito aqui, mais de 95 % de homologia/complementaridade são favorá- veis para alcançar um evento de reparo altamente direcionado. Con- forme mostrado em Rubnitz et al., Mol. Cell Biol., 1984, 4 (11), 2253- 2258, também uma homologia de sequência muito baixa pode ser sufi- ciente para obter uma recombinação homóloga. Como é sabido por aqueles versados na técnica, o grau de complementaridade dependerá do material genético a ser modificado, da natureza da edição planejada, da complexidade e tamanho de um genoma, do número de locais fora do alvo potenciais, do contexto genético e do ambiente dentro de uma célula ou sistema celular a ser modificado.
[0233] Em ainda uma outra modalidade de acordo com os vários aspectos da presente invenção, o material genético do sistema celular pode ser selecionado a partir do grupo que consiste em um protoplasto, um genoma viral transferido para uma célula hospedeira recombinante, uma célula eucariota, tecido ou órgão, de preferência uma célula, tecido ou órgão de planta, e um organismo eucariota, de preferência um orga- nismo vegetal.
[0234] Em uma modalidade dos métodos da presente invenção, (i) o pelo menos um fator de transcrição sintético ou a sequência que co- difica o mesmo; e (ii) a pelo menos uma nuclease específica para loca- lização, ou a sequência que inclui a mesma; e opcionalmente (iii) a pelo menos uma sequência de nucleotídeos de interesse podem ser introdu- zidos no sistema celular através de meios independentemente selecio- nados a partir de meios biológicos e/ou físicos, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de pre- ferência por Agrobacterium tumefaciens, um vetor viral, bombardea-
mento biolístico, transfecção usando agentes químicos, incluindo trans- fecção com polietileno glicol ou qualquer combinação dos mesmos.
[0235] Em uma modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, o pelo menos um domínio de reconhecimento pode ser, ou pode ser um fragmento de, uma molécula selecionada a partir do grupo que consiste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease desarmado, pelo menos um domínio de dedo de zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer combinação dos mesmos.
[0236] Em uma modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, pelo menos um sistema CRISPR/nuclease desar- mado pode ser selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado pode compreender pelo menos um RNA guia, de preferência um RNA guia otimizado para o sistema CRISPR/nuclease desarmado específico e o sistema especí- fico para a localização alvo dentro ou próximo de um sistema morfogê- nico para aumentar as propriedades de reconhecimento e/ou ligação do fator de transcrição sintético da presente invenção.
[0237] Em uma outra modalidade dos métodos para modificar o ma- terial genético de um sistema celular em uma localização predetermi- nada da presente invenção, o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético pode ser selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação pode ser de um gene de efetor TAL de Xanthomonas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Scaffold, Suntag,
P300, VP160 ou qualquer combinação dos mesmos. Em uma modali- dade preferida dos métodos para a modificação do material genético de um sistema celular em uma localização predeterminada da presente in- venção, o pelo menos um domínio de ativação é VP64.
[0238] Em outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético pode estar localizado no N-término e/ou no C-término em relação ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
[0239] Em ainda uma outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeter- minada da presente invenção, o pelo menos um gene morfogênico pode ser selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS?2, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLT5, PLT7, IPT, IPT2, Knotted1 e RKDA4.
[0240] Em uma outra modalidade, são fornecidos os métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, em que o pelo menos um gene morfogênico compreende uma sequência de nucleotídeos selecionada a partir do grupo que consiste em (i) uma sequência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (ii) uma se- quência de nucleotídeos que tem as sequências codificadoras da se- quência de nucleotídeos apresentada em qualquer uma de SEQ ID NOs: 199 a 237, (ii) uma sequência de nucleotídeos complementar à sequência de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotí- deos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, de preferência em todo o comprimento, com a sequência de nucleotí- deos de (i), (ii) ou (iii), (v) a sequência de nucleotídeos que hibridiza com a sequência de nucleotídeos de (ili) sob condições rigorosas, (vi) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID N Os: 238 a 258, (vii) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de prote- Ína que compreende a sequência de aminoácidos apresentada em qual- quer uma de SEQ ID NOs: 238 a 258.
[0241] Em ainda outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeter- minada da presente invenção, o fator de transcrição sintético pode ser configurado para modular a expressão, de preferência a transcrição, do gene morfogênico através de ligação a uma região reguladora locali- zada a uma determinada distância em relação ao códon inicial.
[0242] Em uma modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, o fator de transcrição sintético e/ou o pelo menos um domínio de reconhecimento compreende uma sequência apresen- tada em qualquer uma de SEQ ID NOs: 1 a 94 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade ao longo de todo o comprimento de qualquer uma de SEQ ID NOs: 1 a 94 ou em que o fator de transcrição sintético e/ou o pelo menos um domínio de reco- nhecimento se liga a uma região reguladora apresentada em SEQ ID NOs: 95 a 190 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, em todo o comprimento, com qualquer uma de SEQ ID NOs: 95 a 190.
[0243] Em outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, o sistema celular pode ser selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que pelo menos uma célula eucariota pode ser pelo menos uma célula de planta e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
[0244] Em ainda outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeter- minada da presente invenção, a uma ou mais sequências de nucleotí- deos que flanqueiam a pelo menos uma sequência de nucleotídeos de interesse na localização predeterminada podem ser pelo menos 85 % - 100 % complementares a uma ou mais sequências de nucleotídeos ad- jacentes à localização predeterminada, a montante e/ou a jusante da localização predeterminada, em todo o comprimento da(s) região(ões) adjacente(s).
[0245] Em uma modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, a pelo menos uma sequência de nucleotídeos de interesse pode ser selecionada a partir do grupo que consiste em: um transgene, um gene endógeno modificado, uma sequência sintética, uma sequência intrônica, uma sequência codificadora ou uma sequên- cia reguladora. Se a pelo menos uma sequência de nucleotídeos de in- teresse for um transgene, o transgene pode compreender uma sequên- cia de nucleotídeos que codifica um gene de um genoma de um orga- nismo de interesse ou pelo menos uma parte do dito gene.
[0246] Em outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeterminada da presente invenção, a pelo menos uma sequência de nucleotídeos de interesse pode ser um transgene de um organismo de interesse, em que o transgene ou parte do transgene pode ser selecionado a partir do grupo que consiste em um gene que codifica resistência ou tolerância ao estresse abiótico, incluindo estresse pela seca, estresse osmótico, estresse pelo calor, estresse pelo frio, estresse oxidativo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, es- tresse por sal ou alagamento, resistência a herbicida, incluindo resistên- cia ao glifosato, glufosinato/fosfinotricina, higromicina, resistência ou to- lerância a 2,4-D, inibidores de protoporfirinogênio oxidase (PPO), inibi- dores de ALS e Dicamba, um gene que codifica resistência ou tolerância ao estresse biótico, incluindo um gene de resistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de re- sistência a insetos ou um gene que codifica um traço relacionado ao rendimento, resistência ao hospedeiro, tempo de floração, resistência à ruptura, cor da semente, composição do endosperma ou teor nutricio- nal.
[0247] Em ainda outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeter- minada da presente invenção, a pelo menos uma sequência de nucleo- tídeos de interesse pode ser pelo menos parte de um gene endógeno modificado de um organismo de interesse, em que o gene endógeno modificado pode compreender pelo menos uma eliminação, inserção e/ou substituição de pelo menos um nucleotídeo comparado com a se- quência de nucleotídeos do gene endógeno não modificado e/ou a pelo menos uma sequência de nucleotídeos de interesse pode ser pelo me- nos parte de um gene endógeno modificado de um organismo de inte- resse, em que o gene endógeno modificado pode compreender pelo menos um dentre um truncamento, duplicação, substituição e/ou elimi- nação de pelo menos uma posição de nucleotídeo que codifica um do- mínio do gene endógeno modificado.
[0248] Em ainda outra modalidade dos métodos para modificar o material genético de um sistema celular em uma localização predeter- minada da presente invenção, a pelo menos uma sequência de nucleo- tídeos de interesse pode ser pelo menos parte de uma sequência regu- ladora, em que a sequência reguladora pode compreender pelo menos uma dentre uma sequência promotora central, uma sequência promo- tora proximal, uma sequência cis reguladora, uma sequência trans re- guladora, uma sequência de controle de locus, uma sequência isolante, uma sequência de silenciamento, uma sequência intensificadora, uma sequência terminadora e/ou qualquer combinação das mesmas.
[0249] É fornecida ainda uma modalidade dos métodos de acordo com os vários aspectos descritos aqui em que a pelo menos uma nu- clease específica para localização, ou um fragmento cataliticamente ativo da mesma, pode ser introduzida no sistema celular como uma se- quência de ácidos nucleicos que codifica a nuclease específica para lo- calização, ou fragmento cataliticamente ativo da mesma, em que a se- quência de ácidos nucleicos faz parte de pelo menos um vetor ou em que a pelo menos uma nuclease específica para localização, ou frag- mento cataliticamente ativo da mesma, é introduzida no sistema celular como pelo menos uma sequência de aminoácidos. Em uma modalidade, a pelo menos uma nuclease específica para localização pode ser intro- duzida como RNA traduzível. Em ainda uma outra modalidade, a pelo menos uma nuclease específica para localização pode ser introduzida como parte de um complexo juntamente com pelo menos uma biomolé- cula adicional, por exemplo, um gRNA, o gRNA sendo opcionalmente associado a um RT que compreende ou está associado à pelo menos uma sequência de ácidos nucleicos de interesse a ser introduzida no sistema celular.
[0250] Em outro aspecto da presente invenção, é fornecido um mé- todo para selecionar um fator de transcrição sintético (STF) ideal para modular, de preferência ativar, a expressão de pelo menos um gene de interesse, de preferência um gene morfogênico, em que o método com- preende (i) definir um gene de interesse; (ii) definir e fornecer pelo me- nos um domínio de reconhecimento, em que o domínio de reconheci- mento é concebido para reconhecer um sítio de reconhecimento em ou próximo do gene de interesse; (ili) definir e fornecer pelo menos um do- mínio de ativação; (iv) opcionalmente: fornecer pelo menos um ele- mento adicional, o elemento sendo selecionado a partir de pelo menos um promotor, pelo menos um NLS, pelo menos um domínio de transa- tivação e/ou pelo menos uma etiqueta (tag); (iv) fornecer pelo menos dois STFs que têm como alvo o mesmo gene de interesse; (v) medir a taxa de modulação de cada STF individual testado; (vi) selecionar o STF com a melhor taxa de moldação para um determinado gene de inte- resse. Além disso, o método descrito aqui também pode ser usado para selecionar pelo menos dois STFs ideais para modular a transcrição re- finada de pelo menos dois genes morfogênicos de interesse e aumentar a transformação e a regeneração.
[0251] De acordo com as várias modalidades fornecidas aqui e em virtude da natureza modular dos STFs, mais de um STF pode ser con- cebido para modular um determinado gene de interesse. Em virtude de problemas estereoquímicos e potenciais efeitos fora do alvo em geno- mas de eucariotas complexos, pode ser favorável fornecer STFs dife- rentes que compreendem um número diferente de domínios e uma ar- quitetura de domínio diferente, por exemplo, embaralhamento de domí- nio, ou testar um TALE versus um STF com base em CRISPR para fi- nalmente selecionar o melhor STF para um gene-alvo de sua escolha.
[0252] Em outro aspecto da presente invenção, é fornecido um mé- todo para produzir um organismo ou sistema celular haploide ou haplo- ide duplo, em que o método pode compreender as seguintes etapas: (a) fornecer um sistema celular haploide; (b) introduzir no sistema celular haploide pelo menos um fator de transcrição sintético ou uma sequência de nucleotídeos que codifica o mesmo; (c) cultivar o sistema celular ha- ploide sob condições para obter pelo menos um organismo haploide ou haploide duplo; e (d) opcionalmente: selecionar o pelo menos um orga- nismo haploide ou haploide duplo obtido na etapa (c), em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, pode compreender pelo menos um domínio de reconhecimento e pelo menos um domínio de ativação, em que o pelo menos um fator de transcrição sintético pode ser configurado para mo- dular a expressão, de preferência a transcrição, de pelo menos um gene morfogênico no sistema celular haploide.
[0253] Uma vez que os haploides são homozigóticos em todos os locais e podem representar uma nova variedade (culturas de autopolini- zação) ou uma linhagem progenitora para a produção de variedades híbridas (culturas de polinização cruzada), isto os torna tipos atraentes de células em programas de melhoramento de plantas. Além disso, os haploides são, em geral, menores e exibem menor vigor das plantas comparado com plantas doadoras de tipo selvagem e são estéreis em virtude da incapacidade de seus cromossomas de emparelhar durante a meiose. Portanto, os fatores de transcrição sintéticos e os métodos fornecidos aqui podem ser usados no desenvolvimento de células ha- ploides, sistemas e plantas celulares, uma vez que a introdução de pelo menos um fator de transcrição sintético ou uma sequência de nucleotí- deos que codifica o mesmo da presente invenção em um sistema celular haploide pode aumentar drasticamente as capacidades reprodutivas do sistema celular haploide de se transformar em um embrião haploide o qual, por sua vez, pode ser usado como base para plantas haploides e haploides duplos.
[0254] Uma célula, sistema celular ou organismo "haploide duplo" é obtido através da duplicação espontânea de cromossomas durante a etapa de cultura de uma célula ou sistema celular haploide ou através da duplicação cromossômica induzida após seleção do organismo ha- ploide obtido. Os termos "haploide duplo" e "duplamente haploide" são usados aqui de forma alternada.
[0255] Em uma modalidade, o método de produção de um orga- nismo haploide ou haploide duplo pode usar um embrião haploide como sistema celular haploide ou o pelo menos um organismo haploide ou haploide duplo pode ser obtido através de uma etapa intermediária de geração de pelo menos um embrião haploide a partir do sistema celular haploide.
[0256] Muitas células de planta têm a capacidade de regenerar um organismo completo apenas a partir de células ou tecidos individuais. Este processo é, em geral, denominado de totipotência. Uma grande variedade de células tem o potencial de se desenvolver em embriões, incluindo células gametofíticas haploides, tais como as células dos sa- cos de pólen e embriões (consulte Forster, B.P. et al. (2007) Trends Plant Sci. 12: 368- 375 e Segui-Simarro, J.M. (2010) Bot. Rev. 76: 377- 404), bem como células somáticas derivadas das três camadas tecidu- ais de uma planta (Gaj, M.D. (2004) Plant Growth Regul. 43: 27-47 ou Rose, R. et al. (2010) "Developmental Biology of Somatic Embryogene- sis" em: Plant Developmental Biology-Biotechnological Perspectives, Pua E-C e Davey MR, Eds. (Berlin Heidelberg: Springer), páginas 3-26). O desenvolvimento embrionário também ocorre na ausência de fertiliza- ção dos óvulos durante a apomixia, um tipo de desenvolvimento de se- mentes assexuadas. A totipotência em plantas apomíticas é restrita às células gametofíticas e esporofíticas que normalmente contribuem para o desenvolvimento da semente e de seus progenitores, incluindo a cé- lula-ovo não fertilizada e os tecidos esporofíticos circundantes (consulte Bicknell, R.A. e Koltunow, A.M. (2004) Plant Cell 16: S228-S245).
[0257] Particularmente, o fenômeno da totipotência das células de planta atinge sua maior expressão na cultura de tecidos, isto é, in vitro. Portanto, as etapas relevantes para a geração de haploides começam a partir de culturas de células imaturas in vitro que devem ser tratadas sob condições adequadas para induzir à embriogênese. Estas etapas geralmente são demoradas e muitas vezes bastante ineficientes, uma vez que apenas uma pequena minoria de sistemas celulares haploides cultivados amadurece para um estado morfológico e celular, opcional- mente compreendendo qualquer evento de GE adicional, da maneira desejada. Assistida pelos fatores de transcrição sintéticos e os métodos descritos aqui, a geração de sistemas haploides e/ou haploides duplos, portanto, pode ser significativamente melhorada, uma vez que os méto- dos fornecem um sistema celular que tem uma capacidade muito maior de regeneração, assegurando uma maior frequência de eventos positi- vos.
[0258] Em uma modalidade dos métodos de produção de um sis- tema ou organismo celular haploide ou haploide duplo, os métodos po- dem compreender uma etapa adicional de indução de embriogênese derivada de micrósporos. A embriogênese derivada de micrósporos é um processo único no qual o pólen haploide e imaturo (micrósporos) é induzido por um ou mais tratamentos de estresse para formar embriões em cultura. Estes embriões derivados de micrósporos podem, então, ser germinados e convertidos em plantas haploides duplas homozigóticas por agentes duplicadores de cromossomas e/ou através de duplicação espontânea. A produção de haploides duplos, conforme detalhado acima, é uma ferramenta importante nos programas de melhoramento de plantas e na descoberta de características, uma vez que permite que linhagens homozigotas sejam produzidas em uma única geração. Este caminho rápido para a homozigose não apenas reduz drasticamente o período de reprodução, mas também desmascara características con-
troladas por alelos recessivos. Os haploides duplicados são ampla- mente usados no aprimoramento das culturas como progenitores para a produção de sementes híbridas F1, para facilitar a conversão de re- trocruzamentos, para criação de mutações e gerar populações imortais para estudos de mapeamento molecular.
[0259] O termo "imaturo", conforme usado aqui no contexto de um sistema celular, se destina a significar qualquer célula ou material gené- tico imaturo obtido a partir de uma planta. Células ou sistemas celulares "imaturos" podem incluir células imaturas masculinas ou femininas ou células vegetativas imaturas. As células ou sistemas celulares femininos ou masculinos imaturos podem ser selecionados a partir de embriões imaturos ou tecido caloso imaturo, gametófito masculino, por exemplo, micrósporo ou células vegetativas, generativas ou espermatozoides do grão de pólen ou gametófitos femininos, incluindo um megásporo e seus derivados, incluindo o óvulo, os núcleos polares, a célula central, os si- nergídeos, os antípodas. O material gametófito feminino pode ser cons- tituído por um óvulo e o óvulo pode representar um sistema celular de acordo com a presente invenção. Quando um micrósporo é usado como sistema celular haploide da presente invenção, pode ser formado um calo o qual pode, então, sofrer organogênese para formar um embrião.
[0260] Métodos para obter sistemas e organismos celulares haploi- des e haploides duplos usando abordagens químicas são conhecidos por aqueles versados na técnica (consulte, por exemplo, documento WO 2015/044199 A1). De acordo com determinadas modalidades dos métodos para produzir um sistema celular haploide, os métodos podem, assim, compreender uma etapa adicional de tratamento ou cultura de um sistema celular haploide antes de introduzir no sistema celular ha- ploide pelo menos um fator de transcrição sintético, ou uma sequência de nucleotídeos que codifica o mesmo da presente invenção, em que a etapa adicional de tratamento ou cultura pode compreender a adição de um inibidor de histona desacetilase ou pelo menos um produto químico ao sistema celular em desenvolvimento. Um inibidor de histona desace- tilase (HDACI) é, de preferência, um composto que é capaz de interagir com uma histona desacetilase e inibir sua atividade enzimática, deste modo, reduzindo a capacidade de uma histona desacetilase de remover um grupo acetila de uma histona e pode incluir, por exemplo, ácidos hidroxâmicos (exceto ácido salicil hidroxâmico), tetrapeptídeos cíclicos, ácidos alifáticos, benzamidas, polifenóis ou cetonas eletrofílicas, tricos- tatina A (TSA), ácido butírico, sal butirato, butirato de potássio, butirato de sódio, butirato de amônio, butirato de lítio, fenilbutirato de sódio, fe- nilbutirato ou n-butirato de sódio, em que o termo ácido butírico, no con- texto do presente relatório descritivo, não inclui ácido isobutírico ou ácido a,B-diclorobutírico ou ácido suberoilanilida hidroxâmico, todos compostos comercialmente disponíveis.
[0261] Em outra modalidade, o estresse físico pode ser aplicado ao sistema ou organismo celular haploide. O estresse físico pode ser qual- quer temperatura, escuridão, luz ou radiação ionizante, por exemplo. À luz pode ser luz solar de espectro total ou uma ou mais frequências se- lecionadas a partir do espectro visível, infravermelho ou UV. Um ou mais estresses físicos ou combinações de estresses podem ser usados. Os estresses podem ser contínuos ou interrompidos (periódicos); regulares ou aleatórios ao longo do tempo. Quando os estresses são combinados ao longo do tempo, eles podem ser simultâneos (coterminais ou parci- almente sobrepostos) ou separados.
[0262] Em uma outra modalidade, uma etapa adicional de adição de estresse químico pode ser aplicada nos métodos da presente inven- ção. Assim, o desenvolvimento embrionário haploide ou a embriogê- nese por micrósporos, a embriogênese de pólen ou a androgênese po- dem, portanto, ser adicionalmente induzidos pela exposição de anteras ou gametófitos isolados ao estresse abiótico ou químico durante a cul- tura in vitro (Touraev, A. et al. (1997) Trends Plant Sci. 2: 297 -302).
[0263] Em uma outra modalidade, o método de produção de um sis- tema ou organismo celular haploide pode compreender uma etapa adi- cional de gerar pelo menos um sistema ou organismo celular haploide duplicado a partir do sistema celular haploide.
[0264] Em ainda uma outra modalidade, o método de produção de um sistema ou organismo celular haploide ou haploide duplo pode com- preender uma etapa adicional de geração de mudas a partir de pelo menos um sistema ou organismo celular haploide ou a partir de pelo menos um sistema ou organismo celular haploide duplicado. A capaci- dade dos embriões haploides de se converter espontaneamente ou após tratamento com agentes duplicadores de cromossomas em plan- tas duplamente haploides é amplamente explorada e conhecida por aqueles versados na técnica (Touraev, A. et al. (1997) Trends Plant Sci. 2: 297-302; Forster et a/. (2007) supra). Em determinadas modalidades, a embriogênese haploide e a duplicação de cromossomas podem ocor- rer de modo substancialmente simultâneo. Em outras modalidades, pode haver um retardo de tempo entre a embriogênese haploide e a duplicação cromossômica. O retardo de tempo pode estar relacionado ao estágio de desenvolvimento alcançado pelo embrião, plântula ou muda haploide em crescimento. O crescimento de mudas haploides, plantas ou plântulas não envolve um evento de duplicação do cromos- soma espontânea, em seguida, um agente químico de duplicação do cromossoma pode ser usado de acordo com procedimentos com os quais aqueles versados na técnica estarão familiarizados. Os agentes de duplicação de cromossomas e a duplicação de cromossomas ade- quados de acordo com os vários aspectos e modalidades da presente invenção são fornecidos em Segui-Simarro J. M., & Nuez F. (2008) Cytogenet. Genome Res. 120: 358 — 369). Agentes de duplicação de cromossomas adequados incluem, por exemplo, colchicina, agentes anti-microtúbulos ou herbicidas anti-microtúbulos, tais como pronamida, óxido nitroso ou qualquer inibidor mitótico. Onde a colchicina é usada, a concentração no meio pode ser geralmente 0,01 % - 0,2 % ou aproxi- madamente 0,05 % ou APM (5-225 UM). A faixa de concentração de colchicina pode ser a partir de cerca de 400 - 600 mg/L ou cerca de 500 mg/L. Onde pronamida é usada, a concentração média pode ser cerca de 0,5-20 uM. Outros agentes, tais como DMSO, adjuvantes ou tenso- ativos, podem ser usados com os inibidores mitóticos para melhorar a eficiência de duplicação. Os nomes comuns ou comerciais de agentes duplicadores de cromossomas adequados incluem: colchicina, deriva- dos de ácido acetiltrimetilcolchicínico, carbetamida, cloroprofame, pro- fame, pronamida/propizamida tebutam, clortal dimetila (DCPA), Di- camba/dianat/disugran (dicamba-metila) (BANVEL, CLARITY), benflu- ralina/benefina/(BALAN), butralina, cloralina, dinitramina, etalfluralina (Sonalan), flucloralina, isopropalina, metalpropalina, nitralina, orizalina (SURFLAN), pendimetalina, (PROWL), prodiamina, profluralina, triflura- lina (TREFLAN, TRIFIC, TRILLIN), AMP (Amiprofos metila); amiprofós- metila Butamifós, Ditiopir e Tiazopir. O resultado da aplicação dos ditos agentes é uma célula ou um sistema celular ou organismo haploide du- plo homozigótico.
[0265] Em uma modalidade dos métodos acima, pelo menos um fa- tor de transcrição sintético, ou uma sequência que codifica o mesmo, pode ser introduzido no sistema celular haploide através de meios inde- pendentemente selecionados a partir de meios biológicos e/ou físicos, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de preferência por Agrobacterium tumefaciens, um vetor viral, bombardeamento biolístico, transfecção usando agentes quíi- micos, incluindo transfecção com polietileno glicol ou qualquer combi- nação dos mesmos.
[0266] Na modalidade preferida, o método de fornecer um sistema ou organismo celular haploide ou haploide duplo pode usar pelo menos um fator de transcrição sintético que compreende pelo menos um domí- nio de reconhecimento e pelo menos um domínio de ativação, conforme descrito aqui acima, em que as ditas modalidades e aspectos relaciona- dos ao fator de transcrição sintético da presente invenção podem ser empregados para fornecer métodos otimizados para a obtenção de um sistema ou organismo celular haploide ou duplamente haploide.
[0267] Os genes morfogênicos preferidos a serem modificados de acordo com os métodos descritos aqui podem ser selecionados a partir do grupo que consiste em BBM, WUS, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKD4. Genes morfogênicos mais preferidos a serem modificados de acordo com os métodos descritos aqui podem ser um gene que compreende uma sequência de nucleotídeos selecionada a partir do grupo que consiste em (i) uma sequência de nucleotídeos apre- sentada em qualquer uma de SEQ ID NOs: 199 a 237, (li) uma sequên- cia de nucleotídeos que tem as sequências codificadoras das sequên- cias de nucleotídeos apresentadas em qualquer uma de SEQ ID NOs: 199 a 237, (iii) uma sequência de nucleotídeos complementar à sequên- cia de nucleotídeos de (i) ou (ii), (iv) uma sequência de nucleotídeos que tem pelo menos 50 %, 60 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade, de preferência em todo o comprimento, com a sequência de nucleotídeos de (i), (ii) ou (iii), (v) uma sequência de nucleotídeos que hibridiza à se- quência de nucleotídeos de (iii) sob condições rigorosas, (vi) uma se- quência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258, (vii) uma sequência de nucleotídeos que codifica uma proteína que compreende a sequência de aminoácidos 50 %, 60 %, 70
%, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % idêntica a uma sequência apresentada em qualquer uma de SEQ ID NOs: 238 a 258 ou (viii) uma sequência de nucleotídeos que codifica um homólogo, análogo ou ortólogo de proteína que com- preende a sequência de aminoácidos apresentada em qualquer uma de SEQ ID NOs: 238 a 258.
[0268] Em uma modalidade, o pelo menos um sistema celular ha- ploide pode ser selecionado a partir do grupo que consiste em pelo me- nos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota pode ser pelo menos uma célula de planta e/ou em que o em pelo menos um organismo eucariota pode ser uma planta ou parte de uma planta.
[0269] Em uma outra modalidade, pelo menos uma parte da planta pode ser selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pó- len, tubos de pólen, outros filamentos, óvulos, sacos embrionários, óvu- los, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, pericílios e sementes.
[0270] Em uma outra modalidade, a célula de planta, a pelo menos uma planta ou parte de uma planta é originária de uma espécie de planta que pode ser selecionada a partir do grupo que consiste em Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australien- sis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Dau- cus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana to- mentosiformis, Nicotiana tabacum, Solanum Iycopersicum, Solanum tu- berosum, Coffea canephora, Vitis vinifera, Erythrante gquttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabi- dopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihima- laya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Bras- Sica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Bras- sica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha cur- cas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus ca- janifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, As- tragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum e Allium tuberosum.
[0271] Em um aspecto da presente invenção, pelo menos um sis- tema celular, pelo menos um sistema celular haploide e/ou pelo menos um sistema ou organismo celular haploide ou haploide duplo (d) podem ser fornecidos obtidos por meio dos métodos descritos aqui usando pelo menos um fator de transcrição sintético que modula especificamente a transcrição de pelo menos um gene morfogênico de interesse. O sis- tema celular obtido pode, então, ser usado para outros métodos de edi- ção genômica conforme usado aqui ou para regenerar uma planta a par- tir do sistema celular modificado.
[0272] Em um aspecto da presente invenção, é fornecido um mé- todo ou uso com base em um fator de transcrição sintético, ou uma se- quência que codifica o mesmo, de acordo com os vários métodos des- critos aqui.
[0273] Em virtude do caráter modular dos fatores de transcrição sin- téticos descritos aqui, também pode ser fornecido pelo menos um fator de transcrição sintético que compreende pelo menos um domínio de re- conhecimento conforme descrito aqui e que compreende ainda um do- mínio de silenciamento. O domínio de silenciamento, deste modo, subs- titui o domínio de ativação para fornecer um fator de transcrição sintético altamente específico para modular, neste cenário reduzir, a transcrição de um gene de interesse.
[0274] A repressão da transcrição em eucariotas é conseguida atra- vés de "silenciadores", dos quais há diferentes tipos, a saber, "elemen- tos silenciadores" e "elementos reguladores negativos" (Negative Regu- latory Elements, NREs). Os elementos silenciadores são elementos clássicos independentes de posição que controlam um mecanismo de repressão ativo e os NREs são elementos dependentes de posição que controlam um mecanismo de repressão passiva. Além disso, os "repres- sores" são fatores de transcrição de ligação a DNA que interagem dire- tamente com os silenciadores. O silenciador em si e seu contexto dentro de um determinado promotor, em vez do repressor de interação, geral- mente determina o mecanismo de repressão. Os silenciadores formam uma parte intrínseca de muitos promotores eucariotas e, portanto, são altamente importantes para a regulação de genes em eucariotas, inclu- indo células de planta e animais. Elementos silenciadores podem estar localizados na direção 5' ou 3' em relação a um sítio de início de trans- crição.
[0275] Portanto, os fatores de transcrição sintéticos da presente in- venção, ou uma sequência de nucleotídeos que codifica os mesmos, também podem compreender pelo menos um domínio de reconheci- mento e pelo menos um domínio de silenciamento, em que o fator de transcrição sintético é configurado para modular a expressão de um gene morfogênico em uma célula ou sistema celular de interesse, de preferência em uma célula de planta.
[0276] Em um aspecto, é fornecido um método para a produção de um sistema ou organismo celular transgênico que compreende a reali- zação de qualquer método conforme detalhado aqui, em que o método compreende ainda a regeneração de um sistema ou organismo celular que compreende pelo menos uma sequência de nucleotídeos de inte- resse como um transgene. Um "transgene", neste contexto, se refere a qualquer sequência de ácidos nucleicos introduzida artificialmente em uma célula, sistema celular ou organismo.
[0277] De acordo com determinadas modalidades, o método para a produção de um sistema ou organismo celular transgênico pode, de pre- ferência, usar os fatores de transcrição sintéticos conforme descrito aqui para obter uma frequência de transformação e/ou taxa de regeneração mais alta deste material transformado.
[0278] Em ainda outro aspecto, é fornecido um método para a pro- dução de um sistema celular ou organismo geneticamente modificado, em que o método pode compreende realização de um método de modi- ficação do material genético de um sistema celular em uma localização predeterminada detalhada aqui acima, em que o método compreende ainda a regeneração de um sistema ou organismo celular que compre- ende uma modificação em uma localização predeterminada no material genético do sistema ou organismo celular. Novamente, os ditos méto- dos dependem do uso de um fator de transcrição sintético de acordo com os vários aspectos e modalidades da presente invenção. Este as- pecto pode ser usado vantajosamente para a introdução transitória de pelo menos uma construção ou material genético em uma célula ou sis- tema celular de interesse para modificar a transcrição de um gene de interesse, de preferência um gene morfogênico, de uma maneira direci- onada para aumentar a capacidade de regeneração da célula alvo ou sistema celular ao abrigar potencialmente uma inserção e/ou eliminação e/ou edição. Isto, por sua vez, diminui drasticamente o número de célu- las a serem rastreadas quanto a uma modificação ou edição genética positiva.
[0279] Em uma modalidade de acordo com os vários aspectos da presente invenção, a pelo menos uma sequência de ácidos nucleicos de interesse pode ser fornecida como parte de pelo menos um vetor ou como pelo menos uma molécula linear. Em outro aspecto, a pelo menos uma sequência de ácidos nucleicos de interesse pode ser fornecida como um complexo, de preferência um complexo que associa fisica- mente a pelo menos uma sequência de ácidos nucleicos e outro RT e/ou com um gRNA e/ou com uma nuclease específica para localização. À pelo menos uma sequência de ácidos nucleicos de interesse pode ainda compreender uma sequência que permite a rastreabilidade rápida, in- cluindo a rastreabilidade visual, da sequência de interesse, por exem- plo, uma etiqueta (tag), incluindo uma etiqueta (tag) fluorescente. A pelo menos uma sequência de ácidos nucleicos de interesse pode ser fita dupla, fita simples ou uma mistura das mesmas. Além disso, a pelo me- nos uma sequência de ácidos nucleicos de interesse pode compreender uma mistura de nucleotídeos de DNA e RNA, incluindo também nucleo- tídeos sintéticos, isto é, nucleotídeos de ocorrência não natural. Métodos de Distribuição e Analíticos:
[0280] Qualquer método de distribuição adequado para introduzir pelo menos uma biomolécula em uma célula ou sistema celular pode ser aplicado, dependendo da célula ou sistema celular de interesse. O termo "introdução", conforme usado aqui implica, portanto, um trans- porte funcional de uma biomolécula ou construção genética (DNA, RNA, proteína fita simples ou dupla que compreende componentes naturais e/ou sintéticos ou uma mistura dos mesmos) para pelo menos uma cé- lula ou sistema celular, permitindo a transcrição e/ou tradução e/ou a atividade catalítica e/ou a atividade de ligação, incluindo ligação de uma molécula de ácidos nucleicos à outra molécula de ácidos nucleicos, in- cluindo DNA ou RNA, ou ligação de uma proteína a um estrutura alvo dentro de pelo menos uma célula ou sistema celular e/ou a atividade catalítica de uma enzima introduzida, opcionalmente após transcrição e/ou tradução. Quando pertinente, uma integração funcional de uma construção genética pode ocorrer em um determinado compartimento celular de pelo menos uma célula, incluindo o núcleo, o citosol, as mito- côndrias, o cloroplasto, o vacúolo, a membrana, a parede celular e as- sim por diante. Consequentemente, o termo "integração funcional" im- plica que um complexo molecular de interesse seja introduzido em pelo menos uma célula ou sistema celular através de qualquer meio de trans- formação, transfecção ou transdução através de meios biológicos, in- cluindo transformação por Agrobacterium, ou meios físicos, incluindo bombardeamento de partículas, bem como a etapa subsequente, em que o complexo molecular pode exercer seu efeito dentro ou sobre pelo menos uma célula na qual ele foi introduzido, independentemente da construção ou complexo ser introduzido de maneira estável ou transitó- ria.
[0281] De acordo com as várias modalidades, o pelo menos um STF de acordo com a presente invenção pode, assim, ser fornecido na forma de pelo menos um vetor, por exemplo, um vetor de plasmídeo, como pelo menos uma molécula linear ou como pelo menos um complexo pré- montado ex vivo.
[0282] Dependendo da natureza da construção genética ou biomo- lécula a ser introduzida, o dito efeito naturalmente pode variar e incluir, individualmente ou em combinação, inter alia, a transcrição de um DNA codificado pela construção genética em um ácido ribonucleico, a tradu- ção de um RNA em uma sequência de aminoácidos, a atividade de uma molécula de RNA dentro de uma célula que compreende a atividade de um RNA guia, um crRNA, um tracrRNA ou um miRNA ou um siRNA para uso em interferência de RNA e/ou uma atividade de ligação, incluindo ligação de uma molécula de ácidos nucleicos à outra molécula de ácidos nucleicos, incluindo DNA ou RNA, ou ligação de uma proteína a uma estrutura-alvo dentro de pelo menos uma célula ou incluindo a integra-
ção de uma sequência distribuída via um vetor ou uma construção ge- nética, de forma transitória ou estável. O dito efeito também pode com- preender a atividade catalítica de uma sequência de aminoácidos que representa uma enzima ou uma porção cataliticamente ativa da mesma dentro de pelo menos uma célula e assim por diante. O dito efeito al- cançado após a integração funcional do complexo molecular de acordo com a presente invenção pode depender da presença de sequências reguladoras ou sequências de localização que são compreendidas pela construção genética de interesse, conforme é conhecido por aqueles versados na técnica.
[0283] Uma variedade de técnicas de distribuição transitória e está- vel adequadas, de acordo com os métodos da presente invenção, para a introdução de material genético, biomoléculas, incluindo qualquer tipo de DNA e/ou RNA fita simples e dupla ou aminoácidos, substâncias sin- téticas ou químicas, em uma célula eucariota, de preferência em uma célula de planta ou em um sistema celular que compreende material genético de interesse, é conhecida por aqueles versados na técnica e compreendem, inter alia, a escolha de técnicas de distribuição direta que vão desde o tratamento de protoplastos com polietileno glicol (PEG) (Potrykus et al. 1985), procedimentos tais como eletroporação (D' Halluin et a/., 1992), microinjeção (Neuhaus et a/., 1987), a tecnologia Whisker de fibras de carboneto de silício (Kaeppler et a/., 1992), abor- dagens mediadas por vetores virais (Gelvin, Nature Biotechnology 23, "Viral-Mediated Plant Transformation Gets a Boost", 684-685 (2005)) e bombardeamento de partículas (consulte, por exemplo, Sood et al., 2011, Biologia Plantarum, 55, 1-15). A transfecção transitória de células de mamífero com PEI é descrita em Longo et al., Methods Enzymol., 2013, 529: 227-240. Protocolos para transformação de células de ma- míferos são descritos em Methods in Molecular Biology, Nucleic Acids or Proteins, ed. John M. Walker, Springer Protocols.
[0284] Para que as células de planta sejam modificadas, apesar dos métodos de transformação com base em abordagens biológicas, tal como transformação de Agrobacterium ou transformação de plantas mediada por vetores virais, e métodos com base em métodos de distri- buição física, tais como bombardeamento de partículas ou microinjeão, evoluíram como técnicas importantes para introduzir material genético em uma célula de planta ou tecido de interesse. Helenius et al. "Gene delivery into intact plants using the Helios TM Gene Gun", Plant Molecu- lar Biology Reporter, 2000, 18 (3): 287-288) descrevem um bombarde- amento de partículas como um método físico para introduzir material em uma célula de planta.
[0285] Atualmente, portanto, há uma variedade de métodos de transformação de plantas para introduzir material genético na forma de uma construção genética em uma célula de planta ou sistema celular de interesse que compreende meios biológicos e físicos conhecidos por aqueles versados no campo de biotecnologia de plantas que são apli- cáveis às várias técnicas de introdução de biomoléculas ou seus com- plexos de acordo com a presente invenção. Particularmente, os ditos métodos de distribuição para transformação e transfecção podem ser aplicados para introduzir as ferramentas da presente invenção simulta- neamente. Um meio biológico comum é a transformação com Agrobac- terium spp. que tem sido usado há décadas para uma variedade de di- ferentes materiais vegetais. A transformação de plantas mediada por vetores virais representa uma estratégia adicional para a introdução de material genético em uma célula de interesse. Os meios físicos que en- contram aplicação em biologia de plantas são o bombardeamento de partículas, também denominado transfecção biolística ou transferência de genes mediada por micropartículas, o qual se refere a um método de distribuição física para transferir uma micropartícula ou nanopartícula revestida que compreende um ácido nucleico ou uma construção gené- tica de interesse para uma célula alvo ou tecido. Os meios de introdução física são adequados para introduzir ácidos nucleicos, isto é, RNA e/ou DNA, e proteínas. Da mesma forma, há métodos específicos de trans- formação ou transfecção para introduzir especificamente um ácido nu- cleico ou uma construção de aminoácidos de interesse em uma célula de planta, incluindo eletroporação, microinjeção, nanopartículas e pep- tídeos de penetração celular (Cell-Penetrating Peptides, CPPs). Além disso, há métodos de transfecção com base em produtos químicos para introduzir construções genéticas e/ou ácidos nucleicos e/ou proteínas que compreendem, inter alia, transfecção com fosfato de cálcio, trans- fecção usando lipossomas, por exemplo, lipossomas catiônicos, ou transfecção com polímeros catiônicos, incluindo DEAD-dextrana ou po- lietilenimina ou combinações dos mesmos. Os ditos métodos de distri- buição e veículos de distribuição ou cargas diferem inerentemente das ferramentas de distribuição usadas para outras células eucariotas, in- cluindo células animais e de mamíferos, e pode ser necessário que todo método de distribuição seja especificamente ajustado e otimizado para uma construção de interesse para introduzir e/ou modificar o material genético de pelo menos um sistema celular, célula de planta, tecido, órgão ou planta inteira; e/ou ela pode ser introduzida em um comparti- mento específico de uma célula alvo de interesse de uma maneira total- mente funcional e ativa.
[0286] As técnicas de distribuição acima, individualmente ou em combinação, podem ser usadas para abordagens in vivo (in planta) ou in vitro. De acordo com as várias modalidades da presente invenção, diferentes técnicas de distribuição podem ser combinadas entre si, si- multânea ou subsequentemente, por exemplo, usando uma transfecção química para o pelo menos o fator de transcrição sintético, ou a sequên- cia que codifica o mesmo, uma nuclease específica para localização, ou um mRNA ou DNA que codifica a mesma, e opcionalmente moléculas adicionais, por exemplo, um gRNA, entretanto é combinado com o for- necimento transitório de inativações (parciais) usando uma técnica com base em Agrobacterium.
[0287] Um fator de transcrição sintético da presente invenção pode, assim, ser introduzido juntamente com, antes ou posteriormente à trans- formação e/ou transfecção de ferramentas relevantes para induzir uma edição genômica direcionada e/ou outros produtos químicos para indu- zir ao desenvolvimento de haploides ou haploides duplos.
[0288] Da mesma forma, métodos para analisar um evento bem su- cedido de transformação ou transfecção de acordo com a presente in- venção são conhecidos por aqueles versados na técnica e compreen- dem, porém sem limitações, reação em cadeia da polimerase (Polyme- rase Chain Reaction, PCR) incluindo, dentre outros, PCR quantitativa em tempo real, PCR multiplex, RT-PCR, PCR agrupada, PCR analítica e assim por diante, microscopia, incluindo microscopia de campo claro e escuro, coloração por dispersão, contraste de fase, fluorescência con- focal, contraste de interferência diferencial, deconvolução, microscopia eletrônica, microscopia UV, microscopia IR, sonda de varredura por mi- croscopia, análise de metabólitos vegetais ou de células de planta, aná- lise de RNA, análise de proteoma, ensaios funcionais para determinar uma integração funcional, por exemplo, de um gene marcador ou de um transgene de interesse ou uma análise de Southern-Blot, sequencia- mento, incluindo sequenciamento de próxima geração, incluindo se- quenciamento profundo ou sequenciamento multiplex, e assim por di- ante, e combinações dos mesmos.
[0289] Em ainda outra modalidade do aspecto acima, de acordo com a presente invenção, a introdução de uma construção de interesse é conduzida usando meios físicos e/ou biológicos selecionados a partir do grupo que consiste em um dispositivo adequado para bombardea- mento de partículas, incluindo uma pistola gênica, incluindo uma canhão genético manual (por exemplo, Helios& Gene Gun System, BIO-RAD) ou canhão genético estacionário, transformação, incluindo transforma- ção usando Agrobacterium spp. ou usando um vetor viral, microinjeção, eletroporação, a tecnologia Whisker, incluindo a tecnologia Whisker de carboneto de silício, e transfecção ou uma combinação dos mesmos.
[0290] A prática dos métodos descritos emprega, a menos que indi- cado de outra forma, técnicas convencionais em biologia molecular, bi- oquímica, genética, química computacional, cultura de células, DNA re- combinante e campos relacionados, conforme dentro da técnica. Estas técnicas são totalmente explicadas na literatura. Consulte, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Segunda edição, Cold Spring Harbor Laboratory Press, 1989; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 e atualizações periódicas; e a série METHODS IN ENZYMOLOGY, Academic Press, San Diego.
[0291] A presente invenção é ainda descrita com referência aos exemplos não limitativos a seguir. Exemplos Exemplo 1: Fatores de transcrição TAL para expressão transitória de genes morfogênicos endógenos em Zea mays (Zm)
[0292] Em um exemplo, fatores de transcrição de TAL concebidos e construídos comercialmente são usados para aumentar transitoria- mente a expressão de BBM e WUS. Os fatores de transcrição TAL são concebidos por se ligar a cerca de 24 pb da região reguladora de BBM apresentada em SEQ ID NO: 95, 109-147 e 217-219 e/ou cerca de 18 pb da região reguladora de WUS apresentada em SEQ ID NO: 96, 148 a 190 (consulte Figuras 3A e B). Os domínios de reconhecimento no fator de transcrição TAL para BBM compreendem uma sequência apre- sentada em SEQ ID NOs: 13 a 51 e/ou o domínio de reconhecimento no fator de transcrição TAL para WUS compreende uma sequência apresentada em SEQ ID NO: 52 a 94.
[0293] As sequências do efetor TAL podem ser concebidas e clona- das, e um domínio de ativação do Herpes simplex (VP16 ou VP64 tetra- mérica) pode ser adicionado às construções de maneira similar à prote- ína de fusão.
[0294] A indução transitória de expressão é primeiro testada em protoplastos de milho por meio de transformação mediada por PEG e PCR quantitativa de transcriptase reversa ou transferência de Western contra o MRNA ou proteína ZNBBM e ZMWUS, respectivamente. Para fazer isto, 20 ug de DNA do plasmídeo que codifica os fatores de trans- crição TALE foram distribuídas a aproximadamente 600.000 protoplas- tos por meio de um sistema de transformação com base em PEG comu- mente conhecido na técnica (consulte Figura 4). Os experimentos foram realizados em triplicatas e repetidos quatro vezes (réplicas biológicas). 24 horas após a transformação, o RNA foi extraído e convertido em cDNA usando um kit comercialmente disponível. A expressão de ZmMWUS e ZmMBBM endógenos foi, então, determinada usando uma abordagem SYBR Green gRT-PCR. Os resultados indicam claramente que os fatores de transcrição sintéticos TALE1 (SEQ ID NO: 151) e TALES (SEQ ID NO: 218) são capazes de induzir à expressão do gene endógeno de WUS (indução de 60 vezes) e BBM (indução de 490 ve- zes), respectivamente (consulte Figuras 4A e 4B).
[0295] Em seguida, a função fenotípica da expressão transitória de ZmWUS induzida por fatores de transcrição TALE foi testada em tecido regenerável (consulte a Figura 5). Portanto, células individuais de tecido caloso do milho A188 foram transformadas por meio de bombardea- mento de partículas com o marcador fluorescente tdT, TALE1 e PLT7
(construção de expressão PLT7, consulte também Figura 6; sequências de PLT7: cDNA: SEQ ID NO: 273; sequência de aminoácidos: SEQ ID NO: 274). A indução da proliferação celular foi confirmada por meio de microscopia fluorescente após detecção do sinal fluorescente vermelho de tdTomato (consulte Figura 5, círculo branco e seta). Os resultados indicam claramente que fatores de transcrição TALE são capazes de induzir à regeneração e embriogênese através de expressão transitória de WUS e/ou BBM.
[0296] Além disso, PCR quantitativa de transcriptase reversa ou uma transferência de Western usando um anticorpo específico contra o MRNA ou proteína ZNBBM e ZmMWUS, respectivamente, indicam liga- ção entre a expressão e o fenótipo embriogênico. O comportamento transitório da expressão pode ser detectado por PCR de transcriptase reversa ou transferência de Western contra o mMRNA ou proteína ZMmMBBM e ZmMWUS, respectivamente, ao longo do tempo. Exemplo 2: Proteína de fusão entre uma nuclease CRISPR não funci- onal e um domínio de ativação para expressão transitória de genes mor- fogênicos endógenos em Zea mays
[0297] Similar ao Exemplo 1, é concebida uma construção para dis- tribuição transitória, neste caso, expressando uma dCas9 (variantes de PAM disponíveis) ou dCpf1 (variantes de PAM disponíveis) como uma proteína de fusão com um domínio de ativação como VP16 ou VP64. Os sítios/regiões reguladoras alvo potenciais incluem: Sequências alvo de Cas9 para ZnBBM apresentadas em SEQ ID Nos: 97 a 99; sequên- cias alvo de Cpf1 para ZnBBM apresentadas em SEQ ID Nos: 100 a 102; sequências alvo de Cas9 para ZMWUS?2 apresentadas em SEQ ID NOs: 103 a 105; sequências alvo de Cpf1 para ZnWUS?2 apresentadas em SEQ ID Nos: 106 a 108.
[0298] Com base nas regiões reguladoras descritas acima para CRISPR/dCas9 e CRISPR/dCpf1, os sistemas de fator de transcrição com base em CRISPR podem ser concebidos e obtidos comercialmente com um domínio de reconhecimento que compreende uma sequência apresentada em SEQ ID NOs: 1 a 12.
[0299] A indução transitória de expressão é primeiro testada em protoplastos de milho por meio de transformação mediada por PEG e PCR quantitativa de transcriptase reversa ou transferência de Western contra o MRNA ou proteína ZnBBM e ZmMWUS, respectivamente. A fun- ção fenotípica da expressão transitória de ZMBBM e ZmMWUS é, então, testada em tecido regenerável, tal como calos ou embriões imaturos, tanto pela distribuição de partículas quanto pela transformação mediada por Agrobacterium. A indução bem-sucedida de embriogênese é reco- nhecível por aqueles versados na técnica. Além disso, PCR quantitativa de transcriptase reversa ou transferência de Western contra o MRNA ou proteína ZNBBM e ZmMWUS, respectivamente, indicam ligação entre a expressão e o fenótipo embriogênico.
[0300] O comportamento transitório da expressão pode ser detec- tado por PCR de transcriptase reversa ou transferência de Western con- tra o MRNA ou proteína ZNBBM e ZmMWUS, respectivamente, ao longo do tempo. Exemplo 3: Substituição do domínio de ativação para expressão otimi- zada de genes morfogênicos
[0301] Este exemplo foi concebido para testar o comportamento de diferentes domínios de ativação descritos anteriormente, de maneira sistemática. Isto permitirá avaliar seu efeito sobre o nível de expressão de ZMWUS e ZmMBBM. Conforme detalhado acima, diferentes STFs para um gene-alvo específico de interesse podem compreender diferen- tes domínios de ativação e de reconhecimento e outros elementos. Por- tanto, pode ser muito adequado conceber diferentes STFs para um mesmo alvo para definir o melhor STF para modular um gene de inte- resse.
[0302] O domínio de ativação natural dos genes efetores TAL de Xanthomonas oryzae é o domínio de ativação mais óbvio para uso com fatores de transcrição de TAL, e também representa um domínio de ati- vação, o qual pode ser usado individualmente ou em combinação, de acordo com os vários aspectos da presente invenção, mas também foi usado em outros ambientes. Eles pertencem a uma família de domínios de ativação ácidos (transcricionais).
[0303] Outros domínios de ativação disponíveis foram testados an- teriormente em sistemas de células de mamíferos e insetos (Chavez, Alejandro et al. "Comparative Analysis of Cas9 Activators Across Multi- ple Species", Nature Methods 13.7 (2016): 563-567. PMC. Web. 22 de setembro 2017), mas pouco se sabe sobre os domínios de ativação ide- ais em um fator de transcrição sintético a ser usado em um sistema ve- getal para uso específico em modulação da transcrição de um gene morfogênico de interesse.
[0304] Neste exemplo, VP16 ou VP64 dos EXEMPLOS 1 e 2 é substituído por um ou outro de VPR, SAM, Scaffold, Suntag, P300, VP160 ou uma combinação de pelo menos dois destes fatores ou VP16 e VP64 tanto no N- como no C-término ou ambas as extremidades ter- minais da cadeia de aminoácidos.
[0305] A avaliação da eficácia dos domínios ativadores em conjunto com um TAL ou dCas9 é feita através de PCR quantitativa de transcrip- tase reversa ou transferência de Western contra os genes ativados ZmMBBM e ZmMWUS, porém, é finalmente avaliada pela resposta fenotí- pica em calos ou embriões imaturos. Exemplo 4: Substituição do domínio de reconhecimento para maior va- riabilidade e flexibilidade de direcionamento
[0306] Neste exemplo, TAL, dCas9 ou dCpf1 dos Exemplos 1,2 e 3 são substituídos por um domínio de dedo de zinco específico para sequência ou endonuclease "homing". Como uma proteína de fusão com o domínio de ativação ideal identificado no Exemplo 3, é possível combinar múltiplos ativadores de transcrição que provocam diferentes intensidades de expressão para diferentes genes. Confiar unicamente em um sistema dCas9, por exemplo, poderia não permitir o direciona- mento específico de domínios de ativação (pelo menos para determina- dos genes de interesse), uma vez que a dCas9 ou dCpf1 não confere especificidade suficiente na ligação ao saRNA. Especificamente, os sis- temas dCas9 e dCpf1 são limitados pela especificidade quando ao sítio alvo, uma vez que requerem um motivo PAM específico na região regu- ladora de um gene-alvo, o qual pode não estar presente em pelo menos determinados genes de interesse (Gao, L., et al. (2017). "Engineered Cpf1 Variants with Altered PAM Specificities", Nat Biotech; e Kleinstiver, B. P., et al. (2015). "Engineered CRISPR-Cas9 Nucleases with Altered PAM Specificities", Nature 523(7561): 481-485)). Pelo contrário, os fa- tores de transcrição de TAL geralmente requerem uma T inicial para o reconhecimento do sítio alvo. Portanto, a fim de melhorar a ligação às regiões reguladoras de um gene-alvo específico de interesse que é difí- cil de acessar, por exemplo, com um STF TAL, pode-se substituir o do- mínio de reconhecimento TAL por um sistema com base em dCpf1i de modo a diminuir a distância ideal para o ATG ou para identificar uma faixa alvo mais ampla para obter uma ativação transcricional aprimo- rada. Além disso, as informações obtidas pelos experimentos descritos aqui podem ser usadas para conceber e combinar diferentes sistemas STF para diferentes regiões reguladoras endógenas a fim de melhorar a ativação transcricional de pelo menos um gene-alvo de interesse.
[0307] Uma outra opção para melhorar a especificidade pelo sítio- alvo e ativação da transcrição é o uso combinado de pelo menos dois domínios de reconhecimento específico para a mesma região regula- dora do mesmo gene-alvo de interesse (Bolukbasi, M. F., et al. (2015).
"DNA-Binding-Domain Fusions Enhance the Targeting Range and Pre- cision of Cas9", Nat Meth 12(12): 1150-1156).
[0308] A avaliação dos domínios de reconhecimento adicionais em conjunto com os ativadores do Exemplo 3 seria novamente realizada primeiro por PCR quantitativa de transcriptase reversa ou transferência de Western contra os genes ativados ZNBBM e ZmWUS. Por fim, eles são avaliados pela resposta fenotípica em calos ou embriões imaturos. Exemplo 5: Alvos gênicos morfogênicos e embriogênicos, além de ZmMBBM e ZMWUS
[0309] Múltiplos genes foram descritos nos quais a superexpressão transitória em calos ou embriões imaturos, mas também em folhas ou outros tecidos, causou indução de embriogênese. Estes genes ou ho- mólogos dos mesmos são, individualmente ou de forma combinada, usados com os ativadores transcricionais nos Exemplos 1 a 4. A lista inclui, porém sem limitações, genes WOX, outros homólogos de WUS e BBM, LEC1 e LEC2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT e IPT2, Knotted1 e RKD4 (consulte, por exemplo, Figura 5). De preferência, o fator de transcrição sintético concebido para regular um dos genes mor- fogênicos descritos aqui compreende uma fusão de pelo menos dois domínios de ativação para conferir propriedades ideais de reconheci- mento que não podem ser alcançadas com um domínio de ativação (por exemplo, dCas9 ou dCpf1) apenas. Além disso, os pelo menos dois do- mínios de ativação são adequadamente posicionados para evitar impe- dimentos estéricos e permitir uma alta taxa de ativação. Exemplo 6: Aplicação de ativadores da transcrição para genes morfo- gênicos e embriogênicos em beterraba sacarínica e trigo
[0310] Os processos descritos nos Exemplos 1 a 5 podem ser trans- feridos para todas as culturas relevantes que possuem um protocolo de transformação que envolve uma etapa de regeneração in vitro ou cultura tecidual. Todos os procedimentos e etapas de otimização, bem como os genes alvo e seus homólogos, incluindo os protocolos de avaliação des- critos nos Exemplos 1 a 5, podem ser transferidos para outros sistemas de cultivo. As sequências genômicas dos genes morfogênicos e embrio- gênicos devem ser conhecidas para que seja possível conceber alvos para dCas9, dCpf1 (variantes de PAM disponíveis para ambos), efeto- res TAL, dedos de zinco e endonucleases "homing". De preferência, o fator de transcrição sintético compreende uma fusão de pelo menos dois domínios de ativação para conferir propriedades ideais de reconheci- mento que não podem ser alcançadas com um domínio de ativação (por exemplo, dCas9 ou dCpf1) apenas. Além disso, os pelo menos dois do- mínios de ativação são adequadamente posicionados para evitar impe- dimentos estéricos e permitir uma alta taxa de ativação. Exemplo 7: Análise quantitativa da transcrição aumentada de ZnBBM e ZMWUS
[0311] A indução da transcrição de BBM e WUS pode ser medida por um sistema simples de PCR ou por uma PCR quantitativa de trans- criptase reversa. A vantagem deste último é o maior grau de normaliza- ção para quantificação absoluta da transcrição. Um sistema simples de PCR seria, de preferência, usado para comparação relativa da transcri- ção contra o tipo selvagem ou entre eventos de transformação.
[0312] Para medir a ativação transcricional de BBM, é usado um ensaio de PCR simples. Os iniciadores são BBM-1 apresentado em SEQ ID NO: 191 e BBM-2 apresentado em SEQ ID NO: 192. Hot-Fire Polymerase é usada em uma PCR de 34 ciclos.
[0313] Para medir a ativação transcricional de WUS, é usado uma qgRT-PCR (ensaio Taq-Man). O gene EF1 é usado como referência. Em uma qPCR de 40 ciclos, o ZMEF1 é amplificado usando os iniciadores ZmMEF1xxxr01 apresentado em SEQ ID NO: 193 e ZMEF1xxxf01 apre- sentado em SEQ ID NO: 194 e detectados por ZMEF1xxxMGB.1 apre-
sentado em SEQ ID NO: 195. O ZmMWUS é amplificado usando os inici- adores WUSxxxFw1 apresentado em SEQ ID NO: 196 e WUSxxxRv1 apresentado em SEQ ID NO: 197 e detectado pelo WUSxxxMGB apre- sentado em SEQ ID NO: 198.
[0314] A análise estatística pode ser realizada por meio de métodos estabelecidos e publicados anteriormente. Exemplo 8: Distribuição de fatores de transcrição sintéticos e verifica- ção de morfogênese aumentada em calos de milho e beterraba sacarí- nica e embriões imaturos
[0315] Os fatores de transcrição sintéticos, conforme descrito nos Exemplos 1 a 6, podem ser distribuídos como DNA, RNA ou proteína. À transformação de calos de beterraba sacarínica ou milho e embriões imaturos usando DNA foi descrita e pode ser realizada por Agrobacte- rium tumefaciens ou pela distribuição de partículas. A transformação do DNA pode ser transitória, o que significa que o cassete de expressão não é integrado ao genoma e, portanto, não é herdado ou estável, o que significa que a intenção da transformação é inserir um cassete transgê- nico. O RNA sintético ou transcrito in vitro pode ser distribuído usando bombardeamento. A distribuição de proteínas foi realizada por cepas modificadas de Agrobacterium tumefaciens ou pela distribuição de par- tículas.
[0316] Um gene, ou fragmento gênico ou qualquer outra construção sintética, por exemplo, incluindo um marcador adequado, transformado de modo transitório ou estável, pode ser introduzido com ou sem um gene marcador. Os genes marcadores podem ajudar na seleção ou tri- agem de células ou tecidos transformados. Isto pode variar de um mar- cador fluorescente, como o tdTomato para detectar células transforma- das, a genes de resistência a herbicidas que permitem seleção positiva.
[0317] Aqueles versados na técnica podem identificar os efeitos do aumento da morfogênese nos tecidos de milho ou beterraba sacarínica a olho nu ou através de várias formas de microscopia, ou seja, por meio de inspeção visual. Tipicamente, eles são distinguíveis pelo aumento da divisão celular e pela indução de embriogênese nos tecidos afetados. À embriogênese resulta na reprogramação das células afetadas para um estágio inicial de desenvolvimento embrionário, mesmo que sejam an- teriormente células somáticas.
[0318] Dependendo dos efeitos detectados, será potencialmente necessário modificar a intensidade da transcrição e o perfil de expres- são para obter o efeito desejado. Esta otimização pode envolver a iden- tificação do ativador transcricional ideal (Exemplo 3), o sítio alvo (Exem- plos 1 e 2), os promotores que controlam a expressão, o método de distribuição (Exemplos 8 e 10), o tempo de distribuição (possibilidade do uso de um sistema indutível) e outros fatores. Exemplo 9: Combinação de fatores de transcrição sintéticos com edi- ção gênica para taxas aprimoradas de plantas regeneradas que trazem edições
[0319] Os ativadores de transcrição otimizados descritos nos Exem- plos 1 a 8 podem ser codistribuídos com reagentes de edição gênica ou em vetores de T-DNA. Métodos de transformação típicos, tais como bombardeamento de partículas e Agrobacterium, podem ser desvanta- josos para as células transformadas ou expostas. À luz dos recentes avanços para a ativação transitória de genes morfogênicos, é possível coadministrar a fita de T-DNA com um plasmídeo que contém os fatores de transcrição descritos acima. Isto dá às células transformadas ou ex- postas uma vantagem, em vez de uma desvantagem.
[0320] Neste exemplo, qualquer ativador transcricional transitório codificado por plasmídeo dos Exemplos 1 a 8 pode ser distribuído por meio de bombardeamento de partículas com um cassete de expressão que contém um gene Cpf1 e um crRNA concebido especificamente (por exemplo, para um gene de um traço relevante). Este cassete não con- tém um gene de resistência para seleção. Todas as plantas regenera- das a partir deste calo são rastreadas quanto aos INDELs no sítio alvo. Comparado aos tecidos não selecionados que não receberam o ativa- dor de transcrição, esperamos que a eficiência do INDEL seja significa- tivamente menor.
[0321] Levando as plantas editadas com sucesso para a próxima geração e reconfirmando a modificação por Cpf1 ou outras nucleases específicas para localização, esperamos ter contagens mais altas de plantas T1 editadas do que no controle. Exemplo 10: Codistribuição com base em proteína de ativadores de transcrição sintéticos com RNP's de nuclease direcionada à localização para edição aprimorada de genes transitórios
[0322] Neste exemplo, os componentes do Exemplo 9 são distribu- ídos ao tecido da planta, tal como calos ou embriões imaturos, como proteína purificada. Os fatores de transcrição descritos nos Exemplos 1 a 8 são expressos e purificados a partir de um sistema celular procariota ou eucariota. Cpf1 é igualmente produzida e incubada com crRNA sin- tético ou transcrita in vitro para formar uma ribonucleoproteína (RNP). À distribuição de proteínas foi demonstrada através de bombardeamento de partículas ou fusão com peptídeos que penetram nas células. Seria esperado obter contagens mais baixas de plantas T1 editadas compa- rado com o Exemplo 9. No entanto, a completa ausência de material herdado torna esta abordagem altamente desejável. Exemplo 11: Combinação de fatores de transcrição sintéticos com edi- ção de bases para taxas aprimoradas de plantas regeneradas que tra- zem edições
[0323] Os ativadores de transcrição otimizados descritos nos Exem- plos 1 a 8 são distribuídos em conjunto com reagentes de edição de bases em cassetes de DNA cobombardeados ou em um ou mais veto- res de T-DNA que trazem seus cassetes de expressão. Métodos de transformação típicos, tais como bombardeamento de partículas e Agrobacterium, podem ser desvantajosos para as células transforma- das ou expostas. À luz dos recentes avanços para a ativação transitória de genes morfogênicos, é possível coadministrar a fita de T-DNA com um plasmídeo que contém os fatores de transcrição descritos acima. Isto dá às células transformadas ou expostas uma vantagem, em vez de uma desvantagem.
[0324] Neste exemplo, qualquer ativador de transcrição codificado por plasmídeo dos Exemplos 1 a 8 pode ser distribuído através de bom- bardeamento de partículas com um cassete de expressão que contém um gene editor de bases e um RNA guia especificamente concebido (por exemplo, para um gene de um traço relevante) para direcionar o editor de bases para o alvo apropriado. Este cassete pode ou não conter um gene de resistência para seleção. O gene editor de bases pode codificar uma citidina desaminase, uma adenina desaminase ou outra desaminase ou outra atividade catalítica adequada para fazer conversões de bases. O editor de bases pode ainda ser com base em qualquer domínio CRISPR adequado para fornecer a função de edição de bases ao sítio alvo. Isto pode incluir, porém sem limitações, Cas9, Cpf1, CasX, CasY ou outros domínios adequados. Todas as plantas regeneradas a partir deste calo são pesquisadas quanto a substituições de bases no sítio-alvo. Compa- rado às células que não receberam o(s) ativador(es) de transcrição, es- peraríamos que a eficiência de regeneração fosse muito maior. Exemplo 12: Codistribuição com base em proteína de ativadores trans- cricionais sintéticos com RNPs editores de bases para edição genética transitória aprimorada
[0325] Neste exemplo, os componentes do Exemplo 11 são distri- buídos ao tecido da planta, tais como calos ou embriões imaturos, como proteína purificada e RNA. Os fatores de transcrição descritos nos Exemplos 1 a 8 são expressos e purificados a partir de um sistema ce- lular procariota ou eucariota. O editor de bases é igualmente produzido e incubado com crRNA sintético ou transcrito in vitro para formar uma ribonucleoproteína (RNP). A distribuição de proteínas foi demonstrada através de bombardeamento de partículas ou fusão com peptídeos que penetram nas células. Seria esperado obter contagens mais baixas de plantas T1 editadas comparado com o Exemplo 11. No entanto, a com- pleta ausência de material herdado torna esta abordagem altamente de- sejável. Exemplo 13: Formação de calos embriogênicos em milho promovida pela distribuição transitória de ativadores transcricionais sintéticos
[0326] Para demonstrar o efeito dos ativadores transcricionais sin- téticos, foi realizada uma transformação biolística de milho. Duas trans- formações biolísticas independentes foram realizadas seguindo um pro- tocolo padrão de transformação de milho. A emersão do calo embriogê- nico foi avaliada quatro semanas após o bombardeamento. Conforme mostrado na Figura 7A, cerca de 5,5 % dos embriões imaturos apre- sentaram calos embriogênicos quando tratados de forma simulada (mock). Os genes morfogênicos conhecidos foram distribuídos como um controle positivo (média de 12,4 %). A administração de ativadores transcricionais sintéticos para BBM e WUS?2 sob três diferentes promo- tores constitutivos e específicos para tecidos mostrou um aumento na for- mação de calos embriogênicos, mas não ao nível do controle positivo. No dito experimento, a atividade de todos os promotores testados foi sufici- ente para aumentar a formação de calo embriogênico (Figuras 7A e B). Exemplo 14: Indução do promotor ZMWUS?2 por ativador transcricional sintético em tecido de folhas e embriões
[0327] Em um experimento de distribuição biolística, mostramos que o ativador transcricional sintético TALE1 induz à expressão de uma proteína fluorescente (tdTomato) sob controle de um promotor WUS2 (consulte a Figura 8). Conforme mostrado na Figura 9, os painéis à esquerda mostram que o promotor WUS2 não leva ou leva a apenas uma intensidade muito baixa de expressão de tdTomato em embriões imaturos do genótipo de milho A188 (painel superior) e tecido foliar do genótipo A188 (painel inferior). Quando coadministrado com o ativador transcricional sintético TALE1, o tdTomato é expresso fortemente em embriões imaturos (painel superior à direita) e principalmente em folhas (painel inferior à direita).

Claims (52)

REIVINDICAÇÕES
1. Fator de transcrição sintético, ou uma sequência de nucle- otídeos que codifica o mesmo, que compreende pelo menos um domínio de reconhecimento e pelo menos um domínio de ativação, caracterizado pelo fato de que o fator de transcrição sintético é configurado para mo- dular a expressão de um gene morfogênico em um sistema celular.
2. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o pelo menos um domínio de re- conhecimento é, ou é um fragmento, de uma molécula selecionada a partir do grupo que consiste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease desarmado, pelo menos um domínio de Dedo de Zinco e pelo menos uma endonuclease "homing" desarmada, ou qualquer combinação dos mesmos.
3. Fator de transcrição sintético, de acordo com a reivindica- ção 2, caracterizado pelo fato de que o pelo menos um sistema CRISPR/nuclease desarmado é selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado com- preende pelo menos um RNA guia.
4. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o pelo menos um domínio de ati- vação é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene efetor TAL de Xanthomonas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Armação, Suntag, P300, VP160 ou qualquer combinação dos mesmos.
5. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o pelo menos um domínio de ati- vação está localizado no N-terminal e/ou no C-terminal em relação ao pelo menos um domínio de reconhecimento.
6. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKD4.
7. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o fator de transcrição sintético é configurado para modular a expressão, de preferência a transcrição, do gene morfogênico pela ligação a uma região de regulação localizada a uma certa distância em relação ao códon inicial.
8. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o fator de transcrição sintético e/ou pelo menos um domínio de reconhecimento compreende uma sequên- cia apresentada em qualquer uma de SEQ ID NOs: 1 a 94, ou uma se- quência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o comprimento com qualquer um das SEQ ID NOs: 1 a 94, ou em que o fator de transcrição sintético e/ou pelo menos um domínio de reconhecimento se liga a uma região de regulação apresentada em SEQ ID NOs: 95 a 190, ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o comprimento com qualquer uma de SEQ ID NOs: 95 a 190.
9. Fator de transcrição sintético, de acordo com a reivindica- ção 1, caracterizado pelo fato de que o sistema celular é selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula vegetal e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
10. Fator de transcrição sintético, de acordo com a reivindi- cação 9, caracterizado pelo fato de que a pelo menos uma parte da planta é selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pó- len, tubos de pólen, filamentos de antera, óvulos, sacos embrionários, células-ovo, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, períciclos, sementes, raízes e estacas.
11. Fator de transcrição sintético, de acordo com a reivindi- cação 10, caracterizado pelo fato de que a pelo menos uma célula ve- getal, a pelo menos uma planta ou a pelo menos uma parte de uma planta são originárias de uma espécie vegetal selecionada a partir do grupo que consiste em Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza mi- nuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicoti- ana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum Iycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihi- malaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepi- dium virginicum, Capsella bursa pastoris, OlImarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago trunca- tula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseo- lus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum e Allium tubero- sum.
12. Método para aumentar a eficiência de transformação em um sistema celular, caracterizado pelo fato de que o método compre- ende as etapas de: (a) fornecer um sistema celular; (b) introduzir no sistema celular pelo menos um fator de transcrição sintético ou uma sequência de nucleotídeos que codifica o mesmo; e (c) introduzir no sistema celular pelo menos uma sequência de nucleotídeos de interesse; (d) opcionalmente: cultivar o sistema celular sob condições para obter uma progênie transformada do sistema celular; em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo me- nos um domínio de reconhecimento e pelo menos um domínio de ativa- ção, em que o fator de transcrição sintético é configurado para modular a expressão, de preferência a transcrição, de pelo menos um gene mor- fogênico no sistema celular; e em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, é introduzido em pa- ralelo ou sequencialmente com a introdução de pelo menos uma se- quência de nucleotídeos de interesse.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que (a) o pelo menos um fator de transcrição sintético, ou a se- quência que codifica o mesmo, ou o pelo menos um componente do pelo menos um fator de transcrição sintético, ou a sequência que codi- fica o mesmo; e
(b) a pelo menos uma sequência de nucleotídeos de inte- resse é/são introduzidos no sistema celular através de meios inde- pendentemente selecionados a partir de meios biológicos e/ou físicos, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de preferência transformação por Agrobacterium tumefaciens, um vetor viral, bombardeamento biolístico, transfecção usando agentes químicos, incluindo transfecção de polietileno glicol ou qualquer combinação dos mesmos.
14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o pelo menos um domínio de reconhecimento é ou faz parte de uma molécula selecionada a partir do grupo que consiste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease desarmado não funcional, pelo menos um domínio de Dedo de Zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer com- binação dos mesmos.
15. Método, de acordo com a reivindicação 14, caracterizado pelo fato de que o pelo menos um sistema CRISPR/nuclease desar- mado é selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/ dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado compreende pelo menos um RNA guia.
16. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene de efetor TAL de Xanthomonas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Armação, Suntag, P300, VP160 ou qualquer com- binação dos mesmos.
17. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético está localizado no N-terminal e/ou no C-terminal em relação ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
18. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o pelo menos um gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKD4.
19. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o fator de transcrição sintético é configurado para mo- dular a expressão, de preferência a transcrição, do gene morfogênico por meio de ligação a uma região de regulação localizada a uma certa distância em relação ao códon inicial.
20. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhecimento compreende uma sequência apresentada em qualquer uma de SEQ ID NOs: 1 a 94, ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o compri- mento com qualquer uma de SEQ ID NOs: 1 a 94, ou em que o fator de transcrição sintético e/ou o pelo menos um domínio de reconhecimento se liga a uma região de regulação apresentada em SEQ ID NOs: 95 a 190, ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o comprimento com qualquer uma de SEQ ID NOs: 95 a 190.
21. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o sistema celular é selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula vegetal e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
22. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que a pelo menos uma parte da planta é selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pólen, tubos de pólen, filamentos de antera, óvulos, sacos embrionários, células-ovo, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, sementes, raízes e estacas.
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que a pelo menos uma célula vegetal, a pelo menos uma planta ou a pelo menos uma parte de uma planta são originárias de uma espécie vegetal selecionada a partir do grupo que consiste em Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australien- sis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Dau- cus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana to- mentosiformis, Nicotiana tabacum, Solanum Iycopersicum, Solanum tu- berosum, Coffea canephora, Vitis vinifera, Erythrante gquttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabi- dopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihima- laya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Bras-
Sica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Bras- Sica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha cur- cas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus ca- janifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, As- tragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum e Allium tuberosum.
24. Método para modificar o material genético de um sistema celular em uma localização predeterminada, caracterizado pelo fato de que o método compreende as seguintes etapas: (a) fornecer um sistema celular; (b) introduzir pelo menos um fator de transcrição sintético, ou uma sequência que codifica o mesmo, no sistema celular, (c) introduzir adicionalmente no sistema celular (i) pelo menos uma enzima modificadora de DNA sítio-espe- cífica, ou uma sequência que codifica a mesma, em que a enzima mo- dificadora de DNA sítio-específica induz a uma ruptura de fita simples ou dupla ou uma desaminação (edição de bases) na localização prede- terminada; (ii) opcionalmente: pelo menos uma sequência de nucleotí- deos de interesse, de preferência flanqueada por uma ou mais sequên- cia(s) de homologia complementar(es) a uma ou mais sequência(s) de nucleotídeos adjacente(s) à localização predeterminada no material ge- nético do sistema celular; e; (e) opcionalmente: determinar a presença da modificação na localização predeterminada no material genético do sistema celular; e (f) obter um sistema celular que compreende uma modifica- ção na localização predeterminada no material genético do sistema ce- lular; em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo me- nos um domínio de reconhecimento e pelo menos um domínio de ativa- ção, em que o pelo menos um fator de transcrição sintético está confi- gurado para modular a expressão, de preferência a transcrição, de pelo menos um gene morfogênico no sistema celular; e em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, é introduzido em pa- ralelo ou sequencialmente com a introdução de pelo menos uma nu- clease sítio-específica, ou a sequência que codifica a mesma, e opcio- nalmente a pelo menos uma sequência de nucleotídeos de interesse.
25. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o método compreende ainda a etapa de cultura do sis- tema celular sob condições para obter uma progênie geneticamente mo- dificada do sistema celular modificado.
26. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que (1) o pelo menos um fator de transcrição sintético, ou a se- quência que codifica o mesmo, ou o pelo menos um componente do pelo menos um fator de transcrição sintético, ou a sequência que codi- fica o mesmo; e (ii) a pelo menos uma nuclease sítio-específica ou a sequên- cia que inclui a mesma; e opcionalmente (ili) a pelo menos uma sequência de nucleotídeos de inte- resse é/são introduzidos no sistema celular através de meios inde- pendentemente selecionados a partir de meios biológicos e/ou físicos, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de preferência transformação por Agrobacterium tumefaciens, um vetor viral, bombardeamento biolístico, transfecção usando agentes químicos, incluindo transfecção de polietileno glicol ou qualquer combinação dos mesmos.
27. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o pelo menos um domínio de reconhecimento é ou é um fragmento de uma molécula selecionada a partir do grupo que con- siste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/ nuclease desarmado, pelo menos um domínio de Dedo de Zinco e pelo menos uma endonuclease "homing" desarmada ou qualquer combina- ção dos mesmos.
28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que o pelo menos um sistema CRISPR/nuclease desar- mado é selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/ dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado compreende pelo menos um RNA guia.
29. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene de efetor TAL de Xanthomonas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Armação, Suntag, P300, VP160 ou qualquer com- binação dos mesmos.
30. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético está localizado no N-terminal e/ou no C-terminal em relação ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
31. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o pelo menos um gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKD4.
32. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o fator de transcrição sintético é configurado para mo- dular a expressão, de preferência a transcrição, do gene morfogênico por meio de ligação a uma região de regulação localizada a uma certa distância em relação ao códon inicial.
33. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o fator de transcrição sintético e/ou pelo menos um domínio de reconhecimento compreende uma sequência apresentada em qualquer uma de SEQ ID NOs: 1 a 94, ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o compri- mento com qualquer uma de SEQ ID NOs: 1 a 94, ou em que o fator de transcrição sintético e/ou pelo menos um domínio de reconhecimento, se liga a uma região de regulação apresentada em SEQ ID NOs: 95 a 190 ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o comprimento com qualquer uma de SEQ ID NOs: 95 a 190.
34. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que o sistema celular é selecionado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma célula eucariota é pelo menos uma célula vegetal e/ou em que o pelo menos um organismo eucariota é uma planta ou parte de uma planta.
35. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que a uma ou mais sequência(s) de nucleotídeos que flan- queia(m) a pelo menos uma sequência de nucleotídeos de interesse na localização predeterminada é/são pelo menos 85 % -100 % complemen- tares a uma ou mais sequência(s) de nucleotídeos adjacente(s) à loca- lização predeterminada, a montante e/ou a jusante da localização pre- determinada, em todo o comprimento da(s) respectiva(s) região(ões) adjacente(s).
36. Método para produzir um organismo haploide ou haplo- ide duplo, caracterizado pelo fato de que o método compreende as se- guintes etapas: (a) fornecer um sistema celular haploide; (b) introduzir no sistema celular haploide pelo menos um fa- tor de transcrição sintético ou uma sequência de nucleotídeos que codi- fica o mesmo; (c) cultivar o sistema celular haploide sob condições para ob- ter pelo menos um organismo haploide ou haploide duplo; e (d) opcionalmente: selecionar pelo menos um organismo ha- ploide ou haploide duplo obtido na etapa (c), em que o pelo menos um fator de transcrição sintético, ou a sequência de nucleotídeos que codifica o mesmo, compreende pelo me- nos um domínio de reconhecimento e pelo menos um domínio de ativa- ção, em que o pelo menos um fator de transcrição sintético está confi- gurado para modular a expressão, de preferência a transcrição, de pelo menos um gene morfogênico no sistema celular haploide.
37. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o sistema celular haploide da etapa (a) é um embrião haploide ou em que o pelo menos um organismo haploide ou haploide duplo definido na etapa (c) é obtido através de uma etapa intermediária de gerar pelo menos um embrião haploide a partir do sistema celular haploide de (b).
38. Método, de acordo com a reivindicação 36 ou 37, carac- terizado pelo fato de que o pelo menos um fator de transcrição sintético,
ou uma sequência que codifica o mesmo, ou o pelo menos um compo- nente de pelo menos um fator de transcrição sintético, ou a sequência que codifica o mesmo, é/são introduzidos no sistema celular haploide através de meios independentemente selecionados a partir de meios biológicos e/ou físicos, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., de preferência transformação por Agrobacterium tumefaciens, um vetor viral, bombardeamento biolís- tico, transfecção usando agentes químicos, incluindo transfecção de po- lietileno glicol ou qualquer combinação dos mesmos.
39. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o pelo menos um domínio de reconhecimento é ou é um fragmento de uma molécula selecionada a partir do grupo que con- siste em pelo menos um efetor TAL, pelo menos um sistema CRISPR/nuclease desarmado, pelo menos um domínio de Dedo de Zinco e pelo menos uma endonuclease "homing" desarmada, ou qual- quer combinação dos mesmos.
40. Método, de acordo com a reivindicação 39, caracterizado pelo fato de que o pelo menos um sistema CRISPR/nuclease desar- mado é selecionado a partir de um sistema CRISPR/dCas9, um sistema CRISPR/dCpf1, um sistema CRISPR/dCasX ou um sistema CRISPR/ dCasY ou qualquer combinação dos mesmos, em que o pelo menos um sistema CRISPR/nuclease desarmado compreende pelo menos um RNA guia.
41. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético é selecionado a partir do grupo que consiste em um domínio de ativação transcricional ácido, de preferência em que o pelo menos um domínio de ativação é de um gene de efetor TAL de Xanthomonas oryzae, VP16 ou VP64 tetramérica de Herpes simplex, VPR, SAM, Armação, Suntag, P300, VP160 ou qualquer com- binação dos mesmos.
42. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o pelo menos um domínio de ativação do pelo menos um fator de transcrição sintético está localizado no N-terminal e/ou no C-terminal em relação ao pelo menos um domínio de reconhecimento do pelo menos um fator de transcrição sintético.
43. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o pelo menos um gene morfogênico é selecionado a partir do grupo que consiste em BBM, WUS, incluindo WUS2, um gene WOX, um homólogo de WUS ou BBM, Lec1, Lec2, WIND1, ESR1, PLT3, PLTS5, PLT7, IPT, IPT2, Knotted1 e RKD4.
44. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o fator de transcrição sintético é configurado para mo- dular a expressão, de preferência a transcrição, do gene morfogênico pela ligação a uma região de regulação localizada a uma certa distância em relação ao códon inicial.
45. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o fator de transcrição sintético e/ou pelo menos um domínio de reconhecimento compreende uma sequência apresentada em qualquer uma de SEQ ID NOs: 1 a 94, ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o compri- mento com qualquer uma de SEQ ID NOs: 1 a 94, ou em que o fator de transcrição sintético e/ou pelo menos um domínio de reconhecimento, se liga a uma região de regulação apresentada em SEQ ID NO: 95 a 190, ou uma sequência que tem pelo menos 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % ou 99 % de identidade em todo o comprimento com qualquer uma de SEQ ID NOs: 95 a 190.
46. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que o pelo menos um sistema celular haploide é selecio- nado a partir do grupo que consiste em pelo menos uma célula eucariota ou organismo eucariota, de preferência em que a pelo menos uma cé- lula eucariota é pelo menos uma célula vegetal e/ou em que o pelo me- nos um organismo eucariota é uma planta ou parte de uma planta.
47. Sistema celular ou sua progênie caracterizado por ser obtido por meio de um método como definido na reivindicação 12.
48. Sistema celular ou sua progênie caracterizado por ser obtido por meio de um método como definido na reivindicação 24.
49. Organismo haploide ou haploide duplo caracterizado por ser obtido por meio do método como definido na reivindicação 36.
50. Uso de um fator de transcrição sintético, como definido na reivindicação 1, ou uma sequência que codifica o mesmo, caracteri- zado por ser em um método como definido na reivindicação 12.
51. Uso de um fator de transcrição sintético, como definido na reivindicação 1, ou uma sequência que codifica o mesmo, caracteri- zado por ser em um método como definido na reivindicação 24.
52. Uso de um fator de transcrição sintético, como definido na reivindicação 1, ou uma sequência que o codifique, caracterizado por ser em um método como definido na reivindicação 36.
BR112020012064-2A 2017-12-22 2018-12-21 regulação transcricional direcionada usando fatores de transcrição sintéticos BR112020012064A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762609508P 2017-12-22 2017-12-22
US62/609,508 2017-12-22
US201862738568P 2018-09-28 2018-09-28
US62/738,568 2018-09-28
PCT/EP2018/086700 WO2019122381A2 (en) 2017-12-22 2018-12-21 Targeted transcriptional regulation using synthetic transcription factors

Publications (1)

Publication Number Publication Date
BR112020012064A2 true BR112020012064A2 (pt) 2020-12-01

Family

ID=64949302

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020012064-2A BR112020012064A2 (pt) 2017-12-22 2018-12-21 regulação transcricional direcionada usando fatores de transcrição sintéticos

Country Status (7)

Country Link
US (1) US20200332307A1 (pt)
EP (1) EP3728604A2 (pt)
CN (1) CN112105738A (pt)
AU (1) AU2018390957A1 (pt)
BR (1) BR112020012064A2 (pt)
CA (1) CA3086615A1 (pt)
WO (1) WO2019122381A2 (pt)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3597741A1 (en) 2012-04-27 2020-01-22 Duke University Genetic correction of mutated genes
JP6905755B2 (ja) 2015-08-25 2021-07-21 デューク ユニバーシティ Rnaガイド型エンドヌクレアーゼを使用してゲノム工学における特異性を改善する組成物および方法
EP4089175A1 (en) 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
DK3501268T3 (da) 2017-12-22 2021-11-08 Kws Saat Se & Co Kgaa Regenerering af planter i tilstedeværelse af histondeacetylase hæmmere
CA3158897A1 (en) * 2019-10-30 2021-05-06 Pairwise Plants Services, Inc. Type v crispr-cas base editors and methods of use thereof
CA3169462A1 (en) * 2020-01-30 2021-08-05 Pairwise Plants Services, Inc. Compositions, systems, and methods for base diversification
WO2023154877A2 (en) * 2022-02-10 2023-08-17 The Board Of Trustees Of The Leland Stanford Junior University Rna-guided genome recombineering at kilobase scale
CN115786390A (zh) * 2022-08-19 2023-03-14 中国农业科学院作物科学研究所 一种母体细胞自主的孤雌单倍体生殖方法及其育种应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7256322B2 (en) 1999-10-01 2007-08-14 Pioneer Hi-Bred International, Inc. Wuschel (WUS) Gene Homologs
DE602005012233D1 (de) 2004-02-02 2009-02-26 Pioneer Hi Bred Int Ap2-domäne-transkriptionsfaktor odp2 (ovule development protein 2) und verwendungsverfahren
WO2015043621A1 (en) 2013-09-24 2015-04-02 Stichting Dienst Landbouwkundig Onderzoek Haploid embryogenesis
EP3178935B1 (en) 2014-08-06 2022-12-21 Toolgen Incorporated Genome editing using campylobacter jejuni crispr/cas system-derived rgen
CN108368517B (zh) 2015-10-30 2022-08-02 先锋国际良种公司 用于快速植物转化的方法和组合物

Also Published As

Publication number Publication date
WO2019122381A2 (en) 2019-06-27
CN112105738A (zh) 2020-12-18
CA3086615A1 (en) 2019-06-27
EP3728604A2 (en) 2020-10-28
US20200332307A1 (en) 2020-10-22
WO2019122381A3 (en) 2019-08-01
AU2018390957A1 (en) 2020-07-02

Similar Documents

Publication Publication Date Title
US11807878B2 (en) CRISPR-Cas systems for genome editing
US20210071189A1 (en) Cpf1 based transcription regulation systems in plants
BR112020012064A2 (pt) regulação transcricional direcionada usando fatores de transcrição sintéticos
Wolter et al. Efficient in planta gene targeting in Arabidopsis using egg cell‐specific expression of the Cas9 nuclease of Staphylococcus aureus
WO2018202199A1 (en) Methods for isolating cells without the use of transgenic marker sequences
JP2021151275A (ja) マーカーフリーゲノム改変のための方法および組成物
JP2018531024A6 (ja) マーカーフリーゲノム改変のための方法および組成物
US20230392135A1 (en) Engineered cas endonuclease variants for improved genome editing
US20220235363A1 (en) Enhanced plant regeneration and transformation by using grf1 booster gene
US20200354734A1 (en) New strategies for precision genome editing
AU2018263195B2 (en) Methods for isolating cells without the use of transgenic marker sequences
US20230203517A1 (en) Large scale genome manipulation
Liang et al. Arabidopsis glutamate: glyoxylate aminotransferase 1 (Ler) mutants generated by CRISPR/Cas9 and their characteristics
Alburquerque et al. New transformation technologies for trees
Graham et al. Engineered minichromosomes in plants: structure, function, and applications
US20220112511A1 (en) Methods for enhancing genome engineering efficiency
Malzahn Developing and Expanding CRISPR-Cas Plant Genome Engineering Systems
EP3545756A1 (en) Regeneration of plants in the presence of inhibitors of the histone methyltransferase ezh2
Ryder Molecular genetic investigation towards functions of imprinted genes in reproduction and seed development in Arabidopsis thaliana
CN115151637A (zh) 基因组内同源重组
Tjahjadi Characterization of SOG1-dependent transcription factors and Creation of a SOG1 knockout

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]