BR112020008386A2 - estratégias para edição de genoma de precisão - Google Patents

estratégias para edição de genoma de precisão Download PDF

Info

Publication number
BR112020008386A2
BR112020008386A2 BR112020008386-0A BR112020008386A BR112020008386A2 BR 112020008386 A2 BR112020008386 A2 BR 112020008386A2 BR 112020008386 A BR112020008386 A BR 112020008386A BR 112020008386 A2 BR112020008386 A2 BR 112020008386A2
Authority
BR
Brazil
Prior art keywords
sequence
acid sequence
nucleic acid
seq
inactivated
Prior art date
Application number
BR112020008386-0A
Other languages
English (en)
Inventor
Markus Niessen
Aaron Hummel
Erik Jongedijk
Zarir Vaghchhipawala
Fridtjof Weltmeier
René GLENZ
Original Assignee
KWS SAAT SE & Co. KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KWS SAAT SE & Co. KGaA filed Critical KWS SAAT SE & Co. KGaA
Publication of BR112020008386A2 publication Critical patent/BR112020008386A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

A presente invenção refere-se a métodos aprimorados para edição de genoma de precisão (GE), preferencialmente em células eucarióticas, e particularmente a métodos para GE em células com expressão alterada de Polimerase teta e características alteradas de pelo menos uma enzima adicional envolvida em via de reparo de DNA de junção final não homóloga (NHEJ). São ainda fornecidos sistemas celulares e ferramentas relacionadas aos métodos fornecidos. Especificamente, são fornecidos métodos, em que o bloqueio de polimerase teta e NHEJ e/ou GE são realizados de maneira transiente, de modo que a mecanismo de NHEJ celular e de Polimerase teta endógena seja facilmente reativado após uma edição direcionada, e/ou sem integração permanente de determinadas ferramentas de edição.

Description

Relatório Descritivo da Patente de Invenção para "ESTRA- TÉGIAS PARA EDIÇÃO DE GENOMA DE PRECISÃO".
CAMPO TÉCNICO
[001] A presente invenção refere-se a métodos aprimorados para edição de genoma de precisão (GE), preferencialmente em células eu- carióticas, e particularmente a métodos para GE em células com ex- pressão alterada de polimerase teta e características alteradas de pelo menos uma enzima adicional envolvida em uma via de reparo do DNA de junção final não homóloga (NHEJ). Os métodos permitem uma pro- visão sincronizada de uma polimerase teta pelo menos menos inativa- da e pelo menos uma enzima de NHEJ adicional em conjunto com o fornecimento de ferramentas GE na mesma célula no momento em que uma edição direcionada é introduzida para prover previsibilidade e precisão significativamente melhoradas do resultado de GE. Além dis- so, são fornecidos ferramentas e sistemas celulares relacionados aos métodos fornecidos. Especificamente, são fornecidos métodos, em que o bloqueio de polimerase teta e NHEJ e/ou GE é realizado de ma- neira transiente, de modo que os mecanismos endógenos de NHEJ celular sejam facilmente reativados após uma edição direcionada e/ou sem integração permanente de determinadas ferramentas de edição.
ANTECEDENTES DA INVENÇÃO
[002] A capacidade de modificar com precisão o material genéti- co em células eucarióticas permite uma ampla gama de aplicações de alto valor nos campos médico, farmacêutico, agrícola, de pesquisa bá- sica e outros campos técnicos. Fundamentalmente, a engenharia de genoma ou edição de genes (GE) provê essa capacidade ao introduzir variação genética predefinida em locais específicos em genomas eu- carióticos, bem como procarióticos. As realizações recentes em GE eficiente para mutagênese, edição, substituições ou inserções direcio- nadas dependem da capacidade de introduzir ruptura de filamentos duplos (DSBs) ou simples genômicos em locais específicos em um genoma de interesse.
[003] Em células eucarióticas, a integridade do genoma é garan- tida por mecanismos robustos e parcialmente redundantes para repa- rar DSBs de DNA causadas por estresses ambientais e erros de me- canimos de processamento de DNA celular. Na maioria das células eucarióticas e na maioria dos estágios do respectivo ciclo celular, a via de reparo de DNA de junção final não homóloga (NHEJ) é a forma de reparo altamente dominante. Uma segunda via utiliza recombinação homóloga (HR) de sequências de DNA semelhantes para reparar DSBs. Essa via geralmente pode ser usada nos estágios S e G2 do ciclo celular, modelando-se a partir da região homóloga duplicada de um cromossomo emparelhado para reparar com precisão a DSB. No entanto, um modelo de reparo fornecido artificialmente (RT) com ho- mologia ao alvo também pode ser usado para reparar a DSB, em um processo conhecido como reparo direcionado por homologia (HDR) ou direcionamento genético. Com essa estratégia, é possível introduzir alterações direcionadas muito precisas nos genomas de células euca- rióticas.
[004] Os primeiros estudos de direcionamento de genes em plan- tas revelaram frequências de recombinação homóloga tão baixas que era efetivamente impossível praticar a edição de gene para melhora- mento de culturas. Nuclease específicas de sítio (SSNs), que podem ser direcionadas a uma sequência alvo específica e causar uma DSB, aumenta as frequências de direcionamento de gene em 2-3 ordens de magnitude quando coentregues em conjunto com um DNA RT (Puchta et al., Proc Natl. Acad. Sei. USA 93:5055-5060, 1996). No entanto, a GE em plantas ainda é prejudicada por baixa frequência de reparos de HDR em comparação a reparos por NHEJ, que podem criar inserções ou exclusões (INDELs) no alvo SSN, assim prejudicando ainda mais o corte e tornando o alvo em uma célula específica inutilizável para o direcionamento genético.
[005] Um aspecto a ser criticamente considerado para a GE é, portanto, a natureza do mecanismo de reparo induzido após a cliva- gem de um sítio alvo genômico de interesse, como DSBs, ou quais- quer lesões de DNA em geral são prejudiciais à integridade de um ge- noma. É, portanto, de grande importância que os mecanismos celula- res forneçam mecanismos de reparo de ruptura de filamentos duplos (DSB) no ambiente natural. As células possuem mecanismos intrínse- cos para tentar reparar qualquer dano no DNA de fita dupla ou sim- ples. Os mecanismos de reparo de DSB foram divididos em dois tipos básicos principais; NHEJ e HR são geralmente chamados de HDR.
[006] NHEJ é a resposta nuclear dominante em animais e plantas que não requer sequências homólogas, mas é frequentemente pro- pensa a erros e, portanto, potencialmente mutagênica (Wyman C., Ka- naar R. "DNA double-strand break repair: all’s well that ends well", An- nu. Rev. Genet., 2006, 40, 363-83). As vias NHEJ clássica e de backup são conhecidas com base em diferentes mecanismos, em que ambas as vias são propensas a erros. O reparo por HDR requer homo- logia, mas as vias HDR que usam um cromossomo intacto para repa- rar o quebrado, ou seja, reparo de ruptura de filamentos duplos e ane- lamento de filamento dependente de síntese, são altamente precisos. Na via de reparo de DSB clássica, as extremidades 3’ invadem um modelo homólogo intacto, em seguida, servem como um iniciador para a síntese de reparo de DNA, levando à formação de junções de Holli- day duplas (dHJs). As dHJs são estruturas ramificadas de quatro fila- mentos que se formam quando o alongamento do filamento invasivo "captura" e sintetiza o DNA a partir da segunda extremidade de DSB. As HJs individuais são resolvidas através de clivagem em uma de du- as maneiras. O anelamento de filamentos dependente de síntese é conservador e resulta exclusivamente em eventos não cruzados. Isso significa que todas as sequências recém-sintetizadas estão presentes na mesma molécula. Diferentemente da via de reparo NHEJ, após a invasão de filamento e a formação de alça D no anelamento de fila- mento dependente de síntese, a porção recém-sintetizada do filamento invasor é deslocada do modelo e retornada à extremidade processada do filamento não invasor na outra extremidade de DSB. A extremidade 3’ do filamento não invasor é alongada e ligada para preencher o inter- valo. Existe outra via de HDR, chamada via de reparo induzida por ruptura ainda não totalmente caracterizada. Um recurso central dessa via é a presença de apenas uma extremidade invasiva em uma DSB que pode ser usada para reparo.
[007] A via NHEJ de ocorrência natural, portanto, é altamente efi- ciente e direta, pois pode auxiliar na rejunção das duas extremidades após uma DSB independentemente de homologia significativa, en- quanto essa eficiência é acompanhada pela desvantagem de que esse processo é propenso a erros e pode estar associado a inserções ou exclusões. A via NHEJ ubiquitosamente presente em células eucarióti- cas dificulta, portanto, as abordagens de GE direcionadas.
[008] Um outro desafio é a propensão dos RTs introduzidos de se integrarem aleatoriamente no genoma em locais imprevisíveis e incon- troláveis. Uma via NHEJ é mediada por polimerase θ (polimerase teta, Pol θ ou Pol teta), codificada pelo gene POLQ (por exemplo, para plantas ver: van Kregten et al., 2016, T-DNA integration in plants re- sults from polymerase-θ-mediated DNA repair. Nature Plants 2, Núme- ro do Artigo: 16164). A polimerase θ em mamíferos é uma polimerase do tipo família A atípica com um domínio do tipo helicase de terminal N, um grande domínio central que abriga um motivo de interação Rad51, e um domínio de polimerase de terminal C capaz de estender filamentos de DNA a partir de terminais não compatíveis ou até não correspondentes. As moléculas de DNA podem ser aleatoriamente in- corporadas em genomas eucarióticos através da ação de Pol θ sendo uma polimerase de baixa fidelidade (Hogg et al., 2012. Promiscuous DNA synthesis by human DNA polymerase θ. Nucleic Acids Research, Volume 40, Edição 6, 1 de março 2012, páginas 2611–2622) que é necessária para a integração aleatória de T-DNAs em plantas. Plantas mutantes nocauteadas sem atividade de Pol θ são incapazes de inte- grar moléculas de T-DNA durante a transformação de planta mediada por Agrobacterium tumefaciens (van Kregten et al., 2016, supra). Ex- perimentos in vitro identificaram uma alça evolutivamente conservada no domínio de polimerase, que é essencial para a sinapse das extre- midades de DNA durante a junção final, protegendo o genoma contra rearranjos cromossômicos brutos (Sfeir, The FASEB Journal, vol. 30, nº.1, 2016).
[009] O WO 2017/062754 A1 divulga métodos de GE em células de mamíferos, concentrando-se em células-tronco embrionárias de camundongo, em que Pol teta é inibida. Ainda assim, permanece o problema de que a via NHEJ mediada por Pol teta é apenas uma das vias celulares NHEJ, de modo que a inibição não é perfeita e outras vias de reparo propensas a erros podem prejudicar uma GE direciona- da no referido tipo de célula. Além disso, nenhuma abordagem é for- necida, permitindo a aplicabilidade dos métodos divulgados em células de planta apresentando mecanismos de reparo altamente distintos. Em particular, as enzimas de planta envolvidas nas vias de reparo propensas a erros são pouco caracterizadas, dificultando a previsão de GE direcionada nas células de planta. A GE direcionada em plan- tas, em particular HDR, sofre de uma eficiência muito baixa e, na maio- ria das espécies de culturas, a entrega do mecanismo de GE às célu- las que subsequentemente se regeneram em uma planta transformada não é simples (por exemplo, protoplastos que são fáceis de transfor-
mar não se regeneram na maioria das espécies de cultura). Finalmen- te, existem apenas alguns métodos confiáveis disponíveis que permi- tem o isolamento das células transformadas da maioria das células não transformadas no tecido. Essas são apenas algumas dificuldades que o versado na técnica deve enfrentar ao procurar uma forma de prover meios para a GE direcionada em células de planta.
[0010] Na prática, integrações aleatórias frequentes de RTs limi- tam a disponibilidade dos modelos para uso por células no direciona- mento de genes e dificultam a triagem de células ou plantas com os eventos de direcionamento de genes desejados a partir de um históri- co de eventos de integração aleatória mais abundantes.
[0011] Dessa forma, o direcionamento de genes eficiente em célu- las eucarióticas é significativamente prejudicado por baixas frequên- cias devido à prevalência de reparo de DSB mediado por NHEJ, e pela dificuldade de rastrear eventos de direcionamento de genes devido à frequente integração aleatória do RT em muitas células tratadas.
[0012] A EP 2 958 996 A1 busca superar o problema de reparo de DSB específico, provendo um inibidor de mecanismos NHEJ nas célu- las para aumentar a interrupção de genes mediada por uma nuclease (por exemplo, ZFN ou TALEN) ou sistema de nuclease (por exemplo, CRISPR/Cas, Cpf1, CasX ou CasY). Ao inibir as atividades enzimáti- cas críticas dessas vias NHEJ de reparo de DNA, usando inibidores de moléculas pequenas da subunidade catalítica de proteína quinase de- pendente de DNA (DNA-PKcs) e/ou poli-(ADP-ribose) polimerase 1/2 (PARP1/2), o nível de ruptura de genes por nucleases é elevando for- çando as células a recorrerem a mais vias de reparo propensas a erros do que a NHEJ clássica, tal como NHEJ alternativa e/ou junção final mediada por micro-homologia. Portanto, um produto químico adicional é adicionado no curso da edição de genoma, o que pode, no entanto, ser desvantajoso para vários tipos de células e ensaios. Isso também pode afetar a integridade do genoma das células tratadas e/ou o po- tencial regenerativo.
[0013] Portanto, existe uma necessidade contínua em prover es- tratégias adequadas para a GE de precisão em organismos e células eucarióticas, que também sejam aplicáveis em plantas, especialmente plantas de cultura principais, que combinem clivagem de genoma de alta precisão e simultaneamente forneçam a possibilidade de mediar HDR altamente preciso e exato e, assim, o reparo direcionado de uma DSB, que é essencial para controlar uma edição de genes ou interven- ção em engenharia de genoma.
[0014] Foi, portanto, um objetivo da presente invenção aumentar a previsibilidade de abordagens de GE, em particular abordagens apli- cáveis a plantas e células de planta, em que o resultado de uma GE planejada in silico pode ser definido de maneira muito mais precisa, suprimindo as vias NHEJ relevantes de maneira combinada, além de prover modelos de reparo adequados para obter um material genético modificado, preferencialmente usando estratégias de introdução tran- siente. Portanto, foi um objetivo da presente invenção unificar a regu- lação negativa ou knockdown de vias NHEJ relevantes com estraté- gias de GE direcionadas apenas dentro de uma célula ou sistema ce- lular simultaneamente, para poder introduzir edições ou modificações específicas de sítio de maneira altamente precisa sem inserir muta- ções ou edições indesejadas em um genoma de interesse como inte- grações aleatórias - e, portanto, não previsíveis - durante o reparo de uma DSB induzida artificialmente.
SUMÁRIO DA INVENÇÃO
[0015] Os objetos acima foram solucionados provendo, em um primeiro aspecto, um método para modificar o material genético de um sistema celular em um local predeterminado com pelo menos uma se- quência de ácido nucleico de interesse, em que o método compreende as seguintes etapas: (a) prover um sistema celular compreendendo uma enzima polimerase teta, ou uma sequência que a codifica, e uma ou mais enzimas adicionais de uma via NHEJ, ou a(s) sequência(s) que as codifica(m); (b) inativar ou parcialmente inativar a enzima poli- merase teta, ou a sequência que a codifica, e inativar ou parcialmente inativar as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ, ou a(s) sequência(s) que as codifica(m); (c) introduzir no sistema celular ou um sistema de progênie do mesmo (i) a pelo menos uma sequência de ácido nucleico de interesse, opcionalmente flan- queada por uma ou mais sequências de homologia complementares a uma ou mais sequências de ácido nucleico adjacentes ao local prede- terminado, e (ii) pelo menos uma nuclease específica de sítio, ou uma sequência que a codifica, a nuclease específica de sítio induzindo uma ruptura de filamentos duplos no local predeterminado; e (d) opcional- mente: determinar a presença da modificação no local predeterminado no material genético do sistema celular; (e) obter um sistema celular compreendendo uma modificação no local predeterminado do material genético do sistema celular ou selecionar um sistema celular compre- endendo uma modificação no local predeterminado do material genéti- co do sistema celular com base na determinação de (d).
[0016] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método compreendendo uma etapa adicional de: (f) restaurar a atividade da enzima polimerase teta inati- vada ou parcialmente inativada e/ou restaurar a atividade das uma ou mais enzimas de reparo de DNA adicionalmente inativadas ou parci- almente inativadas de uma via NHEJ no sistema celular compreen- dendo uma modificação no local predeterminado, ou em um sistema de progênie do mesmo.
[0017] Em outra modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a polimerase teta a ser inativada ou parcialmente inativada (i) compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 2, 7, 8, 9 ou 10, ou (ii) compreende uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 2, 7, 8, 9 ou 10, respectivamente, preferencialmente por todo o comprimento da sequência; ou (iii) é codificada por uma sequência de ácido nucleico de acordo com a SEQ ID NO: 1, 3, 4, 5 ou 6, ou (iv) é codificada por uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 1, 3, 4, 5 ou 6, respectivamente, preferencialmente por todo o comprimento da sequência; ou (v) é codificada por uma se- quência de ácido nucleico hibridizando-se a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de (iii), prefe- rencialmente sob condições estringentes.
[0018] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são independentemente seleci- onadas do grupo que consiste em Ku70, Ku80, proteína quinase de- pendente de DNA, Ataxia telangiectasia mutada (ATM), ATM – e Rad3 – relacionada (ATR), Artemis, XRCC4, DNA ligase IV e XLF, ou qual- quer combinação das mesmas.
[0019] Em uma modalidade de acordo com os vários aspectos da presente invenção, pelo menos uma, pelo menos duas, pelo menos três ou pelo menos quatro enzimas de reparo de DNA adicionais de uma via NHEJ são inativadas ou parcialmente inativadas, preferenci-
almente em que pelo menos Ku70 e DNA ligase IV ou em que pelo menos Ku80 e DNA ligase IV são inativadas ou parcialmente inativa- das.
[0020] Em outra modalidade de acordo com os vários aspectos da presente invenção, uma, duas, três ou quatro enzimas de reparo de DNA adicionais de uma via NHEJ são inativadas ou parcialmente inati- vadas, preferencialmente em que Ku70 e DNA ligase IV ou em que Ku80 e DNA ligase IV são inativadas ou parcialmente inativadas.
[0021] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que as uma ou mais en- zimas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas são Ku70, ou uma sequência de ácido nucleico que a codifica, em que a Ku70 compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 12, 18, 19 ou 20, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 12, 18, 19 ou 20, respectivamente, preferencialmente por todo o comprimento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 11, 13, 14, 15, 16 ou 17, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 11, 13, 14, 15, 16 ou 17, respectivamente, preferencial- mente por todo o comprimento da sequência, ou a sequência de ácido nucleico se hibridiza a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 11, 13, 14, 15, 16 ou 17, preferencialmente sob condições estringentes.
[0022] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são Ku80, ou uma sequência de ácido nucleico que a codifica, em que a Ku80 compreende uma se- quência de aminoácido de acordo com a SEQ ID NO: 22, 23, 24 ou 29, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identi- dade de sequência com a sequência estabelecida na SEQ ID NO: 22, 23, 24 ou 29, respectivamente, preferencialmente por todo o compri- mento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 21, 25, 26, 27 ou 28, ou uma sequência de ácido nucleico tendo pelo me- nos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 21, 25, 26, 27 ou 28, respectivamente, preferenci- almente por todo o comprimento da sequência, ou a sequência de áci- do nucleico se hibridiza a uma sequência de ácido nucleico comple- mentar à sequência de ácido nucleico de acordo com a SEQ ID NO: 21, 25, 26, 27 ou 28, preferencialmente sob condições estringentes.
[0023] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são a proteína quinase depen- dente de DNA, ou uma sequência de ácido nucleico que a codifica, em que a proteína quinase dependente de DNA compreende uma se- quência de aminoácido de acordo com a SEQ ID NO: 32, 33 ou 35, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%,
78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identi- dade de sequência com a sequência estabelecida na SEQ ID NO: 32, 33 ou 35, respectivamente, preferencialmente por todo o comprimento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 30, 31 ou 34, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 30, 31 ou 34, respectivamente, preferencialmente por todo o com- primento da sequência, ou a sequência de ácido nucleico se hibridiza a uma sequência de ácido nucleico complementar à sequência de áci- do nucleico de acordo com a SEQ ID NO: 30, 31 ou 34, preferencial- mente sob condições estringentes.
[0024] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são ATM, ou uma sequência de ácido nucleico que as codifica, em que a ATM compreende uma se- quência de aminoácido de acordo com a SEQ ID NO: 37, 38, 39, 41, 42, 43, 44, 45, 46, 47 ou 48, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência esta- belecida na SEQ ID NO: 37, 38, 39, 41, 42, 43, 44, 45, 46, 47 ou 48, respectivamente, preferencialmente por todo o comprimento da se- quência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 36 ou 40, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%,
77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 36 ou 40, respectivamente, preferencialmente por todo o compri- mento da sequência, ou a sequência de ácido nucleico se hibridiza a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 36 ou 40, preferencialmente sob condições estringentes.
[0025] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são ATM – e Rad3 – relacionada (ATR), ou uma sequência de ácido nucleico que as codifica, em que a ATR compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 50, 51, 52, 53, 55 ou 56, ou uma sequência de aminoáci- do tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a se- quência estabelecida na SEQ ID NO: 50, 51, 52, 53, 55 ou 56, respec- tivamente, preferencialmente por todo o comprimento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 49 ou 54, ou uma se- quência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 49 ou 54, respectivamente, preferencialmente por todo o comprimento da se- quência, ou a sequência de ácido nucleico se hibridiza a uma sequên- cia de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 49 ou 54, preferencialmente sob condições estringentes.
[0026] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são Artemis, ou uma sequência de ácido nucleico que a codifica, em que a Artemis compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 60, 61, 62 ou 64, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 60, 61, 62 ou 64, respectivamente, preferencialmente por todo o comprimento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 57, 58, 59 ou 63, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 57, 58, 59 ou 63, respectivamente, preferencial- mente por todo o comprimento da sequência, ou a sequência de ácido nucleico se hibridiza a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 57, 58, 59 ou 63, preferencialmente sob condições estringentes.
[0027] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são XRCC4, ou uma sequência de ácido nucleico que as codifica, em que a XRCC4 compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 66, 67 ou 69, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%,
78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identi- dade de sequência com a sequência estabelecida na SEQ ID NO: 66, 67 ou 69, respectivamente, preferencialmente por todo o comprimento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 65 ou 68, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 65 ou 68, respectivamente, preferencialmente por todo o compri- mento da sequência, ou a sequência de ácido nucleico se hibridiza a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 65 ou 68, preferencialmente sob condições estringentes.
[0028] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são DNA ligase IV, ou uma se- quência de ácido nucleico que as codifica, em que a DNA ligase IV compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 71, 72, 76 ou 77, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 71, 72, 76 ou 77, respectivamente, preferencial- mente por todo o comprimento da sequência, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acor- do com a SEQ ID NO: 70, 73, 74 ou 75, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%,
82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 70, 73, 74 ou 75, respectiva- mente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico se hibridiza a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 70, 73, 74 ou 75, preferencialmente sob condições es- tringentes.
[0029] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são XLF, ou uma sequência de ácido nucleico que a codifica.
[0030] Em outra modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que as uma ou mais en- zimas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas são a Ku70 ou a sequência de ácido nucleico que a codifica, e/ou a Ku80 ou a sequência de ácido nucleico que a codifica, e/ou a proteína quinase dependente de DNA, ou a se- quência de ácido nucleico que a codifica, e/ou a ATM ou a sequência de ácido nucleico que a codifica, e/ou a ATM – e Rad3 – relacionada (ATR), ou a sequência de ácido nucleico que a codifica, e/ou a Arte- mis, ou a sequência de ácido nucleico que a codifica, e/ou a XRCC4, ou a sequência de ácido nucleico que a codifica, e/ou a DNA ligase IV, ou a sequência de ácido nucleico que a codifica, e/ou a XLF, ou a se- quência de ácido nucleico que a codifica.
[0031] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse é provida como parte de pelo menos um constructo genético, ou como pelo menos uma molécula linear.
[0032] Em outra modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que o pelo menos um constructo genético é introduzido no sistema celular por meio biológico ou físico, incluindo transfecção, transformação, incluindo transforma- ção por Agrobacterium spp., preferencialmente por Agrobacterium tu- mefaciens, um vetor viral, bombardeio biolístico, transfecção usando agentes químicos, incluindo transfecção de polietileno glicol, eletropo- ração, fusão de eletrocélulas, ou qualquer combinação dos mesmos.
[0033] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, é provido um método, em que a pelo menos uma nuclease específica de sítio ou uma parte da mesma, ou a se- quência que a codifica, é introduzida no sistema celular por meio bio- lógico ou físico, incluindo transfecção, transformação, incluindo trans- formação por Agrobacterium spp., preferencialmente por Agrobacte- rium tumefaciens, um vetor viral, bombardeio, transfecção usando agentes químicos, incluindo transfecção de polietileno glicol, eletropo- ração, fusão de eletrocélulas, ou qualquer combinação dos mesmos.
[0034] É ainda provido um método de acordo com os vários aspec- tos divulgados neste documento, em que a pelo menos uma nuclease específica de sítio ou um fragmento cataliticamente ativo da mesma é introduzida no sistema celular como uma sequência de ácido nucleico que codifica a nuclease específica de sítio ou o fragmento catalitica- mente ativo da mesma, em que a sequência de ácido nucleico é parte de pelo menos um constructo genético, ou em que a pelo menos uma nuclease específica de sítio ou o fragmento cataliticamente ativo da mesma é introduzida no sistema celular como pelo menos uma molé- cula de mRNA ou como pelo menos uma sequência de aminoácido.
[0035] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular é selecionada do grupo que consiste em: um transgene, um cisgene, um gene endógeno modificado, um gene otimizado de códon, uma sequência sintética, uma sequência intrônica, uma se- quência de codificação ou uma sequência reguladora ou uma parte da mesma incluindo um promotor núcleo, um elemento de ação cis, moti- vo conservado como TATA box et cetera.
[0036] Em outra modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular é um transgene ou cisgene, em que o transgene ou cis- gene compreende uma sequência de ácido nucleico que codifica um gene de um genoma de um organismo de interesse, ou pelo menos uma parte do referido gene.
[0037] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular em um local predeterminado é um transgene ou um cisgene ou parte do transgene ou cisgene de um organismo de inte- resse, em que o transgene ou o cisgene ou parte do transgene ou cis- gene é selecionado do grupo que consiste em um gene que codifica tolerância a estresse abiótico, incluindo estresse hídrico, estresse os- mótico, estresse térmico, chilling stress, estresse por frio incluindo frost, estresse oxidativo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resis- tência a herbicida, incluindo resistência a glifosato, glufosina- to/fosfinotricina, higromicina (hyg), inibidores de protoporfirinogênio oxidase (PPO), inibidores de ALS, e Dicamba, um gene que codifica resistência ou tolerância a estresse biótico, incluindo um gene de re- sistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a inseto, ou um gene que codifica um traço relativo a rendimento, incluindo resistência ao acamamento, resistência ao pendoamento, tempo de floração, resistência à deiscên- cia, cor da semente, composição do endosperma, ou teor nutricional.
[0038] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular em um local predeterminado é pelo menos parte de um gene endógeno modificado de um organismo de interesse, em que o gene endógeno modificado compreende pelo menos uma exclusão, inserção e/ou substituição de pelo menos um nucleotídeo em compa- ração com a sequência de ácido nucleico do gene endógeno não mo- dificado (tipo selvagem).
[0039] Em outra modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular em um local predeterminado é pelo menos parte de um gene endógeno modificado de um organismo de interesse, em que o gene endógeno modificado compreende pelo menos um de um trun- camento, duplicação, substituição e/ou exclusão de pelo menos uma posição de ácido nucleico que codifica um domínio do gene endógeno modificado.
[0040] Ainda em outras modalidade de acordo com os vários as- pectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular em um local predeterminado é pelo menos par- te de uma sequência reguladora, em que a sequência reguladora compreende pelo menos uma de uma sequência promotora núcleo, uma sequência promotora proximal, um elemento de ação cis, um elemento de ação trans, uma sequência de controle de locus, uma se-
quência de isolamento, uma sequência de silenciamento, uma se- quência de aprimoramento, uma sequência de terminação, um motivo conservado de um elemento regulador como TATA box e/ou qualquer combinação dos mesmos.
[0041] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma nuclease específica de sítio compreende uma nuclease de dedo de zinco, uma nuclease efetora do tipo ativadora de transcrição, um sis- tema CRISPR/Cas, incluindo um sistema CRISPR/Cas9, um sistema CRISPR/Cpf1, um sistema CRISPR/CasX, um sistema CRISPR/CasY, uma endonuclease de homing modificada e uma meganuclease, e/ou qualquer combinação, variante ou fragmento cataliticamente ativo dos mesmos.
[0042] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que as uma ou mais sequências de ácido nucleico flanqueando a pelo menos uma sequência de ácido nucleico de interesse no local predeterminado é/são pelo menos 85%, 86%, 87%, 88%, ou 89%, preferencialmente pelo menos 90%, 91%, 92%, 93%, 94% ou 95%, mais preferencial- mente pelo menos 96%, 97%, 98%, 99%, 99,5% ou 100% complemen- tares às uma ou mais sequências de ácido nucleico adjacentes ao lo- cal predeterminado, a montante e/ou a jusante do local predetermina- do, por todo o comprimento da(s) respectiva(s) região(ões) adjacen- te(s).
[0043] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, é provido um método, em que o material genético do sistema celular é selecionado do grupo que consiste em um protoplasto, um genoma viral transferido em uma célula hospedeira recombinante, uma célula eucariótica ou procariótica, tecido ou órgão, e um organismo eucariótico ou procariótico.
[0044] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que o material genético do sistema celular é selecionado de uma célula eucariótica, em que a célula eucariótica é uma célula de planta.
[0045] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que o orga- nismo eucariótico é uma planta, ou uma parte de uma planta.
[0046] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, é provido um método, em que a parte da planta é selecionada do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flor, pétalas, frutas, pólen, tubos de pólen, filamentos de anteras, óvulos, sacos embrionários, óvulos, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, sementes, raízes e mudas.
[0047] Em uma modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que o material genético do sistema celular é, ou se origina de, uma espécie de planta selecio- nada do grupo que consiste em: Hordeum vulgare, Hordeum bulbu- som, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria ita- lica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triti- cum aestivum, Secale cereale, Malus domestica, Brachypodium dista- chyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Be- ta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eu- calyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nico- tiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Ara- bidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris,
Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oele- racia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica ni- gra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bi- jugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus ca- janifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Al- lium fistulosum, Allium sativum e Allium tuberosum.
[0048] Em um aspecto adicional de acordo com a presente inven- ção, é provido um sistema celular obtido por um método de acordo com qualquer um dos aspectos e modalidades acima.
[0049] Ainda em outro aspecto adicional de acordo com a presente invenção, é provido um sistema celular compreendendo uma enzima polimerase teta (Pol teta) inativada ou parcialmente inativada e uma ou mais enzimas de reparo de DNA inativadas ou parcialmente inativadas adicionais de uma via NHEJ, em que o sistema celular modificado é selecionado do grupo que consiste em uma ou mais células de planta, uma planta, e partes de uma planta.
[0050] Em uma modalidade de acordo com os vários aspectos di- vulgados neste documento, é provido um sistema celular, em que as uma ou mais partes da planta é/são selecionada(s) do grupo que con- siste em folhas, caules, raízes, radículas emergidas, flores, partes de flor, pétalas, frutas, pólen, tubos de pólen, filamentos de anteras, óvu- los, sacos embrionários, óvulos, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, sementes, raízes e mudas.
[0051] Em outra modalidade de acordo com os vários aspectos divulgados neste documento, é provido um sistema celular, em que as uma ou mais células de planta, a(s) planta(s) ou a(s) parte(s) de uma planta se origina(m) de uma espécie de planta selecionada do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bi- color, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum mari- num, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicoti- ana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Cruci- himalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepi- dium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Ara- bis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Ra- phanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scara- baeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sati- vum e Allium tuberosum.
[0052] Outros aspectos e modalidades da presente invenção po- dem ser derivados da subsequente descrição detalhada, da listagem de sequências, bem como do conjunto anexo de reivindicações.
DESENHOS
[0053] Figura 1. Visão geral da expressão de genes PolQ, Ku70, Ku80 e LigIV nas linhagens mutantes N698253 (teb-2), N667884 (teb- 5), N656431 (ligIV), N656936 (ku70) e N677892 (ku80). A expressão de gene foi determinada por qRT-PCR usando iniciadores direciona- dos a uma região que não se sobrepõe ao sítio de inserção de T-DNA. Plantas do tipo selvagem Col-0 foram usadas como referência. Os da-
dos de qRT-PCR indicam que a expressão dos genes PolQ, LigIV e Ku80 é significativamente reduzida nas respectivas linhagens mutan- tes. Embora os transcritos de Ku70 sejam detectáveis em N656936, a linhagem mutante pode ser um mutante nulo.
[0054] Figura 2. Representação do constructo de direcionamento de gene usado. LB/RB: borda esquerda/borda direita; PcUbi4-2(P): promotor de ubiquitina de salsa; Cas9: nuclease Cas9; AtU6-26(P): promotor U6 para expressar o RNA guia (sgRNA). As linhas verticais indicam os sítios de reconhecimento para a nuclease Cas9, e marcam o cassete de direcionamento de gene. O cassete é flanqueado por se- quências homólogas para o alvo do gene ADH1 (674 bp a montante, 673 bp a jusante) e uma sequência de codificação de GFP sob contro- le do promotor 2S específico de semente (A). Sementes obtidas após a transformação por imersão floral do constructo de direcionamento em plantas Col-0 Arabidopsis. Direita: campo claro; Esquerda: fluores- cência verde. Os círculos brancos indicam sementes fluorescentes (B).
[0055] Figura 3. Imagem de campo claro da linhagem teb-2 mutan- te e do tipo selvagem transformado (Col-0). A seleção de BASTA foi feita para alíquotas das linhagens mutantes e do tipo selvagem trans- formadas (é apenas mostrada a linhagem teb-2 mutante. Os resulta- dos para as outras linhagens mutantes foram semelhantes). Para ne- nhuma das mutantes, plantas resistentes a BASTA foram identificadas, demonstrando que não há integração aleatória do T-DNA nessas mu- tantes.
[0056] Figura 4. Confirmação do direcionamento de genes em se- mentes fluorescentes por PCR. (A) #2: Sementes fluorescentes da li- nhagem mutante pol Q transformada (evento potencial de direciona- mento de gene); #3: Sementes fluorescentes da planta do tipo selva- gem Col-0 transformada (integração aleatória). (B) confirmação por PCR do direcionamento de gene: #2, #3: DNA de plantas cultivadas a partir das respectivas sementes fluorescentes. WT: DNA de planta do tipo selvagem Col-0 não transformada. P: Vetor de direcionamento de genes (DNA de plasmídeo). PCR1: Locus adh1 do tipo selvagem. PCR2: Detecção do evento de recombinação homóloga usando os ini- ciadores HDRadh1-F (ligação apenas no locus genômico adh1) e HDRadh1-R (ligação no promotor 2S do cassete de direcionamento de gene). (C) Os sítios de ligação são indicados no desenho inferior, o tamanho do produto é 945 bp. A formação do produto confirma uma recombinação homóloga e é encontrada apenas na semente mutante fluorescentes (# 2), enquanto está ausente na semente fluorescente do tipo selvagem. O tipo selvagem de Col-0 e o plasmídeo servem como controles. PCR3: Igual a PCR2, exceto que foram utilizados os iniciadores HDRadh1-F2/R2. Esses iniciadores ligam algumas bases a montante/a jusante do amplicon de PCR2, levando a um produto ligei- ramente maior. PCR3 confirma os resultados de PCR2 com um se- gundo conjunto de iniciadores independentes.
DEFINIÇÕES
[0057] Os termos "associado a" ou "em associação com", de acor- do com a presente divulgação, devem ser interpretados de maneira ampla e, portanto, de acordo com a presente invenção implicam que uma molécula (DNA, RNA, aminoácido, compreendendo blocos de construção sintéticos e/ou de ocorrência natural) é fornecida em asso- ciação física com outra molécula, a associação sendo de natureza co- valente ou não covalente. Por exemplo, um modelo de reparo pode ser associado a um gRNA de uma nuclease CRISPR, em que a associa- ção pode ser de natureza não covalente (emparelhamento de base complementar) ou as moléculas podem ser fisicamente ligadas entre si por uma ligação covalente.
[0058] O termo "fragmento cataliticamente ativo", como usado nes- te documento, referente às sequências de aminoácido, representa a sequência núcleo derivada de uma determinada sequência de amino- ácido modelo, ou uma sequência de ácido nucleico que a codifica, compreendendo todo ou parte do sítio ativo da sequência modelo com a condição de que o fragmento cataliticamente ativo resultante ainda possua a atividade caracterizando a sequência modelo, pela qual o sítio ativo da enzima nativa ou uma variante do mesmo é responsável. As referidas modificações são adequadas para gerar sequências de aminoácido menos volumosas ainda tendo a mesma atividade que uma sequência modelo, tornando o fragmento cataliticamente ativo uma ferramenta mais versátil ou mais estável sendo estereologicamen- te menos exigente.
[0059] Uma "conexão covalente" ou "ligação covalente" é uma li- gação química que envolve o compartilhamento de pares de elétrons entre átomos das moléculas ou sequências covalentemente ligadas entre si. Uma interação "não covalente" difere de uma ligação covalen- te, pois não envolve o compartilhamento de elétrons, mas envolve va- riações mais dispersas de interações eletromagnéticas entre molécu- las/sequências ou dentro de uma molécula/sequência. Interações ou conexões não covalentes compreendem, portanto, interações eletros- táticas, forças de van der Waals, efeitos π e efeitos hidrofóbicos. De importância especial no contexto das moléculas de ácido nucleico são as ligações hidrogênio como interação eletrostática. Uma ligação hi- drogênio (ligação H) é um tipo específico de interação dipolo-dipolo que envolve a interação entre um átomo de hidrogênio parcialmente positivo e um átomo de oxigênio, nitrogênio, enxofre ou flúor altamente eletronegativo, parcialmente negativo não covalentemente ligado ao referido átomo de hidrogênio. Qualquer "associação" ou "associação física", conforme usado neste documento, implica, portanto, uma inte- ração ou conexão covalente ou não covalente. No caso de complexos moleculares, por exemplo, um complexo formado por uma nuclease
CRISPR, um gRNA e um RT, interações mais covalentes e não cova- lentes podem estar presentes para ligar e, assim, associar os diferen- tes componentes de um complexo molecular de interesse.
[0060] Os termos "polipeptídeo CRISPR", "endonuclease CRISPR", "nuclease CRISPR", "proteína CRISPR", "efetor CRISPR" ou "enzima CRISPR" são usados de forma intercambiável neste do- cumento e se referem a qualquer sequência de aminoácido artificial ou de ocorrência natural, ou a sequência de ácido nucleico que a codifica, atuando como nuclease ou nickase de DNA específica der sítio, em que o "polipeptídeo CRISPR" é derivado de um sistema CRISPR de qualquer organismo, que pode ser clonado e usado para engenharia de genoma direcionada. Os termos "nuclease CRISPR" ou "polipeptí- deo CRISPR" também compreendem mutantes ou fragmentos cataliti- camente ativos ou fusões de uma sequência efetora CRISPR de ocor- rência natural, ou as respectivas sequências que as codificam. Uma "nuclease CRISPR" ou "polipeptídeo CRISPR" pode, dessa forma, por exemplo, também se referir a uma nickase CRISPR ou mesmo a uma variante deficiente em nuclease de um polipeptídeo CRISPR que pos- sui função endonucleolítica em seu ambiente natural.
[0061] Uma "célula eucariótica", conforme usado neste documen- to, refere-se a uma célula tendo um núcleo verdadeiro, uma membrana nuclear e organelas pertencentes a qualquer um dos reinos de Protis- ta, Plantae, Fungi ou Animalia. Organismos eucarióticos podem com- preender organismos monocelulares e multicelulares. Os organismos e células eucarióticas preferidas de acordo com a presente invenção são células de plantas (ver abaixo).
[0062] "Complementar" ou "complementaridade", conforme usado neste documento, descreve a relação entre dois (c)DNA, dois RNA, ou entre um RNA e região de ácido nucleico de (c)DNA. Definidas pelas nucleobases do DNA ou RNA, duas regiões de ácido nucleico podem se hibridizar entre si de acordo com o modelo de bloqueio e chave. Para este fim, os princípios de emparelhamento de bases de Watson- Crick têm a base adenina e timina/uracil, bem como guanina e citosi- na, respectivamente, conforme bases complementares se aplicam. Além disso, também o emparelhamento não Watson-Crick, como o emparelhamento Watson-Crick reverso, Hoogsteen, Hoogsteen e Wobble reverso, é englobado pelo termo "complementar", como usado neste documento, desde que os respectivos pares de base possam construir ligações hidrogênio entre si, ou seja, dois filamentos de ácido nucleico diferentes possam se hibridizar entre si com base na referida complementaridade.
[0063] O termo "derivado" ou "descendente" ou "progênie", con- forme usado neste documento no contexto de uma célula procariótica ou eucariótica, preferencialmente uma célula animal e, mais preferen- cialmente, uma planta ou célula de planta ou material de planta, de acordo com a presente divulgação, refere-se aos descendentes de tal célula ou material que resulta da propagação reprodutiva natural, inclu- indo a propagação sexual e assexual. É conhecido pela pessoa versa- da na técnica que a referida propagação pode levar à introdução de mutações no genoma de um organismo resultantes de fenômenos na- turais que resultam em um descendente ou progênie, que é genomi- camente diferente do organismo parental ou célula, no entanto, ainda pertence ao mesmo gênero/espécie e possui principalmente as mes- mas características que a célula hospedeira recombinante de origem. Tais derivados ou descendentes ou progênie resultantes de fenôme- nos naturais durante a reprodução ou regeneração são, portanto, compreendidos pelo termo da presente divulgação e podem ser facil- mente identificados pela pessoa versada na técnica ao comparar o "derivado" ou "descendente" ou "progênie" com a respectiva origem ou ascendente. Além disso, o termo "derivado", no contexto de uma subs-
tância ou molécula e não se referindo a uma célula ou organismo re- plicador, pode implicar uma substância ou molécula derivada da subs- tância ou molécula original por meios químicos e/ou biotecnológicos.
[0064] Como usado neste documento, "fusão" ou "fundido" pode se referir a uma proteína e/ou ácido nucleico compreendendo uma ou mais sequências não nativas (por exemplo, porções). Qualquer se- quência de ácido nucleico ou sequência de aminoácido de acordo com a presente invenção pode, portanto, ser fornecida na forma de uma molécula de fusão. Uma fusão pode ser na extremidade do terminal N ou terminal C da proteína modificada, ou ambas, ou dentro da molécu- la como domínio separado. Para moléculas de ácido nucleico, a molé- cula de fusão pode ser acoplada na extremidade 5’ ou 3’ ou em qual- quer posição adequada entre elas. Uma fusão pode ser uma fusão transcricional e/ou translacional. Uma fusão pode compreender uma ou mais das mesmas sequências não nativas. Uma fusão pode com- preender 10 ou mais de diferentes sequências não nativas. Uma fusão pode ser uma quimera. Uma fusão pode compreender um identificador de afinidade de ácido nucleico. Uma fusão pode compreender um có- digo de barras. Uma fusão pode compreender um identificador de afi- nidade peptídica. Uma fusão pode fornecer localização subcelular do efetor específico de sítio ou editor de base (por exemplo, um sinal de localização nuclear (NLS) para direcionamento (por exemplo, uma nu- clease específica de sítio) para o núcleo, um sinal de localização mito- condrial para direcionamento para as mitocôndrias, um sinal de locali- zação de cloroplasto para direcionamento para um cloroplasto, um si- nal de retenção de retículo endoplasmático (ER) e semelhantes). Uma fusão pode fornecer uma sequência não nativa (por exemplo, identifi- cador de afinidade) que pode ser usada para rastrear ou purificar. Uma fusão pode ser uma molécula pequena, tal como biotina, ou um coran- te, tal como os corantes alexa fluor, corante Cianina 3, corante Cianina
5. A fusão pode prover maior ou menor estabilidade.
Em algumas mo- dalidades, uma fusão pode compreender um rótulo detectável, incluin- do uma porção que pode fornecer um sinal detectável.
Rótulos e/ou porções detectáveis adequados que podem fornecer um sinal detectá- vel podem incluir, mas sem limitação, uma enzima, um radioisótopo, um membro de um par de ligação específica; um fluoróforo; um repór- ter fluorescente ou proteína fluorescente; um ponto quântico; e seme- lhantes.
Uma fusão pode compreender um membro de um par FRET ou um par de doador/aceptor de fluoróforo/ponto quântico.
Uma fusão pode compreender uma enzima.
Enzimas adequadas podem incluir, mas sem limitação, peroxidase de rábano silvestre, luciferase, beta-25 galactosidase e semelhantes.
Uma fusão pode compreender uma pro- teína fluorescente.
Proteínas fluorescentes adequadas podem incluir, mas sem limitação, uma proteína fluorescente verde (GFP), (por exemplo, uma GFP de Aequoria victoria, proteínas fluorescentes de Anguilla japonica, ou um mutante ou seu derivado), uma proteína fluo- rescente vermelha, uma proteína fluorescente amarela, uma proteína fluorescente verde-amarela (por exemplo, mNeonGreen derivada de uma proteína fluorescente tetramérica do cefalocordado Branchiosto- ma lanceolatum) qualquer de uma variedade de proteínas fluorescen- tes e coloridas.
Uma fusão pode compreender uma nanopartícula.
Na- nopartículas adequadas podem incluir nanopartículas fluorescentes ou luminescentes, e nanopartículas magnéticas, ou nanodiamantes, opci- onalmente ligados a uma nanopartícula.
Qualquer propriedade óptica ou magnética ou característica da(s) nanopartícula(s) pode ser detec- tada.
Uma fusão pode compreender uma helicase, uma nuclease (por exemplo, Fokl), uma endonuclease, uma exonuclease (por exemplo, uma exonuclease 5’ e/ou exonuclease 3’), uma ligase, uma nickase, uma nuclease-helicase (por exemplo, Cas3), uma metiltransferase de DNA (por exemplo, Dam), ou desmetilase de DNA, uma histona metil-
transferase, uma histona desmetilase, uma acetilase (incluindo, por exemplo e sem limitação, uma histona acetilase), uma desacetilase (incluindo, por exemplo e sem limitação, uma histona desacetilase), uma fosfatase, uma quinase, um (co)ativador de transcrição, um (co)fator de transcrição, uma subunidade de RNA polimerase, um re- pressor de transcrição, uma proteína de ligação a DNA, uma proteína de estruturação de DNA, um RNA de não-codificação longo, uma pro- teína de reparo de DNA (por exemplo, uma proteína envolvida no re- paro de rupturas de filamentos simples e/ou duplos), por exemplo, pro- teínas envolvidas no reparo de excisão de base, reparo de excisão de nucleotídeo, reparo de incompatibilidade, NHEJ, HR, junção final me- diada por micro-homologia (MMEJ) e/ou junção final não homóloga alternativa (ANHEJ), tal como, exemplo e sem limitação, reguladores de HR e sinais complexos de montagem de HR), uma proteína marca- dora, uma proteína repórter, uma proteína fluorescente, uma proteína de ligação a ligando (por exemplo, mCherry ou uma proteína de liga- ção de metais pesados), um peptídeo sinal (por exemplo, sequência de sinal Tat), uma proteína ou peptídeo alvo, uma sequência de locali- zação subcelular (por exemplo, sequência de localização nuclear, uma sequência de localização de cloroplasto), e/ou um epítopo de anticor- po, ou qualquer combinação dos mesmos.
[0065] Os termos "constructo genético" ou "constructo recombi- nante", "vetor" ou "plasmídeo (vetor)" (por exemplo, no contexto de pelo menos uma sequência de ácido nucleico a ser introduzida em um sistema celular) são usados neste documento para se referir a um constructo compreendendo, entre outros, plasmídeos ou vetores (de plasmídeos), cosmídeos, cromossomos artificiais de bactérias ou de leveduras artificiais (YACs e BACs), fagomídeos, vetores baseados em fagos bacterianos, um cassete de expressão, sequências de ácido nu- cleico de fita simples e fita dupla isoladas, compreendendo sequências de DNA e RNA de forma linear ou circular, ou sequências de aminoá- cido, vetores virais, incluindo vírus modificados, e uma combinação ou uma mistura dos mesmos, para introdução ou transformação, transfec- ção ou transdução em qualquer célula alvo procariótica ou eucariótica, incluindo uma planta, célula de planta, tecido, órgão ou material de acordo com a presente divulgação. "Recombinante" no contexto de um material biológico, por exemplo, uma célula ou vetor, implica, portanto, um material produzido artificialmente.
Um constructo recombinante de acordo com a presente divulgação pode compreender um domínio efe- tor, na forma de um ácido nucleico ou uma sequência de aminoácido, em que um domínio efetor representa uma molécula, que pode exercer um efeito em uma célula alvo e inclui um transgene, um cisgene, uma molécula de RNA de fita simples ou fita dupla, incluindo um RNA guia ((s)gRNA), um miRNA ou um siRNA ou uma sequência de aminoácido, incluindo, entre outros, uma enzima ou um fragmento catalítico ativo da mesma, uma proteína de ligação, um anticorpo, um fator de trans- crição, uma nuclease, preferencialmente uma nuclease específica de sítio, e semelhantes.
Além disso, o constructo recombinante pode compreender sequências reguladoras e/ou sequências de localização.
O constructo recombinante pode ser integrado em um vetor, incluindo um vetor de plasmídeo, e/ou pode estar presente isolado de uma es- trutura vetorial, por exemplo, na forma de uma sequência de polipeptí- deo ou como uma ácido nucleico de fita simples ou fita dupla conecta- do a não vetor.
Após sua introdução, por exemplo, por transformação ou transfecção por meio biológico ou físico, o constructo genético pode persistir de forma extracromossômica, ou seja, não integrado ao ge- noma da célula-alvo, por exemplo, na forma de um DNA de fita simples ou fita dupla, um RNA de fita simples ou fita dupla ou como uma se- quência de aminoácido.
Alternativamente, o constructo genético, ou partes dele, de acordo com a presente divulgação, pode ser integrado de forma estável no genoma de uma célula alvo, incluindo o genoma nuclear ou outros elementos genéticos de uma célula alvo, incluindo o genoma de plastídeos como mitocôndrias ou cloroplastos. O termo ve- tor de plasmídeo, como usado neste contexto, refere-se a um cons- tructo genético originalmente obtido de um plasmídeo. Um plasmídeo geralmente se refere a um elemento extracromossômico de replicação autônoma circular na forma de uma sequência de ácido nucleico de fita dupla. No campo da engenharia genética, esses plasmídeos são rotineiramente submetidos a modificações direcionadas inserindo, por exemplo, genes que codificam uma resistência a um antibiótico ou um herbicida, um gene que codifica uma sequência de ácido nucleico alvo, uma sequência de localização, uma sequência reguladora, uma se- quência de identificadores, um gene marcador, incluindo um marcador antibiótico ou um marcador fluorescente, uma sequência, opcional- mente codificante, um facilmente identificável e semelhantes. Os com- ponentes estruturais do plasmídeo original, como a origem de replica- ção, são mantidos. De acordo com determinadas modalidades da pre- sente invenção, a sequência de localização pode compreender uma sequência de localização nuclear (NLS), uma sequência de localização de plastídeo, preferencialmente uma sequência de localização de mi- tocôndria ou uma sequência de localização de cloroplasto. As referidas sequências de localização estão disponíveis para o versado na técnica de biotecnologia de plantas. Uma variedade de vetores de plasmídeo para uso em células alvo diferentes de interesse é comercialmente disponível e a modificação do mesmo é conhecida pela pessoa versa- da no respectivo campo.
[0066] Um "genoma" usado neste documento inclui ambos os ge- nes (as regiões de codificação), o DNA não codificante e, se presente, o material genético das mitocôndrias e/ou cloroplastos, ou o material genômico que codifica um vírus, ou parte de um vírus. O "genoma" ou
"material genético" de um organismo geralmente consiste em DNA, em que o genoma de um vírus pode consistir em RNA (fita simples ou fita dupla).
[0067] Os termos "edição de genoma", "edição de gene" e "enge- nharia de genoma" são usados de forma intercambiável neste docu- mento e se referem a estratégias e técnicas para a modificação espe- cífica direcionada de qualquer informação genética ou genoma de um organismo vivo em pelo menos uma posição. Dessa forma, os termos compreendem edição de genes, mas também a edição de outras regi- ões que não as regiões de codificação de gene de um genoma. Além disso, compreende a edição ou engenharia do nuclear (se presente), bem como outras informações genéticas de uma célula. Além disso, os termos "edição de genoma", "edição de gene" e "engenharia de geno- ma" também compreendem edição ou engenharia epigenética, ou se- ja, a modificação direcionada de, por exemplo, metilação, modificação de histona ou de RNAs não codificadores, possivelmente causando alterações hereditárias expressão de genes.
[0068] Os termos "RNA guia", "gRNA", "RNA de guia única" ou "sgRNA" são usados de forma intercambiável neste documento e refe- rem-se a uma fusão sintética de um RNA CRISPR (crRNA) e um crR- NA de trans-ativação (tracrRNA), ou o termo refere-se a uma única molécula de RNA que consiste apenas em um crRNA e/ou um tracrR- NA, ou o termo refere-se a um gRNA que compreende individualmente uma porção crRNA ou tracrRNA. Uma porção crRNA, se presente, conforme exigido pelo respectivo polipeptídeo CRISPR, não precisa necessariamente estar presente em uma molécula de RNA covalente- mente ligada, mas também pode ser composta por duas moléculas de RNA individuais, que podem se associar ou podem ser associadas por interação não covalente ou covalente para prover um gRNA de acordo com a presente divulgação. No caso de endonucleases orientadas por
RNA únicas, como Cpf1 (ver Zetsche et al., 2015, supra), por exemplo, um crRNA como sequência de ácido nucleico guia única pode ser sufi- ciente para mediar o direcionamento de DNA.
[0069] O termo "hibridização", como usado neste documento, refe- re-se ao emparelhamento de ácidos nucleicos complementares, isto é, DNA e/ou RNA, usando qualquer processo pelo qual um filamento de ácido nucleico se une a um filamento complementar através de empa- relhamento de base para formar um complexo hibridizado. A hibridiza- ção e a força de hibridização (ou seja, a força da associação entre os ácidos nucléicos) são impactadas por fatores como o grau e o compri- mento de complementaridade entre os ácidos nucléicos, estringência das condições envolvidas, a temperatura de fusão (Tm) do híbrido formado, e a razão G:C dentro dos ácidos nucleicos. O termo comple- xo hibridizado refere-se a um complexo formado entre duas sequên- cias de ácido nucleico em virtude da formação de ligações hidrogênio entre bases G e C complementares e entre bases A e T/U complemen- tares. Um complexo hibridizado ou um constructo híbrido correspon- dente pode ser formado entre duas moléculas de ácido nucleico de DNA, entre duas moléculas de ácido nucleico de RNA ou entre uma molécula de ácido nucleico de DNA e uma de RNA. Para todas as constelações, as moléculas de ácido nucleico podem ser moléculas de ácido nucleico de ocorrência natural geradas in vitro ou in vivo e/ou moléculas de ácido nucleico artificiais ou sintéticas. A hibridização, conforme detalhada acima, por exemplo, pares de base de Watson- Crick, que podem se formar entre sequências de DNA, RNA e DNA/RNA, é ditada por um padrão de ligação de hidrogênio específi- co, que assim representa uma forma de conexão não covalente de acordo com a presente invenção. No contexto de hibridização, o termo "condições estringentes de hibridização" deve ser entendido como aquelas condições sob as quais uma hibridização ocorre principalmen-
te apenas entre moléculas homólogas de ácido nucleico. O termo "condições de hibridização" neste contexto refere-se não apenas às condições reais prevalecentes durante a aglomeração real dos ácidos nucleicos, mas também às condições prevalecentes durante as etapas subsequentes de lavagem. Exemplos de condições de hibridização estringentes são condições sob as quais primariamente apenas aque- las moléculas de ácido nucleico que têm pelo menos 75%, preferenci- almente pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo me- nos 98%, pelo menos 99% ou pelo menos 99,5% de identidade da se- quência sofrem hibridização. As condições de hibridização estringen- tes são, por exemplo: 4×SSC a 65ºC e lavagens múltiplas subsequen- tes em 0,1×SSC a 65ºC por aproximadamente 1 hora. O termo "condi- ções de hibridização estringentes", como usado neste documento, também pode significar: hibridização a 68ºC em 0,25 M de fosfato de sódio, pH 7,2, 7% de SDS, 1 mM de EDTA e 1% de BSA por 16 horas e subsequentemente lavagem duas vezes com 2×SSC e 0,1% de SDS a 68ºC. Preferencialmente, a hibridização ocorre sob condições estrin- gentes.
[0070] Os termos "nucleotídeo" e "ácido nucleico", com referência a uma sequência ou molécula, são usados de forma intercambiável neste documento e se referem a um DNA ou RNA de fita simples ou dupla de origem natural ou sintética. O termo sequência de nucleotí- deo é assim usada para qualquer sequência de DNA ou RNA inde- pendente do seu comprimento, portanto, o termo compreende qual- quer sequência de nucleotídeo compreendendo menos um nucleotí- deo, mas também qualquer tipo de oligonucleotídeo ou polinucleotídeo maior. O(s) termo(s) refere(m)-se, assim, a sequências de ácido ribo- nucleico (RNA) ou ácido desoxirribonucleico (DNA) naturais e/ou sinté-
ticas, que podem opcionalmente compreender análogos de ácido nu- cleico sintético.
Um ácido nucleico de acordo com a presente divulga- ção pode opcionalmente ser otimizado por códon.
A otimização de có- don implica que o uso de códon de DNA ou RNA é adaptado ao de uma célula ou organismo de interesse para melhorar a taxa de trans- crição do referido ácido nucleico recombinante na célula ou organismo de interesse.
O versado está bem ciente do fato de que um ácido nu- cleico alvo pode ser modificado em uma posição devido à degenera- ção de códon, enquanto essa modificação ainda levará à mesma se- quência de aminoácido naquela posição após a translação, que é al- cançada por otimização de códon para levar em consideração o uso de códons específicos da espécie de uma célula ou organismo alvo.
Sequências de ácido nucleico de acordo com o presente pedido po- dem portar otimização de códon específico para a seguinte lista não limitante de organismos: Hordeum vulgare, Sorghum bicolor, Secale cereale, Triticale, Saccharum officinarium, Zea mays, Setaria italic, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Hordeum bulbosum, Brachypodium dista- chyon, Hordeum marinum, Aegilops tauschii, Malus domestica, Beta vulgaris, Helianthus annuus, Daucus glochidiatus, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Erythranthe guttata, Genlisea aurea, Nicotiana sylvestris, Nicotiana tabacum, Nico- tiana tomentosiformis, Nicotiana benthamiana, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Cucumis sativus, Morus notabilis, Arabidopsis thaliana, Arabidopsis lyrata, Arabidopsis arenosa, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olmarabi- dopsis pumila, Arabis hirsuta, Brassica napus, Brassica oleracea, Brassica rapa, Brassica juncacea, Brassica nigra, Raphanus sativus, Eruca vesicaria sativa, Citrus sinensis, Jatropha curcas, Glycine max,
Gossypium ssp., Populus trichocarpa, Mus musculus, Rattus norvegi- cus ou Homo sapiens.
[0071] O termo "bombardeio de partícula", como usado neste do- cumento, também denominado "transfecção biolística" ou "bombardeio biolístico" ou "transferência de genes mediada por micropartículas", refere-se a um método de entrega física para transferir uma micropar- tícula ou nanopartícula revestida compreendendo um ácido nucleico ou um constructo genético de interesse em uma célula ou tecido alvo. A micro- ou nanopartícula funciona como projétil e é disparada sobre a estrutura alvo de interesse sob alta pressão usando um dispositivo adequado, geralmente denominado "pistola de genes". A transforma- ção através do bombardeio de partículas usa um microprojétil de metal coberto com o gene de interesse, que é, em seguida, disparado nas células alvo usando um equipamento conhecido como "pistola de ge- nes" (Sandford et al. 1987) em alta velocidade rápida o suficiente para penetrar na parede celular de um tecido alvo, mas não suficientemente severo para causar a morte celular. Para protoplastos, que têm sua parede celular totalmente removida, as condições são diferentes logi- camente. O ácido nucleico precipitado ou o constructo genético no pe- lo menos um microprojétil é liberado na célula após o bombardeio, e integrado no genoma ou expresso transientemente de acordo com a definição dada acima. A aceleração de microprojéteis é realizada por uma descarga elétrica de alta tensão ou gás comprimido (hélio). No que diz respeito às partículas de metal usadas, é obrigatório que se- jam não tóxicas, não reativas e que tenham um diâmetro menor do que a célula alvo. Os mais comumente usados são ouro ou tungstênio. Há muitas informações disponíveis publicamente nos fabricantes e fornecedores de pistolas de genes e sistema associado a respeito de seu uso geral.
[0072] Os termos "planta" ou "célula de plantas", como usado nes-
te documento, referem-se a um organismo de plantas, um órgão de plantas, tecidos de plantas diferenciados e não diferenciados, células de plantas, sementes, e derivados e progênie dos mesmos. As células de plantas incluem, sem limitação, por exemplo, células de sementes, de embriões maduros e imaturos, tecidos meristemáticos, mudas, teci- dos de calos em diferentes estados de diferenciação, folhas, flores, raízes, brotos, gametófitos masculinos ou femininos, esporófitos, pó- len, tubos de pólen e micrósporos, protoplastos, macroalgas e micro- algas. As diferentes células eucarióticas, por exemplo, células animais, células fúngicas ou células de plantas, podem ter qualquer grau de ploididade (ploidity), isto é, podem ser haploides, diploides, tetraploi- des, hexaploides ou poliploides.
[0073] O termo "sequência regulatória" ou "elemento regulador", como usado neste documento, refere-se a um ácido nucleico ou uma sequência de aminoácido, que pode direcionar a transcrição e/ou translação e/ou modificação de uma sequência de ácido nucleico de interesse em um genoma ou material genético de interesse, seja em cis ou em trans. Tais elementos podem incluir promotores, incluindo elementos promotores núcleo ou motivos promotores núcleo, sequên- cias líderes, aprimoradores, elementos silenciosos, íntrons, regiões de terminação de transcrição (terminadores) e regiões não transladadas a montante e a jusante de uma sequência de codificação. Uma "sequên- cia reguladora", como entendida de acordo com a presente divulgação, também assim pode compreender uma parte de uma sequência regu- ladora ou um elemento regulador, que pode influenciar, ou seja, so- brerregular ou sub-regular ou desligar, a atividade de um elemento ou sequência reguladora nativa, quando introduzido em um determinado elemento ou sequência reguladora.
[0074] Os termos "interferência de RNA" ou "RNAi", como usados neste documento, se referem de maneira intercambiável a um meca-
nismo de sub-regulação de gene, entretanto, demonstrado existir em todos os eucariotas. O mecanismo foi reconhecido pela primeira vez em plantas onde foi chamado de "silenciamento de gene pós- transcricional" ou "PTGS". No RNAi, pequenos RNAs (de cerca de 21 a 24 nucleotídeos) funcionam para guiar proteínas efetoras específicas (por exemplo, membros da família de proteínas Argonaute) para uma sequência de nucleotídeo alvo por emparelhamento de bases com- plementares. O complexo de proteínas efetoras, então, sub-regula a expressão do RNA ou DNA alvo. Pequenos sistemas de regulação de genes direcionados por RNA foram independentemente descobertos (e nomeados) em plantas, fungos, vermes, moscas e células de mamí- feros. Coletivamente, PTGS, silenciamento de RNA e cossupressão (em plantas); supressão (quelling) (em fungos e algas); e RNAi (em Caenorhabditis elegans, Drosophila e células de mamíferos) são exemplos de pequenos sistemas de regulação de genes baseados em RNA.
[0075] Uma "nuclease específica de sítio" ou "SSN", como usado neste documento, refere-se a pelo menos uma nuclease geralmente geneticamente modificada ou um fragmento cataliticamente ativo da mesma, ou a sequência correspondente que a codifica, que atua como uma enzima que catalisa um uma ruptura de filamentos duplos (DSB) não aleatório e específica de sítio ou um corte (nick) de fita simples em um local desejado de um genoma ou sequência genômica de interesse de maneira precisa. A capacidade de ligação, reconhecimento e cliva- gem de DNA dos SSNs, de acordo com a presente divulgação, pode variar dependendo da classe funcional de um SSN de interesse.
[0076] Um "transgene" ou "sequência transgênica", como usado neste documento, refere-se a um gene, ou parte de um gene incluindo as sequências reguladoras dos mesmos e íntrons, que foram artificial- mente transferidos de um genoma doador para um genoma ou sistema aceptor. Uma "sequência transgênica" pode, portanto, ser entendida como uma sequência estranha à espécie à qual a célula ou genoma aceptor pertence.
[0077] Um "cisgene" ou "sequência cisgênica", como usado neste documento, refere-se a um gene, ou parte de um gene incluindo as sequências reguladoras dos mesmos e íntrons, que foram artificial- mente transferidos de um genoma doador para um genoma ou sistema aceptor. Uma "sequência cisgênica" pode, portanto, ser entendida co- mo uma sequência da mesma espécie sendo transferida para outro indivíduo da mesma espécie ou para outra célula da mesma espécie.
[0078] Os termos "transiente" ou "introdução transiente", como usado neste documento, referem-se à introdução transiente de pelo menos um ácido nucleico e/ou sequência de aminoácido de acordo com a presente divulgação, preferencialmente incorporado em um ve- tor de entrega e/ou em um constructo recombinante, com ou sem a ajuda de um vetor de entrega, em uma estrutura alvo, por exemplo, uma célula de planta, em que a pelo menos uma sequência de ácido nucleico é introduzida sob condições de reação adequadas para que nenhuma integração da pelo menos uma sequência de ácido nucleico no material de ácido nucleico endógeno de uma estrutura alvo, o ge- noma como um todo, ocorra, de modo que a pelo menos uma sequên- cia de ácido nucleico não seja integrada no DNA endógeno da célula alvo. Como consequência, no caso de introdução transiente, o cons- tructo genético introduzido não será hereditário para uma progênie da estrutura alvo, por exemplo, uma célula procariótica, animal ou de planta. A pelo menos uma sequência de ácido nucleico e/ou de ami- noácido ou os produtos resultantes da transcrição, translação, proces- samento, modificações pós-translacionais ou construção de complexo das mesmas só estão presentes temporariamente, isto é, de maneira transiente, em forma constitutiva ou induzível, e, portanto, só podem ser ativos na célula alvo por exercer seu efeito por um tempo limitado. Portanto, a pelo menos uma sequência introduzida através de introdu- ção transiente não será hereditária para a progênie de uma célula. O efeito mediado por pelo menos uma sequência ou efetor introduzido de maneira transiente pode, no entanto, ser potencialmente hereditário para a progênie da célula alvo.
[0079] Uma "variante" de qualquer nuclease específica de sítio di- vulgada neste documento representa uma molécula que compreende menos de uma mutação, exclusão ou inserção em comparação com a nucleasse específica de sítio do tipo selvagem para alterar a atividade da nuclease do tipo selvagem como de ocorrência natural. Uma "vari- ante" pode, como exemplo não limitante, ser uma Cas9 cataliticamente inativa (dCas9) ou uma nuclease específica de sítio, que foi modificada para funcionar como nickase.
[0080] Sempre que a presente divulgação se referir à porcentagem de identidade de sequências de ácido nucleico ou de aminoácido entre si, estes valores definem aqueles valores como obtidos usando o pro- grama EMBOSS Water Pairwise Sequence Alignments (nucleotídeo) (www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html) para ácidos nucleicos ou o programa EMBOSS Water Pairwise Sequence Align- ments (proteína) (www.ebi.ac.uk/Tools/psa/emboss_water/) para se- quências de aminoácido. Alinhamentos ou comparações de sequência, como usado neste documento, referem-se a um alinhamento em todo o comprimento de duas sequências em comparação entre si. Essas ferramentas fornecidas pelo Instituto Europeu de Bioinformática (EBI) do Laboratório Europeu de Biologia Molecular (EMBL) para alinhamen- tos de sequências locais usam um algoritmo de Smith-Waterman modi- ficado (ver www.ebi.ac.uk/Tools/psa/ e Smith, T.F. & Waterman, M.S. "Identification of common molecular subsequences" Journal of Molecu- lar Biology, 1981 147 (1):195-197). Ao realizar um alinhamento, os pa-
râmetros padrão definidos pelo EMBL-EBI são usados. Esses parame- ters são (i) para sequências de aminoácido: Matriz = BLOSUM62, pe- nalidade de abertura de intervalo = 10 e penalidade de extensão de intervalo = 0,5 ou (ii) para sequências de ácido nucleico: Matriz = DNA- full, penalidade de abertura de intervalo = 10 e penalidade de extensão de intervalo = 0,5.
DESCRIÇÃO DETALHADA
[0081] A via NHEJ multietapa é mediada por um número de enzi- mas altamente conservadas necessárias para a conclusão do reparo de ruptura de filamentos duplos (DSB) por esse mecanismo. Nocautes ou knockdowns de qualquer uma dessas enzimas essenciais prejudi- cam a capacidade das células de usar a via NHEJ. A função prejudi- cada de NHEJ tende a favorecer HDR como um mecanismo parcial- mente compensatório para preservar o objetivo de uma célula de al- cançar a integridade cromossômica na presença de DSBs.
[0082] A presente invenção é, portanto, parcialmente baseada na descoberta de que células ou sistemas celulares que apresentam ex- pressão inibida de POLQ e uma de várias enzimas essenciais para reparo de NHEJ (por exemplo, LigIV, Ku70, Ku80 e outras enzimas divulgadas neste documento) simultaneamente ao executar edição de genoma (GE) direcionada exatamente nesse sistema celular ou célula apresentam dominância de reparo de DSB mediado por HR sem inte- gração aleatória de modelo(s) de reparo fornecido(s) (RT). As desco- bertas sobre participiantes relevantes de NHEJ/H(D)R e sua inibição foram combinadas e exploradas para direcionamento de genes alta- mente eficiente, pois a ausência de integração aleatória de RT e de reparo de DSB mediado por NHEJ garante precisão e previsibilidade significativamente melhoradas de qualquer experimento de GE, em particular, em células e sistemas eucarióticos. Portanto, a presente invenção fornece métodos para executar um nocaute ou knockdown da via NHEJ direcionado simultâneo com a execução da GE, de modo que seja possível garantir que as enzimas de NHEJ responsáveis pelo reparo impreciso de DSB após uma ruptura DSB não estejam ativas em uma célula ou sistema celular de interesse, exatamente no mo- mento em que um evento de GE, incluindo DSB e reparo, deve ser efetuado na referida uma célula ou sistema celular.
[0083] A presente invenção divulga métodos para direcionamento de genes eficiente em células, preferencialmente células eucarióticas, e, mais preferencialmente, células de plantas. Fundamentalmente, os métodos se baseiam na provisão de uma expressão reduzida ou abo- lida de Pol teta e pelo menos uma enzima adicional essencial para o reparo de NHEJ, que permite realizar o direcionamento de genes de maneira altamente precisa em uma e na mesma célula. Em uma célula ou um sistema celular, em que a enzima Pol teta e pelo menos uma enzima de NHEJ adicional são (parcialmente) inativadas, as rupturas genômicas de filamentos duplos são predominantemente reparadas por HR. Essa célula ou sistema celular permitirá, portanto, Edição de Gene altamente previsível quando transformado com um RT.
[0084] Em um primeiro aspecto, é assim provido um método para modificar o material genético de um sistema celular em um local prede- terminado com pelo menos uma sequência de ácido nucleico de inte- resse, em que o método compreende as seguintes etapas: (a) prover um sistema celular compreendendo uma enzima polimerase teta, ou uma sequência que a codifica, e uma ou mais enzimas adicionais de uma via NHEJ, ou a(s) sequência(s) que as codifica(m); (b) inativar ou parcialmente inativar a enzima polimerase teta, ou a sequência que a codifica, e inativar ou parcialmente inativar as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ, ou a(s) sequência(s) que as codifica(m); (c) introduzir no sistema celular ou um sistema de pro- gênie do mesmo (i) a pelo menos uma sequência de ácido nucleico de interesse, opcionalmente flanqueada por uma ou mais sequências de homologia complementares a uma ou mais sequências de ácido nu- cleico adjacentes ao local predeterminado, e (ii) pelo menos uma nu- clease específica de sítio, ou uma sequência que a codifica, a nu- clease específica de sítio induzindo uma ruptura de filamentos duplos no local predeterminado; e (d) opcionalmente: determinar a presença da modificação no local predeterminado no material genético do siste- ma celular; (e) obter um sistema celular compreendendo uma modifi- cação no local predeterminado do material genético do sistema celular ou selecionar um sistema celular compreendendo uma modificação no local predeterminado do material genético do sistema celular com base na determinação de (d).
[0085] Notavelmente, em uma modalidade, as etapas (b) e (c) po- dem ser realizadas simultaneamente. Dependendo do modo de inati- vação ou inativação parcial como divulgados na etapa (b) do aspecto acima, s etapa (b) pode ser realizada antes da etapa (c). Inversamen- te, a etapa (c) também pode ser realizada antes da etapa (b). Em uma modalidade, a introdução de pelo menos uma sequência de ácido nu- cleico de interesse e a introdução de pelo menos uma nuclease espe- cífica de sítio, ou uma sequência que a codifica, pode ser realizada simultaneamente ou em qualquer ordem sequencial uma em relação à outra e ainda em relação à etapa de inativação ou inativação parcial da enzima polimerase teta, ou uma sequência que a codifica, e/ou uma ou mais enzimas adicionais de uma via NHEJ, ou a(s) sequên- cia(s) que as codifica(m). A ordem sequencial e temporal de etapadas do método dependerão da natureza do material a ser introduzido e do modo de inativação, respectivamente. Por exemplo, ao executar um nocaute ou inativação da enzima polimerase teta, e/ou das uma ou mais enzimas adicionais de uma via NHEJ, essa etapa provavelmente precederá as etapas subsequentes do método. Em outras modalida-
des, uma inativação transiente (parcial) pode ser mais adequada. Nes- sa modalidade, a etapa (b) pode ser conduzida simultaneamente, ou temporalmente, mesmo após qualquer uma das etapas (c)(i) ou (c)(ii) ser realizada.
[0086] Para todos os aspectos e modalidades de acordo com a presente invenção, é importante que a inativação (parcial), conforme detalhada na etapa (b) do primeiro aspecto da presente invenção, e a introdução de pelo menos uma nuclease específica de sítio, ou uma sequência que a codifica, sejam planejadas de forma a garantir que uma e a mesma célula, ou um e o mesmo sistema celular compreen- dendo o material genético a ser modificado, compreenda simultanea- mente ambos: A) a Pol teta (parcialmente) inativada e a pelo menos uma enzima NHEJ (parcialmente) inativada adicional, bem como B) a pelo menos uma nuclease específica de sítio (ativa) e a pelo menos uma sequência de ácido nucleico de interesse em uma mesma célula ou sistema celular para obter uma melhora significativa e GE mais pre- cisa, uma vez que a via NHEJ imprecisa será (parcialmente) inativada de maneira espaço-temporal, de modo que a GE possa ser executada sem inserir nucleotídeos indesejados no sítio de DSB induzido de for- ma direcionada.
[0087] A principal contribuição da presente invenção é, portanto, o fornecimento de métodos e materiais, como os obtidos pelos referidos métodos, em que as vias NHEJ que dificultam significativamente um evento de GE direcionado mediado por HDR são (parcialmente) inati- vadas exatamente no momento e no mesmo sistema celular e seu compartimento necessário, ao induzir a GE para obter resultados de GE ideais sem um resultado indesejado.
[0088] Uma "modificação" ou "modificação" de um material genéti- co de acordo com a presente divulgação implica qualquer tipo de in- serção, exclusão e/ou substituição de pelo menos uma sequência de ácido nucleico de interesse efetuada em um local predeterminado em um genoma ou um material genético de interesse.
[0089] Um "sistema celular", como usado neste documento, refere- se a pelo menos um elemento que compreende todo ou parte do ge- noma de uma célula de interesse a ser modificada. O sistema celular pode, portanto, ser qualquer sistema in vivo ou in vitro, incluindo tam- bém um sistema sem células. O sistema celular assim compreende e provê o genoma alvo ou a sequência genômica a ser modificada de maneira adequada, isto é, de forma acessível para uma modificação ou manipulação genética. O sistema celular pode, portanto, ser seleci- onado, por exemplo, de uma célula procariótica ou eucariótica, incluin- do uma uma célula de animal ou planta, um organismo procariótico ou eucariótico, incluindo um animal ou planta, ou o sistema celular pode compreender um constructo genético conforme definido acima com- preendendo todo ou partes do genoma de uma célula procariótica ou eucariótica a ser modificada de maneira altamente direcionada. O sis- tema celular pode ser fornecido como célula ou vetor isolado, ou o sis- tema celular pode ser composto por uma rede de células em um teci- do, órgão, material ou organismo inteiro, in vivo ou como sistema iso- lado in vitro. Nesse contexto, o "material genético" de um sistema celu- lar pode, portanto, ser entendido como todo ou parte do genoma de um organismo, o material genético de tal organismo, como um todo ou em parte, está presente no sistema celular a ser modificado.
[0090] Em um aspecto, a presente invenção provê um sistema ce- lular que pode ser obtido por um método de acordo com qualquer um dos aspectos e modalidades acima.
[0091] Em uma modalidade, o sistema celular pode compreender uma enzima polimerase teta (Pol teta) inativada ou parcialmente inati- vada e uma ou mais enzimas de reparo de DNA inativadas ou parcial- mente inativadas adicionais de uma via NHEJ, em que o sistema celu-
lar modificado pode ser selecionado do grupo que consiste em uma ou mais células de planta, uma planta, e partes de uma planta.
[0092] Uma inativação "parcial" neste contexto implica uma ativi- dade reduzida da Pol teta e/ou da(s) enzima(s) de reparo de DNA adi- cional(is) de uma via NHEJ em comparação com a atividade enzimáti- ca da respectiva enzima de tipo selvagem, não parcialmente inativada medida sob as mesmas condições in vivo ou in vitro. Uma "inativação" implica, portanto, uma perda completa ou quase completa de atividade enzimática. A inativação parcial e total pode ser temporalmente limita- da. de acordo com a presente invenção, o momento relevante para prover um estado de uma inativação (parcial) é o momento em que a GE incluindo indução de DSB e reparo direcionado é realizada.
[0093] Em uma modalidade de acordo com os vários aspectos di- vulgados neste documento para prover um sistema celular compreen- dendo um material genético modificado, as uma ou mais partes da planta podem ser selecionadas do grupo que consiste em folhas, cau- les, raízes, radículas emergidas, flores, partes de flor, pétalas, frutas, pólen, tubos de pólen, filamentos de anteras, óvulos, sacos embrioná- rios, óvulos, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, semen- tes, raízes e mudas.
[0094] Em outra modalidade de acordo com os vários aspectos divulgados neste documento, é provido um sistema celular, em que as uma ou mais células de planta, a(s) planta(s) ou a(s) parte(s) de uma planta podem se originar de uma espécie de planta selecionada do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulga-
ris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana ta- bacum, Solanum lycopersicum, Solanum tuberosum, Coffea canepho- ra, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesica- ria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scara- baeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sati- vum e Allium tuberosum.
[0095] Uma "sequência de homologia", se presente, pode ser par- te da pelo menos uma sequência de ácido nucleico de interesse, de acordo com as várias modalidades da presente invenção, a ser intro- duzida para modificar o material genético de um sistema celular de acordo com a presente divulgação. Portanto, a pelo menos uma se- quência de homologia é fisicamente associada à pelo menos uma se- quência de ácido nucleico de interesse dentro de uma molécula. Des- sa forma, a sequência de homologia pode ser parte da pelo menos uma sequência de ácido nucleico de interesse a ser introduzida e pode ser posicionada dentro da posição 5’ e/ou 3’ da pelo menos uma se- quência de ácido nucleico de interesse, opcionalmente incluindo pelo menos um nucleotídeo espaçador, ou dentro da pelo menos uma se- quência de ácido nucleico de interesse a ser introduzida. Dessa forma, a(s) sequência(s) de homologia serve(M) como modelos para mediar o reparo direcionado à homologia, tendo complementaridade com pelo menos uma região, a região a montante e/ou a jusante, adjacente ao local predeterminado dentro do material genético do sistema celular a ser modificado. A pelo menos uma sequência de ácido nucleico de in- teresse e as uma ou mais regiões de homologia flanqueadoras, por- tanto, podem ter a função de uma sequência de ácido nucleico de mo- delo de reparo (RT). Em certas modalidades, o RT pode ser ainda as- sociado com outra sequência de DNA e/ou RNA, conforme mediado por emparelhamento de bases complementares. Em uma modalidade alternativa, o RT pode ser associado com outra sequência, por exem- plo, sequências de um vetor, por exemplo, um vetor de plasmídeo, cu- jo vetor pode ser usado para amplificar o RT antes da transformação. Além disso, o RT também pode ser fisicamente associado com menos parte de um componente de aminoácido, preferencialmente uma nu- clease específica de sítio. Essa configuração e associação permitem a disponibilidade do RT em estreita proximidade física ao sítio de uma DSB, ou seja, exatamente na posição em que um evento de GE dire- cionado deve ser efetuado para permitir taxas de eficiência ainda mais altas. Por exemplo, o pelo menos um RT também pode ser associado com pelo menos um gRNA interagindo com o pelo menos um RT e interagindo ainda com pelo menos uma porção de uma nuclease CRISPR como nuclease específica de sítio.
[0096] As uma ou mais regiões de homologia apresentarão, cada uma, um determinado grau de complementaridade com a respectiva região, flanqueando o pelo menos um local predeterminado a montan- te e/ou a jusante da ruptura de filamentos duplos induzida pela pelo menos uma nucleasse específica de sítio, ou seja, a região adjacente a montante e a jusante, respectivamente. Preferencialmente, as uma ou mais regiões de homologia se hibridizarão com a região adjacente a montante e/ou a jusante sob condições de alta estringência. Quanto maior a pelo menos uma região de homologia, menor o grau de com-
plementaridade. A complementaridade geralmente é calculada em to- do o comprimento da respectiva região de homologia. Caso apenas uma região de homologia esteja presente, essa única região de homo- logia geralmente terá um maior grau de complementaridade para per- mitir a hibridização. A complementaridade sob condições estringentes de hibridização será pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo me- nos 95%, pelo menos 96%, e preferencialmente pelo menos 97%, pelo menos 98%, pelo menos 99%, pelo menos 99,5% ou mesmo 100%. Pelo menos na região diretamente flanqueando uma DSB induzida (cerca de 5 a 10 bp a montante e a jusante de uma DSB), complemen- taridades de pelo menos 98%, pelo menos 99%, pelo menos 99,5% e preferencialmente 100% devem estar presentes. Notavelmente, como ainda divulgado abaixo neste documento, o grau de complementarida- de também pode ser inferior a 85%. Isso dependerá em grande parte do material genético alvo e da complexidade do genoma do qual é de- rivado, do comprimento da sequência de ácido nucleico de interesse a ser introduzida, do comprimento e natureza da região de flanqueamen- to ou braço de homologia adicional, da posição relativa e orientação da região de flanqueamento em relação ao sítio em que pelo menos uma DSB é induzida, e semelhantes.
[0097] O termo "adjacente" ou "adjacente a", como usado neste documento no contexto do local predeterminado e das uma ou mais regiões de homologia, pode compreender uma região adjacente a montante e uma a jusante, ou ambas. Portanto, a região adjacente é determinada com base no material genético de um sistema celular a ser modificado, o referido material compreendendo o local predetermi- nado.
[0098] Pode haver uma região adjacente a montante e/ou a jusan- te próximo ao local predeterminado. Para nucleases específicas de sítio (SSNs) induzindo rupturas de filamentos duplos (DSBs) sem cor- te, o "local predeterminado" representará o sítio em que a DSB é indu- zida dentro do material genético em um sistema celular de interesse. Para SSNs que deixam saliências após a indução de DSB, o local pre- determinado significa a região entre o corte na extremidade 5’ em um filamento e a extremidade 3’ no outro filamento. As regiões adjacentes no caso de SSNs de extremidade pegajosa podem, assim, ser calcu- ladas usando os dois filamentos de DNA diferentes como referência. O termo "adjacente a um local predeterminado" pode, portanto, implicar as posições de nucleotídeo a montante e/ou a jusante em um material genético a ser modificado, em que a região adjacente é definida com base no material genético de um sistema celular antes de induzir uma DSB ou modificação. Com base nos diferentes mecanismos de SSNs que induzem DSBs, o "local predeterminado", que significa o local em que uma modificação é feita em um material genético de interesse, pode assim implicar uma posição específica no mesmo filamento para DSBs sem corte, ou a região em diferentes filamentos entre dois sítios de corte para DSBs de corte pegajoso, ou para nickases usadas como SSNs entre o corte na posição 5’ em um filamento e na posição 3’ no outro filamento.
[0099] Se presente, a região adjacente a montante define a região diretamente a montante da extremidade 5’ do sítio de corte de uma nuclease específica de sítio de interesse com referência a um local predeterminado antes de iniciar uma ruptura de filamentos duplos, por exemplo, durante a engenharia de genoma direcionada. De forma cor- respondente, uma região adjacente a jusante define a região direta- mente a jusante da extremidade 3’ do sítio de corte de uma SSN de interesse com referência a um local predeterminado antes de iniciar uma ruptura de filamentos duplos, por exemplo, durante a engenharia de genoma direcionada. A extremidade 5’ e a extremidade 3' podem ser iguais, dependendo da nuclease específica de sítio de interesse.
[00100] Em determinadas modalidades, também pode ser favorável projetar pelo menos uma região de homologia a uma distância da DSB a ser induzida, isto é, não flanqueando diretamente o local predetermi- nado/sítio de DSB. Nesse cenário, a sequência genômica entre o local predeterminado e a sequência de homologia (o braço de homologia) seria "excluída" após a recombinação homóloga ocorrer, o que pode ser preferido para determinadas estratégias, pois isso permite a exclu- são direcionada de sequências próximas a DSB. Diferentes tipos de configuração e projeto de RT são assim contemplados de acordo com a presente invenção para aquelas modalidades que dependem de um RT. RTs podem ser usados para introduzir mutações específicas de sítio, ou RTs podem ser usados para a integração específica de sítio de sequências de ácido nucleico de interesse, ou RTs podem ser usa- dos para ajudar uma exclusão direcionada.
[00101] Uma "sequência(s) de homologia" introduzida(s) e a(s) "re- gião(ões) adjacente(s)" pode(m) ter comprimentos variados e diferen- tes de cerca de 15 bp a cerca de 15.000 bp, ou seja, uma região de homologia a montante pode ter um comprimento diferente em compa- ração com uma região de homologia a jusante. Apenas uma região de homologia pode estar presente. Não existe um limite superior real para o comprimento da(s) região(ões) de homologia, cujo comprimento é determinado por questões técnicas e práticas. De acordo com deter- minadas modalidades, dependendo da natureza do RT e da modifica- ção direcionada a ser introduzida, regiões de homologia assimétricas podem ser preferidas, isto é, regiões de homologia, em que as regiões de flanqueamento a montante e a jusante têm comprimento variável. Em certas modalidades, apenas uma região de flanqueamento a mon- tante e a jusante pode estar presente.
[00102] Com base no exposto acima, um "local predeterminado", de acordo com a presente invenção, significa o local ou sítio em um mate- rial genético em um sistema celular, ou dentro de um genoma de uma célula de interesse a ser modificada, em que uma edição ou modifica- ção direcionada deve ser introduzida. Em determinadas modalidades, o local predeterminado pode, portanto, coincidir com a DSB induzida por um menos uma nuclease específica de sítio, em que, em outras modalidades, o local predeterminado pode compreender o sítio da DSB induzida sem alinhamento direto com os sítios de corte da pelo menos uma nuclease específica de sítio. Ainda em outra modalidade, o local predeterminado pode estar distante de, ou seja, a uma deter- minada distância do sítio de DSB. Dependendo da natureza da modifi- cação a ser introduzida, esse pode ser o caso para modalidades, em que um RT é usado compreendendo pelo menos um alinhamento de região de homologia a uma determinada distância do sítio de uma DSB induzida, ou abrangendo o sítio de DSB, e não alinhando direta- mente com a região a montante e a jusante de uma DSB induzida.
[00103] Em uma modalidade de acordo com os vários aspectos da presente invenção, o método pode compreender uma etapa adicional de: (f) restaurar a atividade da enzima polimerase teta inativada ou parcialmente inativada e/ou restaurar a atividade das uma ou mais en- zimas de reparo de DNA adicionalmente inativadas ou parcialmente inativadas de uma via NHEJ no sistema celular compreendendo uma modificação no local predeterminado, ou em um sistema de progênie do mesmo.
[00104] A restauração de pelo menos uma enzima NHEJ (parcial- mente) inativada pode ser vantajosa para prover um sistema celular, uma célula, um tecido, um órgão ou um organismo inteiro, preferenci- almente uma planta ou um animal, em que as vias NHEJ naturais são totalmente ativas para cumprir suas funções inerentes ao dano ao DNA de ocorrência natural para conservar a integridade do genoma.
Deve-se enfatizar que, em determinadas modalidades de acordo com a presente invenção, os sistemas celulares ou a célula a serem modifi- cados, ou seja, a célula em que pelo menos uma via NHEJ é (parcial- mente) inativada exatamente quando um evento de GE é introduzido terá a capacidade de ser cultivada ou se desenvolver em um organis- mo. Em particular para nas modalidades em que o sistema celular é derivado de uma célula de planta, incluindo células de sementes, de embriões maduros e imaturos, tecidos meristemáticos, mudas, tecidos de calos em diferentes estados de diferenciação, folhas, flores, raízes, brotos, gametófitos masculinos ou femininos, esporófitos, pólen, tubos de pólen e micrósporos, protoplastos, macroalgas e microalgas, em que as diferentes células de plantas podem ter qualquer grau de ploi- didade (ploidity), ou seja, podem ser haploides, diploides, tetraploides, hexaploides ou poliploides, o sistema celular modificado de acordo com a presente invenção será usado para desenvolver um organismo de planta inteiro. Usando técnicas conhecidas do versado na técnica, uma planta pode ser cruzada com outras plantas para possivelmente restaurar a atividade de pelo menos uma enzima Pol teta e/ou a ativi- dade de pelo menos uma enzima da via NHEJ adicional usando estra- tégias de reprodução adequadas.
[00105] Em uma modalidade de acordo com os vários aspectos da presente invenção, a polimerase teta a ser inativada ou parcialmente inativada pode compreender uma sequência de aminoácido de acordo com a SEQ ID NO: 2, 7, 8, 9 ou 10, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 2, 7, 8, 9 ou 10, respectivamente, prefe- rencialmente por todo o comprimento da sequência; ou pode ser codi- ficada pela sequência de ácido nucleico de acordo com a SEQ ID NO:
1, 3, 4, 5 ou 6, ou um ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID No: 1, 3, 4, 5 ou 6, respectivamente, preferencialmente por todo o compri- mento da sequência; ou pode ser codificada por uma sequência de ácido nucleico hibridizando-se a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 1, 3, 4, 5 ou 6 sob condições estringentes.
[00106] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inati- vadas podem ser independentemente selecionadas do grupo que con- siste em Ku70, Ku80, proteína quinase dependente de DNA, Ataxia telangiectasia mutada (ATM), ATM – e Rad3 – relacionada (ATR), Ar- temis, XRCC4, DNA ligase IV (LigIV) e XLF, ou qualquer combinação das mesmas.
[00107] Em uma modalidade de acordo com os vários aspectos da presente invenção, pelo menos uma, pelo menos duas, pelo menos três, ou pelo menos quatro enzimas de reparo de DNA adicionais de uma via NHEJ podem ser inativadsa ou parcialmente inativadas, prefe- rencialmente em que pelo menos Ku70 e DNA ligase IV ou em que pelo menos Ku80 e DNA ligase IV podem ser inativadas ou parcial- mente inativadas.
[00108] Em outra modalidade de acordo com os vários aspectos da presente invenção, uma, duas, três ou quatro, preferencialmente ape- nas uma, apenas duas, apenas três ou apenas quatro, enzimas de re- paro de DNA adicionais de uma via NHEJ podem ser inativadas ou parcialmente inativadas, preferencialmente em que a Ku70 e DNA li- gase IV, ou em que a Ku80 e DNA ligase IV podem ser inativadas ou parcialmente inativadas.
[00109] Em uma modalidade de acordo com os vários aspectos da presente invenção, as uma ou mais enzimas de reparo de DNA adicio- nais de uma via NHEJ a serem inativadas ou parcialmente inativadas podem ser Ku70, ou uma sequência de ácido nucleico que a codifica, em que a Ku70 pode compreender uma sequência de aminoácido de acordo com a SEQ ID NO: 12, 18, 19 ou 20, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 12, 18, 19 ou 20, respectiva- mente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de ácido nucleico de acordo com a SEQ ID NO: 11, 13, 14, 15, 16 ou 17, ou pode compreender uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 11, 13, 14, 15, 16 ou 17, respectivamen- te, preferencialmente por todo o comprimento da sequência, ou pode compreender uma sequência de ácido nucleico hibridizando-se a uma sequência de ácido nucleico complementar à sequência de ácido nu- cleico de acordo com a SEQ ID NO: 11, 13, 14, 15, 16 ou 17.
[00110] Em uma modalidade adicional, em que as uma ou mais en- zimas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas podem ser Ku80, ou uma sequência de ácido nucleico que as codifica, em que a Ku80 pode compreender uma sequência de aminoácido de acordo com a SEQ ID NO: 22, 23, 24 ou 29, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 22, 23, 24 ou 29, respectivamente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de acordo com a SEQ ID NO: 21, 25, 26, 27 ou 28, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência esta- belecida na SEQ ID NO: 21, 25, 26, 27 ou 28, respectivamente, prefe- rencialmente por todo o comprimento da sequência, ou pode compre- ender uma sequência de ácido nucleico hibridizando-se a uma se- quência de ácido nucleico complementar à sequência de ácido nuclei- co de acordo com a SEQ ID NO: 21, 25, 26, 27 ou 28.
[00111] Em uma modalidade adicional, em que as uma ou mais en- zimas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas podem ser proteína quinase dependen- te de DNA, ou uma sequência de ácido nucleico que a codifica, a pro- teína quinase dependente de DNA pode compreender uma sequência de aminoácido de acordo com a SEQ ID NO: 32, 33 ou 35, ou uma se- quência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de se- quência com a sequência estabelecida na SEQ ID NO: 32, 33 ou 35, respectivamente, preferencialmente por todo o comprimento da se- quência, ou a sequência de ácido nucleico que a codifica pode com- preender uma sequência de acordo com a SEQ ID NO: 30, 31 ou 34, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 30, 31 ou 34, respectivamente, preferencialmente por todo o com- primento da sequência, ou pode compreender uma sequência de ácido nucleico hibridizando-se a uma sequência de ácido nucleico comple- mentar à sequência de ácido nucleico de acordo com a SEQ ID NO: 30, 31 ou 34.
[00112] Ainda em outra modalidade, em que as uma ou mais enzi- mas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas podem ser ATM, ou uma sequência de ácido nucleico que a codifica, a ATM pode compreender uma sequên- cia de aminoácido de acordo com a SEQ ID NO: 37, 38, 39, 41, 42, 43, 44, 45, 46, 47 ou 48, ou uma sequência de aminoácido tendo pelo me- nos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 37, 38, 39, 41, 42, 43, 44, 45, 46, 47 ou 48, respec- tivamente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de acordo com a SEQ ID NO: 36 ou 40, ou uma se- quência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 36 ou 40, respectivamente, preferencialmente por todo o comprimento da se- quência, ou pode compreender uma sequência de ácido nucleico hi- bridizando-se a uma sequência de ácido nucleico complementar à se- quência de ácido nucleico de acordo com a SEQ ID NO: 36 ou 40.
[00113] Ainda em outra modalidade, em que as uma ou mais enzi- mas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas podem ser ATM – e Rad3 – relaciona-
da (ATR), ou uma sequência de ácido nucleico que a codifica, a ATR pode compreender uma sequência de aminoácido de acordo com a SEQ ID NO: 50, 51, 52, 53, 55 ou 56, ou uma sequência de aminoáci- do tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a se- quência estabelecida na SEQ ID NO: 50, 51, 52, 53, 55 ou 56, respec- tivamente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de acordo com a SEQ ID NO: 49 ou 54, ou uma se- quência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 49 ou 54, respectivamente, preferencialmente por todo o comprimento da se- quência, ou pode compreender uma sequência de ácido nucleico hi- bridizando-se a uma sequência de ácido nucleico complementar à se- quência de ácido nucleico de acordo com a SEQ ID NO: 49 ou 54.
[00114] Em uma modalidade adicional, em que as uma ou mais en- zimas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas podem ser Artemis, ou uma sequência de ácido nucleico que a codifica, a Artemis pode compreender uma sequência de aminoácido de acordo com a SEQ ID NO: 60, 61, 62 ou 64, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 60, 61, 62 ou 64, respectivamente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de acordo com a SEQ ID
NO: 57, 58, 59 ou 63, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 57, 58, 59 ou 63, respectivamente, preferencial- mente por todo o comprimento da sequência, ou pode compreender uma sequência de ácido nucleico hibridizando-se a uma sequência de ácido nucleico complementar à sequência de ácido nucleico de acordo com a SEQ ID NO: 57, 58, 59 ou 63.
[00115] Em outra modalidade, em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas podem ser XRCC4, ou uma sequência de áci- do nucleico que as codifica, a XRCC4 pode compreender uma se- quência de aminoácido de acordo com a SEQ ID NO: 66, 67, ou 69, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identi- dade de sequência com a sequência estabelecida na SEQ ID NO: 66, 67 ou 69, respectivamente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de acordo com a SEQ ID NO: 65 ou 68, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 65 ou 68, respectivamente, preferencialmente por todo o compri- mento da sequência, ou pode compreender uma sequência de ácido nucleico hibridizando-se a uma sequência de ácido nucleico comple- mentar à sequência de ácido nucleico de acordo com a SEQ ID NO: 65 ou 68.
[00116] Em uma modalidade adicional, em que as uma ou mais en- zimas de reparo de DNA adicionais de uma via NHEJ a serem inativa- das ou parcialmente inativadas podem ser DNA ligase IV, ou uma se- quência de ácido nucleico que a codifica, a DNA ligase IV pode com- preender uma sequência de aminoácido de acordo com a SEQ ID NO: 71, 72, 76 ou 77, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 71, 72, 76 ou 77, respectivamente, preferencialmente por todo o comprimento da sequência, ou a sequência de ácido nucleico que a codifica pode compreender uma sequência de acordo com a SEQ ID NO: 70, 73, 74 ou 75, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 70, 73, 74 ou 75, respectivamente, prefe- rencialmente por todo o comprimento da sequência, ou pode compre- ender uma sequência de ácido nucleico hibridizando-se a uma se- quência de ácido nucleico complementar à sequência de ácido nuclei- co de acordo com a SEQ ID NO: 70, 73, 74 ou 75.
[00117] Ainda em outra modalidade, as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas podem ser XLF, ou uma sequência de ácido nucleico que as codifica.
[00118] Em certas modalidades, um knockdown transiente de pelo menos uma Pol teta e a pelo menos uma enzima adicional de uma via NHEJ podem ser preferíveis, por exemplo, para determinadas enzimas NHEJ sendo prejudiciais para uma célula no estágio de knockdown de homozigoto, de modo que uma sub-regulação transiente para efetuar uma GE direcionada seguida por uma restauração da atividade da pe- lo menos uma enzima NHEJ e/ou a funcionalidade de Pol theta pode ser desejável.
[00119] Em uma modalidade de acordo com os vários aspectos da presente invenção, a pelo menos de uma sequência de ácido nucleico de interesse pode ser fornecida como parte de pelo menos um vetor ou como pelo menos uma molécula linear. Em outro aspecto, a pelo menos uma sequência de ácido nucleico de interesse pode ser forne- cida como um complexo, preferencialmente um complexo associado fisicamente com a pelo menos uma sequência de ácido nucleico e ou- tro RT, e/ou com um gRNA, e/ou com uma nuclease específica de sí- tio. A pelo menos uma sequência de ácido nucleico de interesse pode compreender ainda uma sequência que permite rastreabilidade rápida, incluindo a rastreabilidade visual, da sequência de interesse, por exemplo, um indicador, incluindo um indicador fluorescente. A pelo menos uma sequência de ácido nucleico de interesse pode ser de fita dupla, fita simples ou uma mistura dos mesmos. Além disso, a pelo menos uma sequência de ácido nucleico de interesse pode compreen- der uma mistura de nucleotídeo de DNA e RNA, incluindo também nu- cleotídeos sintéticos, isto é, de ocorrência não natural.
[00120] Em outra modalidade de acordo com os vários aspectos da presente invenção, o pelo menos um vetor usado de acordo com os vários métodos divulgados neste documento pode ser introduzido no sistema celular por meio biológico ou físico, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., prefe- rencialmente por Agrobacterium tumefaciens, um vetor viral, bombar- deio biolístico, transfecção usando agentes químicos, incluindo trans- fecção de polietileno glicol, ou qualquer combinação dos mesmos.
[00121] É ainda provida uma modalidade dos métodos de acordo com os vários aspectos divulgados neste documento, em que a pelo menos uma nuclease específica de sítio ou um fragmento catalitica- mente ativo da mesma pode ser introduzida no sistema celular como uma sequência de ácido nucleico que codifica a nuclease específica de sítio ou o fragmento cataliticamente ativo da mesma, em que a se- quência de ácido nucleico é parte de pelo menos um vetor, ou em que a pelo menos uma nuclease específica de sítio ou o fragmento cataliti- camente ativo da mesma é introduzida no sistema celular como pelo menos uma sequência de aminoácido. Em uma modalidade, a pelo menos uma nuclease específica de sítio pode ser introduzida como RNA transladável. Ainda em outra modalidade, a pelo menos uma nu- clease específica de sítio pode ser introduzida como parte de um com- plexo juntamente com pelo menos uma outra biomolécula, por exem- plo, um gRNA, o gRNA opcionalmente sendo associado à temperatura ambiente compreendendo ou sendo associado com a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida no sistema celular.
[00122] Qualquer método de entrega adequado para introduzir pelo menos uma biomolécula em uma célula ou sistema celular pode ser aplicado, dependendo da célula ou do sistema celular de interesse. O termo "introdução", como usado neste documento, implica, portanto, um transporte funcional de uma biomolécula ou constructo genético (DNA, RNA, fita simples ou duplo, proteína, compreendendo compo- nentes naturais e/ou sintéticos, ou uma mistura dos mesmos) em pelo menos uma célula ou sistema celular, que permite a transcrição e/ou translação e/ou atividade catalítica e/ou atividade de ligação, incluindo a ligação de uma molécula de ácido nucleico a outra molécula de áci- do nucleico, incluindo DNA ou RNA, ou a ligação de uma proteína a uma estrutura alvo dentro da pelo menos uma célula ou sistema celu- lar, e/ou a atividade catalítica de uma enzima assim introduzida, opci- onalmente após a transcrição e/ou translação. Quando pertinente, uma integração funcional de um constructo genético pode ocorrer em um determinado compartimento celular da pelo menos uma célula, incluin- do o núcleo, o citosol, a mitocôndria, o cloroplasto, o vacúolo, a mem- brana, a parede celular e semelhantes.
Consequentemente, o termo "integração funcional" - em contraste com o termo, implica que o com- plexo molecular de interesse é introduzido em pelo menos uma célula por qualquer meio de transformação, transfecção ou transdução por meios biológicos, incluindo transformação com Agrobacterium, ou mei- os físicos, incluindo bombardeio de partículas, bem como a etapa sub- sequente, em que o complexo molecular exerce seu efeito dentro de ou na pelo menos uma célula ou sistema celular em que foi introduzi- do.
Dependendo da natureza do constructo genético ou biomolécula a ser introduzida, o referido efeito naturalmente pode variar e incluir, so- zinho ou em combinação, entre outros, a transcrição de um DNA codi- ficado pelo constructo genético em um RNA, a translação de um RNA para uma sequência de aminoácido, a atividade de uma molécula de RNA dentro de uma célula, compreendendo a atividade de um RNA guia, um crRNA, um tracrRNA ou um miRNA ou um siRNA para uso em interferência de RNA, e/ou uma atividade de ligação, incluindo a ligação de uma molécula de ácido nucleico à outra molécula de ácido nucleico, incluindo DNA ou RNA, ou a ligação de uma proteína a uma estrutura alvo dentro da pelo menos uma célula, ou incluindo a inte- gração de uma sequência entregue através de um vetor ou um cons- tructo genético, seja de forma transiente ou estável.
O referido efeito também pode compreender a atividade catalítica de uma sequência de aminoácido representando uma enzima ou uma porção cataliticamente ativa da mesma dentro da pelo menos uma célula e semelhantes.
O referido efeito obtido após a integração funcional do complexo molecu- lar de acordo com a presente divulgação pode depender da presença de sequências reguladoras ou sequências de localização que são compreendidas pelo constructo genético de interesse, como é conhe- cido pelo versado na técnica.
[00123] Portanto, uma variedade de técnicas de entrega adequadas pode ser adequada de acordo com os métodos da presente invenção para introduzir material genético em uma célula de planta ou um sis- tema celular derivado de uma célula de planta, os métodos de entrega sendo conhecidos pela pessoa versada, por exemplo, escolhendo téc- nicas de entrega direta que variam de tratamento de protoplastos com polietilenoglicol (PEG) (Potrykus et al. 1985), procedimentos como ele- troporação (D´Halluin et al., 1992), microinjeção (Neuhaus et al., 1987), tecnologia de "bigode" de fibra de carboneto de silício (Kaeppler et al., 1992), abordagens mediadas por vetores virais (Gelvin, Nature Biotechnology 23, "Viral-mediated plant transformation gets a boost", 684-685 (2005)) e bombardeio de partículas (ver, por exemplo, Sood et al., 2011, Biologia Plantarum, 55, 1-15).
[00124] Apesar de métodos de transformação baseados em abor- dagens biológicas, como transformação com Agrobacterium ou trans- formação de plantas mediada por vetor viral, e métodos baseados em métodos de entrega física, como bombardeio de partículas ou microin- jeção, terem evoluído como técnicas proeminentes para introduzir ma- terial genético e outras biomoléculas, incluindo biomoléculas de ocor- rência natural e sintéticas, ou uma mistura dos mesmos, em uma célu- la de planta ou tecido de interesse. Helenius et al. ("Gene delivery into intact plants using the HeliosTM Gene Gun", Plant Molecular Biology Reporter, 2000, 18(3):287-288) divulgam um bombardeio de partículas como método físico para introduzir material em uma célula de planta. Atualmente, existe uma variedade de métodos de transformação de planta para introduzir material genético na forma de um constructo ge- nético em uma célula de planta de interesse, compreendendo meios biológicos e físicos conhecidos pelos versados no campo de biotecno-
logia de planta e que podem ser aplicados para introduzir pelo menos um gene que codifica pelo menos uma quinase associada à parede em pelo menos uma célula de pelo menos uma célula de planta, teci- do, órgão ou planta inteira. Notavelmente, os referidos métodos de en- trega para transformação e transfecção podem ser aplicados para in- troduzir as ferramentas da presente invenção simultaneamente. Um meio biológico comum é transformação com Agrobacterium spp. que tem sido usado há décadas para uma variedade de diferentes materi- ais vegetais. De acordo com a natureza da presente invenção, inter alia, baseando-se em uma enzima Pol teta (parcialmente) inativada, as abordagens mediadas por Agrobacterium também podem resultar em uma introdução transiente da sequência relevante inserida usando Agrobacterium como ferramenta de entrega, pois a integração de T- DNA será prejudicada.
[00125] A transformação de plantas mediada por vetores virais re- presenta uma estratégia adicional para a introdução de material gené- tico em uma célula de interesse. Meios físicos que encontram aplica- ção em biologia de plantas são bombardeio de partículas, também de- nominado transfecção biolística ou transferência de genes mediada por micropartículas, que se refere a um método de entrega física para transferir uma micropartícula ou nanopartícula revestida compreen- dendo um ácido nucleico ou um constructo genético de interesse em uma célula ou tecido alvo. Meios de introdução física são adequados para introduzir ácidos nucleicos, isto é, RNA e/ou DNA, e proteínas. Da mesma forma, existem métodos específicos de transformação ou transfecção para especificamente introduzir um ácido nucleico ou um constructo de aminoácido de interesse em uma célula da planta, inclu- indo eletroporação, microinjeção, nanopartículas e peptídeos de pene- tração de células (CPPs). Além disso, existem métodos de transfecção baseados em produtos químicos para introduzir constructos genéticos e/ou ácidos nucleicos e/ou proteínas, compreendendo, entre outros, transfecção com fosfato de cálcio, transfecção usando lipossomas, por exemplo, lipossomas catiônicos ou transfecção com polímeros catiôni- cos, incluindo DEAD-dextrano ou polietilenimina, ou combinações dos mesmos. Os referidos métodos de entrega e veículos de entrega ou cargas, portanto, diferem inerentemente das ferramentas de entrega usadas para outras células eucarióticas, incluindo células animais e de mamíferos e todo método de entrega deve ser especificamente ajusta- do e otimizado para um constructo de interesse introduzir e/ou modifi- car pelo menos um gene que codifica pelo menos uma quinase asso- ciada à parede na pelo menos uma célula de planta, tecido, órgão ou planta inteira; e/ou pode ser introduzido em um compartimento especí- fico de uma célula alvo de interesse de maneira totalmente funcional e ativa. As técnicas de entrega acima, sozinhas ou em combinação, po- dem ser usadas para abordagens in vivo (em planta) ou in vitro. De acordo com as várias modalidades da presente invenção, diferentes técnicas de entrega podem ser combinadas entre si, por exemplo, usando uma transfecção química para a pelo menos uma nuclease específica de sítio, ou um mRNA ou DNA que a codifica, e opcional- mente outras moléculas, por exemplo, um gRNA, enquanto é combi- nada com a provisão transiente de inativações (parciais) usando uma técnica baseada em Agrobacterium.
[00126] Em uma modalidade de acordo com os vários aspectos da presente invenção, a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular pode ser seleciona- da do grupo que consiste em: um transgene, um gene endógeno modi- ficado, uma sequência sintética, uma sequência intrônica, uma se- quência de codificação ou uma sequência reguladora.
[00127] Em outra modalidade de acordo com os vários aspectos da presente invenção, é provido um método, em que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular é um transgene, em que o transgene compreende uma sequência de ácido nucleico que codifica um gene de um genoma de um organismo de interesse, ou pelo menos uma parte do referido ge- ne.
[00128] Em uma modalidade, uma sequência reguladora de acordo com a presente invenção pode ser uma sequência promotora, em que a edição, mutação ou modulação do promotor compreende substituir o promotor, ou fragmento de promotor por um promotor diferente (tam- bém conhecido como promotor de substituição) ou fragmento de pro- motor (também conhecido como fragmento de promotor de substitui- ção), em que a substituição do promotor resulta em qualquer um dos seguintes ou qualquer combinação dos mesmos: um aumento da ativi- dade promotora, um aumento da especificidade de tecido promotor, uma redução da atividade promotora, uma redução da especificidade de tecido promotor, uma nova atividade promotora, uma atividade promotora induzível, uma janela estendida de expressão de genes, uma alteração da temporização ou progresso de desenvolvimento da expressão de gene na mesma camada celular ou outra camada celu- lar, por exemplo, estendendo o tempo da expressão de gene no tape- tum de anteras, uma mutação de elementos de ligação de DNA e/ou exclusão ou adição de elementos de ligação de DNA. O promotor (ou fragmento de promotor) a ser modificado pode ser um promotor (ou fragmento de promotor) que é endógeno, heterólogo, artificial, preexis- tente ou transgênico para a célula que está sendo editada. O promotor de substituição ou fragmento do mesmo pode ser um promotor ou fra- gmento do mesmo que seja endógeno, heterólogo, artificial, preexis- tente ou transgênico para a célula que está sendo editada. Qualquer outra sequência reguladora de acordo com a presente divulgação po- de ser modificada, conforme detalhado para um promotor ou fragmen-
to de promotor acima.
[00129] Em uma modalidade preferida e no caso de genomas de plantas a serem modificados, é altamente desejável que a modificação mediada pelos métodos da presente invenção não resulte em um or- ganismo transgênico geneticamente modificado pela integração de DNA estranho ao genoma de origem de maneira imprecisa, pois ques- tões ambientais, regulatórias e políticas precisam ser consideradas. Portanto, as modalidades de acordo com a presente invenção forne- cendo métodos para modificar um material genético de interesse em um sistema celular de maneira transiente são particularmente adequa- das para prover um sistema celular compreendendo uma modificação em um local predeterminado sem a inserção de DNA estranho e, por- tanto, sem prover uma célula ou organismo considerado organismo geneticamente modificado, uma vez que todas as ferramentas neces- sárias para executar os métodos da presente invenção podem ser for- necidas ao sistema celular de maneira transiente na forma ativa.
[00130] Em certas modalidades, pode ser adequado introduzir uma sequência que codifica a pelo menos uma nuclease específica de sítio como knock-in, e/ou para prover uma inativação (parcial) da sequência que codifica a Pol theta, e/ou para prover uma inativação (parcial) da pelo menos uma enzima de reparo da via NHEJ adicional em um ge- noma doador ou material genético a ser modificado de maneira estável para prover um contexto genético que auxilia na execução dos méto- dos da presente invenção. Nessas modalidades, pode ser favorável restaurar a integridade do genoma doador após uma modificação ter sido realizada de acordo com os métodos da presente invenção, de modo que a mutação estável e/ou knock-in e/ou nocaute introduzido antes da GE seja, em seguida, novamente restaurado pelo cruzamen- to e/ou seleção ou outros meios técnicos adequados de biologia mole- cular, cultura de células ou haploidização.
[00131] Como os métodos da presente invenção compreendem a introdução de mais de uma biomolécula e/ou a inativação (parcial) adi- cional de pelo menos uma enzima Pol teta e de pelo menos uma en- zima da via NHEJ adicional, os métodos podem ser realizados de ma- neira totalmente transiente. Em outras modalidades, os métodos po- dem ser executados por uma combinação de abordagens estáveis e transientes. Ainda em outra modalidade, os métodos também podem ser realizados por meio de introdução estável de ferramentas de en- trega adequadas a uma célula ou sistema celular de interesse.
[00132] Em uma modalidade adicional de acordo com vários aspec- tos da presente invenção, uma modificação adicional em um local pre- determinado é introduzida, resultando na introdução de um marcador de seleção no material genético do sistema celular.
[00133] Plantas editadas podem ser facilmente identificadas e sepa- radas de plantas não editadas, quando são coeditadas com marcado- res selecionáveis. Com base em marcadores visuais ou de resistência específicos, triagens podem ser realizadas. Qualquer gene endógeno que pudesse ser modificado de maneira conveniente que conferisse resistência ou um marcador fenotípico (por exemplo, formato, cor, fluo- rescência etc.) poderia ser usado. Os exemplos fenotípicos podem ser, por exemplo, genes brilhantes, dourados, zebra7/lemonwhite1, tingin- dos (tiedyed), membros da família nitrato redutase (para milho e beter- raba) e semelhantes (ver, por exemplo, a divulgação da US 62/502.418, que é aqui incorporada por referência na sua totalidade).
[00134] Exemplos não limitantes de marcador fenotípico e/ou de resistência incluem resistência/tolerância a herbicida, em que a resis- tência/tolerância a herbicida é selecionada do grupo que consiste em resistência/tolerância a inibidores de EPSPS, incluindo glifosato, resis- tência/tolerância a inibidores de síntese de glutamina, incluindo glufo- sinato, resistência/tolerância a inibidores de ALS ou AHAS, incluindo imidazolina ou sulfonilureia, resistência/tolerância a inibidores da AC- Case, incluindo ariloxifenoxipropionato (FOP), resistência/tolerância a inibidores de biossíntese de carotenoides, incluindo inibidores de bios- síntese de carotenoides na etapa de dessaturase de fitoeno, inibidores de 4-hidroxifenil-piruvato-dioxigenase (HPPD), ou inibidores de outros alvos de biossíntese de carotenoides, resistência/tolerância a inibido- res de celulose, resistência/tolerância a inibidores de síntese de lipí- dios, resistência/tolerância a inibidores de ácidos graxos de cadeia longa, resistência/tolerância a inibidores de conjunto de microtúbulos, resistência/tolerância a desviadores de elétrons de fotossistema I, re- sistência/tolerância a inibidores de fotossistema II, incluindo carbama- to, triazinas e triazinonas, resistência/tolerância a inibidores de PPO e resistência/tolerância a auxinas sintéticas, incluindo dicamba (2,4-D, ou seja, ácido 2,4-diclorofenoxiacético).
[00135] Em uma modalidade de acordo com os vários aspectos da presente invenção, a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular pode ser seleciona- da do grupo que consiste em: um transgene, um cisgene, um gene endógeno modificado, uma sequência sintética, uma sequência intrô- nica, uma sequência de codificação ou uma sequência reguladora.
[00136] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, a pelo menos uma sequência de ácido nu- cleico de interesse a ser introduzida em um sistema celular em um lo- cal predeterminado pode ser um transgene, ou parte de um transgene, ou um cisgene, ou parte de um cisgene, de um organismo de interes- se, em que o transgene, o cisgene ou parte do mesmo é selecionado do grupo que consiste em um gene que codifica tolerância a estresse abiótico, incluindo estresse hídrico, estresse osmótico, estresse térmi- co, estresse por resfriamento, estresse por frio incluindo geada, es- tresse oxidativo, estresse por metais pesados, deficiência de nitrogê-
nio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicida, incluindo resistência a glifosato, glufosinato/fosfinotricina, higromicina, inibidores de protoporfirinogênio oxidase (PPO), inibidores de ALS, e Dicamba, um gene que codifica resistência ou tolerância a estresse biótico, incluindo um gene de resistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a inseto, ou um gene que codifica um traço relativo a ren- dimento, incluindo resistência ao acamamento, resistência ao pendo- amento, tempo de floração, resistência à deiscência, cor da semente, composição do endosperma ou teor nutricional.
[00137] Em uma modalidade de acordo com os vários aspectos da presente invenção, a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular em um local prede- terminado pode ser pelo menos parte de um gene endógeno modifica- do de um organismo de interesse, em que o gene endógeno modifica- do compreende pelo menos uma exclusão, inserção e/ou substituição de pelo menos um nucleotídeo em comparação com a sequência de ácido nucleico do gene endógeno não modificado (tipo selvagem).
[00138] Em outra modalidade de acordo com os vários aspectos da presente invenção, a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular em um local prede- terminado pode ser pelo menos parte de um gene endógeno modifica- do de um organismo de interesse, em que o gene endógeno modifica- do compreende pelo menos um de um truncamento, duplicação, subs- tituição e/ou exclusão de pelo menos uma posição de ácido nucleico que codifica um domínio do gene endógeno modificado.
[00139] Ainda em outras modalidade de acordo com os vários as- pectos da presente invenção, a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sistema celular em um local predeterminado pode ser pelo menos parte de uma sequência reguladora, em que a sequência reguladora compreende pelo menos uma de uma sequência promotora núcleo, uma sequência promotora proximal, um elemento de ação cis, um elemento de ação trans, uma sequência de controle de locus, uma sequência de isolamento, uma sequência de silenciamento, uma sequência de aprimoramento, uma sequência de terminação, um motivo conservado de um elemento re- gulador como TATA box e/ou qualquer combinação dos mesmos.
[00140] Uma modalidade dos métodos acima de acordo com a pre- sente invenção é um método para modificar uma célula eucariótica, preferencialmente pelo menos uma célula de planta, ou um sistema celular compreendendo o material genético, ou parte do material gené- tico do mesmo, de maneira direcionada para prover uma planta gene- ticamente modificada, preferencialmente não transgênica, em que o método pode, entre outros, ser um método para o desenvolvimento de traços. Por exemplo, uma substituição altamente específica de sítio de 1, 2, 3 ou mais nucleotídeos na sequência de codificação de um gene de planta pode ser introduzida de modo a produzir substituições de um ou mais aminoácidos que irão conferir tolerância a pelo menos um herbicida, tal como glifosato, glufosinato, Dicamba ou um herbicida ini- bidor de acetolactato sintase (ALS). Além disso, em outra modalidade, substituições de um ou mais aminoácidos na sequência de codificação de um gene de planta de repetição rica em leucina de sítio de ligação a nucleotídeo (NBS-LRR) que irá alterar o espectro de reconhecimento de patógenos da proteína para otimizar a resistência à doença da planta. Ainda em outra modalidade, uma pequena sequência potenci- adora ou sítio de ligação a fator de transcrição pode ser modificado em um promotor endógeno de um gene de planta ou pode ser introduzido no promotor de um gene de planta para alterar o perfil de expressão ou a força do gene de planta regulado pelo promotor. O perfil de ex- pressão pode ser alterado através de várias modificações, introduções ou exclusões em outras regiões, tais como íntrons, regiões não tradu- zidas 3’, sequências cis ou trans- potenciadoras. Ainda em outra mo- dalidade, o genoma de uma célula de planta, preferencialmente uma célula de planta meristemática, pode ser modificado de maneira que a planta resultante da célula meristemática modificada possa produzir uma substância química ou composto de interesse agronômico ou farmacêutico, por exemplo, insulina ou análogo de insulina, anticorpos, uma proteína com uma função enzimática de interesse, ou qualquer outro composto farmaceuticamente relevante adequado como medi- camento, suplemento dietético ou produto de cuidados médicos.
[00141] Exemplos não limitativos de traços que podem ser introdu- zidos pelo método de acordo com esta modalidade são resistência ou tolerância a pragas de insetos, tais como vermes, brocas, lagarta- rosca, besouros, pulgões, cigarrinhas, gorgulhos, ácaros e percevejos. Isso poderia ser feito pela modificação de genes de plantas, por exemplo, para aumentar a resistência inerente de uma planta às pra- gas de insetos ou para reduzir sua atratividade às referidas pragas. Outros traços podem ser resistência ou tolerância a nemátodos, pató- genos bacterianos, fúngicos ou virais ou seus vetores. Ainda outros traços podem ser o uso mais eficiente de nutrientes, tais como aumen- to do uso de nitrogênio, melhorias ou introduções de eficiência na fixa- ção de nitrogênio, maior eficiência fotossintética, tal como conversão de plantas C3 em C4. No entanto, outros traços poderiam ser maior tolerância a estressores abióticos, tais como temperatura, suprimento de água, salinidade, pH, tolerância a extremos na exposição à luz so- lar. Traços adicionais podem ser características relacionadas a sabor, aparência, perfis nutricionais ou vitamínicos de porções comestíveis ou alimentáveis da planta, ou podem ser relacionados à longevidade do armazenamento ou qualidade dessas porções. Por fim, os traços po- dem ser relacionados a qualidades agronômicas, tais como resistência a acamamento, deiscência, tempo de floração, maturação, emergên- cia, colheita, estrutura da planta, vigor, tamanho, produtividade e ou- tras características.
[00142] Em uma modalidade de acordo com os vários aspectos da presente invenção, a pelo menos uma nuclease específica de sítio po- de compreender uma nuclease de dedo de zinco, uma nuclease efeto- ra do tipo ativadora de transcrição, um sistema CRISPR/Cas, incluindo um sistema CRISPR/Cas9, um sistema CRISPR/Cpf1, um sistema CRISPR/CasX, um sistema CRISPR/CasY, uma endonuclease de ho- ming modificada, e uma meganuclease, e/ou qualquer combinação, variante ou fragmento cataliticamente ativo dos mesmos.
[00143] Um sistema CRISPR em seu ambiente natural descreve um complexo molecular compreendendo pelo menos um RNA não codifi- cante individual e pequeno em combinação com uma nuclease Cas ou outra nuclease CRISPR, como uma nuclease de Cpf1 (Zetsche et al., 2015, supra) que pode produzir uma ruptura de filamentos duplos de DNA específica. Atualmente, os sistemas CRISPR são categorizados em 2 classes, compreendendo cinco tipos de sistemas CRISPR, o sis- tema tipo II, por exemplo, usando Cas9 como efetor e o sistema tipo V usando Cpf1 como molécula efetora (Makarova et al., Nature Rev. Mi- crobiol., 2015). Em sistemas CRISPR artificiais, um RNA sintético não codificante e uma nuclease CRISPR e/ou opcionalmente uma nu- clease CRISPR modificada, modificada para atuar como nickase ou sem função de nuclease, pode ser usada em combinação com pelo menos um RNA guia sintético ou artificial ou gRNA combinando a fun- ção de um crRNA e/ou um tracrRNA (Makarova et al., 2015, supra). A resposta imune mediada por CRISPR/Cas em sistemas naturais re- quer CRISPR-RNA (crRNA), em que a maturação desse RNA guia, que controla a ativação específica da nuclease CRISPR, varia signifi- cativamente entre os vários sistemas CRISPR que foram caracteriza-
dos até o momento.
Primeiramente, o DNA invasor, também conhecido como espaçador, é integrado entre duas regiões de repetição adjacen- tes na extremidade proximal do locus CRISPR.
Os sistemas CRISPR do tipo II, por exemplo, podem codificar uma nuclease Cas9 como en- zima chave para a etapa de interferência, cujo sistema contém um crRNA e também um RNA transativador (tracrRNA) como motivo guia.
Esses se hibridizam e formam regiões de RNAs de fita dupla (ds) que são reconhecidas pelo RNAseIII e podem ser clivadas para formar crRNAs maduros.
Estes, por sua vez, associam-se à molécula de Cas, a fim de direcionar a nuclease especificamente para a região de ácido nucleico alvo.
Moléculas de gRNA recombinantes podem compreender tanto a região de reconhecimento de DNA variável e também a região de interação de Cas e, portanto, podem ser especificamente projeta- das, independentemente do ácido nucleico alvo específico e da nu- clease Cas desejada.
Como mecanismo de segurança adicional, os PAMs (motivos adjacentes de protoespaçador) devem estar presentes na região de ácido nucleico alvo; estas são sequências de DNA sub- sequentes diretamente ao DNA reconhecido pelo complexo Cas9/RNA.
A sequência PAM para Cas9 de Streptococcus pyogenes foi descrita como "NGG" ou "NAG" (código de nucleotídeos Padrão IUPAC) (Jinek et al., "A programmable dual-RNA-guided DNA endonu- clease in adaptative bacterial immunity", Science 2012, 337:816-821). A sequência PAM para Cas9 de Staphylococcus aureus é "NNGRRT" ou "NNGRR(N)". São conhecidos outros sistemas CRISPR/Cas9 vari- antes.
Dessa forma, uma Neisseria meningitidis Cas9 cliva-se na se- quência PAM NNNNGATT.
Um Streptococcus thermophilus Cas9 cli- va-se na sequência PAM NNAGAAW.
Recentemente, um outro motivo PAM NNNNRYAC foi descrito para um sistema CRISPR de Campylo- bacter (WO 2016/021973 A1). Para nucleases Cpf1, foi descrito que o complexo Cpf1-crRNA, sem um tracrRNA, reconhece e cliva de manei-
ra eficiente o DNA alvo procedido por um PAM rico em T curto, em contraste com os PAMs ricos em G geralmente reconhecidos por sis- temas Cas9 (Zetsche et al., supra). Além disso, usando polipeptídeos CRISPR modificados, rupturas de filamentos duplos específicas po- dem ser obtidas. O uso combinado de Cas nickases com vários gRNAs recombinantes também pode induzir rupturas de filamentos duplos de DNA altamente específicas por meio de corte de DNA duplo. Ao usar dois gRNAs, além disso, a especificidade da ligação de DNA e, portanto, a clivagem de DNA podem ser otimizadas. Entretanto, ou- tros efetores CRISPR, como efetores CasX e CasY descritos original- mente para bactérias, estão disponíveis e representam outros efeto- res, que podem ser usados para fins de engenharia de genoma. (Burs- tein et al., "New CRISPR-Cas systems from uncultivated microbes", Nature, 2017, 542, 237-241).
[00144] Atualmente, por exemplo, sistemas tipo II baseados em Cas9, ou uma variante ou qualquer forma quimérica dos mesmos, co- mo endonucleases, foram modificados para engenharia de genoma. Sistemas CRISPR sintéticos que consistem em dois componentes, um RNA guia (gRNA), também chamado de RNA único guia (sgRNA), e uma endonuclease não específica associada a CRISPR podem ser usados para gerar células ou animais nocaute, coexpressando um gRNA específico para o gene a ser direcionado e capaz de associação com a endonuclease Cas9. Notavelmente, o gRNA é uma molécula artificial que compreende um domínio interagindo com Cas ou qual- quer outra proteína efetora CRISPR ou uma variante ou fragmento ca- taliticamente ativo da mesma e outro domínio interagindo com o ácido nucleico alvo de interesse e, portanto, representando uma fusão sinté- tica do crRNA e tracrRNA (como "RNA guia único" (sgRNA) ou sim- plesmente "gRNA"). O alvo genômico pode ser qualquer sequência de DNA de ~20 nucleotídeos, desde que o alvo esteja imediatamente pre-
sente a montante de uma sequência PAM. A sequência PAM é de grande importância para a ligação ao alvo e a sequência exata é de- pendente das espécies de Cas9 e, por exemplo, leituras 5’ NGG 3’ ou 5’ NAG 3’ (código de nucleotídeo Padrão IUPAC) (Jinek et al., Science 2012, supra) para Cas9 derivado de Streptococcus pyogenes. A se- quência PAM para Cas9 de Staphylococcus aureus é NNGRRT ou NNGRR(N). Muitos outros sistemas CRISPR/Cas9 variantes são co- nhecidos, incluindo, entre outros, Neisseria meningitidis Cas9 clivando a sequência PAM NNNNGATT. Um Streptococcus thermophilus Cas9 clivando a sequência PAM NNAGAAW. Usando nucleases Cas modifi- cadas, rupturas de filamentos simples direcionadas podem ser introdu- zidas em uma sequência alvo de interesse. Pelo uso combinado de tal Cas nickase com diferentes gRNAs recombinantes, rupturas de fila- mentos duplos de DNA altamente específicas de sítio podem ser intro- duzidas usando um sistema de corte duplo. O uso de um ou mais gRNAs pode aumentar ainda mais a especificidade geral e reduzir os efeitos fora do alvo.
[00145] Uma vez expressa, a proteína Cas9 e o gRNA formam um complexo de ribonucleoproteínas por meio de interações entre o do- mínio "scaffold" do gRNA e ranhuras com carga positiva expostas à superfície em Cas9. Cas9 sofre uma alteração conformacional após a ligação de gRNA que desloca a molécula de uma conformação de li- gação a não DNA inativa para uma conformação de ligação a DNA ati- va. É importante ressaltar que a sequência "espaçadora" do gRNA permanece livre para interagir com o DNA alvo. O complexo Cas9- gRNA ligará qualquer sequência genômica a um PAM, mas a extensão em que o espaçador de gRNA corresponde ao DNA alvo determina se Cas9 será cortado. Uma vez que o complexo Cas9-gRNA se liga a um alvo de DNA putativo, uma sequência "semente" na extremidade 3’ da sequência de direcionamento de gRNA começa a se anelar ao DNA alvo. Se as sequências de DNA alvo e semente forem corresponden- tes, o gRNA continuará a se anelar ao DNA alvo na direção de 3’ a 5’ (em relação à polaridade do gRNA).
[00146] CRISPR/Cas, por exemplo CRISPR/Cas9, e também CRISPR/Cpf1 ou CRISPR/CasX ou CRISPR/CasY e outros sistemas CRISPR são altamente específicos quando os gRNAs são projetados corretamente, mas especialmente a especificidade ainda é uma gran- de preocupação, especialmente para usos clínicos ou GE de planta direcionada baseada na tecnologia CRISPR. A especificidade do sis- tema CRISPR é determinada em grande parte por quão específica é a sequência de direcionamento de gRNA para o alvo genômico em comparação com o restante do genoma. Portanto, os métodos de acordo com a presente invenção, quando combinados com o uso de pelo menos uma nuclease CRISPR como nuclease específica de sítio e ainda combinados com o uso de um ácido nucleico CRISPR ade- quado, podem fornecer um resultado significativamente mais previsível de GE. Enquanto o complexo CRISPR pode mediar um corte altamen- te preciso de um genoma ou material genético de uma célula ou sis- tema celular em um sítio específico, os métodos apresentados neste documento fornecem um mecanismo de controle adicional que garante um mecanismo de reparo programável e previsível.
[00147] De acordo com as várias modalidades da presente inven- ção, a divulgação acima com relação à associação ou conexão cova- lente e não covalente também se aplica às sequências de ácido nu- cleico CRISPR, que podem compreender mais de uma porção, por exemplo, uma porção de crRNA e tracrRNA, que podem ser associa- das entre si, conforme detalhado acima. Em uma modalidade, uma sequência de ácido nucleico de RT da presente invenção pode ser co- locada dentro de uma sequência de ácido nucleico CRISPR de inte- resse para formar uma sequência de ácido nucleico híbrida de acordo com a presente invenção, cujo híbrido pode ser formado por associa- ção covalente e não covalente.
[00148] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, as uma ou mais sequências de ácido nuclei- co flanqueando a pelo menos uma sequência de ácido nucleico de in- teresse no local predeterminado podem ser pelo menos 85%-100% complementares às uma ou mais sequências de ácido nucleico adja- centes ao local predeterminado, a montante e/ou a jusante do local predeterminado, por todo o comprimento da(s) respectiva(s) regi- ão(ões) adjacente(s). Notavelmente, um grau inferior de homologia ou complementaridade da pelo menos uma região de flanqueamento po- de ser usado, por exemplo pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 81%, pelo menos 82%, pelo menos 83%, ou pelo menos 84% de homologia/complementaridade a pelo menos uma região adjacente no material genético de interesse. Para GE de alta precisão dependendo de modelo HDR, ou seja, um RT como divulga- do neste documento, mais de 95% de homologia/complementaridade são favoráveis para alcançar um evento de reparo altamente direcio- nado. Como mostrado em Rubnitz et al., Mol. Cell Biol., 1984, 4(11), 2253-2258, também uma homologia de sequência muito baixa pode ser suficiente para obter uma recombinação homóloga. Como é co- nhecido pelo versado na técnica, o grau de complementaridade de- penderá do material genético a ser modificado, da natureza da edição planejada, da complexidade e tamanho de um genoma, do número de potenciais sítios fora do alvo, do contexto genético e do ambiente den- tro de uma célula ou sistema celular a ser modificado.
[00149] Ainda em outra modalidade de acordo com os vários aspec- tos da presente invenção, o material genético do sistema celular pode ser selecionado do grupo que consiste em um protoplasto, um genoma viral transferido em uma célula hospedeira recombinante, uma célula eucariótica ou procariótica, tecido ou órgão, e um organismo eucarióti- co ou procariótico, preferencialmente um organismo eucariótico. Mes- mo que o organismo procariótico não possa, ele próprio, compreender Pol teta ou outras enzimas de uma via NHEJ, um genoma procariótico, ou partes dele, ainda pode representar um material genético de acordo com a presente invenção, por exemplo, no caso de todos ou parte de um genoma procariótico ser transferido para uma célula hospedeira eucariótica como sistema celular, isto é, um genoma doador procarióti- co pode ser modificado no contexto de um sistema molecular de hos- pedeiro eucariótico.
[00150] Em uma modalidade de acordo com os vários aspectos da presente invenção, o material genético do sistema celular pode ser se- lecionado de uma célula eucariótica, em que a célula eucariótica é pre- ferencialmente uma célula de planta.
[00151] Em determinadas modalidades, os métodos da presente invenção podem, portanto, ser adequados para uso em um método de tratamento de uma doença, em que a doença é caracterizada por pelo menos uma mutação genômica e o complexo molecular artificial é con- figurado para direcionar e reparar a pelo menos uma mutação genômi- ca que resulta em um fenótipo de doença. É, portanto, provido um mé- todo de tratar uma doença usando o complexo molecular artificial de acordo com qualquer uma das reivindicações precedentes, em que a doença é caracterizada por pelo menos uma mutação genômica e o complexo molecular artificial é configurado para direcionar e reparar a pelo menos uma mutação genômica. O método terapêutico de trata- mento pode compreender edição de genes ou genoma, ou terapia ge- nética.
[00152] Em certas modalidades, o material genético a ser modifica- do a partir de pelo menos uma célula eucariótica pode ser uma célula de planta meristemática, e a célula de planta, após inativação (parcial)
de Pol teta e pelo menos uma enzima de reparo adicional de uma via NHEJ e introdução de ferramentas de GE com acordo com a presente invenção, é ainda cultivada sob condições adequadas até que o está- gio de desenvolvimento da maturidade da inflorescência seja alcança- do para obter uma planta ou material de planta compreendendo uma modificação de interesse mediada por pelo menos um complexo mole- cular de acordo com a presente invenção. Vários protocolos estão, por exemplo, disponíveis para o versado na técnica para produção de pó- len germinável e viável a partir de borlas de milho cultivadas in vitro, por exemplo, em Pareddy DR et al. (1992) Maturation of maize pollen in vitro. Plant Cell Rep. 11 (10):535-539. doi:10.1007/BF00236273, Stapleton AE et al. (1992) Immature maize spikelets develop and pro- duce pollen in culture. Plant. Cell Rep., 11 (5-6):248-252, ou Pareddy DR et al. (1989) Production of normal, germinable and viable pollen from in vitro-cultured maize tassels, Theor. Appl. Genet. 77 (4):521-
526. Esses protocolos baseiam-se, entre outros, na excisão da borla, esterilização da superfície e cultura em um meio com cinetina para promover o crescimento e a maturação da borla. Após a formação das espiguetas, uma colheita contínua de anteras pode ser realizada. Após a extrusão, as anteras serão dessecadas até o pólen sair. Alternativa- mente, as anteras podem ser dissecadas e o pólen é derramado em meio líquido que é posteriormente usado para polinizar as espigas.
[00153] "Maturidade da inflorescência", como usado neste docu- mento, refere-se ao estado, quando a inflorescência imatura de uma planta compreendendo pelo menos uma célula meristemática atingiu um estágio de desenvolvimento, quando uma inflorescência madura, isto é, uma inflorescência estaminada (masculina) ou uma inflorescên- cia pistilada (fêmea), é alcançada e, portanto, um gameta do pólen (macho) ou do óvulo (fêmea) ou ambos está presente. O referido está- gio da fase reprodutiva de uma planta é especialmente importante,
pois o material de planta obtido pode ser usado diretamente para poli- nização de uma planta adicional ou para fertilização com o pólen de outra planta.
[00154] Ao gerar células ou sistemas celulares que abrigam uma mutação em Pol θ em conjunto com uma mutação em uma enzima es- sencial para NHEJ, por exemplo, Ku70, Ku80 ou Ligase IV (LigIV) e outros alvos divulgados neste documento, é possível produzir células ou sistemas celulares com dominância completa da via HDR sem inte- gração aleatória (ou não direcionada) de DNA estranho. A realização de experimentos de direcionamento de genes nas referidas células ou sistemas celulares, e particularmente em células de plantas ou siste- mas celulares, abrigando as mutações duplas, tem vários benefícios. Primeiramente, inibir a via NHEJ, isso impede que as DSBs induzidas por SSN sejam reparadas por essa via, para que permaneçam abertos e disponíveis para HDR. Em segundo lugar, inibir Pol teta, não há in- tegração aleatória do RT ou de qualquer cassete de transgene (por exemplo, cassete SSN, repórteres fluorescentes, estrutura principal de plasmídeo etc.) para interferir na triagem de linhagens celulares ou or- ganismos para o direcionamento de genes. A presente invenção provê métodos particularmente adequados para GE de planta e levando em consideração a complexidade de genomas de plantas para evitar uma perda significativa de viabilidade dessas pelo menos células compro- mentidas duplas ou mutantes duplas com relação às enzimas NHEJ para prover sistemas celulares compreendendo uma Pol teta (parcial- mente) inativada e pelo menos uma enzima adicional tendo uma taxa de HDR aumentada quando a GE é realizada. Portanto, os métodos divulgados neste documento fornecem um ambiente ideal para direci- onamento de genes, no qual o mecanismo dominante disponível para reparar DSBs é por HDR.
[00155] Outra estratégia e modalidades preferidas descritas neste documento são a inibição transiente (parcial) de Pol teta e a via NHEJ em células ou sistemas celulares, ao mesmo tempo em que entrega um SSN e RT simultaneamente. Isso pode ser feito com RNA interfe- rente direcionado contra a Pol teta e Ku70, Ku80, ligase IV ou outra enzima NHEJ essencial divulgada neste documento.
[00156] Por interferência de proteínas com essas enzimas, tal co- mo, por exemplo, entregando proteínas de adenovírus 4 E1B55K e E4orf6 que inibem ligase IV; entregando pequenos inibidores químicos dessas enzimas, tais como, por exemplo, SCR7, W7, Vanillina, NU7026, NU7441 (Arras & Fraser, 2016, PLOS ONE 11(9): e0163049) que inibe ligase IV, DNA PKcs, síntese de cofator de Ku; ou por qual- quer combinação desses e dos métodos de mutação. Outros inibidores químicos ou sintéticos e/ou biológicos de qualquer enzima de uma via NHEJ divulgados neste documento podem ser usados, cujo inibidor pode ser administrado a uma célula ou sistema celular em uma dose não tóxica para a célula ou sistema celular para garantir a viabilidade da célula ou sistema celular, em que a dose é suficiente para inibir pe- lo menos parcialmente a atividade de Pol teta e pelo menos uma en- zima adiciona de uma via NHEJ, preferencialmente de maneira transi- ente.
[00157] Como é conhecido pelo versado na técnica e como definido acima, o RNAi depende da ação de pequenos RNAs, que podem ser selecionados para um micro RNA (miRNA), um pequeno RNA interfe- rente (siRNA) ou um RNA que interage com Piwi (piRNA), compreen- dendo ribonucleotídeos de ocorrência natural e/ou não natural (sintéti- cos), em que o nucleotídeo sintético, por exemplo, compreendendo uma estrutura principal de fosforotioato, pode ser adequado para au- mentar a estabilidade da molécula de RNA geralmente facilmente de- gradável. Foi relatado que SiRNAs de ~21n desempenham um papel crucial no silenciamento de RNA, um termo que se refere ao silencia-
mento de genes pós-transcricional em plantas, suprimindo em fungos e animais RNAi. Acredita-se que o mecanismo de biogênese e função de siRNA seja altamente conservado em quase todos os eucariotas, incluindo plantas e animais, nos quais os siRNAs são produzidos a partir de RNA de fita dupla (dsRNA) por uma RNase III denominada Dicer em células animais ou DCL (tipo Dicer) em plantas, e, em segui- da, incorporados em um complexo de silenciamento induzido por RNA (RISC), em que siRNAs desempenham um papel de orientação na cli- vagem específica de sequência de mRNAs alvo. Além disso, em al- guns organismos, tais como Caenorhabditis elegans, Drosophila e plantas, o sinal siRNA é espalhado ao longo do alvo de mRNA, o que resulta na produção de siRNAs secundários e na indução de silencia- mento de RNA transitivo (ver Lu et al., Nucleic. Acids Res., 2004, 32(21):e171).
[00158] Em outras modalidades, um mecanismo de interferência de RNA (RNAi) pode, portanto, ser usado para obter uma inibição transi- ente da atividade de pelo menos uma Pol teta e pelo menos uma en- zima NHEJ adicional. O RNA interferente pode desencadear o silenci- amento dos mRNAs para enzimas efetoras relevantes de pelo menos uma via NHEJ. Pode ser entregue como RNA de fita dupla, como RNA antissentido de fita simples, em cassetes de expressão de DNA hair- pin, ou como sequências quiméricas de poli-sgRNA/siRNA que geram múltiplos complexos de sgRNA-Cas9 RNP na digestão mediada por Dicer das partes de siRNA, levando a uma interrupção mais eficiente do gene alvo nas células (Ha J.S. et al., Journal of Controlled Release 250 (2017) 27–35).
[00159] A inibição transiente (parcial) de acordo com as várias mo- dalidades divulgadas neste documento pode inibir ou inativar uma Pol teta e pelo menos uma enzima NHEJ adicional em um grau diferente, por exemplo, a atividade de uma enzima Pol teta pode ser totalmente inativada, enquanto a atividade de pelo menos uma enzima da via NHEJ adicional pode ser parcialmente inativada e vice-versa.
[00160] De acordo com os vários aspectos e modalidades da pre- sente invenção, contempla-se que uma inativação (parcial) transiente pode compreender uma combinação de pelo menos um de um meca- nismo de silenciamento de RNAi que atua no nível de RNA e/ou um inibidor químico/sintético ou biológico que atua no nível de RNA ou proteína de uma enzima a ser inativada, e/ou um inibidor que atua, por exemplo, em trans para regular a transcrição de uma Pol teta e pelo menos uma enzima da via NHEJ adicional.
[00161] Em uma modalidade adicional de acordo com os vários as- pectos da presente invenção, é provido um método, em que o orga- nismo eucariótico pode ser uma planta, ou uma parte de uma planta. Ainda em outra modalidade de acordo com os vários aspectos da pre- sente invenção, a parte da planta pode ser selecionada do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flor, pétalas, frutas, pólen, tubos de pólen, filamentos de anteras, óvulos, sacos embrionários, óvulos, ovários, zigotos, embriões, embri- ões zigóticos, embriões somáticos, meristemas apicais, feixes vascula- res, periciclos, sementes, raízes e mudas.
[00162] Em uma modalidade de acordo com os vários aspectos da presente invenção, o material genético do sistema celular pode ser, ou pode se originar de, uma espécie de planta selecionada do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cere- ale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana syl- vestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lyco-
persicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Cruci- himalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepi- dium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Ara- bis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Ra- phanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scara- baeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sati- vum e Allium tuberosum. Com base na divulgação fornecida neste do- cumento, os métodos da presente invenção podem ser facilmente transferidos e podem ser usados para a modificação do material gené- tico obtido de outras plantas ou espéciesde plantas.
[00163] Em um aspecto adicional, é provido um método para pro- duzir um sistema celular, preferencialmente um sistema celular como definido neste documento acima, compreendendo as seguintes eta- pas: (a) prover um sistema celular ou um material genético de um sis- tema celular compreendendo uma enzima polimerase teta funcional, ou a sequência que a codifica, e uma ou mais enzimas de reparo de DNA funcionais adicioais, ou a(s) sequência(s) que a codifica(m), da via NHEJ; (b) inativar ou parcialmente inativar a enzima polimerase teta, ou a sequência que a codifica, e inativar ou parcialmente inativar uma ou mais enzimas de reparo de DNA adicionais, ou a(s) sequên- cia(s) que as codifica(m), em que a inativação ou inativação parcial ocorre simultaneamente ou subsequentemente, preferencialmente de maneira transiente; (c) opcionalmente, introduzir o material genético em um sistema celular; (d) obter um sistema celular compreendendo uma enzima polimerase teta funcionalmente inativada ou parcialmente inativada e uma ou mais enzimas de reparo de DNA funcionalmente inativadas ou parcialmente inativadas. Esse aspecto pode ser particu- larmente adequado para prover um sistema celular e/ou um material genético a ser modificado por qualquer método de GE para prover uma célula ou sistema tendo pelo menos uma via NHEJ endógena comprometida, pelo menos por um período de tempo transiente, por exemplo, para testar condições ideais de GE.
[00164] Em uma modalidade, a inativação ou inativação parcial po- de ser uma inativação estável, ou a inativação ou inativação parcial pode ser uma inativação transiente, preferencialmente uma inativação ou inativação parcial transiente com base em um mecanismo de silen- ciamento de genes, incluindo RNAi, ou um inibidor químico, ou qual- quer combinação dos mesmos. Preferencialmente, todos os alelos da enzima polimerase teta e/ou das uma ou mais enzimas de reparo de DNA adicionais da via NHEJ são inativados ou parcialmente inativa- dos, ou seja, um nocaute da enzima polimerase teta e/ou das uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ está pre- sente de forma homozigótica.
[00165] Em uma modalidade adicional de acordo com os vários as- pectos divulgados neste documento, a modificação ou inativação ou inativação parcial pode compreender uma modificação de pelo menos uma sequência de ácido nucleico que codifica a enzima polimerase teta e de pelo menos uma sequência de ácido nucleico que codifica uma ou mais enzimas de reparo de DNA de uma via NHEJ, em que pelo menos uma modificação pode compreender pelo menos uma ex- clusão, inserção ou substituição de pelo menos um nucleotídeo na respectiva codificação da sequência de ácido nucleico, resultando na alteração da sequência de aminoácido correspondente nas enzimas codificadas.
[00166] Em uma modalidade adicional de acordo com os vários as- pectos divulgados neste documento, a enzima polimerase teta e as uma ou mais enzima de reparo de DNA da via NHEJ são inativadas ou parcialmente inativadas por um mecanismo de silenciamen- to/inativação de genes. A modalidade que utiliza um mecanismo de silenciamento/inativação de genes geralmente depende de um meca- nismo de RNAi e pode ser particularmente adequada para uma inati- vação (parcial) transiente para garantir que a Pol teta e as uma ou mais enzimas de reparo de DNA adicionais da via NHEJ possam ser facilmente reativadas para cumprir sua função natural no reparo de ruptura de DSB após a introdução de um evento de GE direcionado.
[00167] A pelo menos uma enzima polimerase teta e as uma ou mais enzimas de reparo de DNA adicionais da via NHEJ a serem inati- vadas ou parcialmente inativadas de acordo com os aspectos divulga- dos neste documento direcionados a pelo menos um sistema celular podem ser selecionadas das sequências, conforme definido neste do- cumento acima.
[00168] Em certas modalidades, o mecanismo de silenciamen- to/inativação de genes pode ser selecionado de um sistema que com- preenda (i) pelo menos um pequeno RNA interferente, selecionado de um cassete hairpin de DNA, ou RNA interferente, em que o RNA inter- ferente pode compreender um RNA de fita dupla, opcionalmente com- preendendo uma estrutura do tipo hairpin, ou um RNA sentido e/ou antissentido de fita simples; opcionalmente compreendendo (ii) uma endonuclease de RNA específica de sítio, tal como C2c2; e opcional- mente compreendendo (iii) pelo menos um de uma proteína de adeno- vírus 4 E1B55K e/ou E4orf6, ou a sequência que a codifica; e/ou opci- onalmente compreendendo (iv) pelo menos um pequeno inibidor quí- mico selecionado do grupo que consiste em: SCR7, W7, Vanilina, NU7026 e NU7441.
[00169] Em uma modalidade baseada em RNAi como mecanismo de inativação (parcial) transiente, primeiramente, a exclusividade de uma sequência de molécula inibidora de RNA de interesse usada co- mo silenciador em um genoma ou material genético de interesse é confirmada. Em seguida, sequências de cerca de 100 a cerca de 1.000 pb, preferencialmente cerca de 250 a cerca de 500 pb, a partir da 3’UTR de um mRNA de interesse que codifica uma enzima a ser inibi- da são projetadas. Essas sequências podem ser usadas para serem integradas a um vetor hairpin ou a um constructo hairpin, ou para se- rem usadas como sequências sentido e antissentido, para sub-regular a expressão de um gene no nível de RNA de forma precisa. Métodos de Entrega:
[00170] Uma variedade de técnicas de entrega transientes e está- veis adequadas, adequadas de acordo com os métodos da presente invenção para introduzir material genético, biomoléculas, incluindo qualquer tipo de RNA e/ou DNA de fita simples e fita dupla, ou amino- ácidos, substâncias sintéticas ou químicas, em uma célula eucariótica, preferencialmente uma célula de planta, ou em um sistema celular compreendendo material genético de interesse, são conhecidas do versado na técnica e compreendem, entre outros, a escolha de técni- cas de entrega direta que variam de tratamento de protoplastos com polietileno glicol (PEG) (Potrykus et al. 1985), procedimentos como eletroporação (D´Halluin et al., 1992), microinjeção (Neuhaus et al., 1987), tecnologia de "bigodes" de fibra de carboneto de silício (Kaeppler et al., 1992), abordagens mediadas por vetores virais (Gel- vin, Nature Biotechnology 23, "Viral-mediated plant transformação gets a boost", 684-685 (2005)) e bombardeio de partículas (ver, por exem- plo, Sood et al., 2011, Biologia Plantarum, 55, 1-15). A transfecção transiente de células de mamíferos com PEI é divulgada em Longo et al., Methods Enzymol., 2013, 529:227-240. Protocolos para transfor-
mação de células de mamíferos são divulgados em Methods in Mole- cular Biology, Nucleic Acids ou Proteins, ed. John M. Walker, Springer Protocols.
[00171] Para células de plantas a serem modificadas, apesar dos métodos de transformação baseados em abordagens biológicas, como transformação por Agrobacterium ou transformação de plantas media- da por vetores virais, e métodos baseados em métodos de entrega fí- sica, como bombardeio de partículas ou microinjeção, evoluíram como proeminentes técnicas para introduzir material genético em uma célula de planta ou tecido de interesse. Helenius et al. ("Gene delivery into intact plants using the HeliosTM Gene Gun", Plant Molecular Biology Reporter, 2000, 18(3):287-288) divulgam um bombardeio de partículas como método físico para introduzir material em uma célula de planta. Atualmente, existe uma variedade de métodos de transformação de planta para introduzir material genético na forma de um constructo ge- nético em uma célula de planta de interesse, compreendendo meios biológicos e físicos conhecidos pelos versados no campo de biotecno- logia de planta e que podem ser aplicados para introduzir pelo menos um gene que codifica pelo menos uma quinase associada à parede em pelo menos uma célula de pelo menos uma célula de planta, teci- do, órgão ou planta inteira. Notavelmente, os referidos métodos de en- trega para transformação e transfecção podem ser aplicados para in- troduzir as ferramentas da presente invenção simultaneamente. Um meio biológico comum é transformação com Agrobacterium spp. que tem sido usado há décadas para uma variedade de diferentes materi- ais vegetais. A transformação de plantas mediada por vetores virais representa uma estratégia adicional para introduzir material genético em uma célula de interesse. Meios físicos que encontram aplicação em biologia de plantas são bombardeio de partículas, também deno- minado transfecção biolística ou transferência de genes mediada por micropartículas, que refere-se a um método de entrega física para transferir uma micropartícula revestida ou nanopartícula compreen- dendo um ácido nucleico ou um constructo genético de interesse em um tecido ou célula alvo.
Os meios de introdução física são adequados para introduzir ácidos nucleicos, isto é, RNA e/ou DNA, e proteínas.
Da mesma forma, existem métodos específicos de transformação ou transfecção para especificamente introduzir um ácido nucleico ou um constructo de aminoácido de interesse em uma célula de planta, inclu- indo eletroporação, microinjeção, nanopartículas e peptídeos de pene- tração celular (CPPs). Além disso, existem métodos de transfecção baseados em produtos químicos para introduzir constructos genéticos e/ou ácidos nucleicos e/ou proteínas, compreendendo, entre outros, transfecção com fosfato de cálcio, transfecção usando lipossomas, por exemplo, lipossomas catiônicos, ou transfecção de polímeros catiôni- cos, incluindo DEAD-dextrano ou polietilenimina, ou combinações dos mesmos.
Os referidos métodos de entrega e veículos de entrega ou cargas, portanto, diferem inerentemente das ferramentas de entrega usadas para outras células eucarióticas, incluindo células animais e de mamíferos e cada método de entrega deve ser especificamente ajus- tado e otimizado para um constructo de interesse introduzir e/ou modi- ficar pelo menos um gene que codifica pelo menos uma quinase asso- ciada à parede na pelo menos uma célula de planta, tecido, órgão ou planta inteira; e/ou pode ser introduzido em um compartimento especí- fico de uma célula alvo ou sistema celular de interesse de maneira to- talmente funcional e ativa.
As técnicas de entrega acima, sozinhas ou em combinação, podem ser usadas para abordagens in vivo (incluindo em planta) ou in vitro.
Em particular, para modalidades que se basei- am nas estratégias de introdução transiente, moléculas silenciadoras baseadas em RNA ou inibidores químicos, sintéticos ou biológicos de pelo menos uma Pol teta e/ou outra enzima de uma via via NHEJ po-
dem, por exemplo, ser introduzidos juntamente com, antes ou depois da transformação e/ou transfecção de ferramentas relevantes para GE.
[00172] Dependendo da natureza da molécula introduzida, por exemplo, um vetor bastante estável em comparação com uma molécu- la de RNA bastante instável, diferentes esquemas de tempo de trans- formação/transfecção devem ser escolhidos para garantir que a inati- vação (parcial) de Pol teta e pelo menos uma enzima da via NHEJ adi- cional esteja disponível exatamente no momento em que as ferramen- tas de GE estão disponíveis ou são fornecidas a uma mesma célula. A sub-regulação baseada em RNAi de um alvo pode, portanto, levar al- gum tempo para se tornar ativa. Da mesma forma, no caso de uma molécula ser introduzida como vetor transcritível/translatável (plasmí- deo), pode levar algum tempo até que as ferramentas possam ser for- necidas em sua forma ativa e estejam disponíveis no compartimento direito dentro de uma célula ou sistema celular de interesse. Para ser capaz de prover moléculas altamente ativas a um sistema celular de interesse, em determinadas modalidades, pode assim ser preferido para prover complexos moleculares pré-montados e de função com- preendendo pelo menos uma nuclease específica de sítio, opcional- mente pelo menos um gRNA (para nucleases CRISPR), e ainda pro- vendo uma sequência de ácido nucleico de interesse, preferencialmen- te flanqueada por pelo menos uma região de homologia na forma de um modelo de reparo, para poder prover um complexo de GE total- mente funcional a uma célula ou sistema celular exatamente sincroni- zado com inativação (parcial) de Pol teta e pelo menos uma enzima da via NHEJ adicional.
[00173] Em particular com relação a modalidades direcionadas ao fornecimento de métodos para prover um material genético modificado de uma célula de planta, ou para prover uma planta inteira compreen-
dendo material genético modificado, métodos transientes podem ser preferíveis devido a questões legais e regulatórias.
[00174] Em um aspecto de acordo com a presente invenção, é as- sim provida uma célula de planta, tecido, órgão, planta inteira ou mate- rial de planta, ou um derivado ou progênie dos mesmos, que podem ser obtidos por um método conforme divulgado neste documento, em que os métodos opcionalmente compreendem uma etapa adicional de reprodução ou cruzamento.
[00175] A presente invenção é ainda descrita com referência aos seguintes exemplos não limitantes.
EXEMPLOS Exemplo 1: Geração de mutantes duplos em Arabidopsis thaliana
[00176] Para testar se os mutantes duplos de Pol θ (PolQ) e pelo menos um mutante do grupo de Ku70, Ku80 ou LigIV são viáveis e poderiam ser usados para estudos posteriores, as seguintes linhagens mutantes de inserção de T-DNA da Arabidopsis foram obtidas comer- cialmente: NASC-IDs N698253, N667884, N656936, N677892 e N656431 (ver Tabela 1 abaixo). Tabela 1: Visão geral das linhagens mutantes testadas Notação de AGI-ID Notação de T-DNA NASC-ID Genes Linhagem Pol θ, TEB At4g32700 teb-2 SALK_035610C N698253 teb-5 SALK_018851C N667884 KU70 At1g16970 ku70 SALK_123114C N656936 KU80 At1g48050 ku80 SALK_112921C N677892 LIGIV At5g57160 ligIV SALK_044027C N656431
[00177] A inserção e expressão de T-DNA de genes rompidos fo- ram determinadas por PCR/qRT-PCR (Figura 1). Em seguida, todas as linhagens mutantes foram cultivadas até a floração, e os dois mutantes PolQ (At4g32700) (teb-2 e teb-5) foram, cada um, cruzados com os mutantes Ku70 (At1g16970), Ku80 (At1g48050) ou LigIV (At5g57160) para obter os respectivos mutantes duplos. É importante ressaltar que todos os cruzamentos resultaram em sementes viáveis que foram co- lhidas e propagadas para F2. As plantas F2 foram caracterizadas por PCR para inserção de T-DNA em ambos os alelos de PolQ, Ku70, Ku80 e LigIV, respectivamente. Para 5 dos 6 cruzamentos, as plantas com inserções de T-DNA em ambos os alelos de ambos os genes fo- ram identificadas. Para o cruzamento teb-2 x ku70, não foram identifi- cados mutantes duplos homozigotos (Tabela 2). As taxas obtidas fo- ram significativamente mais baixas do que o esperado, indicando que especialmente os mutantes duplos Ku apresentam alguns problemas de fertilidade. Todos os mutantes duplos não apresentaram fenótipos de crescimento severos, embora algumas plantas tenham apresentado crescimento reduzido. Sementes F3 foram colhidas dessas plantas (Tabela 3). Nenhum dos mutantes duplos identificados apresentou de- feitos graves de fertilidade. Foi assim possível obter sementes suficien- tes para todos os mutantes duplos para experimentos subsequentes de imersão floral. Tabela 2: Visão geral de gerações F3 obtidas de linhagens mutantes duplas. Linhagens Mutantes Duplas Geração teb-2 x ligIV F3 teb-5 x ligIV F3 teb-5 x ku70 F3 teb-2 x ku70 Nenhuma planta homozigota teb-2 x ku80 F3 teb-2 x ku80 F3 Exemplo 2: Geração de constructo de direcionamento de genes para testar frequências de direcionamento de genes
[00178] Para a determinação de frequências de direcionamento de genes, um constructo baseado no constructo de direcionamento de genes "pFF15", descrito por Shiml, Fauser e Puchta (2014), foi proje- tado tendo como alvo o locus ADH1 (álcool desidrogenase 1) (Figura 2A; SEQ ID NO: 82). O constructo contém um marcador de seleção Bar para permitir a fácil determinação da eficiência de transformação em plantas Col-0 do tipo selvagem, e para testar a integração aleatória nos mutantes duplos. Para ser capaz de rastrear com eficiência even- tos de direcionamento de genes, um cassete de expressão GFP sob controle do promotor 2S específico de semente (Bensmihen et al., FEBS Letters 561 1–3 (2004): Analysis of an activated ABI5 allele using a new selection method for transgenic Arabidopsis seeds) foi in- serido no modelo de reparo. A inserção do modelo de reparo no locus ADH-1 no genoma de Arabidopsis resulta em sementes fluorescentes verdes, que podem, então, ser facilmente identificadas por microscopia de fluorescência. Exemplo 3: Transformação estável de T-DNA por Agrobacteria para avaliar a frequência de integração aleatória no contexto de mutante duplo
[00179] Para analisar a frequência de integração aleatória nos mu- tantes duplos e nos mutantes únicos de Pol θ, foi realizada transfor- mação estável do constructo de direcionamento de genes por trans- formação de Agrobacteria por imersão floral. Como foi relatado que a mutação de Pol θ aboliu a integração aleatória de T-DNA no genoma alvo (van Kregten, M. et al. Nat. Plants 2, 16164 (2016)), não é possí- vel determinar a taxa de transformação por seleção BASTA em plantas mutantes de Pol θ. Dessa forma, a fim de monitorar a eficiência de transformação, plantas do tipo selvagem também foram transformadas para cada experimento. A seleção BASTA foi, então, aplicada para de- terminar a eficiência de transformação (Figura 3). Além disso, uma se- leção BASTA também foi feita para alíquotas dos mutantes transfor-
mados. Os dados obtidos mostraram claramente que nenhum dos mu- tantes levou a plantas resistentes a BASTA, demonstrando que a inte- gração aleatória do constructo de direcionamento de T-DNA foi inibida com sucesso em mutantes de Pol θ simples e duplos (Figura 3). Exemplo 4: Transformação com Agrobacterium tumefaciens para ava- liar a frequência de direcionamento de genes no contexto de mutantes duplos
[00180] Para testar a frequência de direcionamento de genes, mu- tantes simples e duplos foram transformados com o constructo de di- recionamento de genes descrito acima. Primeiramente, mutantes sim- ples polQ foram transformados com os constructos de direcionamento de genes, seguindo o protocolo de imersão floral de Arabidopsis des- crito em Clough et al. (Clough, S.J. e Bent, A.F. (1998) Floral dip: a simplified method for Agrobacterium-mediated transformation of Arabi- dopsis thaliana. Plant J, 16(6), 735-743). Paralelamente, plantas Col-0 do tipo selvagem foram transformadas para confirmar a alta eficiência de transformação. Após a transformação por imersão floral, as plantas foram cultivadas por aproximadamente 3 semanas. Em seguida, a re- ga foi interrompida para promover a maturação das sementes e as sementes maduras foram colhidas. Uma alíquota das sementes foi usada para a seleção BASTA, e nenhuma planta resistente a BASTA foi identificada nas plantas mutantes de polQ teb-2 e teb-5. Nas plan- tas do tipo selvagem, uma eficiência de transformação de ~1% foi con- firmada. Os resultados indicam que a integração aleatória de T-DNA nas plantas mutantes de polQ é eficientemente inibida.
[00181] O restante das sementes mutantes de polQ transformadas foi, em seguida, avaliado quanto a sementes fluorescentes verdes. Após três rodadas de transformação, apenas duas sementes fluores- centes verdes foram identificadas, representando uma taxa média de direcionamento de genes de 0,4 eventos HDR por 100.000 sementes
(Tabela 3). A caracterização molecular dessas sementes confirmou a integração do modelo de reparo no locus de direcionamento de gene do gene adh1 (Figura 4).
[00182] Na etapa seguinte, os mutantes duplos foram transforma- dos com os constructos de direcionamento de genes, também seguin- do o protocolo de imersão floral de Arabidopsis de Clough e Bent (1998). Após a transformação por imersão floral, as plantas foram cul- tivadas por mais ~3 semanas e, em seguida, a rega foi interrompida para promover a maturação de sementes. As sementes maduras fo- ram colhidas e analisadas quanto às sementes fluorescentes verdes (Tabela 3). Após três experimentos de transformação independentes, em resumo, 31 sementes fluorescentes foram identificadas no mutante duplo teb-5 x ligIV, representando uma taxa média de direcionamento de genes de 2,9 eventos de HDR por 100.000 sementes (Tabela 3). Resultados semelhantes foram obtidos no mutante duplo teb-2 x ligIV equivalente, onde foram identificadas 13 sementes fluorescentes, re- presentando uma taxa de direcionamento de genes de 5,6 eventos HDR por 100.000 sementes.
[00183] A taxa de direcionamento de genes também foi determina- da nos mutantes duplos teb-5 x ku70. Foram realizadas rodadas de experimentos de transformação, conforme descrito acima. No total, foram identificadas 19 sementes fluorescentes no mutante duplo teb-5 x ku70, representando uma taxa média de direcionamento de genes de 1,9 eventos HDR por 100.000 sementes (Tabela 3).
[00184] Os dados obtidos indicam um aumento relativo na taxa de direcionamento de genes em ambos os mutantes duplos polQ-ligIV e polQ-ku70 em comparação com os mutantes únicos polQ.
Tabela 3: Resumo dos experimentos de transformação, número de sementes totais, sementes fluorescentes e eficiência de transforma- ção. Exp. Sementes Eficiênc. Nº. de Cepa de Nº. de Taxa HDR Imersão Genótipo Fluores- de Trans- plantas Agrobact. sementes (/100.000) Floral Nº. centes formação ~0,8% Col-0 48 407100 >>105 (BASTA) 0% (BAS- #10 teb-2 48 AGL1 419500 0 0 TA) 0% (BAS- teb-5 48 447400 0 0 TA) ~0,5% Col-0 48 408200 >>67 (BASTA) 0% (BAS- #11 teb-2 48 GV3101 282300 0 0 TA) 0% (BAS- teb-5 48 315100 1 0,32 TA) Col-0 48 269100 >>6 teb-2 48 257300 1 0,39 teb-5 48 419200 0 0 #15 teb-5 x GV3101 48 175600 0 0 ligIV teb-5 x 48 113200 0 0 ku70 Col-0 108 410200 >>51 teb-2 x 108 233100 13 5,58 ligIV #17 teb-5 x GV3101 108 200200 18 8,99 ligIV teb-5 x 108 233100 15 6,43 ku70 Col-0 96 913000 >>13 teb-5 x 96 687400 13 1,89 #18 ligIV GV3101 teb-5 x 96 677700 4 0,59 ku70
[00185] No geral, os dados apresentados neste documento clara-
mente demonstram que os mutantes duplos em Pol θ e Ku70, Ku80 ou LigIV resultam em recombinação homóloga aumentada, enquanto a integração aleatória de T-DNA no genoma de plantas é inibida de for- ma eficiência. Os métodos da invenção descritos neste documento fornecem, portanto, meios para introduzir edições ou modificações es- pecíficas de sítio de maneira altamente precisa, sem inserir mutações ou edições indesejadas em um genoma de interesse, uma vez que in- tegração aleatória/não previsível durante o reparo de uma ruptura de filamentos duplos artificialmente induzida é eficientemente inibida. Exemplo 5: Geração de mutantes duplos em Arabidposis thaliana (Arabidopsis)
[00186] Além dos experimentos acima, outros modelos de plantas podem ser fornecidos. Para este fim, clones adequados são a linha- gem de nocaute homozigoto de T-DNA SALK SALK_018851.41.00.x para At4g32695, a linhagem de nocaute homozigoto de de T-DNA SALK SALK_035610.46.30.x para At4g32700, para KU70: At1g16970; Col-0: SALK_123114 (Heacock et al., 2007), para KU80: At1g48050; Col-0: SAIL_714_A04; WS: FLAG_396B06, e para LIG4: At5g57160; Col-0: SALK_044027 (Atlig4-2); Col-0: SAIL_597_D10 (Atlig4-5) (Wa- terworth et al., 2010), respectivamente. Cruzamentos podem ser reali- zados em ambas as direções, com o mutante X (Pol θ) como pai e o mutante Y (Ku70, Ku80 ou LigIV) como mãe, ou vice-versa. As plantas cruzadas puderam, então, ser autofecundadas para corrigir as muta- ções em ambos os genes. A progênie dos cruzamentos é, em seguida, analisada por sistemas específicos de análise por PCR para integra- ção de T-DNA em ambos os genes mutados, opcionalmente seguidos por etapas de autofecundação. Os mutantes duplos homozigotos re- sultantes Pol θ//KU70, Pol θ//KU80 e Pol θ//LigIV podem ser usados para todos os outros experimentos em Arabidopsis.
[00187] Durante o cultivo de plantas para experimentos de cruza-
mento descritos, as plantas e seus fenótipos são avaliados quanto a possíveis impactos negativos no cultivo.
[00188] Informações adicionais sobre mutantes de inserção podem ser obtidas no site do SIGnAL em http://signal.salk.edu. Material gené- tico relevante adequado para os cruzamentos pode ser obtido da cole- ção SALK T-DNA (Alonso, J.M. et al. Genome-wide insertional muta- genesis of Arabidopsis, 2003). Exemplo 6: Transformação estável de T-DNA por Agrobacteria para avaliar a frequência de integração aleatória no contexto de mutante duplo
[00189] Para analisar melhor a frequência de integração aleatória nos mutantes duplos, transformação estável de T-DNA por transforma- ção de Agrobacteria é realizada. Resumidamente, Agrobacterium tu- mefaciens foi transformado com um vetor binário contendo o gene de resistência nptII seguido por transformação de material de planta de Arabidopsis. Qualquer outro, ou um marcador adicional, incluindo hi- gromicina (hyg), sulfadizina ou basta, por exemplo, pode ser usado. As plantas de Arabidopsis são, em seguida, cultivadas até o estágio de floração a 24ºC dia/20ºC noite, com 250 µmoles de fóton m-2 s-1. Essas plantas correspondem às linhagens mutantes duplas homozigotas no Exemplo 1, ou irmãos não mutantes como controles. Para obter mais botões florais por planta, as inflorescências podem ser cortadas após a maioria das plantas formarem botões primários, aliviando a dominância apical e estimulando a emergência sincronizada de múltiplos botões secundários. Em seguida, as plantas são infiltradas ou imersas quando a maioria das inflorescências secundárias tem cerca de 1-10 cm de altura (4-8 dias após o corte). Exemplo 7: Transformação de Agrobacterium tumefaciens (Agrobacte- rium)
[00190] Para transformações de Agrobacterium, protocolos padrão,
ligeiramente modificados de acordo com Clough et al., 1998, The Plant Journal, podem ser usados para a cultura de Agrobacterium e a sub- sequente inoculação de plantas. Resumidamente, cepa de Agrobacte- rium tumefaciens AGL1 é usada em todos os experimentos. As bacté- rias são cultivadas até a fase estacionária em cultura líquida a 28ºC, 250 r.p.m. em LB esterilizado (10 g de triptona, 5 g de extrato de leve- dura, 5 g de NaCl por litro de água). As células são colhidas por centri- fugação por 20 minutos à temperatura ambiente a cerca de 5.500 g e, em seguida, ressuspensas em meio de infiltração até um OD600 final de aproximadamente 0,80 antes do uso. Um meio de inoculação por imersão floral revisado pode conter 5,0% de sacarose e 0,04% de Silwet L-77. Para abordagens de imersão floral, o inóculo é adicionado a um copo, as plantas são imersas nessa suspensão de maneira inver- tida, de modo que todos os tecidos acima do solo fiquem submersos, e as plantas são, em seguida, removidas após 2-3 minutos e o procedi- mento é repetido duas vezes. Essas plantas imersas são removidas do copo, colocadas em uma bandeja plástica e cobertas com uma cúpula alta de plástico transparente para manter a umidade. As plantas são deixadas em local escuro durante a noite a 16 – 18ºC e retornam à luz no dia seguinte. As plantas são cultivadas por mais 3-5 semanas até que os síliquas fiquem marrons e secos. Finalmente, as sementes são colhidas para análises e experimentos.
[00191] Para abordagens transientes, isto é, quando Agrobacterium é usado para inserir um constructo de DNA hairpin tradicional a ser transcrito em RNA hairpin tendo capacidade de silenciamento de RNA, as mesmas etapas de transformação com Agrobacterium detalhada acima podem ser usadas.
[00192] No caso em que se pretende transfectar um RNAi que me- deia RNA pequeno diretamente em uma célula, por exemplo, um RNA de filamento (parcialmente) duplo, RNA sentido e/ou antissentido de fita simples, um RNA quimérico ou sintético, e/ou um poli- sgRNAgRNA/siRNA quimérico para gerar uma partícula ribonuclear com uma nuclease CRISPR, uma entrega direta do efetor de RNA, op- cionalmente fornecido em um complexo com uma nuclease específica de sítio, por exemplo, por métodos de transfecção, pode ser usado.
[00193] As sementes colhidas são, por exemplo, colocadas em meio de seleção de higromicina. Como é conhecido no campo técnico, qualquer outro marcador adequado, compreendendo, entre outros, marcadores fluorescentes e/ou de resistência a antibiótico, pode ser usado, por exemplo, Basta ou GFP, opcionalmente sob o controle de promotor constitutivo ou induzível e/ou específico de tecido, por exem- plo, um promotor 2S específico de semente (Bensmihen et al., 2014). Notavelmente, menos ou mesmo 0 (zero) plantas transgênicas seriam identificadas nos mutantes duplos transformados Pol θ//KU70, Pol θ//KU80 ou Pol θ//LigIV, respectivamente. Na transformação WT, ob- serva-se uma frequência de transformação de cerca de 0,5% após a seleção. Todos os experimentos devem ser repetidos 5 vezes para verificar se há menos ou mesmo nenhum impacto de seleção negativo. Exemplo 8: Aumento da recombinação homóloga em mutantes duplos (um vetor circular)
[00194] Para testes adicionais, pode-se usar uma frequência de re- combinação homóloga elevada, um constructo portando o gene bar/hyg (incluindo um promotor e um terminador adequado), flanquea- do por regiões de homologia adequadas ao genoma (locus ADH1). Em princípio, qualquer região alvo, gene de interesse ou mesmo um ácido nucleico a ser alterado de interesse, no genoma de uma célula de inte- resse pode ser usado. Aqui, o locus alvo exemplificativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado.
[00195] Além disso, o vetor contém uma nuclease CRISPR, incluin-
do, entre outras, Cas ou Cpf, CasX ou CasY, que codifica a sequência como nuclease efetora e um sgRNA ou crRNA correspondente ali- nhando-se com uma região no locus ADH1 alvo. As plantas WT (con- troles) e os mutantes duplos (Pol//KU70, Pol//KU80, e Pol//LigIV, res- pectivamente) são transformados por transformação por imersão floral, como descrito acima. As mudas T1 são selecionadas em álcool alílico e adicionalmente analisadas para integração estável do gene bar/hyg (ou qualquer marcador adequado) por qPCR ou por outros métodos de inspeção, dependendo do gene marcador escolhido.
[00196] Um teste de recombinação homóloga preferido pode ser um repórter fluorescente associado à cruciferina, tal como relatado por Shaked et al., 2005, (ver, por exemplo, http://www.pnas.org/content/102/34/12265), porque os resultados po- dem ser diretamente medidos na semente T1. Ensaios semelhantes com um gene RFP associado a um gene diferente de armazenamento de sementes podem ser usados para obter o brilho ideal do marcador.
[00197] T1 pode ainda ser analisado para verificar se o T-DNA do binário foi integrado. Dependendo de se HR convencional usando Agrobacterium em um ambiente normal (NHEJ ativo), ou HR de preci- são, conforme divulgado neste documento, é usado no T-DNA comple- to, ou apenas em determinadas regiões, ou apenas a sequência de ácido nucleico de interesse será integrada.
[00198] Para verificar se ocorreu um reparo com base em HR, as plantas podem ser facilmente analisadas por PCR e sequenciamento de amplicons com base nas informações de sequência disponíveis pa- ra demonstrar a taxa de HR melhorada nos eventos identificados em comparação com plantas WT transformadas. Qualquer aumento da taxa de HR em combinação com nenhuma integração aleatória será adequado. Exemplo 9: Aumento de recombinação homóloga em mutantes duplos
(dois vetores circulares)
[00199] Além dos experimentos descritos acima, o aumento da fre- quência de recombinação homóloga pode ser testado usando um constructo portando o gene bar/hyg (incluindo promotor e terminador), flanqueado por regiões de homologia adequadas ao genoma (locus ADH1). Em princípio, qualquer região alvo, gene de interesse ou mesmo um ácido nucleico a ser alterado de interesse, no genoma de uma célula de interesse pode ser usado. Aqui, o locus alvo exemplifi- cativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado.
[00200] Além disso, um segundo vetor que codifica um efetor Cas ou Cpf, ou qualquer outra nuclease CRISPR, como nuclease específi- ca de sítio e sgRNA/crRNA alinhado com uma região no locus ADH1 alvo, pode ser usado.
[00201] As plantas WT (controles) e mutantes duplos (por exemplo, Pol//KU70, Pol//KU80 ou Pol//LigIV, respectivamente) podem ser trans- formadas por transformação por imersão floral, como descrito acima. Alternativamente, outras estratégias de transformação podem ser usa- das.
[00202] As mudas T1 podem ser selecionadas em álcool alílico e adicionalmente analisadas quanto à integração estável do gene bar/hyg por qPCR. Além disso, T1 pode ser analisada posteriormente para verificar se o T-DNA do binário foi integrado. Como resultado, po- de ser descoberto que, em nenhuma das plantas selecionadas, uma integração bem-sucedida do T-DNA pode ser detectada. Para verificar se ocorreu um evento de HR real, as plantas podem ser analisadas por PCR e sequenciamento de amplicons. Para verificar se ocorreu um reparo com base em HR, as plantas podem ser facilmente analisadas por PCR e sequenciamento de amplicons com base nas informações de sequência disponíveis para demonstrar a taxa de HR melhorada nos eventos identificados em comparação com plantas WT transfor- madas. Qualquer aumento da taxa de HR em combinação com ne- nhum evento de integração aleatória detectado será adequado. Exemplo 10: Aumento de recombinação homóloga em protoplastos de mutantes duplos (um vetor circular)
[00203] Para adicionalmente testar o efeito dos mutantes duplos em diferentes materiais de plantas e para demonstrar uma ampla aplicabi- lidade, a frequência de recombinação homóloga elevada pode ser tes- tada usando um constructo que transporta o gene bar/hyg (incluindo estruturas adequadas de promotor e terminador), flanqueado por regi- ões de homologia adequadas ao genoma (locus ADH1), pode ser usa- da. Em princípio, qualquer região alvo, gene de interesse ou mesmo um ácido nucleico a ser alterado de interesse, no genoma de uma cé- lula de interesse, pode ser usado. Aqui, o locus alvo exemplificativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado.
[00204] Além disso, um vetor contendo uma nuclease CRISPR e pelo menos um sgRNA ou crRNA adequado, alinhando-se com uma região no locus ADH1 alvo é fornecido. Protoplastos WT (controles) e protoplastos mutantes duplos (por exemplo, Pol θ//KU70; Pol θ//KU80, ou Pol θ//LigIV, respectivamente) podem ser isolados e transformados por polietileno glicol (PEG) seguindo protocolos padrão (ver, por exemplo, Methods in Molecular Biology, volume 82, Arabidopsis Proto- cols). Os protoplastos são analisados após 48 h por PCR para integra- ção estável de modelo de reparo e/ou HR no sítio alvo designado. Além disso, HR pode ser confirmado por sequenciamento. Espera-se que a frequência seja pelo menos 3 vezes superior aos resultados medidos nos protoplastos WT transformados. Qualquer aumento da taxa de HR em combinação com nenhum evento de integração aleató- ria detectado será adequado.
Exemplo 11: Aumento de recombinação homóloga em protoplastos de mutantes duplos (dois vetores circulares)
[00205] Para testes adicionais, pode-se utilizar frequência de re- combinação homóloga elevada, novamente um constructo portando o gene bar/hyg (incluindo um promotor e um terminador adequado), flanqueado por regiões de homologia adequadas ao genoma (locus ADH1). Em princípio, qualquer região alvo, gene de interesse ou mesmo um ácido nucleico a ser alterado de interesse, no genoma de uma célula de interesse, pode ser usado. Aqui, o locus alvo exemplifi- cativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado. Além disso, um segundo vetor contendo uma nuclease CRISPR que codifica a sequência como nuclease efetora e um sgRNA/crRNA correspon- dente também compreendendo uma região de homologia em relação ao locus ADH1 pode ser usado. Protoplastos de plantas WT (contro- les) e diferentes mutantes duplos (por exemplo, Pol θ//KU70; Pol θ//KU80, ou Pol θ//LigIV, respectivamente) podem, então, ser isolados e transformados por transformação com PEG seguindo protocolos pa- drão. Os protoplastos são analisados após 48 h por PCR para integra- ção estável de modelo de reparo e/ou HR no sítio alvo designado. Além disso, HR pode ser confirmado por sequenciamento. Para essa configuração nos protoplastos, espera-se que a frequência seja pelo menos 3 vezes maior que os resultados medidos nos protoplastos WT transformados. Qualquer aumento da taxa de HR em combinação com nenhum evento de integração aleatória detectado será adequado. Exemplo 12: Aumento de recombinação homóloga em protoplastos de mutantes duplos (um vetor linearizado)
[00206] Como um experimento adicional na série de testes de pro- toplastos, o aumento da frequência de recombinação homóloga pode ser testado usando um vetor linearizado. Novamente, um constructo portando o gene bar/hyg (incluindo um promotor e um terminador ade- quado), flanqueado por regiões de homologia adequadas ao genoma (locus ADH1) pode ser usado. Em princípio, qualquer região alvo, ge- ne de interesse ou mesmo um ácido nucleico a ser alterado de inte- resse, no genoma de uma célula de interesse, pode ser usado. Aqui, o locus alvo exemplificativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado. Além disso, um segundo vetor contendo uma nuclease CRISPR de interesse e sgRNA/crRNA, conforme detalhado acima, po- de ser usado. Ambos os vetores podem ser linearizados por uma única enzima de restrição, por exemplo, NotI, AscI, ou outra, preferencial- mente cortador de 8 bases. Protoplastos de plantas WT (controles) e mutantes duplos (por exemplo, Pol//KU70; Pol//KU80, ou Pol//LiIV, respectivamente) podem ser isolados e transformados por transforma- ção com PEG como descrito acima. Os protoplastos foram, então, ana- lisados após 48 h por PCR para integração estável do modelo de repa- ro e/ou HR no sítio alvo designado. Além disso, HR pode ser confir- mado por sequenciamento. Para esta configuração, espera-se que a frequência seja pelo menos 1,25 a 1,5 vezes maior do que os resulta- dos medidos nos protoplastos WT transformados. Qualquer aumento da taxa de HR em combinação com nenhum evento de integração ale- atória detectado será adequado. Exemplo 13: Mutantes triplos e quádruplos
[00207] Com base no material detalhado no Exemplo 1 acima, mu- tantes triplos e quádruplos podem ser construídos no contexto de Ara- bidopsis para expandir o kit de ferramentas disponível para otimizar experimentos de edição de genoma altamente específicos de sítio em células de plantas. Por cruzamento e reprodução convencional, por exemplo, um mutante Pol θ//KU70//KU80 (P78), Pol θ//KU80//LigIV (P8L), Pol θ//KU70//LigIV (P7L) e Pol θ//KU70//KU80//LigIV (P78L) po-
de assim ser criado.
[00208] Testes iniciais, novamente usando Agrobacterium e trans- formação/transfecção de protoplastos usando um ou mais vetores, op- cionalmente linearizados para transfecções de protoplastos, de um constructo bar/hyg juntamente com uma nuclease CRISPR como nu- clease efetora específica de sítio podem, então, revelar que certos mu- tantes, por exemplo, P7L ou P8L, ou ainda mais predominantemente, o mutante P78L, podem ter resultados ainda melhores aprimorando a eficiência de transformação durante a GE em comparação com os mu- tantes duplos. Exemplo 14: Abordagem transiente - RNAi
[00209] A transformação transiente de plantas está se tornando ca- da vez mais importante. Para testar o aumento da frequência de re- combinação homóloga em uma configuração transiente, novamente um constructo portando o gene bar/hyg (incluindo um promotor e um terminador adequado), flanqueado por regiões de homologia adequa- das ao genoma (locus ADH1) pode ser usado. Em princípio, qualquer região alvo, gene de interesse ou mesmo um ácido nucleico a ser alte- rado de interesse, no genoma de uma célula de interesse, pode ser usado. Aqui, o locus alvo exemplificativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado. Além disso, o vetor pode conter uma se- quência de codificação efetora específica de sítio de nuclease CRISPR e o cognato sgRNA/crRNA também contra uma região no locus ADH1, conforme descrito acima.
[00210] Um segundo vetor pode ser usado portando um cassete de expressão de DNA hairpin tradicional contra Pol θ e KU70, ou KU80, ou LigIV, ou qualquer outra combinação conforme detalhado para os mutantes duplos, triplos e quádruplos detalhados acima. Como alter- nativa, o RNA interferente pode ser entregue como RNA de fita dupla,
como RNA antissentido de fita simples ou como sequências poli- sgRNA/siRNA quiméricas, que geram múltiplos complexos de RNP de nuclease sgRNA-CRISRPR na digestão mediada por Dicer das partes de siRNA, levando a uma ruptura mais eficiente do gene alvo nas cé- lulas (Ha J.S. et al., Journal of Controlled Release 250 (2017) 27–35). HR pode ser analisado por PCR e sequenciamento de amplicons.
[00211] Notavelmente, a sub-regulação transiente de Pol θ e outro participante envolvido em NHEJ é de interesse particular no contexto da GE direcionada, pois pode não haver interesse em propagar um nocaute para Pol θ, KU70, KU80 e/ou LigIV estavelmente inerente a uma célula progenitora, mas pode ser interessante realizar a sub- regulação de Pol θ, KU70, KU80 e/ou LigIV imediatamente antes de uma GE direcionada de um ácido nucleico, um gene ou um locus de interesse ser realizado para manter a integridade da via NHEJ endó- gena em células e plantas de progênie. Exemplo 15: Abordagem transiente - interferência de proteína
[00212] Para adicionalmente testar se frequência de recombinação homóloga elevada pode ser obtida em um sistema de nocaute transi- ente, novamente um constructo portando o gene bar/hyg (incluindo um promotor e um terminador adequado), flanqueado por regiões de ho- mologia adequadas ao genoma (locus ADH1), pode ser usado. Em princípio, qualquer região alvo, gene de interesse ou mesmo um ácido nucleico a ser alterado de interesse, no genoma de uma célula de inte- resse, pode ser usado. Aqui, o locus alvo exemplificativo é o locus ADH1. Em vez do marcador hyg, outro marcador de seleção, também incluindo um gene repórter, pode ser usado. Além disso, o vetor pode conter uma sequência de codificação efetora específica de sítio de nu- clease CRISPR e o cognato sgRNA/crRNA também contra uma região no locus ADH1, como descrito acima.
[00213] A interferência de proteína com essas enzimas pode ser induzida pela entrega de proteínas de adenovírus 4 E1B55K e E4orf6 de acordo com a SEQ ID NO: 79 e 81, que especificamente inibem LigIV pela entrega de pequenos inibidores químicos dessas enzimas, tais como, por exemplo, SCR7, W7, Vanillina, NU7026, NU7441 (PLOS ONE 11(9):e0163049) que inibe LigIV, proteína quinases de DNA, síntese de cofator Ku; ou por qualquer combinação. Novamente, essa tentativa é particularmente adequada para engenharia de geno- ma de plantas, onde um nocaute permanente de LigIV, KU70, KU80 e/ou Pol θ pode não estar previsto. A eficiência e a frequência de HR podem ser analisadas por PCR e sequenciamento de amplicons. Exemplo 16: Uso de interferência de NHEJ com GE em Zea mays
[00214] Zea mays (ou milho) representa uma importante cultura de planta em todo o mundo. Para transferir as descobertas dos exemplos acima do organismo modelo dicotiledôneo para o milho monocotiledô- neo como cultura de planta relevante para a GE, os experimentos rea- lizados em Arabidopsis também podem ser transferidos para o modelo do milho.
[00215] O milho GDB foi usado para pesquisa por sequência esto- ques de sementes mutantes adequados. Análises iterativas de BLAST foram realizadas em paralelo para os genes relevantes de interesse que codificam milho LigIV, KU70, KU80 e/ou Pol θ. A inserção de um transposon MU de 70 bp a montante do ATG na 5’UTR foi identificada para o gene de milho GRMZM2G151944. As sementes de milho po- dem, em seguida, ser pesquisadas em http://teosinte.uoregon.edu/mu- illumina/ da Universidade de Oregon provendo acesso a um subcon- junto das inserções de Mu detectadas por sequênciamento de Mu- Illumina (ver https://www.ncbi.nlm.nih.gov/pubmed/20409008) durante esforços de clonagem de mutantes envolvendo a Photosynthesis Mu- tant Library (ver http://pml.uoregon.edu/photosyntheticml.html). O ma- pa de inserções postado entre 150 bp a montante do códon de início anotado e 150 bp a jusante do códon de parada anotado de modelos de genes no Conjunto de Genes Filtrados do Conjunto de Genomas de Milho AGPv3 (www.gramene.org). Inserções que mapeiam mais dis- tantes de genes raramente interrompem a expressão de genes; devido a recursos limitados, portanto, elas não são disponibilizados.
[00216] Devido a homologias com uma DNA polimerase de arroz relevante (Os12g19370.1), GRMZM2G151944 contendo sementes de milho pode ser adequado.
[00217] Para KU70, um alinhamento de sítio de inserção de esto- que de semente para uma sequência de KU70 conhecida mostrou uma inserção no final de um gene Ku70 do milho. As sementes rele- vantes podem ser encomendadas em http://teosinte.uoregon.edu/mu- illumina/?maize=GRMZM2G414496#.
[00218] Para KU80, estoques de inserções uniformes de MU no ge- ne Ku80 foram identificados como Mu1089096, 1043955, 1089097, 1058684 (https://www.maizegdb.org) e as respectivas sementes po- dem ser encomendadas.
[00219] Para estoques de sementes de inserção de MU uniforme de DNA ligase IV (LigIV) de milho, Mu1009698::Mu Stocks:uFMu-00167; Mu1089771::Um stocks:uFMu-11366 e mu1044651::um stocks:UFMu-
05547.
[00220] Primeiramente, os mutantes simples disponíveis podem ser verificados quanto ao desempenho de crescimento e impacto das mu- tações no desenvolvimento. Em paralelo, pode ser testado se os mu- tantes são de fato mutados nas posições desejadas por PCR. Para esse fim, um sistema qPCR pode ser estabelecido para medir ade- quadamente a transcrição dos genes individuais e a transcrição foi medida em cDNA.
[00221] Se os mutantes forem confirmados, os mutantes podem ser usados para outros experimentos. Caso contrário, estratégias diferen-
tes para gerar os mutantes são possíveis, como TILLING, GE, editores com base em GE, e semelhantes.
[00222] O termo "TILLING" ou "Lesões Locais Induzidas por Direci- onamento em Genomas" descreve uma técnica de genética reversa bem conhecida, projetada para detectar SNPs (polimorfismos de nu- cleotídeo único) desconhecidos em genes de interesse que é atual- mente empregada na genômica de plantas e animais. A técnica permi- te a identificação de alto rendimento de uma série de mutantes alélicos com uma gama de funções modificadas para um gene particular. TIL- LING combina mutagênese (por exemplo, química ou através de luz UV) com uma técnica sensível de triagem de DNA que identifica muta- ções de base única.
[00223] Enquanto isso, como é do conhecimento da pessoa versa- da, TILLING foi estendido a muitas espécies de plantas e se torna de suma importância para a genética reversa em espécies de culturas. Uma grande mudança recente no TILLING foi a aplicação de sequen- ciamento de próxima geração (NGS) ao processo, que permite a multi- plexação de alvos de genes e genomas. Por ser facilmente aplicável à maioria das plantas, continua sendo um método não-transgênico do- minante para obter mutações em genes conhecidos e, portanto, repre- senta um método facilmente disponível para abordagens não transgê- nicas de acordo com os métodos da presente invenção. Como é do conhecimento da pessoa versada, o TILLING geralmente compreende a mutagênese química, por exemplo, usando metanossulfonato de etil (EMS) ou modificação induzida por luz UV de um genoma de interes- se, em conjunto com uma técnica de triagem de DNA sensível que identifica mutações de base única em um gene alvo.
[00224] Geralmente, a análise de aumento de HR por aplicação de nucleases CRISPR e modelos de reparo em milho pode usar diferen- tes variantes (vetor único, vetor múltiplo, circular, linear etc.) para as diferentes combinações de mutantes. As mudas T1 precisam ser ana- lisadas quanto a HR e potencial integração estável do T-DNA.
[00225] Além disso, seleção baseada em nptII e seleção baseada em PMI ou seleção baseada em bar podem ser usadas. Em termos de loci para realizar ensaios de integração, a inserção da fusão CDS em genes altamente expressos como Alfa Tubulina (GRMZM2G152466), Aconitato hidratase (GRMZM2G020801) ou HSP70 pode ser usada para uma melhor seleção.

Claims (27)

REIVINDICAÇÕES
1. Método para modificar o material genético de um sistema celular em um local predeterminado com pelo menos uma sequência de ácido nucleico de interesse, caracterizado pelo fato de que o méto- do compreende as seguintes etapas: (a) prover um sistema celular compreendendo uma enzima polimerase teta, ou uma sequência que a codifica, e uma ou mais en- zimas adicionais de uma via NHEJ, ou a(s) sequência(s) que as codifi- ca(m); (b) inativar ou parcialmente inativar a enzima polimerase teta, ou a sequência que a codifica, e inativar ou parcialmente inativar as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ, ou a(s) sequência(s) que as codifica(m); (c) introduzir no sistema celular (i) a pelo menos uma sequência de ácido nucleico de inte- resse, opcionalmente flanqueada por uma ou mais sequências de ho- mologia complementares a uma ou mais sequências de ácido nucleico adjacentes ao local predeterminado, e (ii) pelo menos uma nuclease específica de sítio, ou uma sequência que a codifica, a nuclease específica de sítio induzindo uma ruptura de filamentos duplos no local predeterminado; e (d) opcionalmente: determinar a presença da modificação no local predeterminado no material genético do sistema celular; (e) obter um sistema celular compreendendo uma modifica- ção no local predeterminado do material genético do sistema celular.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o método compreende a etapa adicional de: (f) restaurar a atividade da enzima polimerase teta inativada ou parcialmente inativada e/ou restaurar a atividade das uma ou mais enzimas de reparo de DNA adicionalmente inativadas ou parcialmente inativadas de uma via NHEJ no sistema celular compreendendo uma modificação no local predeterminado, ou em um sistema de progênie do mesmo.
3. Método, de acordo com a reivindicação 1 ou 2, caracteri- zado pelo fato de que a polimerase teta a ser inativada ou parcialmen- te inativada compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 2, 7, 8, 9 ou 10, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 2, 7, 8, 9 ou 10, respectivamente; ou é codificada por uma sequência de ácido nucleico de acordo com a SEQ ID NO: 1, 3, 4, 5 ou 6, ou um ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID No: 1, 3, 4, 5 ou 6, respectivamente.
4. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são independentemente selecionadas do gru- po que consiste em Ku70, Ku80, proteína quinase dependente de DNA, Ataxia telangiectasia mutada (ATM), ATM – e Rad3 – relaciona- da (ATR), Artemis, XRCC4, DNA ligase IV e XLF, ou qualquer combi- nação dos mesmos.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que pelo menos dois, pelo menos três ou pelo menos qua- tro enzimas de reparo de DNA adicionais de uma via NHEJ são inati- vadas ou parcialmente inativadas, preferencialmente em que pelo me- nos Ku70 e DNA ligase IV ou em que pelo menos Ku80 e DNA ligase
IV são inativadas ou parcialmente inativadas.
6. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são Ku70, ou uma sequência de ácido nuclei- co que as codifica, em que a Ku70 compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 12, 18, 19 ou 20, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 12, 18, 19 ou 20, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 11, 13, 14, 15, 16 ou 17, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 11, 13, 14, 15, 16 ou 17, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são Ku80, ou uma sequência de ácido nucleico que as codifica, em que a Ku80 compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 22, 23, 24 ou 29, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO: 22, 23, 24 ou 29, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequên- cia de acordo com a SEQ ID NO: 21, 25, 26, 27 ou 28, ou uma se- quência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%,
79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 21, 25, 26, 27 ou 28, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são proteína quinase dependente de DNA, ou uma sequência de ácido nucleico que a codifica, em que a proteína quinase dependente de DNA compreende uma sequência de aminoá- cido de acordo com a SEQ ID NO: 32, 33 ou 35, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 32, 33 ou 35, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 30, 31 ou 34, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 30, 31 ou 34, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são ATM, ou uma sequência de ácido nucleico que a codifi- ca, em que a ATM compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 37, 38, 39, 41, 42, 43, 44, 45, 46, 47 ou 48, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identi- dade de sequência com a sequência estabelecida na SEQ ID NO: 37, 38, 39, 41, 42, 43, 44, 45, 46, 47 ou 48, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequên-
cia de acordo com a SEQ ID NO: 36 ou 40, ou uma sequência de áci- do nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 36 ou 40, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são ATM – e Rad3 – relacionada (ATR), ou uma sequência de ácido nucleico que as codifica, em que a ATR compreende uma sequência de amino- ácido de acordo com a SEQ ID NO: 50, 51, 52, 53, 55 ou 56, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 50, 51, 52, 53, 55 ou 56, respectivamente, ou em que a sequência de ácido nu- cleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 49 ou 54, ou uma sequência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabeleci- da na SEQ ID NO:49 ou 54, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são Artemis, ou uma sequência de ácido nucleico que a codifica, em que a Artemis compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 60, 61, 62 ou 64, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 60, 61, 62 ou 64, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 57, 58, 59 ou 63, ou uma sequência de ácido nu- cleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a se- quência estabelecida na SEQ ID NO: 57, 58, 59 ou 63, respectivamen- te, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são XRCC4, ou uma sequência de ácido nucleico que a codifica, em que a XRCC4 compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 66, 67 ou 69, ou uma sequência de aminoácido tendo pe- lo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência esta- belecida na SEQ ID NO: 66, 67 ou 69, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequên- cia de acordo com a SEQ ID NO: 65 ou 68, ou uma sequência de áci- do nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 65 ou 68, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcialmente inativadas são DNA ligase IV, ou uma sequência de ácido nucleico que a codifica, em que a DNA ligase IV compreende uma sequência de aminoácido de acordo com a SEQ ID NO: 71, 72, 76 ou 77, ou uma sequência de aminoácido tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 71, 72, 76 ou 77, respectivamente, ou em que a sequência de ácido nucleico que a codifica compreende uma sequência de acordo com a SEQ ID NO: 70, 73, 74 ou 75 ou uma se- quência de ácido nucleico tendo pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência estabelecida na SEQ ID NO: 70, 73, 74 ou 75, respectivamente, e/ou em que as uma ou mais enzimas de reparo de DNA adicionais de uma via NHEJ a serem inativadas ou parcial- mente inativadas são XLF, ou uma sequência de ácido nucleico que a codifica.
7. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma se- quência de ácido nucleico de interesse é provida como parte de pelo menos um vetor, ou como pelo menos uma molécula linear.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o pelo menos um vetor é introduzido no sistema celu- lar por meio biológico ou físico, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., preferencialmente por Agrobacterium tumefaciens, um vetor viral, bombardeio biolístico, transfecção usando agentes químicos, incluindo transfecção de polieti- leno glicol, ou qualquer combinação dos mesmos.
9. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma nu- clease específica de sítio, ou a sequência que a codifica, é introduzido no sistema celular por meio biológico ou físico, incluindo transfecção, transformação, incluindo transformação por Agrobacterium spp., prefe- rencialmente por Agrobacterium tumefaciens, um vetor viral, bombar- deio, transfecção usando agentes químicos, incluindo transfecção de polietileno glicol, ou qualquer combinação dos mesmos.
10. Método, de acordo com qualquer uma das reivindica-
ções precedentes, caracterizado pelo fato de que a pelo menos uma nuclease específica de sítio ou um fragmento cataliticamente ativo da mesma é introduzida no sistema celular como uma sequência de ácido nucleico que codifica a nuclease específica de sítio ou o fragmento ca- taliticamente ativo da mesma, em que a sequência de ácido nucleico é parte de pelo menos um vetor, ou em que a pelo menos uma nuclease específica de sítio ou o fragmento cataliticamente ativo da mesma é introduzida no sistema celular como pelo menos uma sequência de aminoácido.
11. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular é selecionada do grupo que consiste em: um transgene, um gene endógeno modificado, uma sequência sintética, uma sequên- cia intrônica, uma sequência de codificação ou uma sequência regula- dora.
12. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que a pelo menos uma sequência de ácido nucleico de interesse a ser introduzida em um sis- tema celular é um transgene, em que o transgene compreende uma sequência de ácido nucleico que codifica um gene de um genoma de um organismo de interesse, ou pelo menos uma parte do referido ge- ne.
13. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma se- quência de ácido nucleico de interesse a ser introduzida em um siste- ma celular em um local predeterminado é um transgene de um orga- nismo de interesse, em que o transgene ou parte do transgene é sele- cionado do grupo que consiste em um gene que codifica resistência ou tolerância a estresse abiótico, incluindo estresse hídrico, estresse os-
mótico, estresse térmico, estresse por frio, estresse oxidativo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicida, incluindo resis- tência a glifosato, glufosinato/fosfinotricina, higromicina, inibidores de protoporfirinogênio oxidase (PPO), inibidores de ALS, e Dicamba, um gene que codifica resistência ou tolerância a estresse biótico, incluindo um gene de resistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a inseto, ou um ge- ne que codifica um traço relativo a rendimento, incluindo resistência ao acamamento, tempo de floração, resistência à deiscência, cor da se- mente, composição do endosperma ou teor nutricional.
14. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma se- quência de ácido nucleico de interesse a ser introduzida em um siste- ma celular em um local predeterminado é pelo menos parte de um ge- ne endógeno modificado de um organismo de interesse, em que o ge- ne endógeno modificado compreende pelo menos uma exclusão, in- serção e/ou substituição de pelo menos um nucleotídeo em compara- ção com a sequência de ácido nucleico do gene endógeno não modifi- cado.
15. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma se- quência de ácido nucleico de interesse a ser introduzida em um siste- ma celular em um local predeterminado é pelo menos parte de um ge- ne endógeno modificado de um organismo de interesse, em que o ge- ne endógeno modificado compreende pelo menos um de um trunca- mento, duplicação, substituição e/ou exclusão de pelo menos uma po- sição de ácido nucleico que codifica um domínio do gene endógeno modificado.
16. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma se- quência de ácido nucleico de interesse a ser introduzida em um siste- ma celular em um local predeterminado é pelo menos parte de uma sequência reguladora, em que a sequência reguladora compreende pelo menos uma de uma sequência promotora núcleo, uma sequência promotora proximal, uma sequência reguladora cis, uma sequência reguladora trans, uma sequência de controle de locus, uma sequência de isolamento, uma sequência de silenciamento, uma sequência de aprimoramento, uma sequência de terminação, e/ou qualquer combi- nação das mesmos.
17. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma nu- clease específica de sítio compreende uma nuclease de dedo de zin- co, uma nuclease efetora do tipo ativadora de transcrição, um sistema CRISPR/Cas, incluindo um sistema CRISPR/Cas9, um sistema CRISPR/Cpf1, um sistema CRISPR/CasX, um sistema CRISPR/CasY, uma endonuclease de homing modificada e uma meganuclease, e/ou qualquer combinação, variante ou fragmento cataliticamente ativo dos mesmos.
18. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que as uma ou mais se- quências de ácido nucleico flanqueando a pelo menos uma sequência de ácido nucleico de interesse no local predeterminado é/são pelo me- nos 85%-100% complementares às uma ou mais sequências de ácido nucleico adjacentes ao local predeterminado, a montante e/ou a jusan- te do local predeterminado, por todo o comprimento da(s) respectiva(s) região(ões) adjacente(s).
19. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que o material genético do sistema celular é selecionado do grupo que consiste em um proto-
plasto, um genoma viral transferido em uma célula hospedeira recom- binante, uma célula eucariótica ou procariótica, tecido ou órgão, e um organismo eucariótico ou procariótico.
20. Método, de acordo com a reivindicação 19, caracteriza- do pelo fato de que a célula eucariótica é uma célula de planta ou uma célula animal.
21. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que o organismo eucariótico é uma planta ou uma parte de uma planta.
22. Método, de acordo com a reivindicação 21, caracteriza- do pelo fato de que a parte da planta é selecionada do grupo que con- siste em folhas, caules, raízes, radículas emergidas, flores, partes de flor, pétalas, frutas, pólen, tubos de pólen, filamentos de anteras, óvu- los, sacos embrionários, óvulos, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, sementes, raízes e mudas.
23. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que o material genético do sistema celular é, ou se origina de, uma espécie de planta selecio- nada do grupo que consiste em: Hordeum vulgare, Hordeum bulbu- som, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria ita- lica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triti- cum aestivum, Secale cereale, Malus domestica, Brachypodium dista- chyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Be- ta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eu- calyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nico- tiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Ara- bidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii,
Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oele- racia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica ni- gra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bi- jugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus ca- janifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Al- lium fistulosum, Allium sativum e Allium tuberosum.
24. Sistema celular, caracterizado pelo fato de ser obtido por um método, como definido em qualquer uma das reivindicações 1 a 23.
25. Sistema celular compreendendo uma enzima polimera- se teta (Pol teta) inativada ou parcialmente inativada e uma ou mais enzimas de reparo de DNA inativadas ou parcialmente inativadas adi- cionais de uma via NHEJ, caracterizado pelo fato de que o sistema celular modificado é selecionado do grupo que consiste em uma ou mais células de plan- ta, uma planta e partes de uma planta.
26. Sistema celular, de acordo com reivindicação 25, carac- terizado pelo fato de que as uma ou mais partes da planta é/são sele- cionadas do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flor, pétalas, frutas, pólen, tubos de pólen, filamentos de anteras, óvulos, sacos embrionários, óvulos, ovários, zigotos, embriões, embriões zigóticos, embriões somáticos, meriste- mas apicais, feixes vasculares, periciclos, sementes, raízes e mudas.
27. Sistema celular, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que as uma ou mais células de planta, a(s) planta(s) ou a(s) parte(s) de uma planta se origina(m) de uma es- pécie de planta selecionada do grupo que consiste em: Hordeum vul-
gare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australien- sis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Dau- cus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana to- mentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genli- sea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Cru- cihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsel- la bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica na- pus, Brassica oeleracia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer ya- mashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer ju- daicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vul- garis, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fourni- eri, Allium cepa, Allium fistulosum, Allium sativum e Allium tuberosum.
BR112020008386-0A 2017-10-30 2018-10-30 estratégias para edição de genoma de precisão BR112020008386A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762578621P 2017-10-30 2017-10-30
US62/578,621 2017-10-30
PCT/EP2018/079718 WO2019086460A1 (en) 2017-10-30 2018-10-30 New strategies for precision genome editing

Publications (1)

Publication Number Publication Date
BR112020008386A2 true BR112020008386A2 (pt) 2020-11-03

Family

ID=64650346

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020008386-0A BR112020008386A2 (pt) 2017-10-30 2018-10-30 estratégias para edição de genoma de precisão

Country Status (7)

Country Link
US (1) US20200354734A1 (pt)
EP (1) EP3704255A1 (pt)
CN (1) CN111542610A (pt)
AR (1) AR113812A1 (pt)
BR (1) BR112020008386A2 (pt)
CA (1) CA3080864A1 (pt)
WO (1) WO2019086460A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019234132A1 (en) * 2018-06-05 2019-12-12 KWS SAAT SE & Co. KGaA Base editing in polymerase theta deficient plants
WO2019234129A1 (en) * 2018-06-05 2019-12-12 KWS SAAT SE & Co. KGaA Haploid induction with modified dna-repair
US20240026369A1 (en) * 2020-10-27 2024-01-25 KWS SAAT SE & Co. KGaA Use of enhanced pol theta activity for eukaryotic genome engineering
CN112708693B (zh) * 2021-01-29 2023-12-26 吉林大学 与玉米大斑病情指数相关的ZmCaMBP1基因SNP分子标记及应用
CN113881703B (zh) * 2021-10-11 2022-06-21 中国人民解放军军事科学院军事医学研究院 一种提高cho细胞同源重组效率的方法及其相关产品和应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102639695B (zh) * 2009-10-26 2015-01-21 独立行政法人农业生物资源研究所 转基因植物细胞的制造方法
WO2011078662A1 (en) * 2009-12-21 2011-06-30 Keygene N.V. Dsrna for improved genetic modification of plant dna
CA2901676C (en) * 2013-02-25 2023-08-22 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
AU2015264108B2 (en) * 2014-05-22 2017-11-23 Corteva Agriscience Llc Cytokinin synthase enzymes, constructs, and related methods
EP4194557A1 (en) 2014-08-06 2023-06-14 Institute for Basic Science Genome editing using campylobacter jejuni crispr/cas system-derived rgen
US10760081B2 (en) 2015-10-07 2020-09-01 New York University Compositions and methods for enhancing CRISPR activity by POLQ inhibition
CN109196105B (zh) * 2016-03-24 2022-08-05 莱顿大学 转染植物和减少随机整合事件的方法

Also Published As

Publication number Publication date
CA3080864A1 (en) 2019-05-09
CN111542610A (zh) 2020-08-14
US20200354734A1 (en) 2020-11-12
WO2019086460A1 (en) 2019-05-09
AR113812A1 (es) 2020-06-17
EP3704255A1 (en) 2020-09-09

Similar Documents

Publication Publication Date Title
Zhu et al. Efficiency and inheritance of targeted mutagenesis in maize using CRISPR-Cas9
JP6886433B2 (ja) 植物のゲノム内に外因性配列を組み込むための方法および組成物
Chilcoat et al. Use of CRISPR/Cas9 for crop improvement in maize and soybean
Shan et al. Considerations in adapting CRISPR/Cas9 in nongenetic model plant systems
JP2021151275A (ja) マーカーフリーゲノム改変のための方法および組成物
WO2018202199A1 (en) Methods for isolating cells without the use of transgenic marker sequences
Srivastava et al. Cre‐mediated site‐specific gene integration for consistent transgene expression in rice
Collonnier et al. Towards mastering CRISPR-induced gene knock-in in plants: Survey of key features and focus on the model Physcomitrella patens
BR112020008386A2 (pt) estratégias para edição de genoma de precisão
WO2018140899A1 (en) Novel plant cells, plants, and seeds
JP2018531024A6 (ja) マーカーフリーゲノム改変のための方法および組成物
KR20200078685A (ko) 부위-특이적인 뉴클레오티드 치환을 통해 글리포세이트-내성 벼를 수득하는 방법
BR112020014017A2 (pt) Sistemas crispr / cpf1 de plantas otimizados
BR112020012327A2 (pt) sistemas de regulação de transcrição com base em cpf1 em plantas
US20210348179A1 (en) Compositions and methods for regulating gene expression for targeted mutagenesis
BR112020012064A2 (pt) regulação transcricional direcionada usando fatores de transcrição sintéticos
BR112020025311A2 (pt) Métodos para melhorar a engenharia e regeneração do genoma em planta ii
WO2019185609A1 (en) Method for increasing the expression level of a nucleic acid molecule of interest in a cell
JP2022534381A (ja) ゲノム編集を使用してドミナントアレルを生成する方法及び組成物
Zhu et al. Modified gene editing systems: diverse bioengineering tools and crop improvement
AU2018263195B2 (en) Methods for isolating cells without the use of transgenic marker sequences
US20230183724A1 (en) Methods and compositions for multiplexed editing of plant cell genomes
CN115698302A (zh) 大规模基因组操纵
WO2019234129A1 (en) Haploid induction with modified dna-repair
US20200332306A1 (en) Type i-e crispr-cas systems for eukaryotic genome editing

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 5A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2746 DE 22-08-2023 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.