BR112021008427A2 - Mutagênese direcionada usando editores de bases - Google Patents

Mutagênese direcionada usando editores de bases Download PDF

Info

Publication number
BR112021008427A2
BR112021008427A2 BR112021008427-4A BR112021008427A BR112021008427A2 BR 112021008427 A2 BR112021008427 A2 BR 112021008427A2 BR 112021008427 A BR112021008427 A BR 112021008427A BR 112021008427 A2 BR112021008427 A2 BR 112021008427A2
Authority
BR
Brazil
Prior art keywords
nucleic acid
interest
steme
complex
sequence
Prior art date
Application number
BR112021008427-4A
Other languages
English (en)
Other versions
BR112021008427A8 (pt
Inventor
Yu Mei
Aaron Hummel
Zarir Vaghchhipawala
Caixia GAO
Chao Li
Rui Zhang
Original Assignee
Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences
KWS SAAT SE & Co. KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences, KWS SAAT SE & Co. KGaA filed Critical Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences
Publication of BR112021008427A2 publication Critical patent/BR112021008427A2/pt
Publication of BR112021008427A8 publication Critical patent/BR112021008427A8/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • A01H6/4636Oryza sp. [rice]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/10Applications; Uses in screening processes
    • C12N2320/13Applications; Uses in screening processes in a process of directed evolution, e.g. SELEX, acquiring a new function
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • C12N2330/31Libraries, arrays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Ecology (AREA)
  • Cell Biology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

MUTAGÊNESE DIRECIONADA USANDO EDITORES DE BASES. A presente invenção refere-se a métodos para descobrir traços e gerar sistemas celulares com fenótipos aprimorados. Em particular, a presente invenção fornece métodos para o desenvolvimento de plantas com fenótipos agronomicamente otimizados usando mutagênese direcionada com poucos ou nenhum efeito fora-do-alvo. Mutagênese direcionada é alcançada pela introdução de um complexo editor de bases ou de um complexo STEME que compreende uma série de RNAs guia que têm como alvo uma sequência de ácidos nucleicos de interesse. A presente invenção refere-se também a sistemas celulares obtidos por meio dos métodos descritos no presente documento e ao uso de um complexo editor de bases ou o complexo STEME que compreende uma matriz de RNAs guia para gerar um sistema celular que tem um fenótipo agronomicamente importante e para a identificação de um fenótipo agronomicamente importante.

Description

Relatório Descritivo da Patente de Invenção para "MUTA- GÊNESE DIRECIONADA USANDO EDITORES DE BASES". Campo Técnico
[001] A presente invenção refere-se a métodos para descobrir traços e gerar sistemas celulares com fenótipos aprimorados. Em par- ticular, a presente invenção fornece métodos para o desenvolvimento de plantas com fenótipos agronomicamente otimizados usando muta- gênese direcionada com poucos ou nenhum efeito fora-do-alvo. A mu- tagênese direcionada é alcançada pela introdução de um complexo editor de bases que compreende uma série de RNAs guia direciona- dos a uma sequência de ácidos nucleicos de interesse. Uma sequên- cia de ácidos nucleicos de interesse é uma sequência genômica asso- ciada a um traço agronomicamente importante, tal como resistência ao estresse ou alto rendimento. A presente invenção refere-se também a sistemas celulares obtidos por meio dos métodos descritos no presen- te documento e ao uso de um complexo editor de bases que compre- ende uma matriz de RNAs guia para gerar um sistema celular que tem um fenótipo agronomicamente importante e para a identificação de um fenótipo agronomicamente importante. Antecedentes da Invenção
[002] A mutagênese induzida tem sido uma fonte valiosa de vari- ação genética para a descoberta de traços em plantas e animais por décadas. Técnicas mais antigas, tal como mutagênese induzida por produtos químicos ou por radiação, são trabalhosas em virtude da bai- xa densidade de mutações (Tadele, Z. (2016). Mutagenesis and TIL- LING to Dissect Gene Function in Plants. Current Genomics, 17(6), 499-508) que ocorrem, requerendo o rastreio de milhares ou milhões de indivíduos para encontrar algumas mutações no gene de interesse. É praticamente impossível atingir uma alta densidade de mutações de novo em um único gene com estes métodos, e eles são ainda mais problemáticos em virtude das mutações aleatoriamente dispersas por todo o genoma, complicando a identificação da genética subjacente para um traço de interesse.
[003] Assim, há uma necessidade de técnicas de mutagênese aprimoradas para acelerar a descoberta de traços em plantas e ani- mais. Rodriguez-Leal et al., 2017 (Rodríguez-Leal, Daniel, et al. 2017.' Engineering Quantitative Trait Variation for Crop Improvement by Ge- nome Editing', Cell, 171: 470-80.e8.), descrevem uma ferramenta com base em CRISPR/Cas9 que tem como alvo regiões genômicas regula- doras para gerar uma população mutante com eliminação para explo- rar como diversos alelos cis-reguladores influenciam os traços quanti- tativos. O método descrito usa uma pluralidade de gRNAs para ter como alvo o complexo CRISPR/Cas9 para a região desejada, onde ele introduz múltiplas rupturas de fita dupla. Os resultados indicam que rearranjos de sequência e grandes eliminações de até vários milhares de pares de bases são introduzidos por meio deste método.
[004] Uma célula fora das fases do ciclo celular S/G2 responde à introdução de uma ruptura de fita dupla (Double Strand Break, DSB) em um locus genômico principalmente ao envolver vias de reparo de junção de extremidade não homóloga (Non-Homologous End Joining, NHEJ). Embora estes mecanismos, em geral, simplesmente reconec- tem as duas extremidades, na presença de um sistema CRISPR/Cas9, a DSB é repetidamente reintroduzida, tornando mais provável a ocor- rência de inserções e eliminações (indels). Se vários locais são alvo dentro de um locus genômico usando uma pluralidade de gRNAs, po- de-se esperar um acúmulo de indels e um rompimento completo do locus, o que resulta em inativação de um gene quando o locus é uma área codificante.
[005] A fim de identificar combinações de mutações que podem melhorar um determinado traço, portanto, é altamente desejável exe-
cutar uma mutagênese direcionada sem a introdução de DSBs e, as- sim, causar modificações de sequência rastreáveis, as quais não rom- pem completamente o locus alvo.
[006] Editores de bases, incluindo BEs (editores de bases que mediam a conversão de C para T) e ABEs (editores de bases de ade- nina que mediam a conversão de A para G), são ferramentas podero- sas para introduzir mutações diretas e programáveis sem a necessi- dade de clivagem de fita dupla (Komor et al., Nature, 2016, 533 (7603), 420-424; Gaudelli et al., Nature, 2017, 551, 464-471). Em geral, os edi- tores de bases são compostos de pelo menos um módulo de direcio- namento de DNA e um domínio catalítico que desamina a citidina ou adenina. Todas as quatro transições de DNA (A-T para G-C e C-G pa- ra T-A) são possíveis, contanto que os editores de bases possam ser orientados para o local alvo. Desenvolvido originalmente para funcio- nar em sistemas de células de mamíferos, os BEs e ABEs foram otimi- zados e aplicados em sistemas de células de plantas. A edição de ba- ses eficiente foi mostrada em várias espécies de plantas (Zong et al., Nature Biotechnology, vol. 25, Nº 5, 2017, 438-440; Yan et al., Molecu- lar Plant, vol. 11, 4, 2018, 631-634; Hua et al., Molecular Plant, vol. 11, 4, 2018, 627-630).
[007] Editores de bases têm sido usados para introduzir substitui- ções direcionadas específicas em sequências genômicas com efeitos fenotípicos conhecidos ou previstos em plantas e animais. Além disso, os editores de bases têm sido usados para ter como alvo vários locais dentro de um locus genético em células de mamíferos (Ma Y. et al. (2016), Targeted AID-Mediated Mutagenesis (TAM) Enables Efficient Genomic Diversification in Mammalian Cells, Nature Methods 13, 1029-1035; e Hess GT et al. (2016), Directed evolution Using dCas9- Targeted Somatic Hypermutation in Mammalian Cells, Nature Methods 13, 1036-1042), mas até agora eles não tinham sido usados para mu-
tagênese dirigida que tem como alvo vários locais dentro de um locus genético ou vários loci para identificar traços novos ou otimizados em plantas.
[008] Foi um objetivo da presente invenção fornecer meios e mé- todos para executar uma mutagênese direcionada sintonizável por densidade em um ou mais locus/loci genômicos de interesse, o que permite identificar combinações específicas de mutações que causam um fenótipo aprimorado.
[009] Também foi um objetivo da presente invenção que os mei- os e métodos pudessem ser direcionados especificamente a um de- terminado locus ou determinados loci, mas não introduzem mutações fora-do-alvo em outras regiões genômicas. Além disso, nenhuma rup- tura de fita dupla deve ser introduzida para evitar o acúmulo de indels.
[0010] Os métodos devem ser utilizáveis para uma ampla varieda- de de aplicações, explorando sequências codificantes gênicas e ele- mentos reguladores gênicos, tais como promotores, terminadores, su- pressores e intensificadores.
[0011] Foi um outro objetivo da presente invenção fornecer meios e métodos para gerar sistemas celulares modificados com traços oti- mizados que conferem um desempenho agrícola aprimorado. Sumário da Invenção
[0012] De acordo com um primeiro aspecto da presente invenção, os objetivos acima são atingidos por um método de identificação de um fenótipo agronomicamente importante em um sistema celular que compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (Saturated Targeted Endogenous Mutagenesis Editor, STEME) ou uma sequência que codifica o mesmo, em que o pelo me- nos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no sistema celular; (d) obter um sistema celular que compreende pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (e) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (f) rastrear a população M0 do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e (g) identificar e, assim, selecionar um fenótipo agronomi- camente importante no sistema celular, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0013] De acordo com um outro aspecto, a presente invenção refe- re-se a um método de identificação de um fenótipo agronomicamente importante em um sistema celular que compreende as seguintes eta- pas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no material genético do sistema celular; (d) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (e) cruzar a população M0 do sistema celular com uma po- pulação de tipo selvagem do sistema celular que compreende pelo menos uma sequência de ácidos nucleicos de interesse para obter uma população de progênie do sistema celular; (f) obter uma população de progênie do sistema celular que tem pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (g) rastrear a população de progênie do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo me- nos uma modificação em pelo menos um ácido nucleico de interesse; e (h) identificar e, assim, selecionar um fenótipo agronomi- camente importante no sistema celular, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0014] De acordo com ainda um outro aspecto, a presente inven- ção refere-se a um método de geração de um sistema celular modifi- cado que tem um fenótipo agronomicamente importante, o método compreendendo as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no sistema celular; (d) obter um sistema celular que compreende pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (e) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (f) rastrear a população M0 do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e (g) identificar e, assim, selecionar um sistema celular da população M0 que tem o fenótipo agronomicamente importante; e (h) obter um sistema celular modificado que tem o fenótipo agronomicamente importante, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0015] De acordo com um outro aspecto, a presente invenção refe- re-se também a um método para gerar uma progênie de um sistema celular modificado que tem um fenótipo agronomicamente importante, o método compreendendo as seguintes etapas:
(a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no material genético do sistema celular; (d) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (e) cruzar a população M0 do sistema celular com uma po- pulação de tipo selvagem do sistema celular que compreende pelo menos uma sequência de ácidos nucleicos de interesse para obter uma população de progênie do sistema celular; (f) obter uma população de progênie do sistema celular que tem pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (g) rastrear a população de progênie do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo me- nos uma modificação em pelo menos um ácido nucleico de interesse; e
(h) identificar e, assim, selecionar um sistema celular da população de progênie com o fenótipo agronomicamente importante, (i) obter uma progênie de um sistema celular modificado que tem o fenótipo agronomicamente importante, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia de pelo menos um complexo STEME com apreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo me- nos uma sequência de ácidos nucleicos de interesse.
[0016] Em uma modalidade dos vários aspectos da presente in- venção, a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, pelo menos dez, pelo menos onze, pelo menos doze, pelo me- nos treze, pelo menos quatorze, pelo menos quinze, pelo menos de- zesseis, pelo menos dezessete, pelo menos dezoito, pelo menos de- zenove, pelo menos vinte ou mais moléculas de RNA guia individuais que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0017] Em uma modalidade dos vários aspectos da presente in- venção, a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos duas, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos pelo menos oito, pelo menos nove, pelo menos dez, pelo menos onze, pelo menos doze, pelo menos treze, pelo menos quatorze, pelo menos quinze, pelo menos dezesseis, pelo menos dezessete, pelo menos de- zoito, pelo menos dezenove, pelo menos vinte ou mais moléculas de
RNA guia individuais que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0018] Em outra modalidade dos vários aspectos da presente in- venção, as moléculas de RNA guia têm como alvo fragmentos sobre- postos e/ou distintos da sequência de ácidos nucleicos de interesse.
[0019] Em ainda outra modalidade dos vários aspectos da presen- te invenção, o pelo menos um complexo editor de bases ou um com- ponente do mesmo é introduzido como parte de pelo menos um plas- mídeo, pelo menos um vetor ou pelo menos uma molécula de DNA linear, como molécula de RNA e/ou como um complexo pré-montado de RNA e/ou proteína.
[0020] Em uma modalidade dos vários aspectos da presente in- venção, o pelo menos um complexo STEME ou um componente do mesmo é introduzido como parte de pelo menos um plasmídeo, pelo menos um vetor ou pelo menos uma molécula de DNA linear, como molécula de RNA e/ou como um complexo pré-montado de RNA e/ou proteína.
[0021] Em uma outra modalidade dos vários aspectos da presente invenção, o pelo menos um complexo editor de bases ou o pelo menos um complexo STEME é introduzido no sistema celular através de mei- os biológicos ou físicos, incluindo transfecção, transformação, incluin- do transformação por Agrobacterium spp., de preferência Agrobacte- rium tumefaciens, um vetor viral, bombardeio biolístico, transfecção usando reagentes químicos, incluindo transfecção de polietileno glicol ou qualquer combinação dos mesmos.
[0022] Em outra modalidade dos vários aspectos da presente in- venção, a pelo menos uma sequência de ácidos nucleicos de interesse é/são (um) gene(s) endógeno(s) ou elemento(s) genético(s) associa- do(s) a um fenótipo agronomicamente importante.
[0023] Em uma outra modalidade dos vários aspectos da presente invenção, o(s) gene(s) endógeno(s) descrito(s) acima é/são seleciona- do(s) a partir do grupo que consiste em um gene que codifica resistên- cia ou tolerância ao estresse abiótico, incluindo estresse hídrico, es- tresse osmótico, estresse por calor, estresse por frio, estresse oxidati- vo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicidas, incluindo resistência ao glifosato, glufosinato/fosfinotricina, higromici- na, inibidores de protoporfirinogênio oxidase (ProtoPorphyrinogen Oxi- dase, PPO), inibidores de ALS e Dicamba, um gene que codifica a re- sistência ou tolerância ao estresse biótico, incluindo um gene de resis- tência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a insetos ou um gene que codifica um traço relacionado ao rendimento, incluindo resistência ao acama- mento, tempo de floração, resistência à deiscência, cor da semente, composição do endosperma ou teor nutricional.
[0024] Em ainda uma outra modalidade dos vários aspectos da presente invenção, o(s) elemento(s) genético(s) descrito(s) acima é/são um DNA que codifica um RNA não codificante, tal como rRNA, tRNA, miRNA, siRNA, piRNA, snRNA, snoRNA, lncRNA, RNA antis- senso, riboswitches ou ribozima ou uma sequência reguladora ou pelo menos parte de uma sequência reguladora, em que a sequência regu- ladora ou a parte da mesma compreende pelo menos um dentre uma sequência promotora central, uma sequência promotora proximal, uma sequência cis reguladora, um sequência trans reguladora, uma se- quência de controle de locus, uma sequência isoladora, uma sequên- cia silenciadora, uma sequência intensificadora, uma sequência termi- nadora e/ou qualquer combinação das mesmas.
[0025] Em outra modalidade dos vários aspectos da presente in- venção, a pelo menos uma modificação em pelo menos uma sequên- cia de ácidos nucleicos de interesse significa que o pelo menos um complexo editor de bases ou o pelo menos um complexo STEME in- duz a pelo menos 1, pelo menos 2, pelo menos 3, pelo menos 4, pelo menos 5, pelo menos 6, pelo menos 7, pelo menos 8, pelo menos 9, pelo menos 10, pelo menos 11, pelo menos 12, pelo menos 13, pelo menos 14, pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 21, pelo menos 22, pelo menos 23, pelo menos 24, pelo menos 25 ou ainda mais troca(s) de nucleotídeos na sequência de ácidos nucleicos de interesse.
[0026] Em uma outra modalidade dos vários aspectos da presente invenção, pelo menos um componente editor de bases do pelo menos um complexo editor de bases ou pelo menos um componente STEME de pelo menos um complexo STEME compreende pelo menos um domínio de reconhecimento de ácidos nucleicos e pelo menos um do- mínio de edição de ácidos nucleicos, em que o pelo menos um domí- nio de reconhecimento de ácidos nucleicos é independentemente se- lecionado a partir de CRISPR-Cas9, CRISPR-Cpf1, CRISPR-CasX, CRISPR-MAD7, CRISPR-Csm1, CRISPR-nickase Cas9, CRISPR- nickase Cpf1, CRISPR-nickase CasX, CRISPR- MAD7 nickase ou CRISPR-nickase Csm1, e em que o pelo menos um domínio de edição de ácidos nucleicos é independentemente selecionado a partir de uma citidina desaminase ou uma adenina desaminase, ou ambas, de prefe- rência em que o pelo menos um domínio de edição de ácidos nuclei- cos é independentemente selecionado a partir de um mRNA de desa- minase da família do complexo de edição-mRNA de apolipoproteína B (APOlipoprotein B mRNA-Editing Complex, APOBEC), de preferência uma APOBEC derivada de rato, uma citidina desaminase induzida por ativação (Activation-Induced cytidine Desaminase, AID), uma desami- nase ACF1/ASE, uma desaminase da família ADAT, uma desaminase ADAR2 ou uma desaminase PmCD A1, uma desaminase derivada de TadA e/ou qualquer combinação, variante ou fragmento cataliticamen-
te ativo das mesmas, e em que o pelo menos um componente editor de bases compreende opcionalmente pelo menos um sinal de locali- zação nuclear, e em que o pelo menos um componente editor de ba- ses compreende opcionalmente pelo menos uma sequência ligante, de preferência um ligante XTEN, e em que o pelo menos um componente editor de bases compreende opcionalmente pelo menos um compo- nente que inibe o reparo de DNA ou RNA de ocorrência natural, de preferência um domínio de inibidor de glicosilase de DNA de uracila (Uracil Glycosylase Inhibitor, UGI), um domínio de proteína Gam do bacteriófago Mu ou um inibidor do domínio de reparo por excisão de base inosina.
[0027] Em ainda outra modalidade dos vários aspectos da presen- te invenção, o pelo menos um componente editor de bases descrito acima, ou as sequências que codificam o mesmo, ou o pelo menos um componente STEME descrito acima, ou a sequência que codifica o mesmo, é fornecido como uma molécula de fusão.
[0028] Em uma outra modalidade dos vários aspectos da presente invenção, os componentes do complexo editor de bases descrito aci- ma, ou as sequências que codificam o mesmo, ou os componentes do complexo STEME descrito acima, ou as sequências que codificam o mesmo, são fornecidos como moléculas individuais.
[0029] Em uma modalidade dos vários aspectos da presente in- venção, o sistema celular é selecionado a partir de um organismo eu- cariota, em que o organismo eucariota é uma planta, parte de uma planta ou uma célula de planta.
[0030] Em outra modalidade dos vários aspectos da presente in- venção, a parte da planta descrita acima é selecionada a partir do gru- po que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pólen, tubos polínicos, filamentos de antera, óvulos, sacos embrionários, óvulos, ovários, zigotos, embriões,
embriões zigóticos, embriões somáticos, meristemas apicais, feixes vasculares, periciclos, sementes, raízes e estacas. Uma célula de planta, como usado no presente documento, pode ser uma célula pro- toplástica.
[0031] Em ainda outra modalidade dos vários aspectos da presen- te invenção, a planta, parte de uma planta ou célula de planta descrita acima é ou se origina de uma espécie de planta selecionada a partir do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distach- yon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyp- tus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea ca- nephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Ara- bidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oele- racia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica ni- gra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yama-shitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Spinacea olera- cea, Phaseolus vulgaris, Vicia faba, Allium cepa, Allium fistulosum, Al- lium sativum e Allium tuberosum.
[0032] Em um aspecto adicional, a presente invenção refere-se também a um sistema celular modificado obtido por meio de um méto-
do de acordo com qualquer um dos aspectos e modalidades descritos acima.
[0033] Em ainda outro aspecto, a presente invenção refere-se ao uso de pelo menos um complexo editor de bases que compreende uma matriz de RNAs guia que têm como alvo a pelo menos uma se- quência de ácidos nucleicos de interesse no material genético de um sistema celular para: (a) gerar um sistema celular que tem um fenótipo agrono- micamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e/ou (b) identificar um fenótipo agronomicamente importante as- sociado a pelo menos uma modificação em pelo menos uma sequên- cia de ácidos nucleicos de interesse no material genético do sistema celular.
[0034] Em ainda um outro aspecto, a presente invenção refere-se ao uso de pelo menos um complexo STEME que compreende uma matriz de RNAs guia que têm como alvo pelo menos uma sequência de ácidos nucleicos de interesse no material genético de um sistema celular para: (a) gerar um sistema celular que tem um fenótipo agrono- micamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e/ou (b) identificar um fenótipo agronomicamente importante as- sociado a pelo menos uma modificação em pelo menos uma sequên- cia de ácidos nucleicos de interesse no material genético do sistema celular. Breve Descrição dos Desenhos
[0035] Figura 1: Visão esquemática dos RNAs guia do editor de bases posicionados lado a lado na sequência de DNA codificante ou sequência promotora para descoberta de fenótipo em virtude de muta-
gênese de proteína e mutagênese de motivo regulador, respectiva- mente. (A) Mutagênese na sequência codificante; (B) Mutagênese de um local ativo na sequência codificante; (C) Mutagênese no promotor.
[0036] Figura 2: Representação esquemática da(s) janela(s) de edição para um editor de bases citidina (C) (BE). A(s) janela(s) de edi- ção é/são representada(s) por caixas retangulares. (A) Duas Cs pró- ximas podem ser editadas em uma janela de edição direcionada por um gRNA. (B) Um gRNA (Guia 1) tem como alvo duas Cs dentro de uma janela de edição e outro gRNA (Guia 2) tem como alvo uma C dentro de outra janela de edição em um local diferente. O motivo adja- cente protoespaçador (Protospacer Adjacent Motif, PAM) é represen- tado em preto.
[0037] Figura 3: Geração de novas mutações HR no gene OsAC- Case por meio de mutagênese de novo usando o editor de bases co- mo descrito no Exemplo 4. (A) Frequências de substituição de nucleo- tídeos de 40 sítios de sgRNA que têm como alvo o domínio funcional do gene OsACCase na geração M0. A posição 2125, onde ocorreu a substituição W2125C, está marcada com uma seta. Os sgRNAs que coincidem com as regiões de aminoácidos são mostrados na parte su- perior. (B) Fenótipos de arroz T1 editado no local OsACCase-W2125 após o tratamento com haloxifope. Mutantes portadores de OsACCa- se-W2125C e OsACCase-W2125C & R2126K e do tipo selvagem fo- ram tratados com haloxifope (48,6 g a.i./ha) no estágio de quatro fo- lhas e as fotos foram tiradas 10 dias depois. A barra de escala repre- senta 2 cm.
[0038] Figura 4: Edição de base de STEMEs via citidina e adeno- sina desaminases fundidas. (a) Arquiteturas de STEME-1, STEME-2, STEME-3 e STEME-4. Abreviaturas: ecTadA7.10: TadA de Escheri- chia coli evoluída; aa: aminoácido; XTEN: um ligante de 16 aa. (b) Comparação das frequências de edição C>T de A3A-PBE e as quatro construções STEME (n = 3). (c) Comparação das frequências de edi- ção A>G de PABE-7 e as quatro construções STEME (n = 3). Uma amostra de protoplasto não tratada serviu como controle. Os valores e as barras de erro indicam a média ± s.e.m de três réplicas biológicas independentes.
[0039] Figura 5. STEME-NG executa mutagênese saturada em protoplastos de arroz. (a) Estrutura de STEME-NG. Abreviaturas: ec- TadA7.10: TadA de Escherichia coli evoluída; aa: aminoácido. (b) Uma visão geral dos domínios da proteína OsACC gerados por Pfam. De- sign de sgRNAs com PAMs de direção direta NGD-3' (D = A, T ou G) e PAMs de complemento reverso 5'-HCN (H = A, T ou C). BC-N: biotina carboxilase, domínio N-terminal; CPSase_L_D2: cadeia L de carba- moil-fosfato sintase, domínio de ligação de ATP; BC-C: biotina carboxi- lase, domínio C-terminal; BA: enzima que requer biotina, o domínio de ligação se liga à biotina; ACC central: acetil-CoA carboxilase, região central; CT: domínio de carboxiltransferase.
[0040] Figura 6. O alinhamento de sequência de domínios CT de OsACC de arroz (SEQ ID NO: 192) e ScACC de levedura (SEQ ID NO: 193). Os principais resíduos envolvidos na ligação do herbicida estão coloridos em vermelho: Y1912, W2097, W2125 e F2128 em OsACC de arroz e Y1738, W1924, W1953 e F1956 em ACC de leve- dura. As mutações encontradas no rastreio são: S1866F (T1692), A1884P (L1710), P1927F (P1753) e W2125C (W1953). Definições
[0041] Um "fenótipo agronomicamente importante", no contexto da presente invenção, é um fenótipo de uma planta que exibe um ou mais traços novos ou otimizados que conferem um desempenho agrícola aprimorado em relação, por exemplo, ao rendimento, arquitetura, divi- são de nutrientes, fotossíntese, absorção de carbono, resistência a doenças, tolerância ao estresse, tolerância a herbicidas, sinalização hormonal e outras categorias de traços. Um fenótipo agronomicamente importante pode ser causado por qualquer uma ou uma combinação de uma ou mais mutações em uma ou mais regiões codificantes ou reguladoras do material genético da planta. As modificações podem ser associadas em termos de proximidade espacial ou contexto genô- mico ou podem ser completamente não relacionadas. Um fenótipo agronomicamente importante pode, assim, exibir um ou mais traços poligênicos.
[0042] O termo "sequência de ácidos nucleicos" usado no presen- te documento refere-se a DNA ou RNA fita simples ou dupla de origem natural ou sintética. Uma molécula de ácidos nucleicos ou uma se- quência de ácidos nucleicos compreende pelo menos um nucleotídeo ou dois ou mais nucleotídeos, respectivamente, em uma sequência específica de qualquer comprimento, incluindo oligonucleotídeos ou polinucleotídeos. Uma sequência de ácidos nucleicos pode ser uma região codificante ou uma região reguladora de um gene ou uma parte do mesmo ou compreender um ou mais genes, opcionalmente incluin- do regiões reguladoras.
[0043] O termo "modificar" ou "modificação" de uma molécula de ácidos nucleicos, no contexto da presente invenção, refere-se a uma alteração em uma sequência de ácidos nucleicos que resulta em pelo menos uma diferença na sequência de ácidos nucleicos que a distin- gue da sequência original. Em particular, uma modificação, no contex- to da presente invenção, é uma substituição de uma ou mais nucleo- bases que não requerem qualquer ruptura de fita dupla no DNA para serem modificadas.
[0044] Um "sistema celular", como usado no presente documento, refere-se a pelo menos um elemento que compreende todo ou parte do genoma de uma célula de interesse a ser modificada. O sistema celular pode, assim, ser qualquer sistema in vivo ou in vitro, incluindo também um sistema isento de células. O sistema celular compreende o genoma alvo ou a sequência genômica a ser modificada de uma forma adequada, isto é, de uma forma acessível a uma modificação ou manipulação genética. O sistema celular pode ser selecionado, por exemplo, a partir uma célula procariota ou eucariota, incluindo uma célula de animal ou uma célula planta, ou o sistema celular pode com- preender uma construção genética que compreende todo ou partes do genoma de uma célula procariota ou eucariota a ser modificada de uma forma altamente direcionada. O sistema celular pode ser forneci- do como célula ou vetor isolado ou o sistema celular pode ser compre- endido por uma rede de células em um tecido, órgão, material ou or- ganismo inteiro, in vivo ou como sistema isolado in vitro. Neste contex- to, o "material genético" de um sistema celular pode, portanto, ser en- tendido como todo ou parte do genoma de um organismo cujo material genético, como um todo ou em parte, está presente no sistema celular a ser modificado. De preferência, "sistema celular", no contexto da presente invenção, refere-se a células, um organismo ou uma parte ou um tecido de um organismo, de preferência uma planta ou uma linha- gem de planta, uma parte de planta ou um órgão de planta, tecidos de planta diferenciados e indiferenciados, células de planta, sementes e derivados e sua progênie.
[0045] Um "editor de bases", como usado no presente documento, refere-se a uma proteína desaminase ou um complexo que compreen- de pelo menos uma proteína ou um fragmento da mesma que tem a capacidade de mediar uma modificação de base direcionada, ou seja, a conversão de uma base de interesse, resultando em uma mutação pontual de interesse. De preferência, o pelo menos um editor de ba- ses, no contexto da presente invenção, compreende pelo menos um domínio de reconhecimento de ácidos nucleicos para ter como alvo o editor de bases a um local específico de uma sequência de ácidos nu-
cleicos e pelo menos um domínio de edição de ácidos nucleicos que executa a conversão de pelo menos uma nucleobase no local alvo es- pecífico. O editor de bases pode compreender outros componentes além do domínio de reconhecimento de ácidos nucleicos e o domínio de edição de ácidos nucleicos, tais como espaçadores, sinais de loca- lização e componentes que inibem DNA de ocorrência natural ou me- canismos de reparo de RNA para assegurar o resultado de edição de- sejado. Um "editor por mutagênese endógena direcionada saturada (STEME)", como usado no presente documento, refere-se a uma pro- teína desaminase de fusão que combina uma citidina desaminase e uma adenosina desaminase. Além da desaminase de fusão, o STEME pode conter uma CRISPR nickase, tal como nCas9 (D10A), e um inibi- dor de glicosilase de DNA de uracila (UGI) (Figura 1a). De preferência, o pelo menos um STEME, no contexto da presente invenção, compre- ende pelo menos um domínio de reconhecimento de ácidos nucleicos para ter como alvo o editor de bases a um local específico de uma se- quência de ácidos nucleicos e pelo menos um domínio de edição de ácidos nucleicos que executa a conversão de pelo menos uma nu- cleobase no local alvo específico. O STEME pode compreender outros componentes além do domínio de reconhecimento de ácidos nucleicos e o domínio de edição de ácidos nucleicos, tais como espaçadores, sinais de localização e componentes que inibem DNA de ocorrência natural ou mecanismos de reparo de RNA para assegurar o resultado de edição desejado.
[0046] O termo "domínio de reconhecimento de ácidos nucleicos" refere-se ao componente editor de bases que assegura a especificida- de pelo local do editor de bases, direcionando-o para um local alvo dentro do local predeterminado. Um domínio de reconhecimento de ácidos nucleicos pode ser com base em um sistema CRISPR, o qual reconhece especificamente uma sequência alvo dentro da molécula de ácidos nucleicos do sistema celular usando um RNA guia (gRNA) ou RNA guia único (sgRNA), pode ser uma fusão sintética de um RNA de CRISPR (crRNA) e um crRNA transativador (tracrRNA).
[0047] Um "sistema CRISPR" refere-se a qualquer sistema de ocorrência natural que compreende uma nuclease CRISPR, a qual foi isolada de seu contexto natural e que, de preferência, foi modificada ou combinada em uma construção recombinante de interesse para ser adequada como ferramenta para engenharia genômica direcionada. Qualquer nuclease CRISPR pode ser usada e opcionalmente repro- gramada ou sofrer mutação adicional para ser adequada para as vá- rias modalidades de acordo com a presente invenção, contanto que a nuclease CRISPR de tipo selvagem original forneça o reconhecimento de DNA, isto é, propriedades de ligação. O dito reconhecimento de DNA pode ser dependente de PAM (motivo adjacente protoespaça- dor). Nucleases CRISPR com padrões de reconhecimento de PAM otimizados e manipulados podem ser usadas e criadas para uma apli- cação específica. A expansão do código de reconhecimento de PAM pode ser adequada para atingir complexos efetores específicos para o local para um local alvo de interesse, independente da especificidade do PAM original da nuclease com base na CRISPR de tipo selvagem. As nucleases CRISPR também compreendem mutantes ou fragmen- tos cataliticamente ativos ou fusões de sequências efetoras de CRISPR de ocorrência natural ou as respectivas sequências que codi- ficam as mesmas. Uma nuclease CRISPR também pode, em particu- lar, referir-se a uma nickase CRISPR ou mesmo uma variante deficien- te em nuclease de um polipeptídeo CRISPR com função endonucleolí- tica em seu ambiente natural.
[0048] O termo "domínio de edição de ácidos nucleicos" refere-se ao componente editor de bases ou STEME que inicia a conversão de nucleotídeos para resultar na edição desejada. A função catalítica do domínio de edição de ácidos nucleicos pode ser uma função de citidi- na desaminase ou uma função de adenina desaminase ou ambas.
[0049] O editor de bases representa um componente de um "com- plexo editor de bases" que compreende, além disso, uma matriz de gRNAs. Uma "matriz de gRNAs" refere-se a dois ou, de preferência, mais gRNAs, que foram concebidos para ter como alvo uma sequência de ácidos nucleicos específica cada um.
[0050] O STEME representa um componente de um "complexo STEME" o qual, além disso, compreende uma matriz de gRNAs. Uma "matriz de gRNAs" refere-se a um gRNA ou, de preferência, um ou mais gRNAs, que foram concebidos para ter como alvo uma sequência de ácidos nucleicos específica cada um.
[0051] Uma "população M0" refere-se a um número de indivíduos de um sistema celular que são obtidos por meio de cultivo após muta- gênese no sistema celular. A população M0 apresenta uma diversida- de de diferentes modificações na sequência de ácidos nucleicos do material genético que foi alvo da mutagênese. Em contraste, uma "po- pulação M1" é obtida através de cruzamento com uma população M0. No contexto da presente invenção, a população M0 obtida por meio de cultivo após mutagênese é, de preferência, cruzada com um sistema celular de tipo selvagem ou uma população de tipo selvagem. Descrição Detalhada
[0052] A presente invenção refere-se um método que usa editores de bases para causar mutagênese de novo direcionada de densidade ultra alta em um único gene de interesse (ou um pequeno número de genes de interesse) e, subsequentemente, rastreio da população que sofreu mutagênese quanto a traços novos ou otimizados. Poucos - se houver - ou nenhum efeito fora-do-alvo podem ser esperados em regi- ões diferentes da(s) região(ões) alvo e o risco de introdução de indels indesejáveis é minimizado. A abordagem permite ajustar a densidade de mutações dependendo da(s) sequência(s) alvo e da diversidade desejada.
[0053] Os métodos descritos no presente documento podem ser usados em qualquer situação onde uma grande quantidade de varia- ção genética de alta densidade pode ser valiosa na descoberta de tra- ços novos ou otimizados. Em plantas, isto pode incluir rendimento, morfologia, arquitetura, divisão de nutrientes, fotossíntese, absorção de carbono, resistência a doenças, tolerância ao estresse, tolerância a herbicidas, sinalização hormonal, fertilidade e outras categorias de tra- ços.
[0054] Em um primeiro aspecto da presente invenção, é fornecido um método para identificar um fenótipo agronomicamente importante em um sistema celular que compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no sistema celular; (d) obter um sistema celular que compreende pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (e) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (f) rastrear a população M0 do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo menos uma modificação na pelo menos uma sequência de ácidos nucleicos de in- teresse; e (g) identificar e, assim, selecionar um fenótipo agronomi- camente importante no sistema celular, em que a matriz de RNAs guia compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mes- mas, que têm como alvo a pelo menos uma sequência de ácidos nu- cleicos de interesse; e em que a matriz de RNAs guia de pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0055] A fim de identificar um fenótipo agronomicamente importan- te que exibe um ou mais traços aprimorados ou novos, as sequências de ácidos nucleicos de interesse podem ser selecionadas na etapa (a), em que se pode esperar que a diversidade de sequência produza fe- nótipos úteis. De interesse particular podem ser genes ou outros ele- mentos genômicos nos quais foi mostrado que a diversidade de se- quência afeta fenótipos valiosos, mas onde toda a faixa de diversidade de sequência potencial ainda não foi explorada. Isto se aplica à grande maioria dos traços importantes em agricultura, uma vez que não foi possível até o momento executar a mutagênese ajustável por densi- dade específica para o alvo sem introduzir efeitos fora-do-alvo e evitar a formação de inserção/eliminação (InDel). No entanto, a fim de des-
cobrir novos traços ou novas maneiras de melhorar os traços, também pode ser de interesse sequências alvo que não são conhecidas por terem uma influência sobre determinados fenótipos.
[0056] As sequências de ácidos nucleicos de interesse podem in- cluir todas as porções de sequências codificantes gênicas, sequências de DNA que codificam RNAs não codificantes, tais como rRNA, tRNA, miRNA, siRNA, piRNA, snRNA, snoRNA, lncRNA, RNA antissenso, riboswitches ou ribozima ou elementos reguladores, tais como promo- tores, terminadores, intensificadores ou supressores. Qualquer um destes elementos pode ser direcionado separadamente ou em combi- nação. Vantajosamente, o método da presente invenção também per- mite identificar fenótipos que são causados por combinações de muta- ções em regiões genômicas aparentemente não relacionadas, por exemplo, traços poligênicos.
[0057] Para ter como alvo a(s) sequência(s) de ácidos nucleicos de interesse selecionada(s), é concebida uma matriz de gRNAs. A ma- triz de gRNAs determina a(s) região(ões) que sofre(m) mutagênese de alta densidade. Particularmente, dentro de um ácido nucleico de inte- resse que codifica uma determinada proteína, a sequência que codifi- ca o sítio ativo da proteína pode ou não ser direcionada, dependendo do resultado desejado (Figuras 1A e 1B). O alvo do gene e o traço gê- nico específico a sofrer mutagênese dependem de que tipo de diversi- dade genética se espera que produza os fenótipos de interesse. Por exemplo, um design preferido pode ser para ter como alvo sequências que codificam o sítio ativo de uma enzima de planta para mutagênese a fim de produzir diversidade estrutural e química no sítio ativo desta enzima (Figura 1B). Outro design pode ser ter como alvo uma região promotora do gene alvo (Figura 1C). É provável que muitos arranjos de gRNA diferentes possam ser úteis contra um único alvo genômico a fim de obter preferencialmente diferentes perfis de mutagênese. Os gRNAs específicos dão origem a pouco ou nenhum efeito potencial fora-do-alvo. No entanto, mesmo se forem observados efeitos fora-do- alvo que causem problemas para o fenótipo desejado, estes mutantes não serão selecionados no rastreio.
[0058] O design da matriz depende do tamanho da região alvo e da densidade de mutação desejada a qual, por exemplo, pode variar com diferentes genes alvo. Se a sequência codificante for a área alvo, o foco é dado na primeira e/ou na segunda nucleobase. É possível que a mesma nucleobase sofra mutação em diferentes nucleobases. Por exemplo, o editor de bases com base em citidina desaminase converte principalmente C em T, mas também pode produzir subprodutos de C em A ou C em G em frequência mais baixa.
[0059] A mutagênese é executada dentro de uma janela de edi- ção, ou seja, a seção da região alvo na qual os nucleotídeos são edi- tados. O tamanho e a posição da janela de edição são determinados pelo editor de bases. Por exemplo, o uso de diferentes desaminases pode resultar em diferentes janelas de edição. Um editor de bases também pode compreender mais de um domínio de desaminase que podem ser ligados entre si por meio de métodos comumente conheci- dos na técnica e, assim, que afetam o tamanho e a posição da janela de edição. Os STEME são tais proteínas de fusão desaminase que compreendem mais de um domínio de desaminase, de preferência pe- lo menos um domínio de citidina desaminase e pelo menos um domí- nio de adenina desaminase. Fora da janela de edição, nenhuma base será editada normalmente. Por exemplo, no sistema BE-PLUS, 10 domínios APOBEC podem ser recrutados para um domínio dCas9 e, no sistema CRISPR-X, 4 domínios AID podem ser recrutados para um domínio dCas9.
[0060] Se vários locais que se deseja editar estiverem próximos dentro da janela de edição, isto pode ser feito usando um único gRNA
(Figura 2A). Se os locais a serem editados estiverem mais distantes uns dos outros, vários gRNAs podem ser distribuídos para que os edi- tores de bases sejam direcionados para diferentes locais e a edição nestes diferentes locais possa ser alcançada (Figura 2B). A liberdade de ter como alvo qualquer local ou vários locais é limitada apenas pela presença de um PAM adequado e da janela de edição do editor de ba- ses ou do STEME.
[0061] Dentro da janela de edição, pode haver vários alvos para o editor de bases específico usado. Neste caso, todos os alvos podem ser editados ou apenas um ou alguns. Além disso, como mencionado acima, a mesma nucleobase pode sofrer mutação em diferentes nu- cleobases. Assim, é possível criar uma grande diversidade de edições de base por meio do método da presente invenção e descobrir traços novos e aprimorados.
[0062] Pode ser apropriado regenerar ou implantar a célula em um organismo inteiro para rastreio fenotípico. É importante rastrear uma população suficientemente grande para assegurar que toda a varieda- de de possível diversidade de mutagênese seja avaliada. A complexi- dade dos possíveis resultados de mutagênese é diretamente determi- nada pelo número de alterações que afetam o fenótipo, o qual é uma função do editor de bases ou densidade alvo do STEME, dos traços específicos do editor de bases ou STEME e do número de conversões de base que causariam um impacto no fenótipo. É muito importante considerar a faixa e a frequência dos resultados de possíveis mutagê- nese e rastrear uma população de tamanho suficiente. Em geral, quan- to maior o número de alvos, maior deve ser o tamanho da população.
[0063] Além disso, o tamanho da população depende do traço e de sua possibilidade de fenotipagem. Em geral, o tamanho da área alvo e a densidade de mutação desejada ditam o número de gRNAs necessários, o que também determina o tamanho da população para rastreio. A área alvo maior e a alta densidade de mutação desejada requerem mais gRNAs e um tamanho populacional maior.
[0064] A edição de bases pode gerar mutações homozigóticas ou bialélicas. Caso contrário, plantas homozigóticas podem ser obtidas por meio de autofecundação. Rastreio genético sensibilizado pode ser usado, como descrito em Rodriguez-Leal et al., 2017 (Rodríguez-Leal, Daniel, et al. 2017'. Engineering Quantitative Trait Variation for Crop Improvement by Genome Editing', Cell, 171: 470-80; e8).
[0065] Várias estratégias estão disponíveis pelas quais as popula- ções que sofreram mutagênese podem ser geradas para rastreio. Em plantas, uma estratégia é distribuir uma única ou múltiplas moléculas de DNA que abrigam cassetes de expressão para o editor de bases e os RNAs guias ou STEME e os RNAs guias para células ou tecidos e, em seguida, aplicar um processo de regeneração que produziria cen- tenas ou milhares de plantas M0 exclusivas. Esta população de plan- tas M0, ou sua progênie, seria rastreada quanto ao fenótipo. A desvan- tagem desta abordagem é que o trabalho envolvido na geração de um número tão grande de plantas M0 torna praticamente difícil e, em al- guns casos, realmente impossível de conseguir em espécies que não têm sistemas de distribuição, seleção e regeneração de DNA extre- mamente eficientes.
[0066] Uma alternativa a este método é gerar um punhado de plantas M0 que abrigam o conjunto completo de editor de bases e cassetes de expressão de RNA guia ou o conjunto completo de STE- ME e cassetes de expressão de RNA guia. Estas plantas, ou sua pro- gênie, então, são cruzadas com outras plantas para gerar um grande número de progênies, e a população da progênie é rastreada quanto ao fenótipo. Embora este método exija mais tempo em virtude de pelo menos uma geração adicional necessária para produzir a população de rastreio, a necessidade de trabalho é substancialmente menor em virtude da facilidade de cruzar plantas para produzir grandes popula- ções comparado com a regeneração de grandes populações de plan- tas.
[0067] Portanto, em outro aspecto, a presente invenção fornece um método para identificar um fenótipo agronomicamente importante em um sistema celular que compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no material genético do sistema celular; (d) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (e) cruzar a população M0 do sistema celular com uma po- pulação de tipo selvagem do sistema celular que compreende pelo menos uma sequência de ácidos nucleicos de interesse para obter uma população de progênie do sistema celular; (f) obter uma população de progênie do sistema celular que tem pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (g) rastrear a população de progênie do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo me- nos uma modificação em pelo menos um ácido nucleico de interesse; e (h) identificar e, assim, selecionar um fenótipo agronomi- camente importante no sistema celular, em que a matriz de RNAs guia compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mes- mas, que têm como alvo a pelo menos uma sequência de ácidos nu- cleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0068] No método descrito acima, uma população é gerada por meio de cruzamento e a ação de edição de bases na cópia de tipo sel- vagem do genoma proveniente do cruzamento. Usando este método, grandes populações de mutantes podem ser produzidas basicamente de qualquer espécie de planta para rastreio.
[0069] A presente invenção refere-se também a um método para gerar um sistema celular modificado que tem um fenótipo agronomi- camente importante. Usar editores de bases ou STEMEs para causar mutagênese direcionada em um único gene de interesse (ou um pe- queno número de genes de interesse) permite gerar fenótipos com tra- ços novos ou otimizados, tais como rendimento aprimorado, resistên- cia a doenças, tolerância ao estresse, tolerância a herbicidas e outras categorias de traços. Em virtude da especificidade pelo alvo da abor- dagem e à prevenção de rupturas de fita dupla, poucos - se houver -
ou nenhum efeito fora-do-alvo ou formações de InDel são observados.
[0070] De acordo com um outro aspecto, a presente invenção, por- tanto, fornece um método para gerar um sistema celular modificado que tem um fenótipo agronomicamente importante, o método compre- endendo as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no sistema celular; (d) obter um sistema celular que compreende pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (e) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (f) rastrear a população M0 do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e
(g) identificar e, assim, selecionar um sistema celular da população M0 que tem o fenótipo agronomicamente importante; e (h) obter um sistema celular modificado que tem o fenótipo agronomicamente importante, em que a matriz de RNAs guia compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mes- mas, que têm como alvo a pelo menos uma sequência de ácidos nu- cleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0071] O fenótipo agronomicamente importante pode ter sido iden- tificado precedentemente usando um método para identificar um fenó- tipo agronomicamente importante como descrito acima. Assim, as se- quências de ácidos nucleicos de interesse a serem direcionadas po- dem já ser conhecidas ou podem ser conhecidas de outras fontes que mutação(ões) em uma ou mais sequências de ácidos nucleicos no ma- terial genético tem/têm um impacto sobre o fenótipo agronomicamente importante desejado.
[0072] O fenótipo agronomicamente importante pode ser causado por mutações em quaisquer porções de sequências codificantes gêni- cas, sequências de DNA que codificam RNA não codificante ou ele- mentos reguladores, tais como promotores, terminadores ou supresso- res. Assim, qualquer um destes elementos pode ser direcionado sepa- radamente ou em combinação. Vantajosamente, o método da presente invenção também permite gerar fenótipos que são causados por com- binações de mutações em regiões genômicas distantes (por exemplo, traços poligênicos) que têm como alvo especificamente todas estas regiões.
[0073] No caso do complexo editor de bases, uma matriz de pelo menos dois, mas provavelmente mais gRNAs, é concebida para ter como alvo a(s) sequência(s) de ácidos nucleicos de interesse, no caso do complexo STEME uma matriz de pelo menos um ou apenas um, mas provavelmente mais gRNAs, é concebida para ter como alvo a(s) sequência(s) de ácidos nucleicos de interesse selecionada(s). Se for conhecido com precisão, onde as mutações são necessárias para ge- rar o fenótipo agronomicamente importante, o(s) gRNA(s) pode(m) ser especificamente concebido(s) para ter como alvo estes locais. Como já descrito acima, no contexto dos métodos de identificação de um fenó- tipo agronomicamente importante, aqueles versados na técnica estão cientes de quais editores de bases usar para ter como alvo determina- dos nucleotídeos e como ajustar o tamanho e a posição da(s) janela(s) de edição. Se a sequência codificante for a área alvo, o foco é dado na primeira e/ou na segunda nucleobase. Por exemplo, usando editores de bases com citidina desaminase, C's são alvos que resultam princi- palmente na conversão de C em T como o produto principal. No entan- to, como já mencionado acima, produtos colaterais podem ser forma- dos, o que pode ou não resultar no fenótipo desejado. Além disso, nem todos os nucleotídeos alvo dentro da janela de edição podem ser convertidos, o que novamente pode ou não resultar no fenótipo dese- jado. Portanto, para classificar os mutantes que não fornecem o fenó- tipo desejado, a população M0 é rastreada quanto ao fenótipo e os mutantes são selecionados em conformidade.
[0074] Após a mutagênese, o sistema celular é cultivado para ob- ter uma população M0 para rastreio. Como já descrito acima, no con- texto dos métodos para identificar um fenótipo agronomicamente im- portante, o tamanho da população precisa ser ajustado para o rastreio, dependendo do(s) alvo(s) da mutagênese.
[0075] Para gerar populações que sofreram mutagênese para ras-
treio, uma única ou múltiplas moléculas de DNA que abrigam cassetes de expressão para o editor de bases e os RNAs guia podem ser distri- buídas às células ou tecido e, em seguida, pode ser aplicado um pro- cesso de regeneração que produziria centenas ou milhares de plantas M0 exclusivas. Esta população de plantas M0, ou sua progênie, seria rastreada quanto ao fenótipo.
[0076] Como já mencionado acima, a desvantagem desta aborda- gem é que o trabalho envolvido na geração de um número tão grande de plantas M0 torna isto praticamente difícil e, em alguns casos, real- mente impossível de alcançar em determinadas espécies. Portanto, alternativamente, um punhado de plantas M0 que abrigam o conjunto completo de editor de bases/STEME e cassetes de expressão de RNA guia pode ser gerado e cruzado com outras plantas para gerar um grande número de progênie e a população de progênie é rastreada quanto ao fenótipo.
[0077] Portanto, em outro aspecto, a presente invenção fornece um método para gerar uma progênie de um sistema celular modificado que tem um fenótipo agronomicamente importante, o método compre- endendo as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no material genético do sistema celular; (d) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (e) cruzar a população M0 do sistema celular com uma po- pulação de tipo selvagem do sistema celular que compreende pelo menos uma sequência de ácidos nucleicos de interesse para obter uma população de progênie do sistema celular; (f) obter uma população de progênie do sistema celular que tem pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (g) rastrear a população de progênie do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo me- nos uma modificação em pelo menos um ácido nucleico de interesse; e (h) identificar e, assim, selecionar um sistema celular da população de progênie com o fenótipo agronomicamente importante, (i) obter uma progênie de um sistema celular modificado que tem o fenótipo agronomicamente importante, em que a matriz de RNAs guia compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mes- mas, que têm como alvo a pelo menos uma sequência de ácidos nu- cleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0078] Usando esta estratégia para gerar uma progênie ao cruzar a população M0 com uma população de tipo selvagem, grandes popu- lações mutantes podem ser produzidas de basicamente qualquer es- pécie de planta para rastreio.
[0079] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, a matriz de RNAs guia do complexo editor de bases compreende pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos pelo menos nove, pelo menos dez, pelo menos onze, pelo menos do- ze, pelo menos treze, pelo menos quatorze, pelo menos quinze, pelo menos dezesseis, pelo menos dezessete, pelo menos dezoito, pelo menos dezenove, pelo menos vinte ou mais moléculas de RNA guia individuais que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0080] Em outra modalidade dos vários aspectos da presente in- venção descritos acima, além disso, a matriz de RNAs guia do com- plexo STEME compreende pelo menos duas, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, pelo menos dez, pelo menos onze, pelo menos doze, pelo menos treze, pelo menos quatorze, pelo menos quinze, pelo menos dezesseis, pelo menos dezessete, pelo menos de- zoito, pelo menos dezenove, pelo menos vinte ou mais moléculas de RNA guia individuais que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
[0081] Em ainda outra modalidade dos vários aspectos da presen- te invenção descritos acima, as moléculas de RNA guia têm como alvo fragmentos sobrepostos e/ou distintos da sequência de ácidos nuclei- cos de interesse.
[0082] O número de gRNAs usados depende do tamanho da(s)
região(ões) alvo e da densidade de mutação desejada. Um único gRNA pode causar múltiplas mutações na janela de edição, mas tam- bém dois ou mais gRNAs que têm como alvo regiões próximas ou so- brepostas podem ser usados. É provável que muitos arranjos de gRNA diferentes possam ser úteis contra um único alvo genômico a fim de obter preferencialmente diferentes perfis de mutagênese. O design da matriz depende da finalidade da mutagênese, isto é, se a mutagênese é desejada para todo o ORF de um gene ou um determinado domínio de uma proteína ou regiões reguladoras de um gene (consulte Exem- plo 2).
[0083] Quando as sequências de gRNA são concebidas, Multiplex é o método preferido para clonagem uma vez que, para clonagem in- dividual, o número de construções e transformações a serem executa- das e o rastreio da população podem facilmente resultar em grandes esforços e custos. Há vários sistemas de vetor disponíveis para clona- gem Multiplex de gRNAs (consulte Exemplo 3).
[0084] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, o pelo menos um complexo editor de bases ou o pelo menos um complexo STEME ou um componente do mesmo é introduzido como parte de pelo menos um plasmídeo, pelo menos um vetor ou pelo menos uma molécula de DNA linear, tcomo molécula de RNA e/ou como um complexo pré-montado de RNA e/ou proteína.
[0085] Em outra modalidade dos vários aspectos da presente in- venção descritos acima, o pelo menos um complexo editor de bases ou o pelo menos um complexo STEME é introduzido no sistema celu- lar por meios biológicos ou físicos, incluindo transfecção, transforma- ção, incluindo transformação por Agrobacterium spp., de preferência Agrobacterium tumefaciens, um vetor viral, bombardeio biolístico, transfecção usando reagentes químicos, incluindo transfecção de poli- etileno glicol ou qualquer combinação dos mesmos.
[0086] Qualquer método de distribuição adequado para introduzir o pelo menos um complexo editor de bases ou um componente do mesmo ou o pelo menos um complexo STEME ou um componente do mesmo em uma célula ou sistema celular pode ser aplicado, depen- dendo da célula ou sistema celular de interesse. O termo "introdução", como usado no presente documento implica, portanto, em um trans- porte funcional de uma biomolécula ou construção genética (DNA, RNA, proteína fita simples ou dupla que compreende componentes naturais e/ou sintéticos ou uma mistura dos mesmos) em pelo menos uma célula ou em um compartimento de interesse, por exemplo, o nú- cleo ou uma organela ou no citoplasma, que permite a transcrição e/ou tradução e/ou a atividade catalítica e/ou atividade de ligação, incluindo ligação de uma molécula de ácidos nucleicos à outra molécula de áci- dos nucleicos, incluindo DNA ou RNA, ou ligação de uma proteína a uma estrutura alvo dentro de pelo menos uma célula ou sistema celu- lar e/ou a atividade catalítica de tal enzima introduzida, opcionalmente após transcrição e/ou tradução.
[0087] Portanto, uma variedade de técnicas de distribuição pode ser adequada de acordo com os métodos da presente invenção para introduzir o pelo menos um complexo editor de bases ou um compo- nente do mesmo ou o pelo menos um complexo STEME ou um com- ponente do mesmo em uma célula de proveniente ou sistema celular derivado de uma célula de planta, os métodos de distribuição sendo conhecidos pelo especialista, por exemplo, ao escolher técnicas de distribuição direta que variam de tratamento de protoplastos com polie- tileno glicol (PEG), procedimentos tais como eletroporação, microinje- ção, tecnologia de Whisker de fibras de carboneto de silício, aborda- gens mediadas por vetor viral e bombardeio de partículas.
[0088] Um meio biológico comum é a transformação com Agrobac- terium spp. que tem sido usada por décadas para uma variedade de diferentes materiais vegetais. A transformação de plantas mediada por vetor viral representa uma estratégia adicional para a introdução de material genético em uma célula de interesse.
[0089] Particularmente, os ditos métodos de distribuição para transformação e transfecção podem ser aplicados para introduzir com- ponentes de pelo menos um complexo editor de bases simultanea- mente. As técnicas de distribuição acima, individualmente ou em com- binação, podem ser usadas para abordagens in vivo (in planta) ou in vitro. De acordo com as várias modalidades da presente invenção, di- ferentes técnicas de distribuição podem ser combinadas entre si para introduzir pelo menos um complexo editor de bases ou seus compo- nentes ou pelo menos um complexo STEME ou seus componentes.
[0090] A matriz de gRNAs pode ser distribuída em uma construção ou várias construções. Os gRNAs podem ser eficientemente expres- sos a partir de promotores comumente usados.
[0091] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, a pelo menos uma sequência de ácidos nu- cleicos de interesse é (um) gene(s) endógeno(s) ou elemento(s) gené- tico(s) associado(s) a um fenótipo agronomicamente importante.
[0092] A modificação de genes endógenos que codificam traços relacionadas ao desempenho agrícola provavelmente resultará em um aprimoramento ou otimização do(s) respectivo(s) traço(s). Por outro lado, a modificação de elementos genéticos, tais como sequências re- guladoras associadas a tais traços, também pode ter um grande im- pacto sobre o desempenho agrícola. Também pode ser desejável ter como alvo genes relacionados ao traço endógenos e as sequências reguladoras associadas ao mesmo tempo para identificar ou gerar um fenótipo agronomicamente importante.
[0093] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, o(s) gene(s) endógeno(s) é/são seleciona-
do(s) a partir do grupo que consiste em um gene que codifica resistên- cia ou tolerância ao estresse abiótico, incluindo estresse hídrico, es- tresse osmótico, estresse por calor, estresse por frio, estresse oxidati- vo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicidas, incluindo resistência ao glifosato, glufosinato/fosfinotricina, higromici- na, inibidores de protoporfirinogênio oxidase (PPO), inibidores de ALS e Dicamba, um gene que codifica resistência ou tolerância ao estresse biótico, incluindo um gene de resistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a insetos ou um gene que codifica um traço relacionado ao rendimento, incluindo resistência ao acamamento, tempo de floração, resistência à deiscência, cor da semente, composição do endosperma ou teor nutri- cional.
[0094] Em outra modalidade dos vários aspectos da presente in- venção descritos acima, o(s) elemento(s) genético(s) é/são pelo me- nos parte de uma sequência reguladora, em que a sequência regula- dora compreende pelo menos uma sequência promotora central, uma sequência promotora proximal, uma sequência cis reguladora, uma sequência trans reguladora, uma sequência de controle de locus, uma sequência isoladora, uma sequência silenciadora, uma sequência in- tensificadora, uma sequência terminadora e/ou qualquer combinação dos mesmos.
[0095] Uma ou mais modificações induzidas em uma sequência reguladora podem resultar em uma expressão alterada de um ou mais gene(s) alvo. Por exemplo, uma sequência promotora modificada pode mostrar atividade de promotor aumentada, especificidade do promotor por um tecido aumentada, atividade de promotor diminuída ou especi- ficidade do promotor por um tecido diminuída comparado com a se- quência promotora não editada. Além disso, uma nova atividade de promotor, uma atividade de promotor indutível, uma janela estendida de expressão gênica, uma modificação do tempo ou progresso de de- senvolvimento da expressão gênica na mesma camada celular ou ou- tra camada celular, por exemplo, aumento do tempo de expressão gê- nica no tapete de anteras, uma mutação dos elementos de ligação ao DNA e/ou uma eliminação ou adição de elementos de ligação ao DNA pode resultar da modificação.
[0096] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, o pelo menos um complexo editor de bases induz a pelo menos 1, pelo menos 2, pelo menos 3, pelo menos 4, pe- lo menos 5, pelo menos 6, pelo menos 7, pelo menos 8, pelo menos 9, pelo menos 10, pelo menos 11, pelo menos 12, pelo menos 13, pelo menos 14, pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 21, pelo menos 22, pelo menos 23, pelo menos 24, pelo menos 25 ou mesmo mais substi- tuições de nucleotídeos na sequência de ácidos nucleicos de interes- se.
[0097] Os métodos de acordo com a presente invenção permitem mutagênese específica para local sintonizável por densidade em múl- tiplos nucleotídeos alvo. As modificações podem estar associadas em termos de proximidade espacial ou contexto genômico ou podem ser completamente não relacionadas. Um fenótipo agronomicamente im- portante identificado ou gerado com um método de acordo com a pre- sente invenção pode, assim, exibir um ou mais traços poligênicos.
[0098] Em outra modalidade dos vários aspectos da presente in- venção, o pelo menos um editor de bases específico para local com- preende pelo menos um domínio de reconhecimento de ácidos nuclei- cos e pelo menos um domínio de edição de ácidos nucleicos e o pelo menos um STEME compreende pelo menos um domínio de reconhe- cimento de ácidos nucleicos e pelo menos dois domínios de edição de ácidos nucleicos, em que o pelo menos um domínio de reconhecimen- to de ácidos nucleicos é independentemente selecionado a partir da versão desarmada e nickase de quaisquer nucleases CRISPR incluin- do, porém sem limitações, CRISPR-dCas9, CRISPR-dCpf1, CRISPR- dCsm1, CRISPR-dCasX, CRISPR-dCasY, CRISPR-dMAD7, CRISPR- nickase Cas9, CRISPR-nickase Cpf1, CRISPR-nickase Csm1, CRISPR-nickase CasX, CRISPR-nickase CasY ou CRISPR-MAD7 nickase, e em que pelo menos um ou pelo menos dois domínios de edição de ácidos nucleicos são independentemente selecionados a partir de uma citidina desaminase ou uma adenina desaminase, de preferência em que o pelo menos um domínio de edição de ácidos nu- cleicos é independentemente selecionado a partir de um mRNA de de- saminase da família do complexo de edição-mRNA de apolipoproteína B (APOBEC), de preferência uma APOBEC derivada de rato, uma citi- dina desaminase induzida por ativação (AID), uma desaminase ACF1/ASE, uma desaminase da família ADAT, uma desaminase ADAR2 ou uma desaminase derivada de PmCDA1 e/ou qualquer combinação, variante ou fragmento cataliticamente ativo das mesmas, e em que o pelo menos um editor de bases específico para local com- preende opcionalmente pelo menos um sinal de localização nuclear e em que o pelo menos um editor de bases compreende opcionalmente pelo menos uma sequência ligante, de preferência um ligante XTEN, e em que o pelo menos um editor de bases compreende opcionalmente pelo menos um componente que inibe o DNA ou reparo de RNA de ocorrência natural, de preferência um domínio de inibidor de glicosila- se de DNA de uracila (UGI), um domínio de proteína Gam do bacterió- fago Mu ou um inibidor de domínio de reparo de excisão de base ino- sina.
[0099] O domínio de reconhecimento de ácidos nucleicos pode ser com base em um sistema CRISPR que compreende uma nuclease
CRISPR modificada que direciona o editor de bases para o local alvo desejado, mas não possui qualquer função de nuclease ou, de prefe- rência, é modificado para atuar como uma nickase (por exemplo, nCas9). Portanto, a nuclease CRISPR não introduz rupturas de fita dupla, mas apenas cortes na fita não editada. A conversão do(s) nu- cleotídeo(s) alvo é iniciada pela ação de uma citidina desaminase ou uma adenina desaminase. Um domínio de reconhecimento de ácidos nucleicos CRISPR pode ser selecionado a partir de diferentes orga- nismos tais como, por exemplo, S. pyogenes ou S. aureus.
[00100] Domínios de edição de ácidos nucleicos adequados podem compreender um complexo de edição de mRNA de desaminase da família do complexo de edição-mRNA de apolipoproteína B (APO- BEC), de preferência uma APOBEC derivada de rato, uma citidina de- saminase induzida por ativação (AID), uma desaminase ACF1/ASE, uma desaminase da família ADAT, uma desaminase ADAR2 ou uma desaminase PmCDA1, uma desaminase derivada de TadA e/ou qual- quer combinação, variante ou fragmento cataliticamente ativo das mesmas. Informações sobre estas e outras desaminases adequadas como componente editor de bases de acordo com a presente invenção podem ser obtidas nos documentos WO2015089406A1, WO201707063 2A2, WO2017070633A2, WO2018027078A1 ou WO2015133554A1.
[00101] Informações sobre o uso de um domínio de proteína Gam do bacteriófago Mu no contexto de edição de base podem ser encon- tradas em Komor et al., "Improved Base Excision Repair Inhibition and Bacteriophage Mu Gam Protein Yields C:G-to-T:A Base Editors with Higher Efficiency and Product Purity", Science Advances, 2017, Vol. 3, Nº 8: eaao4774.
[00102] Há três versões BE descritas em Komor et al., 2016 (Komor et al., Nature, 2016, 533 (7603), 420-424), a saber BE1, BE2 e BE3,
com BE3 mostrando a maior eficiência de conversão direcionada de C em T, resultando em até 37 % da conversão desejada de C em T em células humanas. BE3 é composto de APOBEC-XTEN-dCas9 (A840H)-UGI, onde APOBEC1 é uma citidina desaminase, XTEN é um ligante de 16 resíduos, dCas9 (A840H) é uma versão de nickase de Cas9 que corta a fita não editada e UGI é um inibidor de glicosilase do DNA de uracila. Neste sistema, o complexo BE é orientado ao DNA alvo pelo sgRNA, onde a citosina é, então, convertida em uracila por meio de desaminação da citosina. O UGI inibe a função da glicosilase de DNA da uracila celular, a qual catalisa a remoção da uracila do DNA e inicia o reparo por excisão de base (Base-Excision Repair, BER). O corte da fita de DNA não editada ajuda a resolver a incompa- tibilidade U:G nos produtos U:A e T:A desejados.
[00103] Como mencionado acima, os BEs são eficientes na conver- são de C em T (G em A), mas não são capazes de conversão de A em G (T em C). ABEs foram desenvolvidos pela primeira vez por Gaudelli et al., 2017 (Gaudelli et al., Nature, 2017, 551, 464-471) para converter A-T em G-C. Uma adenosina desaminase de RNA de transferência foi desenvolvida para operar no DNA, a qual catalisa a desaminação da adenosina para produzir inosina, que é lida e replicada como G pelas polimerases. Atraves de fusão da adenina desaminase evoluída e um módulo Cas9, ABEs descritos em Gaudelli et al., 2017 (vide supra) mostraram cerca de 50 % de eficiência na conversão direcionada de A em G.
[00104] Zong et al. (Zong et al., Nature Biotechnology, vol. 25, Nº 5, 2017, 438-440) adotaram o BE2 e BE3 (Komor et al., 2016, vide su- pra), os quais são compostos por APOBEC1 de rato-Cas9 (catalitica- mente inativado para BE2 e nickase para BE3)-UGI, otimizaram có- dons de para plantas de cereais, as clonaram sob o promotor do gene de Ubiquitina-1 de milho e depois as aplicaram em arroz, trigo e milho.
Eles relataram que usando a fusão de nickase-citidina desaminase CRISPR-Cas9, a conversão direcionada de C em T tanto em proto- plastos como arroz, trigo e milho regenerados mostrou frequências de até 43,48 %. Yan et al. e Hua et al. relataram ambos a adoção de ABE descrito em Gaudelli et al., 2017 (vide supra) para gerar mutações A-T para G-C direcionadas em plantas de arroz (Yan et al., Molecular Plant, vol. 11, 4, 2018, 631-634; Hua et al., Molecular Plant, vol. 11, 4, 2018, 627-630). A otimização de códons para expressão em arroz foi executada em Yan et al.; enquanto Hua et al. usaram as sequências com códons otimizados de mamífero descritas em Gaudelli et al., além disso com uma forte fusão de sinal de localização nuclear VirD2 com o terminal C da nickase cas9 (D10A) de S. pyogenes e S. aureus. Am- bos os trabalhos demonstraram a aplicação bem-sucedida de ABEs que introduzem a conversão de A em G em plantas de arroz.
[00105] Os editores de bases atuais com base em CRISPR têm li- mitações de sequência no local do PAM e nas bases de nucleotídeos que podem ser convertidas (atualmente CT ou AG). uma vez que a alta diversidade genética induzida por esta mutagênese do editor de bases aumenta o espaço genético possível que pode ser amostrado para fenótipos úteis, em geral é útil ter editores de bases com requisi- tos de PAM mais baixos (para aumentar a densidade de RNAs guia dentro de uma região de interesse), mais flexibilidade nas conversões de resíduos (por exemplo teórico, CT, G ou A; AG, T ou C; GA, C ou T; e TC, A ou G), e janelas de conversão maiores.
[00106] Um dos editores de bases preferidos é um A3A-PBE recen- temente desenvolvido que consiste na citidina desaminase humana APOBEC3A (A3A) fundida com uma Cas9-nickase (códons otimizados para plantas de cereais). A vantagem deste editor básico é que ele possui uma janela de edição de 17 nucleotídeos e a atividade é inde- pendente do contexto da sequência. Basicamente, o editor de bases
A3A é composto por APOBEC3A-XTEN-nCas9-NLS-UGI-NLS sob o controle do promotor Ubi1 e do terminador CaMV (Zong et al., Nature Biotechnology, 36, 2018, 950-953). A sequência tem códons otimiza- dos para uma planta de cereal, mas pode ser otimizada para outras plantas através de meios conhecidos pelo especialista. Comparado com o PBE original desenvolvido sobre o BE3 com base em APO- BEC1 de rato, o qual tem uma janela de edição estreita de 4-5 nt e é ineficiente no contexto de um elevado teor de GC (Zong et al., Nature Biotechnology, vol. 25, Nº 5, 2017, 438-440 e Komor et al., 2016, vide supra), o editor de bases A3A converte C em T de forma eficiente em trigo, arroz e batata com uma janela de edição de 17 nt em todos os locais examinados, independente do contexto de sequência.
[00107] Editores de bases com janelas de conversão amplas são mais vantajosos do que aqueles com janelas de conversão estreitas em virtude de sua capacidade de afetar mais espaço de sequência por RNA guia. Por esta razão, o sistema BE-PLUS recentemente descrito ou sistemas similares ainda são preferidos no contexto da presente invenção (Jiang et al., "BE-PLUS: A New Base Editing Tool with Bro- adened Editing Window and Enhanced Fidelity", Cell Research, 2018, Vol. 28, Edição 8, 855-861).
[00108] Além disso, os inventores previram a possibilidade de uma única proteína usando um único sgRNA executar substituições A: T>G: C além de substituições C: G>T: A e atuar como um novo editor por meio de mutagênese endógena direcionada saturada (STEME) (Figura 1a). Eles, portanto, combinaram uma citidina desaminase com uma adenosina desaminase para obter uma desaminase de fusão. Além da desaminase de fusão, o STEME pode conter, por exemplo, nCas9 (D10A) e inibidor de glicosilase de DNA de uracila (UGI) (Figura 1a). Este novo STEME usa, por exemplo, o editor de bases de citosina de alta eficiência, A3A-PBE, com uma ampla janela de edição de base em plantas e o editor de bases de adenina de planta, PABE-7, o qual con- tém um tRNA de adenosina desaminase evoluído (ecTadA- ecTadA7.10). Para gerar substituições C:G>T: A e A:T>G: C na mes- ma sequência alvo usando uma única proteína, os inventores fundi- ram, por exemplo, APOBEC3A-ecTadA65-ecTadA7.10 ou ecTadA- ecTadA7.10-APOBEC3A ao N-término, por exemplo, de nCas9 (D10A), juntamente com UGI ou duas cópias de UGI livre no C-término de nCas9 (D10A), gerando STEME-1 (DNA=SEQ ID NO: 175: APO- BEC3A (1…597)-48aa ligante (598…741)-ecTadA (742…1239)-32aa ligante (1240…1335)-ecTadA7.10 (1336…1833)-32aa ligante (1834…1929)-nCas9 (D10A) (1930…6030)-NLS (6031…6078)-UGI (6097…6345)-NLS (6358…6378); proteína = SEQ ID NO: 176), STE- ME-2 (DNA=SEQ ID NO: 177: ecTadA (1…501)-32aa ligante (502…597)-ecTadA7.10 (598…1095)-32aa ligante (1096…1191)- APOBEC3A (1192…1785)-16aa ligante (1786…1833)-nCas9 (D10A) (1840…5940)-NLS (5941…5988)-UGI (6007…6255)-NLS (6268…6288); proteína = SEQ ID NO: 178), STEME-3 (DNA=SEQ ID NO: 179: APOBEC3A (1…597)-48aa ligante (598…741)-ecTadA (742…1239)-32aa ligante (1240…1335)-ecTadA7.10 (1195…1833)- 32aa ligante (1834…1929)-nCas9 (D10A) (1930…6030)-NLS (6031…6078)-T2A (6085…6138)-UGI (6139…6387)-NLS (6400…6420)-T2A (6421…6474)-UGI (6475…6723)-NLS (6736…6756); proteína = SEQ ID NO: 180) e STEME-4 (DNA=SEQ ID NO: 181: ecTadA (1…501)-32aa ligante (502…597)-ecTadA7.10 (598…1095)-32aa ligante (1096…1191)-APOBEC3A (1192…1785)- 16aa ligante (1786…1833)-nCas9 (D10A) (1834…5934)-NLS (5935…5982)-T2A (5989…6042)-UGI (6043…6291)-NLS (6304…6324)-T2A (6325…6378)-UGI (6379…6627)-NLS (6640…6660); proteína = SEQ ID NO: 182). Os STEMEs podem ter códons otimizados para plantas de cultivo e serem controlados por um promotor funcional em uma célula de planta, tal como o promotor Ubi-1 de milho. As janelas de edição de bases C>T variam, de preferência, a partir de 0,10-60 %, com STEME-1 sendo o mais eficiente. Dentro da janela de edição primária de A3A-PBE (C1-C17; contando a extremi- dade distal ao PAM como posição 1), o STEME-1 mostra uma eficiên- cia de edição C>T com uma média de 25,14 % em diferentes alvos gênicos. A eficiência de edição C>T foi 1,5 vezes maior do que A3A- PBE (média de 17,25 %).
[00109] O STEME-1 também mostra a maior eficiência de edição de bases A>G (0,69-15,50 %) dentre os quatro STEMEs e uma janela de edição de bases A>G de A4 a A8. A eficiência de edição A>G do STEME-1 foi capaz de conferir a diversidade desejada para uma estra- tégia de evolução direcionada aprimorada. Além disso, em geral, nos casos de substituição A>G por STEME-1, isto foi acompanhado por edição C>T simultânea na mesma fita de DNA. Nenhuma edição inde- sejada em qualquer um dos alvos desejados do sgRNA é evidente (< 0,05 %). As frequências de Indels com STEMEs também foram equi- valentes àquelas de células de planta de controle não tratadas. STE- MEs podem induzir a conversões C>T e A>G usando apenas um sgRNA e o STEME-1 é eficaz na geração de mutações simultâneas para aumentar a diversidade de mutações em um local alvo.
[00110] A fim de expandir o escopo de direcionamento de STEME-1 ou outro STEME, nCas9 (D10A) foi substituída por nCas9-NG com có- dons otimizados (D10A) para produzir STEME-NG (DNA=SEQ ID NO: 183: APOBEC3A (1…597)-48aa ligante (598…741)-ecTadA (742…1239)-32aa ligante (1240…1335)-ecTadA7.10 (1336…1833)- 32aa ligante (1834…1929)-nCas9-NG (D10A) (1930…6030)-NLS (6031…6078)-UGI (6100…6360)-NLS (6361…6381); proteína = SEQ ID NO: 184) derivado de STEME 1. STEME-NG tem uma ampla capa- cidade para editar C>T e A>G em sequências de PAM NG, mas prefe-
rem PAMs NGD (D = A, T ou G). STEME-NG exibiu atividade com- prometida (média para C>T de 7,92 %, A>G de 1,84 %) em sequên- cias canônicas de PAM NGG comparado com STEME-1 (média para C>T de 17,89 %, A>G de 3,80 %). STEME-NG edita citosinas em uma janela de C1 a C17 e adeninas em uma janela de A4 a A8. Além disso, STEME-NG gerou indels em frequências muito mais baixas (< 0,10 %) do que pCas9-NG (0,16-13,24 %) em células de planta, por exemplo, protoplastos. Em conjunto, as atividades de edição do STEME-NG de- pendem da natureza da Cas9-NG. Ela prefere PAMs NGD a PAMs NGC. Embora a eficiência de edição de STEME-NG tenha sido em média 2,2 vezes menor do que aquela do STEME-1 em PAM NGG, os dados abaixo sugerem que o STEME-NG pode expandir o escopo de edição de bases C>T e A>G e pode facilitar a aplicação de evolução dirigida em plantas.
[00111] A presente invenção demonstra que a edição dirigida auxi- liada por STEME é uma ferramenta eficaz para mutagênese em plan- tas. STEMEs podem gerar diversas mutações, incluindo substituições de base e indels in-frame, facilitando a análise da função da proteína e o desenvolvimento de traços agronômicos. Entretanto, a alta pureza do produto e os baixos números de indels obtidos pela edição de pro- toplastos apontam para a importância da expressão transitória de CRISPR. O sistema STEME pode ser usado para evolução dirigida, por exemplo, de genes que codificam proteínas onde uma atividade funcional nova ou alternativa é desejada e este sistema também pode ser aplicável além de plantas, por exemplo, ao rastrear mutantes de resistência a fármaco, alterar elementos cis em regiões não codifican- tes e corrigir SNVs patogênicos em animais.
[00112] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, o pelo menos um componente editor de ba- ses, ou a sequência que codifica o mesmo, ou pelo menos um compo-
nente STEME, ou a sequência que codifica o mesmo, é fornecido co- mo uma molécula de fusão.
[00113] Em outra modalidade dos vários aspectos da presente in- venção descritos acima, os componentes do complexo editor de ba- ses, ou as sequências que codificam o mesmo, ou pelo menos um componente STEME, ou a sequência que codifica o mesmo, são for- necidos como moléculas individuais.
[00114] Os componentes do pelo menos um editor de bases ou pe- lo menos um STEME podem estar presentes como moléculas de fusão ou como moléculas individuais ao se associarem ou serem associadas através de pelo menos um de uma interação covalente ou não cova- lente, de modo que os componentes do pelo menos um complexo edi- tor de bases seja colocado em estreita proximidade física.
[00115] Uma fusão pode, por exemplo, permitir localização subcelu- lar do editor de bases (por exemplo, um sinal de localização nuclear (Nuclear Localization Signal, NLS) para direcionamento (por exemplo, uma nuclease específica para local) para o núcleo, um sinal de locali- zação mitocondrial para direcionamento para as mitocôndrias, um sinal de localização de cloroplasto para direcionamento aos cloroplastos e assim por diante.
[00116] Em uma modalidade dos vários aspectos da presente in- venção descritos acima, o sistema celular é selecionado a partir de um organismo eucariota, em que o organismo eucariota é uma planta, par- te de uma planta ou uma célula de planta.
[00117] Em outra modalidade dos vários aspectos da presente in- venção descritos acima, a parte da planta é selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flo- res, partes de flores, pétalas, frutas, pólen, tubos polínicos, filamentos de antera, óvulos, sacos embrionários, óvulos, ovários, zigotos, embri- ões, embriões zigóticos, embriões somáticos, meristemas apicais, fei-
xes vasculares, periciclos, sementes, raízes e estacas. A célula de planta pode ser um protoplasto.
[00118] Em ainda outra modalidade dos vários aspectos da presen- te invenção descritos acima, a planta, parte de uma planta ou célula de planta é ou se origina de uma espécie de planta selecionada a partir do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distach- yon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyp- tus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea ca- nephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Ara- bidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oele- racia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica ni- gra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yama-shitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Spinacea olera- cea, Phaseolus vulgaris, Vicia faba, Allium cepa, Allium fistulosum, Al- lium sativum e Allium tuberosum.
[00119] De acordo com um outro aspecto, a presente invenção também refere-se a um sistema celular modificado obtido por meio de um método de acordo com qualquer um dos aspectos e modalidades descritos acima.
[00120] De acordo com ainda um outro aspecto, a presente inven- ção também refere-se ao uso de pelo menos um complexo editor de bases ou pelo menos um complexo STEME que compreende uma ma- triz de RNAs guia que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse no material genético de uma célula sis- tema para: (a) gerar um sistema celular que tem um fenótipo agrono- micamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e/ou (b) identificar um fenótipo agronomicamente importante as- sociado a pelo menos uma modificação em pelo menos uma sequên- cia de ácidos nucleicos de interesse no material genético do sistema celular.
[00121] Para uso de pelo menos um complexo editor de bases que compreende uma matriz de RNAs guia ou uso de pelo menos um complexo STEME que compreende uma matriz de RNAs guia, os de- talhes e características descritos no contexto dos vários aspectos e modalidades acima se aplicam em conformidade.
[00122] Uma modalidade preferida é o uso de pelo menos um com- plexo editor de bases ou de pelo menos um complexo STEME que compreende uma matriz de RNAs guia que têm como alvo pelo menos uma sequência de ácidos nucleicos no material genético de um siste- ma celular em um método de identificação de um fenótipo agronomi- camente importante em um sistema celular como definido em qualquer um dos aspectos e modalidades acima.
[00123] Outra modalidade preferida é o uso de pelo menos um complexo editor de bases ou de pelo menos um complexo STEME que compreende uma matriz de RNAs guia que têm como alvo pelo menos uma sequência de ácidos nucleicos no material genético de um siste- ma celular em um método de geração de um sistema celular modifica-
do que tem um fenótipo agronomicamente importante ou em um méto- do de geração de uma progênie de um sistema celular modificado que tem um fenótipo agronomicamente importante, como definido em qualquer um dos aspectos e modalidades acima.
[00124] Em uma modalidade do uso de acordo com a invenção re- lacionada a pelo menos um complexo editor de bases, a matriz de RNAs guia compreende pelo menos três, pelo menos quatro, pelo me- nos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, pelo menos dez, pelo menos onze, pelo menos doze, pe- lo menos treze, pelo menos quatorze, pelo menos quinze, pelo menos dezesseis, pelo menos dezessete, pelo menos dezoito, pelo menos dezenove, pelo menos vinte ou mais moléculas de RNA guia individu- ais que têm como alvo a pelo menos uma sequência de ácidos nuclei- cos de interesse e o uso de acordo com a invenção relacionado a pelo menos um complexo STEME, a matriz de RNAs guia compreende pelo menos duas, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, pelo menos dez, pelo menos onze, pelo menos doze, pelo menos tre- ze, pelo menos quatorze, pelo menos quinze, pelo menos dezesseis, pelo menos dezessete, pelo menos dezoito, pelo menos dezenove, pelo menos vinte ou mais moléculas de RNA guias individuais que têm como alvo a pelo menos uma sequência de ácidos nucleicos de inte- resse.
[00125] Em outra modalidade do uso de acordo com a invenção, as moléculas de RNA guia têm como alvo fragmentos sobrepostos e/ou distintos da sequência de ácidos nucleicos de interesse.
[00126] Em uma outra modalidade do uso de acordo com a inven- ção, o pelo menos um complexo editor de bases ou um componente do mesmo ou o pelo menos um complexo STEME ou um componente do mesmo é introduzido como parte de pelo menos um plasmídeo, pe-
lo menos um vetor ou pelo menos uma molécula de DNA linear, como molécula de RNA e/ou como um complexo pré-montado de RNA e/ou proteína.
[00127] Em uma modalidade do uso de acordo com a invenção, o pelo menos um complexo editor de bases ou o pelo menos um com- plexo STEME é introduzido no sistema celular através de meios bioló- gicos ou físicos, incluindo transfecção, transformação, incluindo trans- formação por Agrobacterium spp., de preferência Agrobacterium tume- faciens, um vetor viral, bombardeio biolístico, transfecção usando rea- gentes químicos, incluindo transfecção de polietileno glicol ou qualquer combinação dos mesmos.
[00128] Em outra modalidade do uso de acordo com a invenção, a pelo menos uma sequência de ácidos nucleicos de interesse é/são (um) gene(s) endógeno(s) ou elemento(s) genético(s) associado(s) a um fenótipo agronomicamente importante.
[00129] Em uma outra modalidade do uso de acordo com a inven- ção, o(s) gene(s) endógeno(s) descrito(s) acima é/são selecionado(s) a partir do grupo que consiste em um gene que codifica resistência ou tolerância ao estresse abiótico, incluindo estresse hídrico, estresse osmótico, estresse por calor, estresse por frio, estresse oxidativo, es- tresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicidas, inclu- indo resistência ao glifosato, glufosinato/fosfinotricina, higromicina, ini- bidores de protoporfirinogênio oxidase (PPO), inibidores de ALS e Di- camba, um gene que codifica resistência ou tolerância ao estresse bió- tico, incluindo um gene de resistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a insetos ou um gene que codifica um traço relacionado ao rendimento, incluindo resistência ao acamamento, tempo de floração, resistência à deiscência, cor da semente, composição do endosperma ou teor nutri-
cional.
[00130] Em ainda uma outra modalidade do uso de acordo com a invenção, o elemento genético descrito acima é pelo menos parte de uma sequência reguladora, em que a sequência reguladora compre- ende pelo menos um de uma sequência promotora central, uma se- quência promotora proximal, uma sequência cis reguladora, uma se- quência trans reguladora, uma sequência de controle de locus, uma sequência isoladora, uma sequência silenciadora, uma sequência in- tensificadora, uma sequência terminadora e/ou qualquer combinação das mesmas.
[00131] Em uma modalidade do uso de acordo com a invenção, o pelo menos um complexo editor de bases induz a pelo menos 1, pelo menos 2, pelo menos 3, pelo menos 4, pelo menos 5, pelo menos 6, pelo menos 7, pelo menos 8, pelo menos 9, pelo menos 10, pelo me- nos 11, pelo menos 12, pelo menos 13, pelo menos 14, pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos pelo menos 21, pelo menos 22, pelo me- nos 23, pelo menos 24, pelo menos 25 ou ainda mais substituição(ões) de nucleotídeos na sequência de ácidos nucleicos de interesse.
[00132] Em outra modalidade do uso de acordo com a invenção, o pelo menos um componente editor de bases de pelo menos um com- plexo editor de bases compreende pelo menos um domínio de reco- nhecimento de ácidos nucleicos e pelo menos um domínio de edição de ácidos nucleicos e pelo menos um STEME compreende em pelo menos um domínio de reconhecimento de ácidos nucleicos e pelo me- nos dois domínios de edição de ácidos nucleicos, em que o pelo me- nos um domínio de reconhecimento de ácidos nucleicos é independen- temente selecionado a partir da versão desarmada e nickase de quaisquer nucleases CRISPR incluindo, porém sem limitações, CRISPR-dCas9, CRISPR- dCpf1, CRISPR-dCsm1, CRISPR-dCasX,
CRISPR-dCasY, CRISPR-dMAD7, CRISPR-nickase Cas9, CRISPR- nickase Cpf1, CRISPR-nickase Csm1, CRISPR-nickase CasX, CRISPR-nickase CasY ou CRISPR-MAD7 nickase, em que o pelo me- nos um domínio de edição de ácidos nucleicos ou os pelo menos dois domínios de edição de ácidos nucleicos são independentemente sele- cionados a partir de uma citidina desaminase ou uma adenina desami- nase, de preferência em que o pelo menos um domínio de edição de ácidos nucleicos é independentemente selecionado a partir de um complexo de edição de mRNA de desaminase da família do complexo de edição-mRNA de apolipoproteína B (APOBEC), de preferência um APOBEC derivado de rato, uma citidina desaminase induzida por ati- vação (AID), um desaminase ACF1/ASE, uma desaminase da família ADAT, uma desaminase ADAR2 ou uma desaminase PmCDA1, uma desaminase derivada de TadA e/ou qualquer combinação, variante ou fragmento cataliticamente ativo dos mesmos, e em que o pelo menos um editor de bases específico para local compreende opcionalmente pelo menos um sinal de localização nuclear, e em que o pelo menos um editor de bases compreende opcionalmente pelo menos uma se- quência ligante, de preferência um ligante XTEN, e em que o pelo me- nos um editor de bases compreende opcionalmente pelo menos um componente que inibe o DNA de ocorrência natural ou reparo de RNA, de preferência um domínio de inibidor de glicosilase de DNA de uracila (UGI), um domínio de proteína Gam do bacteriófago Mu ou um inibidor de domínio de reparo por excisão de base inosina.
[00133] Em uma outra modalidade do uso de acordo com a inven- ção, o pelo menos um componente editor de bases, ou a sequência que codifica o mesmo, ou pelo menos um componente STEME, ou a sequência que codifica o mesmo, é fornecido como uma molécula de fusão.
[00134] Em ainda uma outra modalidade do uso de acordo com a invenção, os componentes do complexo editor de bases, ou as se- quências que codificam os mesmos, ou os componentes do complexo STEME, ou as sequências que codificam os mesmos, são fornecidos como moléculas individuais.
[00135] Em uma modalidade do uso de acordo com a invenção, o sistema celular é selecionado a partir de um organismo eucariota, em que o organismo eucariota é uma planta, parte de uma planta ou uma célula de planta.
[00136] Em outra modalidade do uso de acordo com a invenção, a parte da planta descrita acima é selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pólen, tubos polínicos, filamentos de antera, óvulos, sacos embrionários, óvulos, ovários, zigotos, embriões, embri- ões zigóticos, embriões somáticos, meristemas apicais, feixes vascula- res, periciclos, sementes, raízes e cortes.
[00137] Em uma outra modalidade do uso de acordo com a inven- ção, a planta, parte de uma planta ou célula de planta descrita acima é ou se origina de uma espécie de planta selecionada a partir do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bi- color, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distach-yon, Hordeum mari- num, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicoti- ana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Cruci- himalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepi- dium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Ara-
bis hirsute, Brassica napus, Brassica oeleracia, Brassica rapa, Ra- phanus sativus, Brassica juncea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yama-shitae, Cicer bijugum, Cicer arieti- num, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Spinacea oleracea, Phaseolus vul- garis, Vicia faba, Allium cepa, Allium fistulosum, Allium sativum e Al- lium tuberosum.
[00138] De acordo com ainda outro aspecto, a presente invenção também refere-se a um sistema celular modificado obtido por meio de um método descrito acima.
[00139] De acordo com ainda um outro aspecto, a presente inven- ção refere-se também a uma molécula de ácidos nucleicos que codifi- ca um editor por mutagênese endógena direcionada saturada (STE- ME). De preferência, a molécula de ácidos nucleicos compreende uma sequência de nucleotídeos de acordo com SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181 ou SEQ ID NO 183; ou uma sequência de nucleotídeos que tem uma identidade de pelo me- nos 80 %, pelo menos 85 %, pelo menos 90 %, pelo menos 92 %, pelo menos 94 %, pelo menos 95 %, pelo menos 96 %, pelo menos 97 %, pelo menos 98 % ou pelo menos 99 % com SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181 ou SEQ ID NO 183 ou uma sequência de nucleotídeos que codifica uma proteína de fusão de desaminase de acordo com SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182 ou SEQ ID NO 184; ou uma sequência de nucleotídeos que codifica uma proteína de fusão de desaminase que tem uma sequência de aminoácidos com uma identidade de pelo menos 80 %, pelo menos 85 %, pelo menos 90 %, pelo menos 92 %, pelo menos 94 %, pelo menos 95 %, pelo menos 96 %, pelo menos 97
%, pelo menos 98 % ou pelo menos 99 % com SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182 ou SEQ ID NO 184.
[00140] De acordo com ainda um outro aspecto, a presente inven- ção refere-se também a um polipeptídeo que codifica um editor por mutagênese endógena direcionada saturada (STEME). De preferên- cia, o polipeptídeo codifica uma proteína de fusão de desaminase de acordo com SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182 ou SEQ ID NO 184; ou uma proteína de fusão de desami- nase que tem uma sequência de aminoácidos com uma identidade de pelo menos 80 %, pelo menos 85 %, pelo menos 90 %, pelo menos 92 %, pelo menos 94 %, pelo menos 95 %, pelo menos 96 %, a pelo me- nos 97 %, pelo menos 98 % ou pelo menos 99 % com SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182 ou SEQ ID NO 184.
[00141] Tal molécula de ácidos nucleicos ou polipeptídeos codifica- dos podem ser usados como STEME ou como componente STEME em pelo menos um complexo STEME de acordo com qualquer método e uso descrito acima. Exemplos Exemplo 1: Editores de Bases Usados na Presente Invenção
[00142] Há vários editores de bases que estão disponíveis para aplicação em plantas, conferindo tanto a conversão de C em T quanto conversão de A em G no DNA genômico. Um dos editores de bases preferidos é o A3A-PBE recentemente desenvolvido, o qual consiste em citidina desaminase humana APOBEC3A (A3A) fundida com uma Cas9-nickase (códons otimizados para plantas de cereais) descrita acima (Zong et al., 2018, vide supra). A vantagem deste editor básico é que ele possui uma janela de edição de 17 nucleotídeos e a ativida- de é independente do contexto da sequência. Quaisquer outros edito- res de bases disponíveis também podem ser usados. Por exemplo, o domínio Cas9 pode ser trocado por qualquer outro domínio CRISPR incluindo, porém sem limitações, Cpf1, xCas9, C2c1, CasX, CasY, etc; o domínio da citidina desaminase pode ser um dos seguintes, porém sem limitações, APOBEC1, PmCDA1, AID de rato. Também pode ha- ver dois editores de bases componentes, tal como o sistema de edição de base BE-PLUS com base em SunTag (Jiang et al., "BE-PLUS: A New Base Editing Tool with Broadened Editing Window and Enhanced Fidelity", Cell Research, 2018, Vol. 28, Edição 8, 855-861). O domínio de citidina desaminase do editor de bases pode ser substituído pela adenina desaminase que conferiria as conversões de A em G, por exemplo, o domínio TadA* desenvolvido e otimizado a partir de ecTa- dA. Exemplo 2: Design de RNA Guia Para Mutagênese Direcionada
[00143] O alvo do gene e o traço específico do gene a sofrer muta- gênese dependem de que tipo de diversidade genética se espera que produza os fenótipos de interesse. A flexibilidade de combinar o editor básico com RNAs guia torna possível ter como alvo qualquer região do genoma. No entanto, um design preferido seria 1) para ter como alvo sequências que codificam o sítio ativo de um gene de planta (se esta informação estiver disponível); 2) ter como alvo toda a sequência codi- ficante (se a função do gene for conhecida por estar relacionada a um traço valioso, mas as informações estruturais ou funcionais do local são desconhecidas) ou 3) ter como alvo os elementos reguladores do gene, tais como promotores, terminadores, supressores e intensifica- dores, a fim de ajustar o padrão de expressão do gene de interesse (Figura 1).
[00144] A janela de edição do editor de bases escolhido está dire- tamente relacionada ao número de gRNAs necessários para atingir determinada densidade de mutação. Ao ter como alvo uma sequência codificante de um gene, apenas os gRNAs que causam mutações missense são usados, aqueles que geram apenas mutações nonsense ou sinônimas e aqueles que causam alterações de splicing são excluí- dos. O potencial de efeitos fora-do-alvo também é considerado, por- tanto, apenas gRNAs com pouco ou nenhum potencial fora-do-alvo são incluídos, se possível. Exemplo 3: Estratégia de Clonagem para Mutagênese e Rastreio de População
[00145] Os RNAs guias podem ser clonados individualmente, po- rém, de preferência com Multiplex.
[00146] Para clonagem individual, o seguinte método é usado. APOBEC1, sequências parciais de nCas9 e UGI (SEQ ID NO: 129) sem BsaI foram sintetizadas comercialmente (GenScript, Nanjing, Chi- na) e clonadas no pUC57 (SEQ ID NO: 130) como vetor intermediário. Outra parte de nCas9 (SEQ ID NO: 131) foi excisada de pHUE411 (Xing, Hui-Li, et al. 2014. 'A CRISPR/Cas9 Toolkit for Multiplex Geno- me Editing in Plants', BMC Plant Biology, 14: 327) com SdaI e MluI, e ligado ao vetor intermediário digerido com as mesmas duas enzimas, produzindo o plasmídeo pUC57-APOBEC1-nCas9-UGI (SEQ ID NO: 132). O APOBEC1-nCas9-UGI de comprimento total foi excisado usando XmaJI e SacI, então, foi subclonado em pHUE411 que tinha sido digerido usando as mesmas duas enzimas. O vetor pZRH-PBE resultante (SEQ ID NO: 133) foi usado para construir plasmídeos de expressão de sgRNA usando o sítio de enzima de restrição BsaI.
[00147] Para Multiplex, a clonagem da parte do editor de bases po- de ser a mesma, mas os múltiplos RNAs guia foram clonados em uma única construção. Por exemplo, no sistema CRISPR/Cas9, tais cons- truções podem ser obtidas a partir da Golden Gate Assembly ou Gib- son (Xing et al. 2014; Rodríguez-Leal et al. 2017, vide supra); ou usando o vetor CRISPR/Cas9 Multiplex com base em tRNA (Xie, Ka- bin, et al. 2015. 'Boosting CRISPR/Cas9 Multiplex Editing Capability with the Endogenous tRNA-Processing System', Proceedings of the National Academy of Sciences, 112: 3570-75; Čermák, Tomáš, et al.
2017. 'A Multipurpose Toolkit to Enable Advanced Genome Enginee- ring in Plants', The Plant Cell, 29: 1196-217); no sistema CRISPR/Cpf1, isto pode ser conseguido simplesmente usando uma única matriz CRISPR personalizada em virtude da capacidade do Cpf1 de processar seu próprio crRNA (Zetsche, Bernd, et al. 2016. 'Multiplex Gene Editing by CRISPR–Cpf1 Using a Single crRNA Array', Nature Biotechnology, 35: 31); documento US 62/616.136). O número de RNAs guia a serem distribuídos pode ser aumentado ainda mais ao misturar culturas de Agrobacterium que abrigam diferentes matrizes de RNA guia usando transformação mediada por Agrobacterium ou sim- plesmente adicionando mais plasmídeos que abrigam diferentes matri- zes de RNA guia na mistura de DNA ao usar distribuição biolística.
[00148] Há algumas estratégias nas quais as populações que sofre- ram mutagênese podem ser geradas para rastreio. Em plantas, uma estratégia (estratégia de rastreio I) seria distribuir uma única ou múlti- plas moléculas de DNA que abrigam cassetes de expressão ao editor de bases e os RNAs guia às células ou tecidos e, em seguida, aplicar um processo de regeneração que produziria centenas ou milhares de plantas M0. Esta população de plantas M0, ou sua progênie, seria ras- treada quanto ao fenótipo (consulte Exemplo 4). Uma estratégia alter- nativa e preferida (estratégia de rastreio II) é usar gRNAs Multiplex pa- ra gerar um pequeno número de plantas M0 que abrigam o conjunto completo de editor de bases e cassetes de expressão de RNA guia, cruzar estas plantas transgênicas em uma população de tipo selvagem para produzir uma população maior por meio edição nas cópias de tipo selvagem do gene proveniente do cruzamento (Rodríguez-Leal, Dani- el, et al. 2017. 'Engineering Quantitative Trait Variation for Crop Impro- vement by Genome Editing', Cell, 171: 470-80.e8).
Exemplo 4: Mutagênese de novo no Domínio Funcional do Gene de Acetil-CoA Carboxilase (ACCase) de Arroz
[00149] ACCase é uma enzima chave na biossíntese de lipídios ve- getais a qual carboxila acetil-CoA para formar malonil-CoA, e foi rela- tado que mutações em A1992 conferem resistência ao quizalofope (Ostlie, Michael, et al. 2015. 'Development and Characterization of Mu- tant Winter Wheat (Triticum aestivum L.) Accessions Resistant to the Herbicide Quizalofop', Theoretical and Applied Genetics, 128: 343-51). Para gerar de novo diversos mutantes resistentes a herbicidas que ini- bem ACCase em arroz, são concebidos 40 sgRNAs que têm como al- vo o domínio funcional do gene de ACCase (Délye, Christophe, et al.
2005. 'Molecular Bases for Sensitivity to Acetyl-Coenzyme A Carbo- xylase Inhibitors in Black-Grass', Plant Physiology, 137: 794-806). Os sgRNAs individuais foram clonados no vetor pZRH-PBE e as constru- ções resultantes (SEQ ID NO: 134-171) foram transformadas separa- damente em calos de arroz (var. Zhonghua11). As sequências alvo para os 40 sgRNAs estão listadas na Tabela 2 abaixo (SEQ ID NO: 1, 8, 11, 15, 22, 27, 32, 40, 42, 47, 49, 53, 59, 61, 64, 68, 71, 73, 76, 79, 81, 83, 85, 88, 90, 92, 94, 99, 102, 104, 107, 109, 113, 115, 119, 122, 125 e 127). O editor de bases guiado por 38/40 sgRNAs executou edi- ções em plantas M0 transgênicas com uma frequência de 5,9-80,0 % (Figura 3A e Tabela 1), resultando em 86 edições missense únicas (Tabela 2). Ensaios de resistência a herbicidas de plantas M1 usando os inibidores de ACCase, haloxifope, setoxidim ou pinoxadeno, que pertencem a três grupos químicos distintos, descreveram que a muta- ção W2125C e a mutação dupla W2125C e R2126K conferiram resis- tência ao haloxifope na taxa recomendada para o campo de 48,6 g a.i./ha (Figura 3B). W2125C correspondia a W2027C, uma mutação HR de ocorrência natural em outras três gramíneas, e W2125C e R2126K não foram relatadas precedentemente (Powles, Stephen B., et al. 2010. 'Evolution in Action: Plants Resistant to Herbicides', Annual Review of Plant Biology, 61: 317-47). Estes resultados indicaram que a mutagênese de novo mediada por edição de bases foi uma ferramenta eficaz para gerar novas mutações de ganho de função em plantas.
Cu- riosamente, W2125C foi causada por uma transversão de G para C na 11ª posição da sequência espaçadora, em vez de uma transição de G para A, a qual criaria um códon terminal.
Tabela 1: Frequências (%) de substituição de nucleotídeos e indels de 40 locais que têm como alvo OsACCase ID Nº de Plan- Nº de Nº de Frequên- Nº de Frequência Alvo tas Sequen- WT Indels cia de Substitui- de Substitui- ciadas Indels (%) ções ções (%) R1 53 13 3 5,7 37 69,8 R2 25 5 0 0 20 80 R3 23 19 1 4,8 0 0 R4 32 24 2 3,1 6 31,3 R5 52 11 0 0,0 34 65,4 R6 21 14 3 14,3 4 19 R7 17 6 1 5,9 10 58,8 R8 57 17 6 10,5 34 59,6 R9 25 25 0 0 0 0 R10 28 23 0 0 5 17,9 R11 19 14 0 0 5 26,3 R12 27 14 0 0 13 48,1 R13 25 20 0 0 5 20 R14 36 27 2 5,6 7 19,4 R15 23 18 0 0 5 21,7 R16 33 28 0 0 5 15,2 R17 42 22 2 4,1 11 42,9 R18 23 6 3 13,0 14 60,9 R19 29 27 0 0,0 2 6,9 R20 12 11 0 0,0 2 16,7
ID Nº de Plan- Nº de Nº de Frequên- Nº de Frequência Alvo tas Sequen- WT Indels cia de Substitui- de Substitui- ciadas Indels (%) ções ções (%) R21 21 14 2 9,5 5 23,8 R22 16 13 0 0,0 3 18,8 R23 27 21 0 0,0 6 22,2 R24 21 16 3 14,3 2 9,5 R25 5 3 0 0,0 2 40,0 R26 7 2 0 0,0 5 71,4 R27 13 11 0 0,0 2 15,4 R28 7 3 1 14,3 3 42,9 R29 25 7 3 12,0 15 60,0 R30 16 5 2 12,5 9 56,3 R31 17 16 0 0,0 1 5,9 R32 19 13 11 10,5 4 21,1 R33 17 9 1 5,9 7 412 R34 14 4 0 0,0 10 71,4 R35 8 7 0 0,0 1 12,5 R36 14 9 0 0,0 5 35,7 R37 11 4 5 45,5 2 18,2 R38 14 5 4 28,6 5 35,7 R39 4 1 2 50,0 1 25,0 R40 15 12 1 6,7 2 13,3
Tabela 2: Análise de substituições de nucleotídeos e aminoácidos di- recionados a 38 locais que têm como alvo a OsACCase.
Substituição de nucleotídeos fora da sequência espaçadora e as mutações em mo- saico não foram incluídas nesta tabela.
As citosinas ou guaninas alvo estão em itálico e os nucleotídeos substituídos pelo PBE estão em ne- grito
Exemplo 5: Mutagênese Direcionada em Di-hidroxiácido Desidra- tase de Arroz (DHAD)
[00150] DHAD é uma enzima essencial e altamente conservada en- tre as espécies de plantas que catalisa reações de β-desidratação pa- ra produzir precursores de α-cetoácidos para isoleucina, valina e leuci- na. Recentemente, foi descoberto um herbicida de produto natural que tem como alvo a DHAD (Yan, et al. 2018. 'Resistance-Gene-Directed Discovery of A Natural-Product Herbicide with A New Mode of Action', Nature, 559: 415-18). Para gerar diversos mutantes resistentes a her- bicidas que inibem a DHAD, 16 sgRNAs são concebidos para ter como alvo toda a sequência codificante de DHAD de arroz (SEQ ID NO: 172). Construções com editor de bases e cassetes de expressão de sgRNAs Multiplex são geradas usando o método no Exemplo 3 e estas construções são transformadas em calos de arroz usando transforma- ção mediada por Agrobacterium ou distribuição biolística. Um punhado de plantas M0 transgênicas são regeneradas e a sequência analisada quanto a substituições de base dentro da janela de edição. Como des- crito no Exemplo 3, as plantas M0 são cruzadas com plantas de arroz de tipo selvagem e as progênies F1 e/ou F2 são rastreadas quanto à resistência a herbicidas usando ácido asptérrico inibidor de DHAD.
[00151] A fim de direcionar o sítio ativo descrito em uma análise es- trutural de DHAD de Arabidopsis (Yan et al. 2018, vide supra), o editor de bases que consite em adenina desaminase e domínio xCas9 é usado. Neste caso, 11 guias são concebidos, cobrindo a maioria dos resíduos de aminoácidos dentro e ao redor do sítio ativo. Usando a mesma estratégia de clonagem e rastreio supracitada, esta população também é rastreada quanto à resistência a herbicidas usando ácido asptérrico inibidor de DHAD. Exemplo 6: Mutagênese Direcionada no Domínio Regulador de Sacarose Sintase de Trigo (SUS)
[00152] A sacarose sintase catalisa a conversão de sacarose em frutose e UDP-glicose, a qual está ligada à biossíntese de amido. Uma vez que o amido é o principal componente das sementes secas de tri- go, a síntese do amido tem efeitos significativos sobre a produtividade. Análise da estrutura de sacarose sintase-1 de Arabidopsis revelou que o domínio regulador N terminal está envolvido na interação de interfa- ce múltipla (Zheng, Yi, et al. 2011.' The Structure of Sucrose Synthase- 1 from Arabidopsis thaliana and Its Functional Implications', Journal of Biological Chemistry, 286: 36108-18.). Com base nisto, o domínio re- gulador de SUS1 de trigo (com foco em resíduos de aminoácidos con- servados envolvidos na fosforilação e interação de interface no tetrâ- mero) é direcionado para mutagênese por edição de base para desco- brir novos alelos que produzem rendimento otimizado (SEQ ID NO: 173). Um total de 12 sgRNAs são concebidos para introduzir múltiplas mutações dos aminoácidos conservados. Expressão de sgRNA Multi- plex e a estratégia de rastreio II são usadas para rastrear mutantes com rendimento otimizado. Exemplo 7: Mutagênese Direcionada da Região do Promotor SlCLV3
[00153] Foi relatado que o uso de CRISPR/Cas9 para mutagênese direcionada do promotor SlCLV3 gera novos alelos cis-reguladores para variação quantitativa (Rodríguez-Leal et al. 2017, vide supra). O mesmo gene é direcionado no presente documento usando o editor de bases. Um total de 14 sgRNAs são concebidos que têm como alvo a região promotora de SlCLV3, 2 kb a montante da sequência codifican- te (SEQ ID NO: 174), sem considerar quaisquer elementos cis regula- dores previstos. O editor de bases e construções de expressão de sgRNA Multiplex são transformados em S. lyc por meio de transforma- ção mediada por Agrobacterium (Gupta, Sarika, et al. 2016. 'Modifica- tion of Plant Regeneration Medium Decreases the Time for Recovery of Solanum lycopersicum Cultivar M82 Stable Transgenic Lines', Plant Cell, Tissue and Organ Culture (PCTOC), 127: 417-23; Rodríguez-Leal et al. 2017, vide supra; e Čermák et al., 2017, vide supra). Cinco a dez plantas M0 transgênicas são regeneradas e a sequência é analisada quanto a substituições de bases em locais dentro da janela de edição. As progênies F1 e/ou F2 do cruzamento de plantas transgênicas M0 e de tipo selvagem são rastreadas quanto ao tamanho do fruto e número de lóculos. Exemplo 8:
[00154] Para gerar substituições C:G>T:A e A:T>G:C na mesma sequência alvo usando uma única proteína, os inventores fundiram APOBEC3A-ecTadA65ecTadA7.10 ou ecTadA-ecTadA7.10- APOBEC3A ao N-término de nCas9 (D10A), juntamente com UGI ou duas cópias de UGI livre no C-término de nCas9 (D10A), gerando STEME-1, STEME-2, STEME-3 e STEME-4, respectivamente (Figura 4a). Os STEMEs tiveram códons otimizados para plantas de cultivo e controlados pelo promotor Ubi-1 de milho. Para examinar suas ativida- des de edição de bases em genes endógenos, seis sgRNAs que têm como alvo diferentes genes de arroz foram concebidos e clonados em pOsU3-esgRNA.
[00155] Cada sgRNA foi cotransfectado em protoplastos de arroz juntamente com cada um dos quatro STEMEs. A3A-PBE, PABE-7 e Cas9 de tipo selvagem foram usados como controles. O sequencia- mento profundo do amplicon mostrou que todos os quatro STEMEs produziram conversões C>T e A>G de maneira eficiente (Figuras 4 b, c). As janelas de edição base C>T eram equivalentes àquelas de A3A- PBE e as eficiências de edição variavam a partir de 0,10 a 61,61 %, STEME-1 sendo o mais eficiente (Figura 4 b). Dentro da janela de edi- ção primária de A3A-PBE (C1-C17; contando a extremidade distal ao PAM como posição 1), o STEME-1 teve uma eficiência de edição C>T com uma média de 25,14 % em OsAAT, OsACC, OsCDC48 e Os- DEP1, a qual era 1,5 vezes maior do que A3A-PBE (média de 17,25 %) (Figura 4c).
[00156] STEME-1 também teve a maior eficiência de edição de ba- se A>G (0,69-15,50 %) dentre os quatro STEMEs e a janela de edição de base A>G de A4 a A8. Embora tenha sido menor do que PABE-7 (1,74-21,54 %), a eficiência de edição de A>G do STEME-1 ainda es- tava dentro de um limite aceitável para conferir a diversidade desejada para uma estratégia de evolução direcionada aprimorada (Figura 4c). Além disso, em mais de 99 % dos casos de substituição A>G pelo STEME-1, isto foi acompanhado por edição C>T simultânea na mesma fita de DNA. Nenhuma edição indesejada em qualquer um dos alvos de sgRNA foi evidente (< 0,05 %). As frequências de Indels com STE- MEs (0,04-0,63 %) também foram equivalentes àquelas de protoplas- tos de controle não tratados (0,04-0,51 %), muito mais baixas do que com Cas9 (6,30-15,61 %). Estes resultados indicam que os STEMEs induzem a 88 conversões C>T e A>G usando apenas um sgRNA e que o STEME-1 é eficaz na geração de mutações simultâneas para aumentar a diversidade de mutações em um local alvo.
[00157] Em seguida, para expandir o escopo de direcionamento do STEME-1 a fim de aumentar sua utilidade, a nCas9 (D10A) em STE- ME-1 foi substituída por nCas9-NG com códons otimizados (D10A) para produzir STEME-NG (Figura 5a). Também foram geradas cons- truções A3A-PBE-NG (DNA = SEQ ID NO: 185; proteína = SEQ ID NO: 186), PABE7-NG (DNA = SEQ ID NO: 187; proteína = SEQ ID NO: 188) e pCas9-NG (DNA = SEQ ID NO: 189; proteína = SEQ ID NO: 190) substituindo as porções correspondentes de A3A-PBE, PA- BE-7 e pCas9 por nCas9-NG com códons otimizados (D10A) ou Cas9- NG. Foram concebidos dezesseis espaçadores de 20 nt com PAMs NG de quatro locais de arroz diferentes. STEME-NG, juntamente com cada um destes dezesseis sgRNAs foi, então, cotransfectado em pro- toplastos de arroz. Descobriu-se que STEME-NG tinha uma ampla ca- pacidade para editar C>T e A>G em sequências PAM NG, mas prefe- ria PAMs NGD (D = A, T ou G). Assim como Cas9-NG24, STEME-NG exibiu atividade comprometida (média para C>T de 7,92 %, A>G de 1,84 %) em sequências PAM NGG canônicas comparado com STE- ME-1 (média para C>T de 17,89 %, A>G de 3,80 %). STEME-NG edi- tou citosinas em uma janela de C1 a C17 e adeninas em uma janela de A4 a A8, a qual foi a mesma observada para A3A-PBE-NG e PA- BE7-NG individuais, respectivamente. Além disso, STEME-NG, A3A- PBE-NG e PABE7-NG geraram indels em frequências muito mais bai- xas (< 0,10 %) do que pCas9-NG (0,16-13,24 %) em protoplastos de arroz. Tomados em conjunto, estes dados mostram que as atividades de edição de STEME-NG, A3A-PBE-NG e PABE7-NG em PAMs NG dependem principalmente da natureza da Cas9-NG. Embora a eficiên- cia de edição de STEME-NG tenha sido em média 2,2 vezes menor do que aquela de STEME-1 em PAMs NGG, os dados acima sugerem que STEME-NG é capaz de expandir o escopo da edição de base C>T e A>G e facilitar a aplicação de evolução dirigida em plantas. Exemplo 9:
[00158] Para testar a capacidade do STEME de atingir a mutagêne- se de novo saturada em protoplastos de arroz, tomou-se a acetil- coenzima A carboxilase (OsACC) como exemplo. ACC é uma enzima chave na biossíntese de lipídios e seu domínio de carboxil transferase (CT) é o alvo dos herbicidas (Figura 5b). As substituições de aminoá- cidos no domínio CT podem conferir resistência a herbicidas em gra- míneas. 20 sgRNAs foram concebidos, incluindo 11 sgRNAs com PAMs NGD-3' de direção direta e 9 com PAMs de complemento rever- so 5'-HCN (H = A, T ou C) abrangendo uma sequência de DNA de 168 pb que codifica 56 aminoácidos do domínio de CT (Figura 5b). Usando
STEME-NG, os sgRNAs cobriram 90,32 % das citosinas, 40,43 % das adeninas, 77,78 % das guaninas e 38,89 % das timidinas nas janelas de edição, correspondendo ao todo a 61,31 % das bases da fita codifi- cante. Estes sgRNAs foram cotransfectados individualmente com STEME-NG em protoplastos de arroz. A3A-PBE-NG e pCas9-NG ser- viram como controles. O sequenciamento profundo do amplicon mos- trou que STEME-NG converteu 96,43 % das Cs em Ts, 63,16 % das As em Gs, 92,86 % das Gs em As e 42,86 % das Ts em Cs nas bases cobertas na fita codificante; as eficiências médias de edição de base foram de 11,50 %, 0,35 %, 13,33 % e 0,45 %, respectivamente. Entre- tanto, A3A-PBE-NG editou 89,29 % de Cs para Ts e 92,86 % de Gs para As na fita codificante, e nenhuma substituição A>G ou T>C foi encontrada. Nenhuma conversão de base foi detectada no controle não tratado. A diversidade de mutações induzidas por estes 20 sgR- NAs usando STEME-NG foi cerca de duas vezes maior do que aquela observada usando A3A-PBE-NG. Os eventos simultâneos C:G>T:A e A:T>G:C contribuíram com 18,4 % da diversidade observada com STEME-NG, uma eficiência de até 2,71 %. Consistente com os expe- rimentos acima, STEME-NG mostrou, em protoplastos de controle não tratados, indels (< 0,02 %) com este conjunto alvo diferente, similar ao A3A-PBE-NG (< 0,01 %) e muito menos do que Cas9-NG (0,32-39,72 %).
[00159] Também analisamos as substituições de aminoácidos ge- radas por STEME-NG nos 56 aminoácidos alvo. Descobrimos que 41 dos aminoácidos foram substituídos (incluindo mutações silenciosas, mutações missense e mutações nonsense). Destes, vinte e quatro, doze e cinco aminoácidos tinham um, dois e três tipos de substituição de aminoácidos, respectivamente. Assim, mutagênese quase saturada (73,21 %) ocorreu sobre os 56 aminoácidos usando STEME-NG e apenas 20 sgRNAs. Da mesma forma, A3A-PBE-NG causou mutação em 33 aminoácidos, dos quais vinte e seis, seis e um continham um, dois e três tipos de substituição de aminoácidos, respectivamente. Es- tes resultados mostram coletivamente que STEME-NG pode induzir a diversos tipos de mutação na sequência codificante de arroz. Assim, ele promete ser uma ferramenta poderosa para a evolução direcionada de genes endógenos por meio de mutagênese de novo saturada in situ. Exemplo 10:
[00160] Como prova de conceito, STEMEs foram usados para a evolução direcionada de ACC em plantas de arroz. Uma região de
1.200 nt que codifica 400 aa do domínio de CT foi escolhida como o alvo de mutagênese. Um total de 200 sgRNAs foi concebido, incluindo 118 sgRNAs NGD-3' de direção direta e 82 sgRNAs de PAMs de com- plemento reverso 5'-HCN. STEME-1 foi escolhido para 102 sgRNAs com PAMs NGG-3' ou 5'-CCN, enquanto que STEME-NG foi usado para os sgRNAs restantes, os quais tinham PAMs NGW-3' ou 5'-WCN (W = A ou T). Estes sgRNAs cobriram 94,61 % das Cs, 48,26 % das As, 83,39 % das Gs e 37,46 % das Ts nas janelas de edição, repre- sentando ao todo 63,95 % das bases na fita codificante. Estes sgRNAs foram inseridos separadamente no vetor binário pH-STEME-1-esgRNA ou pH-STEME-NG-esgRNA. Para executar a transformação da planta e a genotipagem de forma eficiente, os 200 sgRNAs foram divididos em 27 grupos (Grupos 1-27). Em cada grupo, quantidades iguais de 4 a 11 plasmídeos de sgRNA, cobrindo 80-142 nt na OsACC, foram reu- nidas.
[00161] Para avaliar a cobertura da transformação, as sequências de RNA guia do DNA genômico extraídas de cada grupo de mudas regeneradas foram amplificadas para sequenciamento profundo do amplicon. Descobriu-se que 72,73 % a 100 % dos sgRNAs foram transformados nas plantas de cada grupo e, no total, 92,50 %
(185/200) dos sgRNAs foram introduzidos com sucesso. A cobertura mutacional foi caracterizada por meio de sequenciamento profundo e foram observadas 377 substituições de nucleotídeos entre os 768 nu- cleotídeos cobertos, envolvendo 168 Cs (73,68 %), 23 As (15,03 %), 164 Gs (61,65 %) e 22 Ts (18,18 %). A eficiência média de edição em cada grupo foi de 13,18 %. Além disso, ao contrário das substituições uniformes vistas em protoplastos, os STEMEs induziram a conversões C>G/A, G> C/T e indels in-frame, além de conversões de base C:G>T:A e A:T>G:C canônicas. As distribuições do produto entre as bases editadas foram 81,86 % C>T, 13,73 % C>G, 4,41 % C>A, 76,63 % G>A, 19,02 % G>C, 4,35 % G>T, 100 % A>G e 100 % T>C; esta distribuição um tanto alterada pode ser em virtude de diferenças nos mecanismos de reparo por excisão de base em protoplastos e plantas. Assim, STEMEs também podem ser usados para gerar substituições C:G>G:C ou C:G> A:T além de 176 para edições canônicas, o que de- ve aumentar a diversidade na evolução direcionada de proteínas nas plantas.
[00162] Foram analisados os detalhes das leituras mutacionais cri- adas nas plantas de arroz. Dos 495 tipos de leituras mutacionais indu- zidas pelos 185 sgRNAs, 76,36 %, 19,80 %, 3,64 % e 0,20 % envolve- ram uma, duas, três e quatro substituições de aminoácidos, respecti- vamente. Além disso, 2,83 % das sequências mutantes envolveram alterações A:T>G:C e 3,84 % envolveram alterações simultâneas A:T>G:C e C:G>T:A. Dos 400 aminoácidos alvo, 209 (52,25 %) foram alterados, gerando mutações silenciosas, missense e nonsense (Figu- ra 6d). Destes, 116, 66, 19, 7 e 1 tinham uma, duas, três, quatro e seis tipos de substituições de aminoácidos, respectivamente (Figura 6d). Tomados em conjunto, estes dados demonstram que STEMEs são capazes de gerar um grande número 185 de mutações para servir co- mo base para a evolução direcionada de genes endógenos no genoma de arroz. Exemplo 11:
[00163] Para identificar os mutantes desejados, um inibidor de ACC comumente usado, haloxifope, foi pulverizado para selecionar mudas de resistência a herbicidas nos Grupos 1 a 27. Três semanas depois, algumas mudas de aparência normal apareceram e eram claramente resistentes a herbicida. Sequenciamento de Sanger mostrou que dez no Grupo 6 traziam mutações: sete eram homozigotos P1927F e dois eram heterozigotos, e a muda remanescente era um mutante bialélico Q1926*/P1927F e P1927F; duas mudas no Grupo 20 traziam muta- ções: uma era um homozigoto W2125C e a outra um heterozigoto A2123T/W2125C. Foram observadas outras mudas com resistência ao haloxifope ligeiramente mais fraca do que aquela observada acima, sugerindo que podem representar alelos diferentes. O sequenciamento de Sanger mostrou que duas das mudas, no Grupo 2, eram heterozi- gotos S1866F, enquanto que três mudas no Grupo 3 eram heterozigo- tos A1884P. Em todas as plantas que continham as substituições S1866F, P1927F ou A2123T, estas foram o resultado das transições C:G>T:A, enquanto que uma transversão C:G>G:C foi responsável por todas as substituições W2125C observadas. Isto foi consistente com os dados de amplicon de STEMEs em plantas de arroz, mostrando a ocorrência de transversões C:G>G:C. Em contraste, as substituições A1884P observadas foram causadas por atividades diferentes; duas plantas continham uma única transversão C:G>G:C, enquanto que a terceira planta continha uma transversão C:G>G:C e uma transversão A:T>G:C dentro do códon A1884P, indicativo de atividades de desami- nase simultâneas de STEME-NG. W2125C é uma mutação de resis- tência a herbicida que foi relatada em gramíneas (Powles, SB & Yu, Q. Evolution in Action: Plants Resistant to Herbicides. Annu. Rev. Plant. Biol. 61, 317-347 (2010)), indicando que a mutagênese de ACC por
STEMEs é capaz de gerar mutações conhecidas. É importante ressal- tar que estes resultados também confirmaram que STEMEs podem gerar múltiplas mutações novas, tais como P1927F, S1866F e A1884P, as quais não foram relatadas precedentemente. Exemplo 12:
[00164] Foi testada uma estratégia de uso de STEMEs para muta- gênese direcionada sob pressão de seleção simultânea. Com base nos resultados acima, o Grupo 6 (P1927) e o Grupo 20 (W2125) foram selecionados como alvos representativos e usados para transformar o arroz com um protocolo modificado no qual a pressão de seleção do herbicida foi aplicada durante a indução e regeneração do calo. Cres- cimento vigoroso de calos foi observado nas transformações de alvos, enquanto que calos transformados com o vetor de controle morreram.
[00165] Vinte plantas de cada uma das transformações do Grupo 6 e do Grupo 20 foram selecionadas para posterior análise e todas trai- zam as mutações P1927F ou W2125C esperadas, respectivamente. Três dos vinte mutantes portadores de W2125C também continham mutações A2123T com alterações de nucleotídeos resultantes da ati- vidade simultânea de adenosina e citidina desaminase dentro do có- don A2123. Além disso, também sequenciamos o gene de OsACC de mudas de resistência representativas que abrigam P1927F, W2125C, S1866F ou A1884P e não encontramos outras alterações mutacionais. Portanto, a mutagênese de OsACC por STEMEs pode descrever uma série de novas mutações funcionais de resistência a herbicidas, além das mutações descritas precedentemente, demonstrando seu valor potencial na execução de evolução direcionada de proteínas.
[00166] Para avaliar o potencial de efeitos fora-do-alvo, foi feita uma varredura da sequência genômica para todos os locais alvo similares que continham até uma incompatibilidade de 3 nt e sequenciamos es- tes locais nos respectivos mutantes. A partir desta análise, uma única mutação fora-do-alvo foi encontrada em apenas um dos mutantes (o mutante bialélico que traz A2123T e A2123T/W2125C), enquanto que nenhuma mutação fora-do-alvo foi encontrada em qualquer um dos outros mutantes. Construção de Plasmídeos
[00167] As porções de citidina desaminase, adenosina desaminase, nCas9 (D10A) e UGI de STEME-1, STEME-2, STEME-3 e STEME-4 foram amplificadas a partir de A3A-PBE ou PABE-7 e montadas na estrutura pJIT163 através de One Step Cloning (ClonExpress II One Step Cloning Kit, Vazyme, Nanjing, China). PCR foi executada usando TransStart FastPfu DNA Polymerase (TransGen Biotech). A variante Cas9 nCas9-NG (D10A) que contém substituições R1335V/L1111R/D1135V/G1218R/E1219F/A1322R/T1337R foi sinteti- zada comercialmente (GENEWIZ, Suzhou, China). A construção de sgRNA pOsU3-esgRNA foi descrita precedentemente (Li, C. et al. Ex- panded Base Editing in Rice and Wheat Using a Cas9-Adenosine De- aminase Fusion. Genome Biol. 19, 59 (2018)). Os oligos recozidos fo- ram inseridos no pOsU3-esgRNA digerido com BsaI (New England Bi- oLabs). Para construir os vetores binários pH-STEME-1-esgRNA e pH- STEME-NG-esgRNA, STEME-1 e STEME-NG, juntamente com o cas- sete de expressão OsU3-esgRNA, foram clonados na estrutura de pHUE41131. Todos os conjuntos de iniciadores foram sintetizados pe- lo Beijing Genomics Institute (BGI). Transfecção de Protoplastos
[00168] Usamos a variedade de arroz Japonica Nipponbare para preparar protoplastos. O isolamento e a transformação do protoplasto foram executados como descrito (Shan, Q. et al. Rapid and Efficient Gene Modification in Rice and Brachypodium Using TALENs. Mol. Plant 6, 1365-1368 (2013)). 10 μg cada de nuclease e DNA de plasmí- deo de sgRNA foram introduzidos nos protoplastos através de trans-
fecção mediada por PEG, com uma eficiência de transformação média de 40-55 % medida por um hemocitômetro. Os protoplastos transfec- tados foram incubados a 23 °C e 60 h após a transfecção, foram cole- tados e o DNA genômico extraído para sequenciamento profundo do amplicon. Transformação Mediada por Agrobacterium de Células de Calo de Arroz
[00169] Os vetores binários para cada grupo foram agrupados em proporções equimolares e transformados em A. tumefaciens AGL1 por meio de eletroporação e usados para transformar cerca de 240 calos de arroz. A transformação mediada por Agrobacterium de células de calos de arroz da variedade Japonica Zhonghua11 foi conduzida como relatado32,33. Higromicina (50 μg/ml) foi usada para selecionar plantas transgênicas. Rastreio Quanto à Tolerância a Herbicidas
[00170] Mudas de arroz regeneradas T0 foram transferidas para água, cultivadas em uma câmara de crescimento (25 °C, 16 h de luz e 8 h de escuridão) durante dez dias e pulverizadas com haloxifope (34 g de ingrediente ativo ha-1). O herbicida foi aplicado com um equipa- mento pressurizado a 0,2 MPa e um volume de pulverização de 450 L/ha. Três semanas depois, as mudas sobreviventes foram identifica- das. Seleção de Mudas Resistentes ao Haloxifope no Meio
[00171] Após a transformação, os calos foram selecionados em meio de indução de calos suplementado com higromicina (50 μg/ml) durante quatro semanas. Em seguida, os calos resistentes à higromi- cina foram transferidos para meio de indução de calos suplementado com haloxifope (0,108 mg/L). Após seis semanas de seleção, os calos frescos e brilhantes foram transferidos para meio de regeneração su- plementado com haloxifope (0,108 mg/L) para regeneração.
Extração de DNA
[00172] O DNA genômico dos protoplastos foi extraído com um DNA-Quick Plant System (Tiangen Biotech, Beijing, China). O DNA genômico de mudas regeneradas de arroz foi extraído com CTAB, e todas as mudas de cada grupo foram amostradas juntas. O local alvo foi amplificado com iniciadores específicos e os amplicons foram puri- ficados com um EasyPure PCR Purification Kit (TransGen Biotech, Beijing, China) e quantificados com um espectrofotômetro NanoDrop™ 2000 (Thermo Fisher Scientific, Waltham, MA, EUA). Detecção de Prováveis Locais Fora-do-Alvo
[00173] Os potenciais locais fora-do-alvo foram previstos usando a ferramenta online Cas-OFFinder (Bae, S., Park, J. & Kim, J.-S. Cas- OFFinder: A Fast and Versatile Algorithm That Searches for Potential Off-Target Sites of Cas9 RNA-Guided Endonucleases. Bioinformatics 30, 1473-1475 (2014)). Se o sgRNA no alvo com um PAM NGG, os locais fora-do-alvo foram previstos usando PAMs NGG. Alternativa- mente, o sgRNA no alvo com um PAM NG, os locais fora-do-alvo fo- ram previstos usando PAMs NG. Os locais fora-do-alvo que contêm incompatibilidades de até 3 nt foram examinados nos exemplos acima.

Claims (20)

REIVINDICAÇÕES
1. Método de identificação de um fenótipo agronomicamen- te importante em um sistema celular, caracterizado pelo fato de que compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por mutagênese endógena direcionada saturada (STEME), ou uma sequência que codifica o mesmo, no sistema celular; (d) obter um sistema celular que compreende pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (e) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (f) rastrear a população M0 do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e (g) identificar e, assim, selecionar um fenótipo agronomi-
camente importante no sistema celular, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
2. Método de identificação de um fenótipo agronomicamen- te importante em um sistema celular, caracterizado pelo fato de que compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no material genético do sistema celular; (d) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (e) cruzar a população M0 do sistema celular com uma po- pulação de tipo selvagem do sistema celular que compreende pelo menos uma sequência de ácidos nucleicos de interesse para obter uma população de progênie do sistema celular; (f) obter uma população de progênie do sistema celular que tem pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (g) rastrear a população de progênie do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo me- nos uma modificação em pelo menos um ácido nucleico de interesse; e (h) identificar e, assim, selecionar um fenótipo agronomi- camente importante no sistema celular, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
3. Método de geração de um sistema celular modificado que tem um fenótipo agronomicamente importante, caracterizado pelo fato de que o método compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no sistema celular; (d) obter um sistema celular que compreende pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (e) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (f) rastrear a população M0 do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e (g) identificar e, assim, selecionar um sistema celular da população M0 que tem o fenótipo agronomicamente importante; e (h) obter um sistema celular modificado que tem o fenótipo agronomicamente importante, em que a matriz de RNAs guia do pelo menos um editor de bases completa x compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
4. Método de geração de uma progênie de um sistema ce- lular modificado que tem um fenótipo agronomicamente importante, caracterizado pelo fato de que o método compreende as seguintes etapas: (a) selecionar pelo menos uma sequência de ácidos nuclei- cos de interesse no material genético do sistema celular; (b) fornecer pelo menos um complexo editor de bases, ou uma sequência que codifica o mesmo, em que o pelo menos um com- plexo editor de bases compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; ou fornecer pelo me- nos um complexo editor por meio de mutagênese endógena direciona- da saturada (STEME), ou uma sequência que codifica o mesmo, em que o pelo menos um complexo STEME compreende uma matriz de RNAs guia, ou uma sequência que codifica os mesmos, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; (c) introduzir o pelo menos um complexo editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um complexo editor por meio de mutagênese endógena direcionada saturada (STE- ME), ou uma sequência que codifica o mesmo, no material genético do sistema celular; (d) cultivar o sistema celular sob condições para obter uma população M0 do sistema celular; (e) cruzar a população M0 do sistema celular com uma po- pulação de tipo selvagem do sistema celular que compreende pelo menos uma sequência de ácidos nucleicos de interesse para obter uma população de progênie do sistema celular; (f) obter uma população de progênie do sistema celular que tem pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; (g) rastrear a população de progênie do sistema celular quanto ao fenótipo agronomicamente importante associado a pelo me- nos uma modificação em pelo menos um ácido nucleico de interesse; e (h) identificar e, assim, selecionar um sistema celular da população de progênie com o fenótipo agronomicamente importante, (i) obter uma progênie de um sistema celular modificado que tem o fenótipo agronomicamente importante, em que a matriz de RNAs guia do pelo menos um complexo editor de bases compreende pelo menos duas moléculas de RNA guia, ou uma sequência que codifica as mesmas, que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse; e em que a matriz de RNAs guia do pelo menos um complexo STEME compreende pelo menos uma molécula de RNA guia, ou uma sequência que codifica a mesma, que tem como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
5. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a matriz de RNAs guia compreende pelo menos duas, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, pelo menos dez, pelo menos onze, pelo menos do- ze, pelo menos treze, pelo menos quatorze, pelo menos quinze, pelo menos dezesseis, pelo menos dezessete, pelo menos dezoito, pelo menos dezenove, pelo menos vinte ou mais moléculas de RNA guias individuais que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que as moléculas de RNA guia têm como alvo fragmentos sobrepostos e/ou distintos da sequência de ácidos nucleicos de inte- resse.
7. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o pelo menos um comple- xo editor de bases ou um componente do mesmo ou o pelo menos um complexo STEME ou um componente do mesmo é introduzido como parte de pelo menos um plasmídeo, pelo menos um vetor ou pelo me- nos uma molécula de DNA linear, como molécula de RNA e/ou como um complexo pré-montado de RNA e/ou proteína.
8. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o pelo menos um comple- xo editor de bases ou pelo menos um complexo STEME é introduzido no sistema celular por meios biológicos ou físicos, incluindo transfec- ção, transformação, incluindo transformação por Agrobacterium spp., de preferência Agrobacterium tumefaciens, um vetor viral, bombardeio biolístico, transfecção usando reagentes químicos, incluindo transfec- ção de polietileno glicol ou qualquer combinação dos mesmos.
9. Método, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que a pelo menos uma se- quência de ácidos nucleicos de interesse é (um) gene(s) endógeno(s) ou elemento(s) genético(s) associado(s) a um fenótipo agronomica- mente importante.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o(s) gene(s) endógeno(s) é/são selecionado(s) a par- tir do grupo que consiste em um gene que codifica resistência ou tole- rância ao estresse abiótico, incluindo estresse hídrico, estresse osmó- tico, estresse por calor, estresse por frio, estresse oxidativo, estresse por metais pesados, deficiência de nitrogênio, deficiência de fosfato, estresse salino ou alagamento, resistência a herbicidas, incluindo re- sistência ao glifosato, glufosinato/fosfinotricina, higromicina, inibidores de protoporfirinogênio oxidase (PPO), ALS inibidores e Dicamba, um gene que codifica resistência ou tolerância ao estresse biótico, incluin- do um gene de resistência viral, um gene de resistência fúngica, um gene de resistência bacteriana, um gene de resistência a insetos ou um gene que codifica um traço relacionado ao rendimento, incluindo resistência ao acamamento, tempo de floração, resistência à deiscên- cia, cor da semente, composição do endosperma ou teor nutricional.
11. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o(s) elemento(s) genético(s) é/são pelo menos parte de uma sequência reguladora, em que a sequência reguladora com- preende pelo menos um dentre uma sequência promotora central, uma sequência promotora proximal, uma sequência cis reguladora, uma sequência trans reguladora, uma sequência de controle de locus, uma sequência isoladora, uma sequência silenciadora, uma sequência in- tensificadora, uma sequência terminadora e/ou qualquer combinação das mesmas.
12. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que o pelo menos um complexo editor de bases induz a pelo menos 1, pelo menos 2, pelo menos 3, pelo menos 4, pelo menos 5, pelo menos 6, pelo menos 7, pelo menos 8, pelo menos 9, pelo menos 10, pelo menos 11, pelo me- nos 12, pelo menos 13, pelo menos 14, pelo menos 15, pelo menos 16, pelo menos 17, pelo menos 18, pelo menos 19, pelo menos 20, pelo menos 21, pelo menos 22, pelo menos 23, pelo menos 24, pelo menos 25 ou ainda mais substituição(ões) de nucleotídeos na sequên- cia de ácidos nucleicos de interesse.
13. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que pelo menos um componente editor de bases do pelo menos um complexo editor de bases compreende pelo menos um domínio de reconhecimento de ácidos nucleicos e pelo menos um domínio de edição de ácidos nu- cleicos e o pelo menos um STEME componente do pelo menos um complexo STEME compreende pelo menos um domínio de reconhe- cimento de ácidos nucleicos e pelo menos dois domínios de edição de ácidos nucleicos, em que o pelo menos um domínio de reconhecimen- to de ácidos nucleicos é independentemente selecionado a partir da versão desarmada e de nickase de qualquer nucleases CRISPR inclu- indo, porém sem limitações, CRISPR-dCas9, CRISPR-dCpf1, CRISPR-dCsm1, CRISPR-dCasX, CRISPR-dCasY, CRISPR-dMAD7, CRISPR-Cas9, CRISPR-nickase Cpf1, CRISPR-nickase Csm1 CRISPR-CasY, CRISPR-nickase CasY ou CRISPR-nickase MAD7, e em que o pelo menos um ou pelo menos dois domínios de edição de ácidos nucleicos são independentemente selecionados a partir de uma citidina desaminase ou uma adenina desaminase, de preferência em que o pelo menos um mRNA de desaminase da família do complexo de edição-mRNA de apolipoproteína B (APOlipoprotein B mRNA- Editing Complex, APOBEC), de preferência uma APOBEC derivada de rato, uma citidina desaminase induzida por ativação (Activation- Induced cytidine Desaminase, AID), uma desaminase ACF1/ASE, uma desaminase da família ADAT, uma desaminase ADAR2 ou uma de- saminase PmCD A1, uma desaminase derivada de TadA e/ou qual- quer combinação, variante ou fragmento cataliticamente ativo das mesmas, e em que o pelo menos um componente editor de bases compreende opcionalmente pelo menos um sinal de localização nu- clear, e em que o pelo menos um componente editor de bases com- preende opcionalmente pelo menos uma sequência ligante, de prefe- rência um ligante XTEN, e em que o pelo menos um componente edi- tor de bases compreende opcionalmente pelo menos um componente que inibe o reparo de DNA ou RNA de ocorrência natural, de preferên- cia um domínio de inibidor de glicosilase de DNA de uracila (Uracil
Glycosylase Inhibitor, UGI), um domínio de proteína Gam do bacterió- fago Mu ou um inibidor do domínio de reparo por excisão de base ino- sina.
14. Método, de acordo com a reivindicação 13, caracteriza- do pelo fato de que o pelo menos um componente editor de bases, ou a sequência que codifica o mesmo, ou o pelo menos um componente STEME, ou a sequência que codifica o mesmo, é fornecido como uma molécula de fusão.
15. Método, de acordo com a reivindicação 13, caracteriza- do pelo fato de que os componentes do complexo editor de bases ou as sequências que os codificam ou os componentes do complexo STEME ou as sequências que codificam o mesmo, são fornecidos co- mo moléculas individuais.
16. Método, de acordo com qualquer uma das reivindica- ções precedentes, caracterizado pelo fato de que o sistema celular é selecionado a partir de um organismo eucariota, em que o organismo eucariota é uma planta, parte de uma planta ou uma célula de planta.
17. Método, de acordo com a reivindicação 16, caracteriza- do pelo fato de que a parte da planta é selecionada a partir do grupo que consiste em folhas, caules, raízes, radículas emergidas, flores, partes de flores, pétalas, frutas, pólen, tubos polínicos, filamentos de anteras, óvulos, sacos embrionários, óvulos, ovários, zigotos, embri- ões, embriões zigóticos, embriões somáticos, meristemas apicais, fei- xes vasculares, periciclos, sementes, raízes e cortes.
18. Método, de acordo com a reivindicação 16 ou 17, carac- terizado pelo fato de que a planta, parte de uma planta ou célula de planta é ou se origina de, uma espécie de planta selecionada a partir do grupo que consiste em: Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea mays, Setaria italica, Oryza minuta, Oriza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Secale cereale, Malus domestica, Brachypodium distach- yon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyp- tus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Solanum lycopersicum, Solanum tuberosum, Coffea ca- nephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Morus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Ara- bidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oele- racia, Brassica rapa, Raphanus sativus, Brassica juncea, Brassica ni- gra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yama-shitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Astragalus sinicus, Lotus japonicas, Torenia fournieri, Spinacea olera- cea, Phaseolus vulgaris, Vicia faba, Allium cepa, Allium fistulosum, Al- lium sativum e Allium tuberosum.
19. Sistema celular modificado, caracterizado pelo fato de que é obtido por meio de um método como definido em qualquer uma das reivindicações 3 a 18.
20. Uso de pelo menos um complexo editor de bases ou pelo menos um complexo STEME que compreende uma matriz de RNAs guia que têm como alvo a pelo menos uma sequência de ácidos nucleicos de interesse no material genético de um sistema celular, ca- racterizado pelo fato de que é para: (a) gerar um sistema celular que tem um fenótipo agrono- micamente importante associado a pelo menos uma modificação em pelo menos uma sequência de ácidos nucleicos de interesse; e/ou (b) identificar um fenótipo agronomicamente importante as-
sociado a pelo menos uma modificação em pelo menos uma sequên- cia de ácidos nucleicos de interesse no material genético do sistema celular.
BR112021008427A 2018-11-01 2019-11-04 Mutagênese direcionada usando editores de bases BR112021008427A8 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862754281P 2018-11-01 2018-11-01
US62/754,281 2018-11-01
PCT/EP2019/080140 WO2020089489A1 (en) 2018-11-01 2019-11-04 Targeted mutagenesis using base editors

Publications (2)

Publication Number Publication Date
BR112021008427A2 true BR112021008427A2 (pt) 2021-09-28
BR112021008427A8 BR112021008427A8 (pt) 2023-05-09

Family

ID=68470510

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021008427A BR112021008427A8 (pt) 2018-11-01 2019-11-04 Mutagênese direcionada usando editores de bases

Country Status (6)

Country Link
US (1) US20210403901A1 (pt)
EP (1) EP3956443A1 (pt)
CN (1) CN113874501A (pt)
BR (1) BR112021008427A8 (pt)
CA (1) CA3118340A1 (pt)
WO (1) WO2020089489A1 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2021212189A1 (en) * 2020-01-30 2022-08-04 Pairwise Plants Services, Inc. Compositions, systems, and methods for base diversification
CN111549053B (zh) * 2020-05-22 2022-06-07 北京市农林科学院 一种花椰菜单核苷酸突变的方法
CN113215190B (zh) * 2021-06-03 2022-09-27 西南大学 CRISPR/Cas9介导的基因编辑技术制备柑橘纯合突变体的方法
WO2023050158A1 (zh) * 2021-09-29 2023-04-06 深圳先进技术研究院 一种实现多碱基编辑的方法
CN114395585B (zh) * 2022-01-12 2024-03-08 中国科学院天津工业生物技术研究所 用于碱基编辑的组合物
IL292199B2 (en) * 2022-04-12 2024-02-01 Plantarc Bio Ltd A method for optimizing gene expression levels in plants
WO2023232024A1 (en) * 2022-05-30 2023-12-07 Wuhan University System and methods for duplicating target fragments
WO2023247753A1 (en) * 2022-06-23 2023-12-28 BASF Agricultural Solutions Seed US LLC Diversifying base editing
CN115820691B (zh) * 2022-07-25 2023-08-22 安徽农业大学 一种基于LbCpf1变体的水稻碱基编辑系统和应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
CN111500570A (zh) 2014-03-05 2020-08-07 国立大学法人神户大学 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体
EP3186381B1 (en) * 2014-08-28 2022-07-06 KWS SAAT SE & Co. KGaA Generation of haploid plants
EP3095870A1 (en) * 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
JP7067793B2 (ja) 2015-10-23 2022-05-16 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸塩基編集因子およびその使用
JP7231935B2 (ja) 2016-08-03 2023-03-08 プレジデント アンド フェローズ オブ ハーバード カレッジ アデノシン核酸塩基編集因子およびそれらの使用
US20200190527A1 (en) * 2017-02-15 2020-06-18 Keygene N.V. Methods of targeted genetic alteration in plant cells

Also Published As

Publication number Publication date
CN113874501A (zh) 2021-12-31
US20210403901A1 (en) 2021-12-30
WO2020089489A1 (en) 2020-05-07
CA3118340A1 (en) 2020-05-07
BR112021008427A8 (pt) 2023-05-09
EP3956443A1 (en) 2022-02-23

Similar Documents

Publication Publication Date Title
BR112021008427A2 (pt) Mutagênese direcionada usando editores de bases
D’Ambrosio et al. CRISPR/Cas9 editing of carotenoid genes in tomato
US20220267788A1 (en) Creation of herbicide resistant gene and use thereof
CN107043775B (zh) 一种能促进棉花侧根发育的sgRNA及其应用
US20190330647A1 (en) Methods and compositions for multiplex rna guided genome editing and other rna technologies
JP2019523011A (ja) 植物における塩基編集のための方法
US20200140874A1 (en) Genome Editing-Based Crop Engineering and Production of Brachytic Plants
BR112020010594A2 (pt) método para edição de bases em plantas
BR112020012327A2 (pt) sistemas de regulação de transcrição com base em cpf1 em plantas
EP3752619A1 (en) Methods and compositions for increasing harvestable yield via editing ga20 oxidase genes to generate short stature plants
BR112019025498A2 (pt) Planta de banana e sua parte, método para produção e aumento da meia-vida de banana, fruto, construto de ácido nucleico, planta ou método ou produtos processados
CN115315516A (zh) 一种提高植物遗传转化和基因编辑效率的方法
WO2020020193A1 (zh) 基于人apobec3a脱氨酶的碱基编辑器及其用途
EP3752622A1 (en) Methods and compositions for increasing harvestable yield via editing ga20 oxidase genes to generate short stature plants
WO2019234132A1 (en) Base editing in polymerase theta deficient plants
US20220195445A1 (en) Methods and compositions for generating dominant short stature alleles using genome editing
KR20190122595A (ko) 식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법
Rahim et al. CRISPR/Cas9 mediated TaRPK1 root architecture gene mutagenesis confers enhanced wheat yield
JP7452884B2 (ja) Dnaが編集された植物細胞を製造する方法、及びそれに用いるためのキット
Viviani et al. Origin of the genome editing systems: application for crop improvement
US20220195450A1 (en) Methods and compositions for generating dominant short stature alleles using genome editing
Brant et al. The extent of multiallelic, co‐editing of LIGULELESS1 in highly polyploid sugarcane tunes leaf inclination angle and enables selection of the ideotype for biomass yield
Kim et al. The strategy of knock-in with homology-directed genome editing in the model ornamental plant Petunia using CRISPR/Cas9 ribonucleoprotein complex
Kanwal et al. Evolution of genome editing technologies
Tsakirpaloglou et al. Gene and base editing tools to accelerate cereal improvement

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: KWS SAAT SE AND CO. KGAA (DE) ; SHANGHAI BLUECROSS MEDICAL SCIENCE INSTITUTE (CN)

B25A Requested transfer of rights approved

Owner name: KWS SAAT SE AND CO. KGAA (DE) ; SUZHOU QI BIODESIGN BIOTECHNOLOGY COMPANY LIMITED (CN)