BR112020010594A2 - método para edição de bases em plantas - Google Patents

método para edição de bases em plantas Download PDF

Info

Publication number
BR112020010594A2
BR112020010594A2 BR112020010594-5A BR112020010594A BR112020010594A2 BR 112020010594 A2 BR112020010594 A2 BR 112020010594A2 BR 112020010594 A BR112020010594 A BR 112020010594A BR 112020010594 A2 BR112020010594 A2 BR 112020010594A2
Authority
BR
Brazil
Prior art keywords
plant
fact
fusion protein
editing
seq
Prior art date
Application number
BR112020010594-5A
Other languages
English (en)
Inventor
Caixia GAO
Chao Li
Yuan ZONG
Yanpeng WANG
Original Assignee
Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences filed Critical Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences
Publication of BR112020010594A2 publication Critical patent/BR112020010594A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

A invenção refere-se ao campo da engenharia genética. Em particular, a invenção refere-se a um método para edição de bases em plantas. Mais especificamente, a presente invenção refere-se a um método altamente eficiente de edição da base A pela base G em uma sequência alvo no genoma de uma planta (por exemplo, uma planta de cultura) por uma proteína de fusão CRISPR direcionado por RNA guia-adenina desaminase, e a planta e suas progênies produzidas pelo método.

Description

Relatório Descritivo da Patente de Invenção para "MÉTODO PARA EDIÇÃO DE BASES EM PLANTAS". Campo Técnico
[001] A invenção refere-se ao campo da engenharia genética. Em particular, a invenção refere-se a um método para edição de bases em plantas. Mais especificamente, a presente invenção refere-se a um mé- todo altamente eficiente de edição da base A pela base G em uma se- quência alvo no genoma de uma planta (por exemplo, uma planta de cultura) por uma proteína de fusão CRISPR direcionada por RNA guia- adenina desaminase, e a planta e suas progênies produzidas pelo mé- todo. Antecedentes da Técnica
[002] O pré-requisito para o melhoramento eficiente de culturas é a capacidade de obter novas mutações genéticas que possam ser fa- cilmente introduzidos em cultivares modernos. Estudos genéticos, es- pecialmente aqueles baseados no genoma total, já demonstraram que mudanças em nucleotídeos individuais constituem os principais moti- vos para diferenças nos traços das culturas. Variações de bases indivi- duais resultam em substituições aminoacídicas que levam à evolução de alelos superiores e traços superiores. Antes do surgimento da edi- ção de genoma, o direcionamento de lesões locais induzidas em ge- nomas (TILLING) podia ser usado como um método para gerar muta- ções que são urgentemente necessárias no melhoramento de culturas. No entanto, o rastreamento de TILLING é demorado e trabalhoso, e as mutações pontuais identificadas são frequentemente limitadas tanto em números como em tipos das mesmas. Técnicas de edição de ge- noma, particularmente aquelas baseadas no sistema CRISPR/Cas9, permitem a introdução de substituições de bases específicas em loci genômicos pela via de reparo de DNA mediado por recombinação ho- móloga (HR). No entanto, o uso bem-sucedido deste método atualmen-
te é limitado, principalmente devido à baixa frequência de reparo medi- ado por HR de cadeias de cordão duplo quebradas em plantas. Além disso, o fornecimento efetivo de uma quantidade suficiente de templa- tes de reparo de DNA também é uma dificuldade importante. Estes problemas tornam um desafio a obtenção eficiente e simples de muta- gênese sítio-direcionada em plantas através de HR.
[003] Atualmente, a edição da base C para a base T em plantas foi obtida com o uso de uma proteína de fusão de Cas9 e citosina de- saminase. No entanto, métodos para mutações pontuais de A por G nos genomas das plantas continuam sendo uma necessidade premen- te no estado da técnica. Breve Descrição da Invenção
[004] No primeiro aspecto, a presente invenção apreseta um sis- tema para edição de bases de uma sequência alvo no genoma de uma planta, compreendendo pelo menos um dos seguintes itens i) a v): i) uma proteína de fusão editora de bases, e um RNA guia; ii) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases, e um RNA guia; iii) uma proteína de fusão editora de bases, e um construto de expressão compreendendo uma sequência de nucleotídeos codifi- cando um RNA guia; iv) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases, e um construto de expressão compreendendo uma sequência de nucleotídeos codificando um RNA guia; v) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases e uma sequência de nucleotídeos codificando um RNA guia; em que a proteína de fusão editora de bases compreende uma proteína efetora CRISPR com nuclease inativada (tal como Cas9,
Cpf1 entre outras) e adenina desaminase DNA-dependente, sendo o RNA guia capaz de orientar a proteína de fusão editora de bases para uma sequência alvo no genoma de uma planta, sendo que dessa for- ma a proteína de fusão editora de bases resulta em um ou mais A sen- do substituído por G na sequência alvo.
[005] No segundo aspecto, a invenção oferece um método de produção de uma planta geneticamente modificada, compreendendo a introdução de um sistema da invenção para editar bases de uma se- quência alvo no genoma de planta na planta, por meio do que o RNA guia direciona a proteína de fusão editora de bases para uma sequên- cia alvo no genoma de uma planta, resultando em um ou mais A sendo substituídos por G na sequência alvo.
[006] No terceiro aspecto, a presente invenção apresenta uma planta geneticamente modificada ou uma progênie da mesma, onde a planta é obtida pelo método da invenção.
[007] No quarto aspecto, a presente invenção apresenta um mé- todo de cultivo de plantas compreendendo o cruzamento de uma pri- meira planta contendo uma modificação genética obtida pelo método acima da presente invenção com uma segunda planta não contendo a modificação genética, sendo que dessa forma a modificação genética é introduzida na segunda planta. Descrição dos desenhos
[008] Figura 1. Construto de edição da base adenina adequado para edição em células vegetais.
[009] Figura 2. O sistema de edição da base adenina permite a edição de bases de genes de GFP exógenos em protoplastos de plan- ta.
[0010] Figura 3. Edição de bases de genes endógenos de plantas pelo sistema de edição da base adenina.
[0011] Figura 4. Edição de bases de genes endógenos de plantas por diferentes construtos de edição da base adenina.
[0012] Figura 5. Construtos PABE-1 a PABE-7 e resultados da edi- ção de seus genes.
[0013] Figura 6. Edição de genes endógenos em arroz por PABE-2 e por PABE-7.
[0014] Figura 7. Diagrama esquemático de três formatos de sgR- NA nos quais o promotor U3 de arroz, o promotor U6 de trigo, o cada- falso de sgaRNA, o cadafalso de esgRNA, e sequências de tRNA estão representados em azul, roxo, vermelho, verde, e marrom, respectiva- mente; o sítio de início de transcrição está representado com realce amarelo; as setas indicam o sítio de clivagem Z de RNase; os trechos sublinhados representam sítios de restrição Bsal, o oligonucleotídeo temperado pode ser usado para inserir a sequência condutora entre os dois sítios Bsal.
[0015] Figura 8. Efeito de diferentes formatos de saRNA na edição de genes.
[0016] Figura 9. Pureza do produto da edição de um locus genômi- co de arroz pelo ABE de plantas, onde a distribuição do produto e a frequência de mutação para indel foram detectadas em 10 sítios repre- sentativos de DNA genômico de arroz, as amostras eram protoplastos de arroz tratados com PABE-7 e sgRNA, esgRNA e tRNA-sgRNA nati- vos correspondentes; foi usado um total de 48.616-111.697 leituras de sequenciamento em cada posição.
[0017] Figura 10. Pureza do produto da edição de um locus genô- mico de trigo pelo ABE de plantas, onde a distribuição do produto e a frequência de mutação para indel foram detectadas em 3 sítios repre- sentativos de DNA genômico de trigo, as amostras eram protoplastos de arroz tratados com PABE-7 e sgRNA, esgRNA e tRNA-sgRNA nati- vos correspondentes; foi usado um total de 28.110-28.4527 leituras de sequenciamento em cada posição.
[0018] Figura 11. Efeito dos formatos de saRNA nas mutações pa- ra indel.
[0019] Figura 12. Efeito do comprimento da sequência espaçadora na edição da base A para a base G.
[0020] Figura 13. Efeito do comprimento da sequência espaçadora nas mutações para indel.
[0021] Figura 14. Produção de plantas de arroz com substituições de A por G usando PABE-7.
[0022] Figura 15. Produção de plantas de trigo com substituições de A por G usando PABE-7.
[0023] Figura 16. Deteção de vetores transgênicos em plantas de trigo.
[0024] Figura 17. Arroz com resistência a herbicidas produzido por edição de bases.
Descrição Detalhada da Invenção
1. Definição
[0025] Na presente invenção, os termos científicos e técnicos usa- dos neste pedido possuem o significado comumente conhecido pelo especialista na técnica, a menos que especificado em contrário. Ainda, os termos relacionados com a química de proteínas e ácidos nucleicos, biologia molecular, cultura de células e tecidos, microbiologia, e imuno- logia, e os procedimentos laboratoriais usados neste pedido são ter- mos e etapas rotineiras que são amplamente usados no campo cor- respondente. Por exemplo, as técnicas tradicionais de DNA recombi- nante e clonagem molecular usadas na presente invenção são bastan- te conhecidas pelos especialistas na técnica e estão descritas de forma completa no seguinte documento: Sambrook, J., Fritsch, E.F. and Ma- niatis, T., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, 1989 (doravante denominado "Sambrook"). Entretanto, para uma melhor compreensão da presente invenção, as definições e explicações de termos relacionados estão apresentadas abaixo.
[0026] Conforme usado neste pedido, o termo "proteína efetora
CRISPR" geralmente refere-se a uma nuclease presente em um siste- ma CRISPR de ocorrência natural, assim como formas modificadas da mesma, variantes da mesma, e fragmentos cataliticamente ativos da mesma, entre outros. O termo abrange qualquer proteína efetora ba- seada no sistema CRISPR que permite a orientação de genes (por exemplo, edição de genes, regulação da orientação de genes, etc.) em uma célula.
[0027] Exemplos de "proteínas efetoras CRISPR" incluem nuclea- ses Cas9 ou variantes da mesma. A nuclease Cas9 pode ser uma nu- clease Cas9 de diferentes espécies, tal como spCas9 de S. pyogenes ou SaCas9 derivada de S. aureus. "Nuclease Cas9" e "Cas9" são usa- dos intercambiavelmente neste pedido e referem-se à nuclease direci- onada por RNA compreendendo uma proteína Cas9 ou um fragmento da mesma (por exemplo, uma proteína compreendendo um domínio de clivagem de DNA ativo da Cas9 e/ou um domínio de ligação de gRNA da Cas9). Cas9 é um componente do sistema de edição de genoma CRISPR/Cas (repetições palindrômicas curtas regulamente interespa- çadas conglomeradas) que orienta e cliva sequências de DNA alvo sob a orientação de um RNA guia para formar quebras no cordão duplo do DNA (DSB).
[0028] Exemplos de "proteínas efetoras CRISPR" também podem incluir Cpfl nucleases ou variantes das mesmas tais como variantes altamente específicas. A nuclease Cpf1 pode ser uma nuclease Cpf1 de uma espécie diferente, tal como uma nuclease Cpf1i de Francisella novicida U112, de Acidaminococcus sp. BV3L6, e de Lachnospiraceae bacterium ND2006.
[0029] Conforme usado neste pedido, "RNA" e "RNA guia" podem ser usados intercambiavelmente, e referem-se a uma molécula de RNA capaz de formar um complexo com uma proteína efetora CRISPR e capaz de orientar o complexo para uma sequência alvo devido a uma certa complementaridade com a sequência alvo. Por exemplo, em um sistema de edição de genes baseado na Cas9, os gRNAs são tipica- mente compostos de moléculas de crRNA e de tracrRNA formando complexos através do complemento parcial, onde o cr»RNA compreen- de uma sequência que é suficientemente complementar a uma se- quência alvo para hibridização e direciona o complexo CRISPR (Cas9+crRNAt+tracrRNA) para se ligar especificamente à sequência alvo. No entanto, já se sabe na literatura que é possível desenhar um RNA guia simples (sgaRNA) que compreende as características tanto do crRNA quanto do tracr»RNA. O RNA guia do sistema de edição de genoma mediado pela Cpf1 é tipicamente composto apenas de molé- culas de cr»RNA maduro, onde o crRNA compreende uma sequência que é suficientemente idêntica à sequência alvo para hibridizar para o com- plemento da sequência alvo e direcionar o complexo (Cpf1+crRNA) para ligar especificamente a sequência à sequência alvo. Os especialistas na técnica sabem como criar sequências de gRNA adequadas basea- das nas proteínas efetoras CRISPR usadas e as sequências alvo a se- rem editadas.
[0030] "Adenina desaminase" refere-se à adenina desaminase que é capaz de catalisar a formação de inosina (1) a partir de adenosina ou desoxiadenosina (A).
[0031] "Genoma" conforme usado neste pedido abrange não ape- nas o DNA cromossômico presente no núcleo, mas também o DNA organelar presente nos componentes subcelulares (por exemplo, mito- côndria, plastídeos) da célula.
[0032] Conforme usado neste pedido, o termo "planta" inclui uma planta inteira e qualquer descendente, célula, tecido, ou parte de uma planta. O termo "partes de planta" inclui qualquer parte de uma planta, incluindo, por exemplo, e sem limitação: semente (incluindo semente madura e semente imatura); uma muda da planta; uma célula da plan- ta; uma cultura de células vegetais; um órgão da planta (por exemplo, pólen, embriões, flores, frutos, brotos, folhas, raízes, talos, e explan-
tes). Um tecido vegetal ou órgão vegetal pode ser uma semente, pro- toplasto, calo, ou qualquer outro grupo de células vegetais que esteja organizado em uma unidade estrutural ou funcional. Uma cultura de célula ou tecido vegetal deve ser capaz de regenerar uma planta tendo as características fisiológicas e morfológicas da planta da qual a célula ou tecido foi obtido, e de regenerar uma planta tendo substancialmente o mesmo genótipo que a planta. Em contraste, algumas células vege- tais não são capazes de serem regeneradas para produzir plantas. As células regeneráveis em uma cultura de células ou tecido vegetal po- dem ser embriões protoplastos, células meristemáticas, calo, pólen, folhas, anteros, raízes, pontas de raiz, seda, flores, caroços, espigas, sabugos, cascas ou talos.
[0033] Partes de planta incluem partes colhíveis e partes úteis para propagação de plantas descendentes. Partes de planta úteis para pro- porção incluem, por exemplo, e sem limitação: sementes; frutos; mu- das; plântulas; tubérculos; e um porta-enxerto. Uma parte colhível de uma planta pode ser qualquer parte útil de uma planta, incluindo, por exemplo, e sem limitação: flor; pólen; plântula; tubérculo; folha; caule, furto; semente; e raiz.
[0034] Uma célula vegetal é a unidade estrutural e fisiológica da planta, e inclui células de protoplasto sem parede celular e células ve- getais com parede celular. Uma célula vegetal pode estar na forma de uma única célula isolada, ou de um agregado de células (por exemplo, um calo friável e uma célula de cultura), e pode ser qualquer parte de uma unidade organizada superior (por exemplo, um tecido vegetal, um órgão vegetal, e uma planta). Assim sendo, uma célula vegetal pode ser um protoplasto, uma célula produtora de gameta, ou uma célula ou coleção de células que podem regenerar-se em uma planta inteira. As- sim sendo, uma semente, que compreende múltiplas células vegetais e é capaz de se regenerar em uma planta inteira, é considerada uma "parte de planta" nas modalidades deste pedido.
[0035] O termo "protoplasto", conforme usado neste pedido, refere- se a uma célula vegetal que teve sua parede celular completa ou par- cialmente removida, com a membrana de sua bicamada lipídica nua. Tipicamente, um protoplasto é uma célula vegetal isolada sem paredes celulares que tem potência para regeneração em uma cultura de célu- las ou uma planta inteira.
[0036] "Progênie" de uma planta compreende qualquer geração subsequente da planta.
[0037] Uma "planta geneticamente modificada" inclui uma planta que compreende em seu genoma um polinucleotídeo exógeno. Por exemplo, o polinucleotídeo exógeno é integrado de forma estável no genoma de modo que o polinucleotídeo é passado para as gerações sucessivas. O polinucleotídeo exógeno pode ser integrado no genoma sozinho ou como parte de um construto de DNA recombinante. O gene ou sequência reguladora de expressão modificada significa que, no genoma da planta, a referida sequência compreende uma ou mais substituição, deleção ou adição de nucleotídeo. Por exemplo, uma planta geneticamente modificada obtida pela presente invenção pode compreender uma ou mais substituições de A por G em relação a um tipo selvagem (planta correspondente sem tal modificação genética).
[0038] "Exógeno" em relação a uma sequência significa uma se- quência de uma espécie estranha, ou refere-se a uma sequência na qual ocorrem alterações significativas na composição e/ou no locus de sua forma nativa através de intervenção humana deliberada se ela for da mesma espécie.
[0039] "Polinucleotídeo", "sequência de ácidos nucleicos", "se- quência de nucleotídeos" ou "fragmento de ácido nucleico" são usados intercambiavelmente e são polímeros de RNA ou de DNA de cordão simples ou de cordão duplo, opcionalmente contendo bases nucleotídi- cas sintéticas, não naturais ou alteradas. Os nucleotídeos são indica- dos por seus nomes de uma letra como a seguir: "A" é adenosina ou desoxiadenosina (correspondendo ao RNA ou DNA, respectivamente), "C" significa citidina ou desoxicitidina, "G" significa guanosina ou deso- xiguanosina, "U" representa uridina, "T" significa desoxitimidina, "R" significa purina (A ou G), "Il" significa pirimidina (C ou T), "K" significa G ou T, "H" significa A ou C ou T, "Il" significa inosina, e "N" significa qualquer nucleotídeo.
[0040] "Polipeptídio", "peptídio", e "proteína" são usados intercam- biavelmente na presente invenção para indicar um polímero de resí- duos aminoacídicos. Os termos se aplicam a um polímero de aminoá- cido no qual um ou mais resíduos aminoacídicos são análogos quími- cos artificiais dos aminoácidos de ocorrência natural correspondentes, bem como se aplicam a um polímero de aminoácido de ocorrência na- tural. Os termos "polipeptídio", "peptídio", "sequência de aminoácidos" e "proteína" também incluem formas modificadas, incluindo, porém sem limitação, glicosilação, ligação de lipídios, sulfatação e carboxila- ção de resíduos ácido glutâmico, e ribosilação de ADP.
[0041] Conforme usado na presente invenção, "construto de ex- pressão" refere-se a um vetor tal como um vetor recombinante que é adequado para expressão de uma sequência de nucleotídeos de inte- resse em uma planta. "Expressão" refere-se à produção de um produto funcional. Por exemplo, expressão de uma sequência de nucleotídeos pode indicar a transcrição de uma sequência de nucleotídeos (por exemplo, transcrição para produzir MRNA ou RNA funcional) e/ou a translação de um RNA em uma proteína precursora ou madura.
[0042] O "construto de expressão" da presente invenção pode ser um fragmento de ácido nucleico linear, um plasmídio circular, um vetor viral ou, em algumas modalidades, um RNA que é capaz de translação (tal como mMRNA).
[0043] O "construto de expressão" da presente invenção pode compreender sequências reguladoras e sequências de nucleotídeos de interesse de diferentes origens, ou sequências reguladoras e sequên-
cias de nucleotídeos de interesse da mesma fonte, porém dispostas de maneira diferente daquele que normalmente ocorre na natureza.
[0044] "Sequência reguladora" e "elemento regulador" são usados intercambiavelmente para indicar uma sequência de nucleotídeos que fica localizada a montante (sequência não codificadora 5'), no centro ou a jusante (sequência não codificadora 3') de uma sequência codifi- cadora e afeta a transcrição, o processamento do RNA ou a estabilida- de ou translação da sequência codificadora relevante. Elementos regu- ladores da expressão em plantas indicam sequências de nucleotídeos que são capazes de controlar a transcrição, o processamento do RNA ou estabilidade ou translação de uma sequência de nucleotídeos de interesse em uma planta.
[0045] Sequências reguladoras podem incluir, porém sem limita- ção, promotores, condutores de translação, introns e sequências de reconhecimento de poliadenilação.
[0046] "Promotor" refere-se a um fragmento de ácido nucleico ca- paz de controlar a transcrição de um outro fragmento de ácido nuclei- co. Em algumas modalidades da presente invenção, o promotor é um promotor capaz de controlar a transcrição de um gene em uma célula vegetal, seja ele derivado ou não da célula vegetal. O promotor pode ser um promotor constitutivo ou um promotor tecido específico ou um promotor regulado pelo desenvolvimento ou um promotor induzível.
[0047] "Promotor constitutivo" refere-se a um promotor que em ge- ral pode fazer com que o gene seja expresso, na maioria dos casos, na maioria dos tipos de célula. "Promotor tecido-específico" e "promotor tecido-preferido" são usados intercambiavelmente e significam que eles são expressos principalmente, porém não necessariamente exclu- sivamente, em um tecido ou órgão, mas também em uma célula ou tipo de célula específico. "Promotor regulado pelo desenvolvimento" refere- se a um promotor cuja atividade é ditada por eventos de desenvolvi- mento. O "promotor induzível" expressa seletivamente sequências de
DNA operacionalmente ligadas em resposta a um estímulo endógeno ou exógeno (ambiente, hormônios, sinais químicos, etc.).
[0048] Conforme usado neste pedido, o termo "operacionalmente ligado" refere-se à ligação de um elemento regulador (por exemplo, porém sem limitação, uma sequência promotora, uma sequência de término de transcrição, etc.) a uma sequência de ácidos nucleicos (por exemplo, uma sequência codificadora ou uma fase de leitura aberta) de modo que a transcrição da sequência de nucleotídeos seja contro- lada e regulada pelo elemento regulador de transcrição. Técnicas para ligar operacionalmente regiões de elementos reguladres a moléculas de ácido nucleico são conhecidas no estado da técnica.
[0049] "Introdução" de uma molécula de ácido nucleico (por exem- plo, plasmídio, fragmento de ácido nucleico linear, RNA, etc.) ou prote- Ína em uma planta significa que o ácido nucleico ou proteína é usada para transformar uma célula vegetal de modo que o ácido nucleico ou a proteína seja cpaz de funcionar na célula vegetal. Conforme usado na presente invenção, "transformação" inclui transformações tanto es- táveis quanto transitórias.
[0050] "Transformação estável" refere-se à introdução de sequên- cias de nucleotídeos exógenas no genoma da planta, resultando na herança estável de genes estranhos. Uma vez estravelmente transfor- madas, a sequência de nucleotídeos exógeno é estavelmente integra- da no genoma da planta e em qualquer de suas sucessivas gerações.
[0051] "Transformação transitória" refere-se à introdução de uma molécula de ácido nucleico ou proteína em uma célula vegetal, desem- penhando uma função sem a herança estável de um gene exógeno. Na transformação transitória, as sequências de nucleotídeos exógenas não são integradas no genoma da planta.
[0052] "Traço" refere-se a características fisiológicas, morfológicas, bioquímicas ou físicas de uma planta ou de um material ou célula parti- cular da planta. Em algumas modalidades, a característica é visível a olho nu, tal como o tamanho da semente ou da planta, ou pode ser medida por técnicas bioquímicas, tal como detecção do teor de proteí- na, amido, ou óleo na semente ou nas folhas, ou por observação de um processo metabólico ou fisiológico, por exemplo, por medição da tolerância à privação de água ou das concentrações de sais ou açúca- res específicos, ou por observação do nível de expressão de um gene ou genes, ou por observações agrícolas tais como tolerância ao es- tresse osmótico ou rendimento. Em algumas modalidades, traço tam- bém inclui a resistência de uma planta a herbicidas.
[0053] "Traço agronômico" é um parâmetro mensurável que inclui, porém sem limitação, verdor das folhas, rendimento, taxa de cresci- mento, biomassa, peso fresco na maturação, peso seco na maturação, produção de frutos, produção de sementes, teor de nitrogênio total da planta, teor de nitrogênio nos frutos, teor de nitrogênio nas sementes, teor de nitrogênio em um tecido vegetativo, teor de aminoácidos livres totais na planta, teor de aminoácidos livres nos frutos, teor de aminoá- cidos livres nas sementes, teor de aminoácidos livres em um tecido vegetativo, teor de proteínas totais na planta, teor de proteínas nos fru- tos, teor de proteínas nas sementes, teor de proteínas em um tecido vegetativo, tolerância à seca, absorção de nitrogênio, alojamento da raiz, índice de colheita, alojamento do caule, altura da planta, altura da espiga, comprimento da espiga, resistência a doenças, tolerância ao frio, tolerância a sais, e número de rebentos e assim por diante.
2. Sistema de edição da base adenina para plantas
[0054] A presente invenção apresenta um sistema para edição de bases de uma sequência alvo no genoma de uma planta, compreen- dendo pelo menos um dos itens i) a v) a seguir: i) uma proteína de fusão editora de bases, e um RNA guia; ii) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases, e um RNA guia;
iii) uma proteína de fusão editora de bases, e um construto de expressão compreendendo uma sequência de nucleotídeos codifi- cando um RNA guia; iv) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases, e um construto de expressão compreendendo uma sequência de nucleotídeos codificando um RNA guia; v) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases e uma sequência de nucleotídeos codificando um RNA guia; em que a proteína de fusão editora de bases compreende uma proteína efetora CRISPR com nuclease inativada (tal como Cas9, Cpf1 entre outras) e adenina desaminase DNA-dependente, sendo o RNA guia capaz de orientar a proteína de fusão editora de bases para uma sequência alvo no genoma de uma planta, sendo que dessa for- ma a proteína de fusão editora de bases resulta em um ou mais A sen- do substituído por G na sequência alvo.
[0055] Conforme usado neste pedido, uma "proteína efetora CRISPR com nuclease inativada" refere-se a uma proteína efetora CRISPR que não possui a atividade de clivagem de ácido nucleico de cordão duplo, mas conserva a capacidade de orientação de DNA direcionada pelo gRNA. Uma proteína efetora CRISPR sem a atividade de clivagem de ácido nucleico de cordão duplo também abrange uma nicase que ape- nas forma um recorte em uma molécula de ácido nucleico de cordão duplo, mas não cliva completamente o ácido nucleico de cordão duplo.
[0056] Em algumas modalidades, a proteína efetora CRISPR com nuclease inativada é uma nuclease Cas9 inativada. Sabe-se que o domínio de clivagem de DNA da nuclease Cas9 compreende dois sub- domínios: o subdomínio nuclease HNH e o subdomínio RuvC. O sub- domínio HNH cliva um cordão complementar ao gRNA, enquanto que o subdomínio RuvC cliva o cordão não complementar. Mutações nestes subdomínios podem inativar a atividade de nuclease da Cas9, forman- do uma "nuclease Cas9 inativada". A nuclease Cas9 inativada ainda conserva a capacidade de ligação de DNA direcionada pelo gRNA. As- sim sendo, a princípio, quando fundida a uma outra proteína, a nu- clease Cas9 inativada pode orientar a proteína adicional para pratica- mente qualquer sequência de DNA simplesmente por coexpressão com um RNA guia adequado.
[0057] A adenina desaminase de ocorrência natural converte a adenosina em um RNA de cordão simples em inosina (1) por desami- nação usando RNA como um substrato. Recentemente, a adenina de- saminase DNA-dependente que converte desoxiguanosina em um DNA de cordão simples em inosina (1) usando DNA de cordão simples como um substrato foi obtida com base tRNA adenina desaminase Ta- dA de E. coli por meio de evolução direcionada. Vide Nicloe M. Gaudel- li et al., doi: 10.1038/nature 24644, 2017. No entanto, ainda não se sa- be e é difícil prever se tal adenina desaminase DNA-dependente pode funcionar em plantas.
[0058] Os presentes inventores descobriram surpreendentemente que proteínas efetoras de CRISPR com nuclease inativada (tal como nuclease Cas9 inativada) são fundidas a uma adenina desaminase DNA-dependente, e sob orientação de um RNA guia, a proteína de fu- são pode orientar uma sequência alvo no genoma de uma planta. De- vido à atividade deficiente da nuclease nas proteínas efetoras de CRISPR, os cordões duplos do DNA não são clivados, e a adenina de- saminase DNA-dependente na proteína de fusão é capaz de desami- nar a(s) adenosina(s) no DNA de cordão simples produzido durante a formação do complexo de proteínas efetoras de CRISPR-RNA qguia- DNA em uma inosina (1). Como a DNA polimerase trata a inosina (|) como guanina (G), a substituição de A por G pode ser obtida por repa- rado do malpareamento de bases.
[0059] Em algumas modalidades da presente invenção, a adenina desaminase DNA-dependente é uma variante da tRNA adenina desa- minase TadA de E. coli (ecTadA), em particular uma variante que pode aceitar um DNA de cordão simples como um substrato, a variante compreendendo, em relação ao ecTadA do tipo selvagem, um ou mais conjuntos de mutações selecionados do grupo que consiste em: 1) A106V e D108N; 2) D147Y e E155V; 3) L84F, H123Y e 1156F; 4) A142N; 5) H36L, R51L, S146C e K157N; 6) P48S/T/A; 7) A142N; 8) W23L/R; 9) R152H/P.
[0060] Em uma modalidade preferida da presente invenção, a adenina desaminase DNA-dependente compreende as seguintes mu- tações em relação ao ecTadA do tipo selvagem: W23R, H36L, R51L, S146C, K1I57N, A106V, D108N, P48A, L84F, H123Y, 1156F, D147Y, E155V, R152P.
[0061] A sequência de aminoácidos da EcTadA do tipo selvagem está mostrada como SEQ ID NO:1.
[0062] A sequência de aminoácidos de uma adenina desaminase DNA-dependente preferida derivada de ecTadA está mostrada na SEQ ID NO: 2.
[0063] A nuclease Cas9 inativada da presente invenção pode ser derivada da Cas9 de diferentes espécies, por exemplo, da Cas9 de S. pyogenes (SpCas9), ou da Cas9 de S. aureus (SaCas9). Mutação do subdomínio nuclease HNH e do subdomínio RuvC da Cas9 (por exem- plo, incluindo as mutações D10A e H840A) vai inativar a nuclease Cas9 em nuclease Cas9 morta (dCas9). A inativação por mutação em um dos subdomínios permite que a Cas9 tenha atividade de nicase,
i.e., a obtenção da nicase Cas9 (nCas9), por exemplo, nCas9 apenas com a mutação D10A.
[0064] Assim sendo, em algumas modalidades da invenção, a nu- clease Cas9 inativada da invenção compreende uma substituição ami- noacídica D10A e/ou H840A em relação à Cas9 do tipo selvagem.
[0065] Em algumas modalidades preferidas da invenção, a nu- clease Cas9 inativada da invenção tem atividade de nicase. Sem nos atermos a qualquer teoria, acreditamos que o reparo do malpareamen- to de eucariotas direciona a remoção e o reparo de bases malpareadas pelos recortes no cordão de DNA. O malpareamento |:T formado pela adenina desaminase DNA-dependente pode ser reparado para A:T. Com a introdução de um recorte em uma cadeia contendo T não edita- da será possível reparar preferencialmente o malpareamento |:T para o C:G desejado. Aasim sendo, de preferência, a nuclease Cas9 inativada é uma nicase Cas9 que conserva a atividade de clivagem do subdomí- nio HNH da Cas9, enquanto que while a atividade de clivagem do sub- domínio RuvC é inativado. Por exemplo, a nuclease Cas9 inativada compreende uma substituição aminoacídica D10A em relação à Cas9 do tipo selvagem.
[0066] Em algumas modalidades da invenção, a nuclease Cas9 inativada também pode compreender mutações adicionais. Por exem- plo, a nuclease SpCas9 inativada também pode compreender uma mu- tação VOR ou VRER e a SaCas9 inativada também pode compreender uma mutação KKH (Kim et al. Nat. Biotechnol. 35, 371-376.).
[0067] Em algumas modalidades da invenção, a nuclease SpCas9 inativada compreende a sequência de aminoácidos apresentada na SEQ ID NO:3.
[0068] Em algumas modalidades da presente invenção, a desami- nase é fundida ao terminal N de proteínas efetoras de CRISPR com nuclease inativada (por exemplo, nuclease Cas9 inativada).
[0069] Em algumas modalidades preferidas, o terminal N da ade-
nina desaminase DNA-dependente é fundido com uma adenina desa- minase do tipo selvagem correspondente. Espera-se que a formação de heterodímeros entre a adenina desaminase DNA-dependente e a adenina desaminase do tipo selvagem possa aumentar significativa- mente a ativação de edição de A em G da proteína de fusão.
[0070] Em algumas modalidades da presente invenção, a adenina desaminase DNA-dependente e as proteínas efetoras de CRISPR com nuclease inativada são fundidas via um ligador. O ligador pode ter 1-50 (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17,18, 19, 20 ou 20-25, 25-50) aminoácidos de comprimento, ou sequências de aminoácidos não funcionais com mais aminoácidos e sem estruturas secundários ou superiores. Por exemplo, o ligador pode ser um ligador flexível tal como GGGGS, GS, GAP, (GGGGS) x 3, GGS e (GGS) x7, en- tre outros. De preferência, o ligador tem 32 aminoácidos de comprimento. Em algumas modalidades preferidas, a sequência de aminoácidos do ligador é: SEGSSGGSSGSETPGTSESATPESSGGSSGGS.
[0071] Em algumas modalidades da presente invenção, as proteí- nas de fusão editoras de bases da presente invenção compreendem ainda uma sequência de localização nuclear (NLS). Em geral, uma ou mais NLSs na proteína de fusão editora de bases deve ser de resistên- cia suficiente para forçar a proteína de fusão editora de bases no nú- cleo de uma célula vegetal a atingir um acúmulo quantitativo da função de edição de bases. Em geral, a intensidade da atividade de localiza- ção nuclear é determinada pelo número, localização, uma ou mais NLSs específicas usadas na proteína de fusão editora de bases, ou uma combinação destes fatores.
[0072] Em algumas modalidades da presente invenção, a NLS da proteína de fusão editora de bases da presente invenção pode estar localizada no terminal N e/ou no terminal C. Em algumas modalidades da invenção, a NLS da proteína de fusão editora de bases da invenção pode estar entre a adenina desaminase e a proteína efetora CRISPR com nuclease inativada. Em algumas modalidades da invenção, a NLS da proteína de fusão editora de bases da invenção pode estar entre a adenina desaminase DNA-dependente e a proteína efetora CRISPR com nuclease inativada. Em algumas modalidades, a proteína de fusão editora de bases compreende cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais NLSs. Em algumas modalidades, a proteína de fusão editora de bases compreende cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais NLS no terminal N ou perto deste. Em algumas modalidades, a proteína de fu- são editora de bases compreende cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais NLSs no terminal C ou perto deste. Em algumas modalidades, a proteína de fusão editora de bases compreende uma combinação destes, tal como compreende uma ou mais NLSs no terminal N e uma ou mais NLSs no terminal C. Quando há mais de uma NLS, cada uma delas pode ser selecionada independentemente das outras NLSs. Em algumas modalidades preferidas da presente invenção, a proteína de fusão editora de bases compreende pelo menos 2 NLSs, por exemplo, as pelo menos 2 NLSs estão localizadas no terminal C. Em algumas modalidades preferidas, a NLS está no terminal C da proteína de fusão editora de bases. Em algumas modalidades preferidas da presente in- venção, a proteína de fusão editora de bases compreende pelo menos 3 NLSs. Em modalidades mais preferidas da presente invenção, a pro- teína de fusão editora de bases compreende pelo menos 3 NLSs no terminal C. Em algumas modalidades preferidas, a proteína de fusão editora de bases não compreende NLS no terminal N e/ou entre a ade- nina desaminase e a proteína efetora CRISPR com nuclease inativada.
[0073] Em geral, a NLS consiste em uma ou mais sequências cur- tas de lisina ou arginina positivamente carregada exposta na superfície da proteína, mas também são conhecidos outros tipos de NLS. Exemplos não limitativos de NLS incluem: KKRKV (sequência de nucleotídeos 5'- AAGAAGAGAAAGGTC-3'), PKKKRKV (sequência de nucleotídeos 5-CCCAAGAAGAAGAGGAAGGTG-3' ou CCAAAGAAGAAGAGGA-
AGGTT), ou SEGSPKKKRKV (sequência de nucleotídeos 5'- TEGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG -3').
[0074] Em algumas modalidades da presente invenção, o terminal N da proteína de fusão editora de bases compreende a NLS com a se- quência de aminoácidos representada por PKKKRKV. Em algumas modalidades da presente invenção, o terminal C da proteína de fusão editora de bases compreende a NLS com a sequência de aminoácidos representada por KRPAATKKAGQAKKKK. Em algumas modalidades da invenção, o terminal C da proteína de fusão editora de bases com- preende uma NLS mais eficiente com a sequência de aminoácidos re- presentada por PKKKRKV.
[0075] Além disso, dependendo da localização do DNA a ser edi- tado, as proteínas de fusão editoras de bases da presente invenção também podem incluir sequências de localização, tais como sequên- cias de localização citoplasmáticas, sequências de localização cloro- plásticas, sequências de localização mitocondrias, entre outras.
[0076] Em outras modalidades específicas da invenção, a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada na SEQ ID NO:4.
[0077] Em outras modalidades específicas da invenção, a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada na SEQ ID NO:5.
[0078] Em outras modalidades específicas da invenção, a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada em uma das SEQ ID NOs: 18-25. Em outras modalidades específicas da invenção, a proteína de fusão editora de bases compre- ende a sequência de aminoácidos apresentada em uma das SEQ ID NOs: 33-39. Em outras modalidades preferidas da invenção, a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada em uma das SEQ ID NOs: 33-35, 38 e 39. Em uma moda- lidade preferida, a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada na SEQ ID NO:39.
[0079] Para obter expressão eficiente em plantas, em algumas modalidades da presente invenção, a sequência de nucleotídeos codi- ficando a proteína de fusão editora de bases é códon-otimizada para que a planta sofra edição de bases.
[0080] Otimização de códons refere-se à substituição de pelo me- nos um códon (por exemplo, cerca de ou mais de cerca de 1,2,3,4,5, 10, 15, 20, 25, 50 ou mais códons) de uma sequência nativa por um códon que é usado com mais frequência ou mais frequentemente no gene da célula hospedeira, modificando a sequência de ácidos nuclei- cos, porém mantendo a sequência de aminoácidos nativa para aumen- tar a expressão na célula hospedeira de interesse. Espécies diferentes mostram preferências específicas para determinados códons de um aminoácido particular. A preferência por códons (diferença no uso de códons entre organismos) normalmente está associada à eficiência de translação do RNA mensageiro (mMRNA), o que se acredita depender da natureza do códon transladado e da disponibilidade de moléculas de RNA de transferência (tRNA) específicas. As vantagens de tRNAs seletos nas células geralmente refletem os códons usados com mais frequência para a síntese de peptídios. Portanto, os genes podem ser customizados para o melhor gene expresso em um dado organismo com base na otimização de códons. A tabela de uso de códons pode ser facilmente obtida, por exemplo, no Codon Usage Database dispo- nível em www.kKazusa.orjp/codon/, e estas tabelas podem ser ajustadas de diferentes maneiras. Vide, Nakamura Y. et. Al. "Codon usage tabu- lated from the international DNA sequence databases: status for the year2000 Nucl. Acids Res, 28: 292 (2000).
[0081] Em algumas modalidades da invenção, a sequência de nu- cleotídeos codificando a proteína de fusão editora de bases com otimi- zação de códons está mostrada na SEQ ID NO: 6.
[0082] Em outras modalidades específicas da invenção, a sequên-
cia de nucleotídeos codificando a proteína de fusão editora de bases com otimização de códons está mostrada na SEQ ID NO:7.
[0083] Em outras modalidades específicas da invenção, a sequência de nucleotídeos codificando a proteína de fusão editora de bases com otimização de códons está mostrada em uma das SEQ ID NOs: 10-17.
[0084] Em outras modalidades específicas da invenção, a sequên- cia de nucleotídeos codificando a proteína de fusão editora de bases com otimização de códons está mostrada em uma das SEQ ID NOs: 26-32. Em outras modalidades preferidas da invenção, a sequência de nucleotídeos codificando a proteína de fusão editora de bases com otimização de códons está mostrada em uma das SEQ ID NOs: 26-28, 31 e 32. De preferência, a sequência de nucleotídeos codificando a proteína de fusão editora de bases com otimização de códons está mostrada na SEQ ID NO: 32.
[0085] Em algumas modalidades da invenção, o RNA guia é um RNA guia simples (sgRNA). Métodos para a construção de saRNAs adequados a partir de uma sequência alvo dada são conhecidos no estado da técnica. Vide, por exemplo, Wang, Y. et al. Simultaneous editing of three homoeoalleles in hexaploid bread wheat confers herita- ble resistance to powdery mildew. Nat. Biotechnol. 32, 947-951 (2014); Shan, Q. et al. Targeted Nat. Biotechnol. 31, 686-688 (2013); Liang, Z. et al. Targeted mutagenesis in Zea mays using TALENs and the CRISPR/Cas system. J Genet Genomics. 41, 63-68 (2014).
[0086] Em algumas modalidades da invenção, a sequência do SgRNA compreende a seguinte sequência de cadafalso: Gttttagagctagaaatagcaagttaaaataaggctagtcegttatcaacttgaaaaagtggeace gagtcggtgac (SEQ ID NO: 138, correspondente ao sgRNA no Exemplo) ou Gtttaagagctatgctggaaacagcatagcaagtttaaataaggtagtcegttatcaacttgaaaa agtggcacegagteggtgc (SEQ ID NO: 139, correspondente ao esgRNA no Exemplo) em que a sequência alvo (ou sequência espaçadora) no
SgRNA fica na extremidade 5' da sequência de cadafalso acima.
[0087] Em uma modalidade preferida, a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada na SEQ ID NO: 39, e o RNA guia é um RNA guia simplescompreendendo a sequência de cadafalso mostrada na SEQ ID NO:139.
[0088] Em algumas modalidades da invenção, a sequência de nu- cleotídeos codificando a proteína de fusão editora de bases e/ou a se- quência de nucleotídeos codificando o RNA guia é operacionalmente ligada a um elemento regulador da expressão vegetal tal como um promotor.
[0089] Exemplos de promotores que podem ser usados na presen- te invenção incluem, porém sem limitação, o promotor do vírus do mo- saico da couve-flor 35S (Odell et al. (1985) Nature 313: 810-812), o promotor de Ubi-1 do milho, o promotor de U6 do trigo, o promotor de U3 do arroz, o promotor de U3 do milho, o promotor da actina do arroz, o promotor de TrpPro5 (Pedido de Patente US Nº 10/377,318; 16 de março de 2005), o promotor de pEMU (Last et al. (1991) Theor Appl. Genet. 81: 581-588), o promotor de MAS (Velten et al. (1984) EMBO J. 3: 2723-2730), o promotor da histona H3 do milho (Lepetit et al. (1992) Mol. Gen. Genet. 231:276-285 e Atanassova et al. (1992) Plant J. 2(3): 291-300) e o promotor de ALS3 da Brassica napus (pedido PCT WO 97/41228). Promotores úteis na presente invenção também incluem os promotores tecido-específicos comumente usados revisados em Moore et al. (2006) Plant J. 45(4): 651-683.
[0090] O RNA exato do saRNA que pode ser usado na presente invenção pode ser produzido por auto-clivagem do tRNA (Zhang et al. (2017) Genome Biology, 2017, 18: 191).
3. Método de produção de plantas geneticamente modificadas
[0091] Em um outro aspecto, a invenção apresenta um método pa- ra a produção de uma planta geneticamente modificada, compreen- dendo a introdução de um sistema da invenção para edição de bases de uma sequência alvo em um genoma de planta na planta, e com isso o RNA guia orienta a proteína de fusão editora de bases para uma se- quência alvo no genoma de uma planta, resultando em um ou mais À sendo substituídos por G na sequência alvo.
[0092] O desenho das sequências alvo que podem ser reconheci- das e orientadas pela Cas9 e pelo complexo de RNA guia é de conhe- cimento do especialista na técnica. Em geral, a sequência alvo é uma sequência complementar a uma sequência guia de cerca de 20 nucleo- tídeos contida no RNA guia, e a extremidade 3' é imediatamente adja- cente ao motivo adjacente protoespaçador (PAM) NGG.
[0093] Por exemplo, em algumas modalidades da presente inven- ção, a sequência alvo possui a seguinte estrutura: 5-Nx-NGG-3', onde N é independentemente selecionado dentre A, G, C e T; X é um inteiro igual a 14 € X < 35; Nx representa X nucleotídeos consecutivos, NGG é uma se- quência PAM. Em algumas modalidades preferidas da invenção, X é 20. Em algumas modalidades, a janela de edição de bases fica localizada nas posições 4-8 da sequência alvo. Isto é, o sistema da presente in- venção pode causar uma ou mais substituições de A por G no intervalo de posições 4 a 8 a partir da extremidade 5' da sequência alvo.
[0094] Em algumas modalidades os métodos da presente invenção compreendem ainda o rastreamento de uma planta que tenha a substi- tuição nucleotídica desejada. A substituição nucleotídica em plantas por ser detectada por métodos de T7El, POR/RE ou sequenciamento, vide, por exemplo, Shan, Q., Wang, Y., Li, J. & Gao, C. Genome editing in rice and wheat using the CRISPR /Cas system. Nat. Protoc. 9, 2395- 2410 (2014).
[0095] Nos métodos da presente invenção, o sistema de edição de bases pode ser introduzido na planta por meio de uma variedade de métodos bastante conhecidos pelos especialistas na técnica. Métodos que podem ser usados para introduzir um sistema de edição de geno- ma da presente invenção na planta incluem, porém sem limitação, o método da pistola de genes, transformação de protoplastos mediada por PEG, transformação mediada por Agrobacterium, transformação mediada por vírus de plantas, transformação pela via do tubo polínico e injeção no ovário. De preferência, o sistema de edição de bases é in- troduzido na planta por transformação transitória.
[0096] No método da presente invenção, a modificação da se- quência alvo só pode ser obtida por introdução ou produção da proteí- na de fusão editora de bases e do RNA guia na célula vegetal, e a mo- dificação pode ser herdade de forma estável, sem necessidade de transformar estavelmente o sistema de edição de bases nas plantas. Isto evita o potencial efeito fora do alvo do sistema de edição de bases transformado estável e também evita a integração da sequência de nu- cleotídeos exógeno no genoma da planta, oferecendo assim maior bi- ossegurança.
[0097] Em algumas modalidades preferidas, a introdução é reali- zada na ausência de pressão de seleção para evitar a integração da sequência de nucleotídeos exógena no genoma da planta.
[0098] Em algumas modalidades, a introdução compreende trans- formar o sistema de edição de bases da presente invenção em uma célula ou tecido vegetal isolado e em seguida regenerar a célula ou tecido vegetal transformado em uma planta intacta. De preferência, a regeneração é realizada na ausência de pressão de seleção, i.e., ne- nhum agente de seleção para o gene de seleção no vetor de expres- são é usado durante a cultura de tecido. Evitar o uso de um agente de seleção pode aumentar a eficiência de regeneração da planta, sendo obtida uma planta modificada livre de sequências de nucleotídeos exó- genas.
[0099] Em outras modalidades, o sistema de edição de bases da presente invenção pode ser transformado em partes específicas de uma planta intacta, tais como folhas, extremidades dos rebentos, tubos polínicos, espigas jovens ou hipocótilos. Isto é particularmente ade-
quado para a transformação de plantas que são difíceis de regenerar em cultura de tecido.
[00100] Em algumas modalidades da invenção, a proteína expressa in vitro e/ou a molécula de RNA transcrita in vitro são transformadas diretamente na planta. A proteína e/ou a molécula de RNA é capaz de edição de bases em células vegetais e subsequente degradação pela célula, evitando a integração da sequência de nucleotídeos exógena no genona da planta.
[00101] Assim sendo, em algumas modalidades, as plantas podem ser geneticamente modificadas e cultivadas com a ajuda dos métodos da invenção para obteção de plantas que são livres de integração de DNA exógeno, i.e., plantas modificadas livres de transgenes. Além dis- So, o sistema de edição de bases da presente invenção apresenta alta especificidade (baixa taxa fora do alvo) e maior biossegurança durante a edição de bases em plantas.
[00102] Plantas que podem ter bases editadas pelos métodos da invenção incluem monocotiledôneas e dicotiledôneas. Por exemplo, a planta pode ser uma planta de cultura tal como trigo, arroz, milho, soja, girassol, sorgo, canola, alfalfa, algodão, cevada, milhete, cana-de-açúcar, tomate, tabaco, tapioca ou batata.
[00103] Em algumas modalidades da presente invenção, em que a sequência alvo é associada a um traço de uma planta, tal como um traço agronômico, a edição de bases resulta no fato de a planta ter tra- ços alterados em relação a uma planta do tipo selvagem. Na presente invenção, a sequência alvo a ser modificada pode estar localizada em qualquer posição no genoma, por exemplo, em um gene funcional tal como um gene codificador de proteína, ou pode estar, por exemplo, localizada em uma região reguladora da expressão do gene tal como uma região promotora ou uma região potencializadora, sendo que des- sa forma é possível obter modificação funcional do gene ou modifica- ção da expressão do gene. Por conseguinte, em algumas modalidades da presente invenção, a substituição de A por G resulta em uma substi- tuição aminoacídica na proteína alvo. Em outras modalidades da pre- sente invenção, a substituição de A por G resulta em uma alteração na expressão do gene alvo.
[00104] Em algumas modalidades, o gene modificado pelos méto- dos da invenção pode ser um gene de acetolactato sintase (ALS) e um gene de acetil CoA carboxilase (ACC) resistentes a herbicidas. Muta- ções de A por G em sítios aminoacídicos chave dos genes resisitentes a herbicidas ALS e ACC podem conferir resistência a herbicidas às plan- tas. Em algumas modalidades, o gene de ACC é modificado. Em algu- mas modalidades, o gene de ACC é modificado e a proteína de ACC codificada pelo gene de ACC modificado tem uma mutação C2186R.
[00105] Em algumas modalidades da presente invenção, o método compreende ainda a obtenção de progênies da planta geneticamente modificada.
[00106] Em um outro aspecto, a presente invenção apresenta uma planta geneticamente modificada ou uma progênie da mesma, ou uma parte da mesma, onde a planta é obtida pelo método da invenção des- crito acima. Em algumas modalidades, planta geneticamente modifica- da ou uma progênie da mesma ou uma parte da mesma é livre de transgenes.
[00107] Em um outro aspecto, a presente invenção apresenta um método de cultivo de plantas compreendendo cruzar uma primeira planta geneticamente modificada pelo método acima da presente in- venção com uma segunda planta não contendo a modificação genéti- ca, e assim a modificação genética é introduzida na segunda planta. Exemplo Construção do vetor de expressão de nCas9- ABE
[00108] As sequências de ABE, XTEN, nCas9(D10A) foram códon- otimizadas para plantas e adquiridas da GenScript (Nanjing). O frag- mento nCas9-ABE de comprimento integral foi amplificado usando os pares de iniciadores Hindlll-F (com sítio de restrição Hindlll) e EcoR| (com sítio de restrição EcoRI). O produto de PCR foi digerido com Hin- dill e EcoRI, e então inserido nos dois vetores pJIT163-GFP digeridos por enzima (a sequência deste vetor está mostrada na SEQ ID NO: 8) para gerar o vetor de expressão de fusão pn/dCas9-PBE. Construção do vetor de expressão de saRNA
[00109] “De acordo com a descrição anterior (Wang, Y. et al. Simul- taneous editing of three homoeoalleles in hexaploid bread wheat con- fers heritable resistance to powdery mildew. Nat. Biotechnol. 32, 947- 951, 2014; Shan, Q. et al. Targeted genome modification of Crops us- ing a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688, 2013; e Liang, Z. et al. Targeted mutagenesis in Zea mays using TALENs and the CRISPR/Cas system. J Genet Genomics. 41, 63 —68, 2014), foi construído um vetor de expressão de saRNA baseado em pTaUu6- SgRNA (Addgene ID53062) ou pOsU3-sgRNA (Addgene ID53063) ou pZmU3-sgRNA (Addgene ID5306) ou OsU3/TaU6-tRNA-sgRNA (Zhang et al. 2017. Genome Biology. DO!I:10.1186 /s13059-017-1325-9): pTaU3-mGFPP-sgRNA, pOsU3-mGFP-sgRNA, pZzmU3-mGFP-sgRNA, pOsU3-DEP1-T6-sgRNA, pOsU3-DEP1-T7-sgRNA, pOsU3-ACC-T3- SgRNA, pOsU3-NRT1.1-T1-sgRNA. Vetor de expressão de GFP
[00110] —pUbi-mGFP, a sequência do vetor está mostrada na SEQ ID NO: 9. Ensaios de protoplastos
[00111] Trigo Bobwnhite e arroz Nipponbare foram usados neste es- tudo. A transformação de protoplastos foi realizada da maneira descrita abaixo. A eficiência de transformação média é de 55-70%. A transfor- mação de protoplastos é realizada da maneira descrita abaixo A trans- formação é realizada com 10 ug de cada plsamídio pelo método medi- ado por PEG. Os protoplastos foram coletados depois de 48 horas e o DNA foi extraído pelo ensaio T7El e POR-RE.
[00112] Preparação e transformação de protoplastos de trigo 1) As partes do meio de plantas de trigo jovens foram corta- das em tiras de 0,5-1 mm de largura. As tiras foram colocadas em uma solução 0,6 M de manitol por 10 minutoss, filtradas, e em seguida colo- cadas em 50 ml de uma solução de enzimas a 20-25ºC no escuro, com agitação delicada (10 rmp) por 5 horas.
2) 10 ml de WB5 foram acrescentados para diluir os produtos da enzimólise e os produtos foram filtrados por um filtro de náilon de 75 um em um tubo de centrífuga de fundo redondo (50 ml).
3) Centrifugação a 100 g por 3 minutos a 23ºC, e o sobre- nadante foi descartado.
4) Os produtos foram delicadamente suspendidos com 10 ml de W5, colocados em gelo por 30 minutos para deixar que os proto- plastos sedimentassem gradativamente, e o sobrenadante foi descar- tado.
5) Os protoplastos foram suspendidos por adição de uma quantidade apropriada de MMG, e colocados em gelo até a tranformação.
6) 10-20 ug de plasmídio, 200 ul de protoplastos (cerca de 4x105 células), 220 ul de solução de PEG fresca foi introduzidos em um tubo de centrífuga de 2 ml, misturados, e colocados à temperatura ambiente no escuro por 10-20 minutos para induzir a transformação.
7) Depois da indução de transformação, 880 ul de solução de W5B5 foram adicionados lentamente, e os tubos foram delicadamente virados para baixo para que ocorresse misturação, seguido por centrifu- gação horizontal a 100 g por 3 minutos, e o sobrenadante foi descartado.
8) Os produtos foram ressuspendidos em 2 ml de solução de W5, transferidos para uma placa de seis poços, cultivados à tempe- ratura ambiente (ou 25ºC) no escuro. Para extração do DNA genômico dos protoplastos, os produtos precisaram ser cultivados por 48 horas.
[00116] Preparação e transformação de protoplastos de arroz 1) Bainha de folhas de mudas foram usadas para isolamen-
to de protoplastos, e cortadas em cerca de 0,5 mm de largura com uma lâmina afiada.
2) Imediatamente após a incisão, foram transferidas para uma solução 0,6 M de manitol, e colocadas no escuro por 10 minutos.
3) A solução de manitol foi removida por filtração, e os pro- dutos foram transferidos para uma solução de enzimólise, e evacuados por 30 minutos.
4) A enzimólise foi realizada por 5-6 horas no escuro com agitação delicada (agitador de descoloração, velocidade 10).
5) Depois de terminada a enzimólise, um volume igual de WB foi adicionado, com agitação horizontal por 10 segundos para libe- rar os protoplastos.
6) Os protoplastos foram filtrados em um tubo de centrífuga de fundo redondo de 50 ml com uma membrana de náilon de 40 um e lavados com a solução de W5.
7) Centrifugação horizontal a 250 g por 3 minutos para pre- cipitatar os protoplastos, e o sobrenadante foi descartado.
8) Os protoplastos foram ressuspendidos por adição de 10 ml de W5, e em seguida centrifugados a 250g por 3 min, e o sobrena- dante foi descartado.
9) Uma quantidade apropriada de solução de MMG foi adi- cionada para ressuspender os protoplastos até uma concentração de 2x106/ml.
Nota: Todas as etapas acima foram realizadas à temperatu- ra ambiente.
10) 10-20 ug de plasmídio, 200 ul de protoplastos (cerca de 4x10º cells), e 220 ul de solução de PEG fresca foram introduzidos em um tubo de centrífuga de 2 ml, misturados, e colocados à temperatura ambiente no escuro por 10-20 minutos para induzir a transformação.
11) Depois de terminada a transformação, 880 ul de solu- ção de WB5 foram adicionados lentamente, e os tubos foram delicada-
mente virados para baixo para que ocorresse misturação, seguido por centrifugação horizontal a 250 g por 3 minutos, e o sobrenadante foi descartado.
12) Os produtos foram ressuspendidos em 2 ml de solução de WI, transferidos para uma placa de seis poços, cultivados à tempe- ratura ambiente (ou 25ºC) no escuro. Para extração do DNA genômico dos protoplastos, os produtos precisaram ser cultivados por 48 horas.
[00117] PCR/RE: 1) O DNA genômico das plantas foi extraído.
2) Fragmentos contendo os sítio alvo, cujo comprimento va- ria entre 350-1000 bp, foram amplificados com iniciadores gene-espe- cíficos sintéticos: 3) As condições reacionais gerais são: desnaturação a 94ºC por 5 min; desnaturação a 94ºC por 30 seg; têmpera a 58ºC por 30 seg, extensão a 72ºC por 30 seg, amplificação por 30 a 35 ciclos; incu- bação a 72ºC por 5 min; incubação a 12ºC. 5 ul dos produtos de PCR foram submetidos à eletroforese.
4) Os produtos de PCR foram digeridos com endonuclease de restrição como a seguir: 5) Digestão a 37ºC por 2-3 h. Os produtos foram analisa-
dos por eletroforese em gel de agarose 1,2%.
6) As faixas mutantes sem cortes nos produtos de PCR fo- ram recuperadas e purificadas, e submetidas à clonagem de TA da se- guinte maneira: 7) A ligação foi realizada a 22ºC por 12 minutos. E os pro- dutos foram transformados em células competentes de E.coli, que fo- ram então plaqueadas em placas LB (Amp100, IPTG, e X-gal), e incu- badas a 22ºC por 12-16 horas. As colônias brancas foram coletadas para identificação de clones positivos e sequenciamento. Transformação mediada por Agrobacterium de calo de arroz
[00118] —Agrobacterium tumefaciens cepa AGL1 foi transformada por eletroporação usando o vetor binário pH-PABE-7-esgRNA ou pH- PABE-7-sgRNA. A transformação mediada por Agrobacterium de calo de arroz (Zhonghua 11) foi processada de acordo com o método des- crito por Shan Q et al. (Shan Q et al., Rapid and efficient gene modifi- cation in rice and Brachypodium using TALENs. Mol Plant 2013, 6:1365-1368), e as plantas transgênicas foram selecionadas usando higromicina.
Introdução de construtos de DNA em células de embrião imaturo de trigo por meio da pistola de genes
[00119] Os DNAs plasmídicos PABE-7 e pTaU6-esgRNA foram in- troduzidos simultaneamente em células de embriões de trigo imaturos por meio da pistola de genes, e a planta foi regenerada sem agentes de seleção de acordo com a descrição anterior (Zhang Y, Liang Z, Zong Y, Wang Y, Liu J, Chen K, Qiu JL, Gao C: Efficient and transge- ne-free genome editing in wheat through transient expression of CRISPR/Cas9 DNA or RNA. Nat Commun 2016, 7:12617).
Sequenciamento
[00120] Diferentes vetores de expressão de sgRNA foram transfor- mados em protoplastos de trigo e de arroz com ABE e pwCas9 por 48 horas - 60 horas, e os protoplasts foram coletados e o DNA foi extraído para sequenciamento. Na primeira rodada de PCR, a região alvo foi amplificada com a ajuda de iniciadores sítio-específicos. Na segunda rodada de PCR, tags de sentido normal e reverso foram acrescentadas à extremidade do produto de PCR para construção de bibliotecas. Quantidades iguais de diferentes produtos de PCR foram reunidas. As amostras foram então sequenciadas usando a plataforma Illumina High-Seq 4000 no Beijing Genomics Institute ou usando a plataforma Illumina NextSeq 500 da Mega Genomics (Pequim, China). Exemplo 1. Edição de bases de GFP pelo sistema ABE em proto- plastos de plantas
[00121] — Primeiro, os inventores construíram um sistema ABE (edi- ção da base adenina) adequado para edição de células vegetais, inclu- indo SpnCas9-ABE (SEQ ID NO: 4, SEQ ID NO: 6), e SpnCas9-VQR- ABE (SEQ ID NO: 10, SEQ ID NO: 18), SonCas9-VRER-ABE (SEQ ID NO: 11, SEQ ID NO: 19), SanCas9-ABE (SEQ ID NO: 12, SEQ ID NO: 20), SanCas9-KKH-ABE (SEQ ID NO: 13, SEQ ID NO: 21), SpnCas9- ABE-1 (SEQ ID NO: 5, SEQ ID NO: 7), SpnCas9-VQR-ABE-1 (SEQ ID NO: 14, 22), SonCas9- VRER-ABE-1 (SEQ ID NO: 15, SEQ ID NO: 23), SanCas9-ABE-1 (SEQ ID NO: 16, SEQ ID NO: 24), SanCas9- KKH-ABE-1 (SEQ ID NO: 17. SEQ ID NO: 25), cada sistema foi otimi- zado em códons para expressão em plantas. A sequência de aminoá- cidos e a sequência de nucleotídeos de cada proteína de fusão de edi- ção de base estão mostradas na listagem de sequências em anexo. À estrutura de cada construto está mostrada na Figura 1.
[00122] Em seguida, os inventores usaram o sistema de expressão transitória de protoplastos e o sistema repórter de GFP para detectar a função do sistema ABE em células vegetais.
[00123] Primeiro, foi construído um vetor de expressão de GFP ina- tivado induzido por promotor Ubi (Ubi-mGFP) no qual o códon de ami- noácido (CAG) na posição 70 do GFP foi mutado para um códon de término (tAG) para inativar o GFP. O vetor foi co-transformado com o sistema ABE acima em protoplastos de planta. Se o sistema ABE mu- tar o códon de término (tAG) para (CAG), ele vai restaurar o mMGFP pa- ra o tipo selvagem, fazendo com que ele produza fluorescência verde. O princípio experimental está mostrado na Figura 2A.
[00124] Os resultados experimentais estão mostrados na Figura 2B. As células de protoplasto transformadas com o vetor Ubi-mGFP de controle negativo isoladamente não apresentaram produção de fluo- rescência verde, e as células de protoplasto transformadas com o Ubi- mGFP de controle positivo isoladamente apresentaram produção de fluorescência verde. Quando o vetor Ubi-mGFP foi co-transformado com o sistema ABE contra mGFP, fluorescência verde foi produzida. Quando o vetor Ubi-mGFP foi co-transformado com o sistema ABE pa- ra o gene DEP1 não relacionado, nenhuma fluorescência verde foi produzida. Pode-se observar que o sistema ABE pode realização a edição de base de A para G em protoplastos de planta. Exemplo 2. Edição de genes vegetais endógenos pelo ABE
[00125] Os genes OsSDEP1, OSCDC48, OSsACC e OsNRT1.1b de arroz foram selecionados como objetos de pesquisas, e a sequência alvo está mostrada no trecho sublinhado da Figura 3B.
[00126] Um sítio de clivagem foi selecionado no sítio de mutação para detecção por PCR/RE. Os resultados da digestão e do sequenci- amento mostraram uma mutação de A para G no sítio alvo (Figura 3 e Figura 4). Exemplo 3. Efeito da estrutura da ABE na edição de genes
[00127] Neste exemplo, foram construídas sete proteínas de fusão de ABE. As sete proteínas de fusão foram denominadas PABE-1 a PABE-7, diferindo na localização da adenina desaminase e no número e localização da NLS. As estruturas das 7 proteínas de fusão estão mostradas na Figura 5A, suas sequências estando mostradas nas SEQ ID NOs: 33-39, e as sequências codificadoras para otimização de có- dons baseadas nos grãos estão mostradas nas SEQ ID NOs: 26-32.
[00128] Primeiro, a eficiência de edição das proteínas de fusão PA- BE acima foi testado pelo experimento de restauração do GFP mutante para o GFP do tipo selvagem como descrito no Exemplo 1. Os resulta- dos mostraram que as células tratadas com cinco destas sete proteí- nas de fusão (PABE-1, PABE-2, PABE-3, PABE-6, e PABE-7) apresen- taram fluorescência de GFP estável (Figura 5B).
[00129] Análise por citometria de fluxo mostrou que a percentagem de células que apresentavam fluorescência variava entre 0,1% e 32,8% (Figura 5C). O tratamento com nCas9 com 3 cópias de NLS (PABE-7) no terminal C produziu a proporção mais alta de células ex- pressando GFP, significativamente mais alta que aquela com PABE-2 e outros construtos PABE (Figura 5B, C). A eficiência do PABE apenas com NLS no terminal C foi mais alta que aquela do PABE com NLS no terminal N. Exemplo 4. Edição de genes vegetais endógenos pelo PABE-2 e PABE-7
[00130] Para comparar ainda as eficiências de edição do PABE-2 e do PABE-7, neste exemplo, foram testados 16 loci genômicos endóge- nos de arroz. Os sítios e sequências alvo específicos estão mostrados na Tabela 1.
Tabela 1. Sítios e sequências alvo do saRNA.
F:GGCGGCACTACACGCCGTAGGTGA CCTTCACCTACGGCGTGTAGTGC (SEQ ID NO: 41) mGFP = Construção pOsU3-sgRNA (SEQ ID NO: 40) R:AMACTCACCTACGGCGTGTAGTGC (SEQ ID NO: 42) F:GGCGCCCAAGTGGGGGCGCATTCA (SEQ ID NO: 44) Construção pOsU3-sgRNA/esgRNA R:AMACTGAATGCGCCCCCACTTGGG OsALS-T1 CCCAAGTGGGGGCGCATTCAAGG (SEQ ID NO: 45) SsALS- (SEQ ID NO: 43) F:TGCACCCAAGTGGGGGCGCATTCA S (SEQ ID NO: 46) x Construção pOsU3-tRNA-sgRNA o R:AMACTGAATGCGCCCCCACTTGGG (SEQ ID NO: 47) F:GGCGCCTCATGAACATTCAGGAGC (SEQ ID NO: 49) Construção pOsU3-sgRNA/esgRNA R:AMACGCTCCTGAATGTTCATGAGG OsALS-T2 CCTCATGAACATTCAGGAGCTGG (SEQ ID NO: 50) SsALS- (SEQ ID NO: 48) F:TGCACCTCATGAACATTCAGGAGC (SEQ ID NO: 51) Construção pOsU3-tRNA-sgRNA R:AMACGCTCCTGAATGTTCATGAGG (SEQ ID NO: 52) OsCDC48-T1 GCTAGCTTTGACATAATCTCCGG F:GGCGGCTAGCTTTGACATAATCTC Construção pOsU3-sgRNA
(SEQ ID NO: 53) (SEQ ID NO: 54) R:AMACGAGATTATGTCAAAGCTAGC (SEQ ID NO: 55) F:GGCGCCAATGCATCCGTGAGAAGA CCAATGCATCCGTGAGAAGATGG (SEQ ID NO: 57) OsCDC48-T2 = " Construção pOsU3-sgRNA (SEQ ID NO: 56) R:AMACTCTTCTCACGGATGCATTGG (SEQ ID NO: 58) F:GGCGTAGCACCCATGACAATGACA (SEQ ID NO: 60) Construção pOsU3-sgRNA/esgRNA R:AMACTGTCATTGTCATGGGTGCTA TAGCACCCATGACAATGACATGG (SEQ ID NO: 61) OsCDC48-T3 — - o (SEQ ID NO: 59) F:TGCATAGCACCCATGACAATGACA NS
E (SEQ ID NO: 62) o Construção pOsU3-tRNA-sgRNA R:AMACTGTCATTGTCATGGGTGCTA (SEQ ID NO: 63) F:GGCGCAAGGATCCCAGCCCCGTGA (SEQ ID NO: 65) Construção pOsU3-sgRNA/esgRNA R:AMACTCACGGGGCTGGGATCCTTG OSAAT CAAGGATCCCAGCCCCGTGAAGG (SEQ ID NO: 66) s (SEQ ID NO: 64) F:TGCACAAGGATCCCAGCCCCGTGA (SEQ ID NO: 67) Construção pOsU3-tRNA-sgRNA R:AMACTCACGGGGCTGGGATCCTTG (SEQ ID NO: 68)
F:GGCGAGCACATGAGAGAACAATAT (SEQ ID NO: 70) Construção pOsU3-sgRNA/esgRNA R:AMACATATTGTTCTCTCATGTGCT AGCACATGAGAGAACAATATTGG (SEQ ID NO: 71) OsDEP1-T1 (SEQ ID NO: 69) F:TGCAAGCACATGAGAGAACAATAT (SEQ ID NO: 72) Construção pOsU3-tRNA-sgRNA R:AMACATATTGTTCTCTCATGTGCT (SEQ ID NO: 73) F:GGCGAGACAAGCTTGGCCCTCTTT (SEQ ID NO: 75) Construção pOsU3-sgRNA/esgRNA R:AMACAAAGAGGGCCAAGCTTGTCT
O AGACAAGCTTGGCCCTCTTTGGG (SEQ ID NO: 76) oo OsDEP1-T2 RD (SEQ ID NO: 74) F:TGCAAGACAAGCTTGGCCCTCTTT o (SEQ ID NO: 77) Construção pOsU3-tRNA-sgRNA R:AMACAAAGAGGGCCAAGCTTGTCT (SEQ ID NO: 78) F:GGCGATTTCAAATGGATCTAAACA ATTTCAAATGGATCTAAACAGGG (SEQ ID NO: 80) OsDEP1-T3 Construção pOsU3-sgRNA (SEQ ID NO: 79) R:AMACTGTTTAGATCCATTTGAAAT (SEQ ID NO: 81) F:GGCGACAGATCTTGCCGTCTTITITT
ACAGATCTTGCCGTCTTTTTCGG OsDEP1-T4 (SEQ ID NO: 83) Construção pOsU3-sgRNA (SEQ ID NO: 82) R:AMACAAAAAGACGGCAAGATCTGT
FEEL FE F:GGCGCATAGCACTCAATGCGGTCT (SEQ ID NO: 86) Construção pOsU3-sgRNA/esgRNA R:AMACAGACCGCATTGAGTGCTATG OSsACC-T1 CCCAGACCGCATTGAGTGCTATG (SEQ ID NO: 87) SACC- (SEQ ID NO: 85) F:TGCACATAGCACTCAATGCGGTCT (SEQ ID NO: 88) Construção pOsU3-tRNA-sgRNA R:AMACAGACCGCATTGAGTGCTATG (SEQ ID NO: 89) F:GGCGTACTAGTCACACTTGCACTG TACTAGTCACACTTGCACTGTGG (SEQ ID NO: 91) OsACC-T2 Construção pOsU3-sgRNA o (SEQ ID NO: 90) R:AMACCAGTGCAAGTGTGACTAGTA o
E (SEQ ID NO: 92) o F:GGCGACTAGATATCTAAACCATTA (SEQ ID NO: 94) Construção pOsU3-sgRNA/esgRNA R:AMACTAATGGTTTAGATATCTAGT ACTAGATATCTAAACCATTAAGG (SEQ ID NO: 95) OsNRT1.1B-T1 (SEQ ID NO: 93) F:TGCAACTAGATATCTAAACCATTA (SEQ ID NO: 96) Construção pOsU3-tRNA-sgRNA R:AMACTAATGGTTTAGATATCTAGT (SEQ ID NO: 97) GGCCATGGCGCCCGCEGCGGCEG F:GGCGGGCCATGGCGCCCGcCesees OsNRT1.1B-T2 Construção pOsU3-sgRNA (SEQ ID NO: 98) (SEQ ID NO: 99)
R:AMACCCGCCGCGGGCGCCATGGCC (SEQ ID NO: 100) F:GGCGCACACACACACTAGTACCTC (SEQ ID NO: 102) Construção pOsU3-sgRNA/esgRNA R:AMACGAGGTACTAGTGTGTGTGTG OsEV CACACACACACTAGTACCTCTGG (SEQ ID NO: 103) s (SEQ ID NO: 101) F:TGCACACACACACACTAGTACCTC (SEQ ID NO: 104) Construção pOsU3-tRNA-sgRNA R:AMACGAGGTACTAGTGTGTGTGTG (SEQ ID NO: 105) F:GGCGACACACACACTAGTACCTCT A (SEQ ID NO: 107) o Construção pOsU3-sgRNA/esgRNA PD R:AMACAGAGGTACTAGTGTGTGTGT o
ACACACACACTAGTACCTCTGGG (SEQ ID NO: 108) (SEQ ID NO: 106) F:TGCAACACACACACTAGTACCTCT (SEQ ID NO: 109) = Construção pOsU3-tRNA-sgRNA R:AMACAGAGGTACTAGTGTGTGTGT (SEQ ID NO: 110) F:CTTGACGAGCTACATTTACTTGAA (SEQ ID NO: 112) = ACGAGCTACATTTACTTGAAGGG Construção pTaU6-sgRNA/esgRNA TaDEP1 R:AMACTTCAAGTAAATGTAGCTCGT (SEQ ID NO: 111) (SEQ ID NO: 113) F:TGCAACGAGCTACATTTACTTGAA ConstruçãopTaU6-tRNA-sgRNA
(SEQ ID NO: 114) R:AMACTTCAAGTAAATGTAGCTCGT (SEQ ID NO: 115) F:CTTGGAGGAAGTAAAGCTCTTCTT (SEQ ID NO: 117) PTaU6-sgaRNA/esgRNA R:AMACAAGAAGAGCTTTACTTCCTC GAGGAAGTAAAGCTCTTCTTGGG (SEQ ID NO: 118) TaEPSPS O (SEQ ID NO: 116) F;:TGCAGAGGAAGTAAAGCTCTTCTT (SEQ ID NO: 119) Construção pTaU6-tRNA-saRNA R:AMACAAGAAGAGCTTTACTTCCTC (SEQ ID NO: 120) a F:CTTGCACAAGAAAATCCACCAGGA 2 rs (SEQ ID NO: 122) o Construção pTaU6-sgRNA/esgRNA R:AMACTCCTGGTGGATTTTCTTGTG TaGWo CACAAGAAAATCCACCAGGATGG (SEQ ID NO: 123) a (SEQ ID NO: 121) F;:TGCACACAAGAAAMATCCACCAGGA (SEQ ID NO: 124) Construção pTaU6-tRNA-saRNA R:AMACTCCTGGTGGATTTTCTTGTG (SEQ ID NO: 125) Constatou-se a ABE de planta modificou a base A/T sublinhada.
Os domínios de PAM em cada sequência alvo estão mostrados em nedgrito.
[00131] A edição de bases de A para G de cada gene nos proto- plastos foi avaliada por sequenciamento (100.000-220.000 leituras por locos). Como mostrado na Figura 6, a eficiência de edição de bases do PABE-7 foi mais, e a conversão de A/T em C/G em cada ponto aumen- tou em uma média de cerca de 1,1 vez em comparação com o PABE-
2. Em conjunto, estes resultados demonstram que o sistema ABE de plantas é capaz de induzir a conversão de A em G no arroz e que a eficiência de edição foi maximizada quando havia três NLSs no termi- nal C da nCas9. Exemplo 5. Efeito do saRNA na eficiência de edição
[00132] Para identificar o formato ideal do saRNA para atividade de PABE-7, este exemplo testou uma variedade de modificações no sgR- NA em uma ampla gama de loci endógenos. Os inventores compara- ram as atividades de edição de bases de três formatos de saRNA (S9RNA nativo, esgRNA e tRNA-sgRNA) nos 10 sítios alvo genômicos endógenos de arroz e nos 3 sítios alvo genômicos endógenos de trigo mostrados na Tabela 1, respectivamente.
[00133] As sequências protoespaçadoras orientando estes genes endógenos foram clonadas em três estruturas de sgRNA, respectiva- mente (como mostrado na Figura 7), e co-transformadas com PABE-7. Cas9 do tipo selvagem (WT Cas9) foi usada como um controle para gerar deleções e/ou indels. A combinação de cada PABE-7 e vetor de expressão de sgaRNA observou a conversão de A em G em todos os 13 sítios alvo, com posições 4-8 na sequência protoespaçadora tendo uma frequência de edição efetiva (Figura 8A). A Figura 8A também mostra que o esgRNA apresentou a eficiência de edição de bases mais alta na maioria dos testes nos três construtos de saRNA, variando de 0,1 a 7,5% tanto no arroz quanto no trigo. A eficiência média do esgR- NA em 13 sítios foi aproximadamente duas vezes mais alta do que aquela do sgRNA nativo e aproximadamente 3 vezes mais alta do que aquela do tRNA-sgRNA (Figura 8B). No estudo acima, observou-se apenas a conversão de A em G, e não houve evidências de edição in- desejada (<0,02%) em nenhum locus alvo genômico do arroz e do trigo (Figuras 9, 10), e a frequência de mutações em indel (<0,1%) é muito mais baixa do que aquela da Cas9 WT (3,3-31,6%) (Figura 11).
[00134] Juntos, o construto de edição de bases PABE-7, junto com o esgRNA, induz eficientemente as substituições de A por G e tem alta precisão em múltiplos loci no arroz e no trigo. Exemplo 6. Efeito da sequência espaçadora na edição
[00135] Este exemplo testou o efeito do comprimento da sequência espaçadora do esgRNA na eficiência de edição de bases orientando o OsEV e o OsOD (como mostrado na Tabela 1). Como resultado, como mostrado na Figura 12, a sequência espaçadora de 20-nt convencional apresentou a eficiência mais alta de conversão de A em G. Nestes dois sítios, os esgaRNAs com uma sequência espaçadora de 14-nt a 19-nt de comprimento apresentaram atividade de edição de base de À em G substancialmente reduzida ou não detectável (<0,9%), compara- dos aos esgRNA com uma sequência espaçadora de 20-nt convencio- nal (<4,5%).
[00136] Além disso, nestes dois sítios, na Cas9 WT de controle, a frequência de mutação de indel (0,3-12,6%) do esgRNA com um com- primento de sequência espaçadora de 14-nt a 19-nt foi muito mais bai- xa que aquela do esgRNA com uma sequência espaçadora de 20-nt (Figura 13).
[00137] Estes resultados sugerem que um esgRNA com uma se- quência espaçadora de 20-nt é crítico para o sistema de ABE em plan- tas e não e tolerante a comprimento reduzido. Exemplo 7. Produção de arroz e trigo com substituição de A por G
[00138] Neste exemplo, 6 loci de genoma de arroz (OsACC-T1, OSsALS-T1, OSCDC48-T3, OSDEP1-T1, OSDEP1-T2, e OSNRT1.1B- T1) foram orientados pelo PABE-7 por transgene mediado por Agrobacterium, como mostrado nas Tabelas 1 e 2), e as plantas de arroz mutantes foram regeneradas. A estrutura do vetor está mostrada na Figura 14A. A eficiência de substituição de A por G é 15,8%-59,1%. 1,6, 1, e 13 linhagens homozigóticas mutantes foram identificadas pa- ra OSsACC-T1, OSDEP1-T1, OSDEP1-T2, e OSNRT1.1B-T1, respecti- vamente.
[00139] Curiosamente, os experimentos comparativos mostraram que a frequência de conversão de PABE-7 ao se usar um esgRNA foi em média 1,7 vez mais alta que aquela do saRNA nativo (como mos- trado na Tabela 2). Isto é consistente com os resultados observados com protoplastos (Figura 8A, B). Em todos os sítios alvo, a janela de desaminação efetiva (posições 4 a 8) foi consistente com os resultados em protoplastos. Além disso, as plantas de arroz transgênicas não con- tinham mutações de indel ou edição indesejada no sítio alvo (Figura 14B-G).
Tabela 2. Frequência de mutação de PABE-7 induzida em plantas TO de arroz e de trigo Número de |i- Linhagens de arroz Frequência Ae PP Formato transgênicas ou q 14 Heterozogótico/ Espécie | Sítio alvo do saRNA nhagens/plantas embriões de trigo de A-T em | Genótipo mutante 1 9 mutantes ? 9 GC (%) homozigótico bombardeados SACC- esgRNA TeC1 (10) T7267 (2), AVGIG7 (AM) | 327 OsALS-T1 esgRNA As>Gs (1); As>Gs (41) 4210 oscncas- |sgrna 19 ao | 90 —— jasGs(19) 190 AG (2); As (00) AVAGG:G: (O) | 88/13 à Aroz | osDePITA | 4 (2); As>Go (90); AsAs>GaGo (9) & esgRNA AG: (4); As>Gs (73); AsAs>GaGs (6) | 77/6 ã sgRNA AsGs (5); º OsDEP1-T2 As>Gs (1); As>Gs (32); RNA [34 215 15,8 33/1 esq ' AsAs>G3Gs (1) As>Gs (8); As>Gs (30); AsAs>G4uGs (3); OsNRT1.16. | SIRNA 116 303 38,3 AsAs>GoGs (75) 1115 Ti As>Gs (6); As>Gs (46); AsAs>G4Gs (2); esgRNA | 149 252 59,1 AsAs>GoGs (95) 136/13 tro — LTADEPt jJesgRna |5 => 460 | |11 | AsGs(4,AaBBDD;1, AABDDD) rigo Tam [esarna AszGs (2, AABDDD) º O número de linhagens de arroz mutantes e o número de plantas de trigo mutantes. º Baseado na razão do número de linhagens (arroz) ou plantas (trigo) TO com mutações observadas para o número total de linhagens de arroz trans- gênicas TO analisadas e o número de embriões imaturos de trigo bombardeado.
[00142] Neste exemplo, também foi gerada uma planta de trigo com edição de base usando o sistema ABE de plantas orientando os genes TaDEP1 e TaGW?2 por transformação por meio de uma pistola de ge- nes. Cinco plantas heterozigóticas Ag a Gs mutantes de TaDEP1 (mos- tradas na Tabela 2 e na Figura 15A) foram regeneradas a partir de 460 embriões imaturos bombardeados por T7E1 e sequenciamento de Sanger, quatro deles sendo mutantes heterozigóticos de TaDEP1-A (tadep1-AaBBDD), uma linhagem sendo um mutante heterozigótico de TaDEP1-B (tadep1-AABbDD). Para o sítio alvo TaGW?2, foram identifi- cados dois mutantes heterozigóticos, ambos tendo substituições de À por G na posição 5 do TaGW2-B (tagw2-AABbDD) (como mostrado na Tabela 2 e na Figura 15B). Não foram observadas mutações de indel nas regiões alvo de todas as plantas mutantes. Além disso, o rastrea- mento por PCR foi realizado com 6 conjuntos de iniciadores especiífi- cos para PABE-7 e pTaU6-esgRNA (como mostrado na Tabela 3), e 3 dos 5 mutantes de TaDEP1 e 2 mutantes de TaGW2 não eram porta- dores do vetor transgênico (Figura 16). Tabela 3. Iniciadores de PCR F1 ATGCTCACCCTGTTGTTTGGTGTTACTTC 126 F2 TCCGCTACACCAGAGTCTTCTGGAGGATCTAG |128 F3 GAAGAACTACTGGCGCCAGCTCCTGAATG 130 F4 TCGACAGCCCCACTGTGGCCTACTC 132 F5 GACCAAGCCCGTTATTCTGAC 134 F6 TGAAAAAGTGGCACCGAGTCGGTGC 136
[00143] Em conjunto, estes resultados indicam que o sistema ABE de plantas induz de forma efetiva mutações sítio-específicas no arroz e no trigo de forma altamente deliberada e precisa sem causar outras modificações no genoma. Além disso, o sistema ABE de plantas da presente invenção não integra uma sequência de DNA estranha (tal como um vetor transgênico) no genoma da planta ao realizar a modifi- cação no genoma. Exemplo 8. Indução de resistência a herbicidas no arroz
[00144] Neste exemplo, foi analisada a resistência a herbicidas de arroz modificado no sítio alvo OSACC-T1. Esta modificação visa o gene ACC no arroz, e o ACC do arroz modificado carrega a mutação C2186R, que corresponde à mutação C2088R do ACC da grama preta.
[00145] A detecção de 160 linhagens transformadas no pH-PABE-7- esgRNA mostrou que 33 das linhagens tinha pelo menos uma substi- tuição de T por C na região alvo (eficiência de mutação de 20,6, como mostrado na Tabela 2). Uma destas linhagens mutantes continha subs- tituições homozigóticas (TaT7 por CaC7), ao passo que as outras 32 continham substituições heterozigóticas, sendo que 20 destas apresen- taram substituição de duas bases (TaT7 por CaC;7) e 10 apresentaram substituição de uma única base Ta por Ca, assim como 2 apresentaram substituição de uma única base (T; por C;; TO-7 e TO-13) proporcio- nando a substituição aminoacídica C2186R desejada em um dos ale- los. Os resultados estão mostrados nas Figuras 14B, 17 e na Tabela 2.
[00146] Além disso, não foram detectadas mutações em potenciais áreas fora do alvo em todas as linhagens mutantes (como mostrado na Tabela 4).
Tabela 4. Potencial análise fora do alvo do locus genômico endógeno OsACC-T1 Potenciais sítios fora Mismatch Genótipo — mu- Sequência? Loci alvo Método de detecção do alvo No. tante Sítio correto CCCAGACCGCATTGAGTGC- T7E1/Sequenciamento LOC Os05g22940 | A para G TATG de Sanger . T7E1/Sequenciamento Sítio fora do alvo-1 CATAGCACTCAActCaGTtTGGG |4 LOC Os08g35020 | Não foram en- de S e Sanger contradas con- º T7E1/Sequenciamento Sítio fora do alvo-2 | aATAGCACTCAtTGaGaTCTTGG |4 LOC Os05g30010 | versões — A-G de S e Sanger nem mutações 9 & . , T7E1/Sequenciamento = Sítio fora do alvo-3 = | CATAGCACTIAATGtGGgACgGAG | 4 LOC Os03g46820 | para indel & de Sanger "base malpareada em um potencial sítio fora do alvo (14) está indicada em caixa baixa.
PAM continua sendo represen- tado em negrito.
[00147] Ademais, os inventores testaram a resistência das linha- gens T0-13 a herbicidas.
Depois de uma semana de crescimento em meio de regeneração suplementado com 0,086 ppm de haloxyfop-R- metil éster, as plantas mutantes apresentaram um fenótipo normal sem sinais de lesões, ao passo que as plantas do tipo selvagem (WT) apre- sentaram atrofia severa e folhas murchas (como mostrado na Figura 17). Os resultados acima indicam que arroz resistente a herbicidas car- regando a substituição C2186R do ACC foi produzido com a ajuda da ferramenta de edição de genomas.
Os resultados acima também indi- cam que o sistema de edição de genomas da presente invenção apre- senta uma baixa taxa fora do alvo em plantas e pode realizar a edição precisa de bases.

Claims (29)

REIVINDICAÇÕES
1. Sistema para edição de bases de uma sequência alvo no genoma de uma planta, caracterizado pelo fato de que compreende pelo menos um dos seguintes itens i) a v): i) uma proteína de fusão editora de bases, e um RNA guia; ii) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases, e um RNA guia; iii) uma proteína de fusão editora de bases, e um cons- truto de expressão compreendendo uma sequência de nucleotídeos codificando um RNA guia; iv) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases, e um construto de expressão compreendendo uma sequência de nucleotídeos codificando um RNA guia; v) um construto de expressão compreendendo uma se- quência de nucleotídeos codificando uma proteína de fusão editora de bases e uma sequência de nucleotídeos codificando um RNA guia; em que a proteína de fusão editora de bases compreende uma proteína efetora CRISPR com nuclease inativada e uma adenina desaminase DNA-dependente, sendo o RNA guia capaz de orientar a proteína de fusão editora de bases para uma sequência alvo no geno- ma de uma planta, dessa forma a proteína de fusão editora de bases resulta em um ou mais A sendo substituídos por G na sequência alvo.
2. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a adenina desaminase DNA-dependente é uma vari- ante da tRNA adenina desaminase E. coli TadA (ecTadA), em particu- lar uma variante que pode aceitar DNA de cordão simples como um substrato, a variante compreende, em relação ao ecTadA do tipo sel- vagem, um ou mais conjuntos de mutações selecionados do grupo que consiste em: 1) A106V e D108N; 2) D147Y e E155V; 3) L84F, H123Y e 1156F; 4) A142N; 5) H36L, R51L, S146C e K157N; 6) P48S/T/A; 7) A142N; 8) W23L/R; 9) R152H/P.
3. Sistema, de acordo com a reivindicação 2, caracterizado pelo fato de que a adenina desaminase DNA-dependente compreende as seguintes mutações em relação ao ecTadA do tipo selvagem: W23R, H36L, R51L, S146C, K157N, A106V, D108N, P48A, L84F, H123Y, N1156F, D147Y, E155V, R152P; de preferência, a adenina de- saminase DNA-dependente compreende a sequência de aminoácidos apresentada na SEQ ID NO: 2.
4. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a proteína efetora CRISPR com nuclease inativada é uma Cas9 com nuclease inativada, que compreende uma substituição aminoacídica D10A e/ou H840A em relação à Cas9 do tipo selvagem, por exemplo, a nuclease SpCas9 inativada compreende a sequência de aminoácidos apresentada na SEQ ID NO:3.
5. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a adenina desaminase DNA-dependente é fundida ao terminal N da proteína efetora CRISPR com nuclease inativada, de prefe- rência, o terminal N da adenina desaminase DNA-dependente é fundido com uma adenina desaminase do tipo selvagem correspondente.
6. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o domínio da desaminase e a proteína efetora CRISPR com nuclease inativada ou a adenina desaminase do tipo selvagem cor-
respondente são fundidos via um ligante, de preferência, o ligante tem 32 aminoácidos de comprimento.
7. Sistema, de acordo com a reivindicação 1 ou 5, caracteri- zado pelo fato de que a proteína de fusão editora de bases compreen- de ainda uma sequência de localização nuclear (NLS) no terminal N e/ou no terminal C.
8. Sistema, de acordo com a reivindicação 7, caracterizado pelo fato de que a NLS fica localizada no terminal C da proteína de fu- são editora de bases.
9. Sistema, de acordo com a reivindicação 8, caracterizado pelo fato de que a proteína de fusão editora de bases compreende pelo menos 3 NLSs.
10. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada em uma das SEQ ID NO: 4, 5 ou 18-25 ou 33-39.
11. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência de nucleotídeos codificando a proteína de fusão editora de bases é códon-otimizada para que a planta sofra edi- ção de bases, por exemplo, a sequência de nucleotídeos codificando a proteína de fusão editora de bases está mostrada em uma das SEQ ID NO: 6, 7, 10-17, 26-32.
12. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o RNA guia é um RNA guia simples RNA(sgRNA).
13. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a sequência de nucleotídeos codificando a proteína de fusão editora de bases e/ou a sequência de nucleotídeos codificando o RNA guia é operacionalmente ligada a um elemento regulador da ex- pressão vegetal.
14. Sistema, de acordo com a reivindicação 14, caracteriza- do pelo fato de que o elemento regulador é um promotor, tal como um promotor de 35S, um promotor de Ubi-1 de milho, um promotor de U6 de trigo, um promotor de U3 de arroz ou um promotor de U3 de milho.
15. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a proteína efetora CRISPR é a nuclease Cas9 ou a nuclease Cpf1.
16. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a proteína de fusão editora de bases compreende a sequência de aminoácidos apresentada na SEQ ID NO: 39, o RNA guia é um RNA guia simples compreendendo a sequência de cadafalso apresentada na SEQ ID NO:139.
17. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a região alvo do RNA guia tem 20 nucleotídeos de comprimento.
18. Método para a produção de uma planta geneticamente modificada, caracterizado pelo fato de que compreende a introdução de um sistema, como definido em qualquer uma das reivindicações 1 a na planta, e com isso o RNA guia orienta a proteína de fusão edito- ra de bases para uma sequência alvo no genoma de uma planta, resul- tando em um ou mais A sendo substituídos por G na sequência alvo.
19. Método, de acordo com a reivindicação 18, caracteriza- do pelo fato de que a introdução é realizada na ausência de pressão de seleção.
20. Método, de acordo com a reivindicação 18, caracteriza- do pelo fato de que compreende ainda o rastreamento de uma planta tendo a substituição nucleotídica desejada.
21. Método, de acordo com qualquer uma das reivindica- ções 18 a 20, caracterizado pelo fato de que a planta é selecionada do grupo que consiste em monocotiledôneas e dicotiledôneas.
22. Método, de acordo com a reivindicação 21, caracteriza- do pelo fato de que a planta é uma planta de cultura, tal como trigo, arroz, milho, soja, girassol, sorgo, canola, alfalfa, algodão, cevada, mi-
lhete, cana-de-açúcar, tomate, tabaco, tapioca ou batata.
23. Método, de acordo com qualquer uma das reivindicações 18 a 22, caracterizado pelo fato de que a sequência alvo é associada a um traço da planta, e com isso a edição de bases resulta na planta tendo um traço alterado em relação a uma planta do tipo selvagem.
24. Método, de acordo com qualquer uma das reivindica- ções 18 a 23, caracterizado pelo fato de que o sistema é introduzido por transformação transitória.
25. Método, de acordo com qualquer uma das reivindica- ções 18 a 24, caracterizado pelo fato de que o método que pode ser usado para introduzir o sistema na planta na planta é selecionado den- tre: método da pistola de genes, transformação de protoplastos media- da por PEG, transformação mediada por Agrobacterium, transformação mediada por vírus de plantas, transformação pela via do tubo polínico e injeção no ovário.
26. Método, de acordo com qualquer uma das reivindica- ções 18 a 25, caracterizado pelo fato de que compreende ainda a ob- tenção de progênie do planta geneticamente modificada.
27. Método, de acordo com qualquer uma das reivindica- ções 18 a 26, caracterizado pelo fato de que nenhum DNA exógeno é integrado no genoma da planta modificada.
28. Planta geneticamente modificada ou uma progênie da mesma, ou uma parte da mesma, caracterizada pelo fato de que é obtida pelo método, como definido em qualquer uma das reivindicações 18 a 27, de preferência, a planta geneticamente modificada é livre de transgenes.
29. Método para o cultivo de plantas, caracterizado pelo fato de que compreende o cruzamento de uma primeira planta contendo uma modificação genética obtida pelo método, como definido em qual- quer uma das reivindicações 18 a 27 com uma segunda planta não contendo a modificação genética, a modificação genética sendo dessa forma introduzida na segunda planta.
BR112020010594-5A 2017-12-21 2018-12-21 método para edição de bases em plantas BR112020010594A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201711393160 2017-12-21
CN201711393160.7 2017-12-21
CN201810402244 2018-04-28
CN201810402244.0 2018-04-28
PCT/CN2018/122640 WO2019120283A1 (en) 2017-12-21 2018-12-21 Method for base editing in plants

Publications (1)

Publication Number Publication Date
BR112020010594A2 true BR112020010594A2 (pt) 2020-11-10

Family

ID=66993107

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020010594-5A BR112020010594A2 (pt) 2017-12-21 2018-12-21 método para edição de bases em plantas

Country Status (6)

Country Link
US (1) US11820990B2 (pt)
EP (1) EP3728600A4 (pt)
CN (1) CN110157727A (pt)
BR (1) BR112020010594A2 (pt)
CA (1) CA3091157A1 (pt)
WO (1) WO2019120283A1 (pt)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3924481A4 (en) 2019-02-13 2023-01-25 Beam Therapeutics Inc. COMPOSITIONS AND METHODS FOR THE TREATMENT OF HEMOGLOBINOPATHIES
CA3139581A1 (en) * 2019-05-03 2020-11-12 Specific Biologics Inc. Lipid-encapsulated dual-cleaving endonuclease for dna and gene editing
WO2021030666A1 (en) * 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
US20230257761A1 (en) * 2019-09-12 2023-08-17 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Herbicide resistant plant
WO2021056302A1 (en) * 2019-09-26 2021-04-01 Syngenta Crop Protection Ag Methods and compositions for dna base editing
CN112725348B (zh) * 2019-10-28 2022-04-01 安徽省农业科学院水稻研究所 一种提高水稻单碱基编辑效率的基因、方法及应用
CN114867852A (zh) * 2019-10-30 2022-08-05 成对植物服务股份有限公司 V型crispr-cas碱基编辑器及其使用方法
AU2020378387A1 (en) * 2019-11-07 2022-01-20 Qingdao Kingagroot Chemical Compound Co., Ltd. Method for generating new mutations in organisms, and application thereof
CN112813064A (zh) * 2019-11-18 2021-05-18 安徽省农业科学院水稻研究所 一种创制高抗稳定的内源抗除草剂水稻的方法
CN112824526A (zh) * 2019-11-18 2021-05-21 安徽省农业科学院水稻研究所 一种水稻ACCase突变型蛋白及相应基因
CN110878305B (zh) * 2019-12-09 2022-04-12 安徽省农业科学院水稻研究所 一种宽窗口单碱基编辑基因及其应用和育种方法
CN110982818B (zh) * 2019-12-20 2022-03-08 北京市农林科学院 核定位信号f4nls在高效创制水稻除草剂抗性材料中的应用
US20230116627A1 (en) * 2020-02-14 2023-04-13 Ohio State Innovation Foundation Nucleobase editors and methods of use thereof
EP4204559A4 (en) * 2020-10-23 2024-10-23 Broad Inst Inc NUCLEIC ACID-GUIDED NUCLEASES AND USE THEREOF
CN112778425B (zh) * 2020-12-31 2022-11-18 国家卫生健康委科学技术研究所 一种降低脱靶效应的rna基因编辑系统的制备方法
CN114686454B (zh) * 2020-12-31 2024-04-26 北京市农林科学院 Pe-p3引导编辑系统及其在基因组碱基编辑中的应用
CN114763556B (zh) * 2020-12-31 2024-04-26 北京市农林科学院 一种基因编辑效率提高的引导碱基编辑系统及其应用
CN114908116B (zh) * 2022-04-29 2024-05-10 中国农业科学院作物科学研究所 一种通过借助代理引导编辑器进行水稻多基因精准编辑的方法
CN114686456B (zh) * 2022-05-10 2023-02-17 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR006928A1 (es) 1996-05-01 1999-09-29 Pioneer Hi Bred Int Una molecula de adn aislada que codifica una proteina fluorescente verde como marcador rastreable para la transformacion de plantas, un metodo para laproduccion de plantas transgenicas, un vector de expresion, una planta transgenica y celulas de dichas plantas.
US6919619B2 (en) 2003-02-28 2005-07-19 The Regents Of The University Of Michigan Actively-shielded signal wires
WO2014127287A1 (en) * 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
US9840699B2 (en) * 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
US11584936B2 (en) * 2014-06-12 2023-02-21 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using CRISPR /Cas9
CA2956224A1 (en) * 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20170233762A1 (en) * 2014-09-29 2017-08-17 The Regents Of The University Of California Scaffold rnas
US10538758B2 (en) * 2015-08-19 2020-01-21 Arc Bio, Llc Capture of nucleic acids using a nucleic acid-guided nuclease-based system
WO2017090761A1 (ja) 2015-11-27 2017-06-01 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、単子葉植物のゲノム配列の変換方法、及びそれに用いる分子複合体
CN105907785B (zh) * 2016-05-05 2020-02-07 苏州吉玛基因股份有限公司 化学合成的crRNA用于CRISPR/Cpf1系统在基因编辑中的应用
SG11201900907YA (en) * 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
AR110075A1 (es) * 2016-11-14 2019-02-20 Inst Genetics & Developmental Biology Cas Un método para edición basal en plantas
KR20190117536A (ko) * 2017-02-15 2019-10-16 키진 엔.브이. 식물 세포에서 표적 유전적 변형 방법
US11866697B2 (en) 2017-05-18 2024-01-09 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing

Also Published As

Publication number Publication date
CA3091157A1 (en) 2019-06-27
EP3728600A4 (en) 2021-10-20
US20200340002A1 (en) 2020-10-29
WO2019120283A1 (en) 2019-06-27
US11820990B2 (en) 2023-11-21
CN110157727A (zh) 2019-08-23
EP3728600A1 (en) 2020-10-28

Similar Documents

Publication Publication Date Title
BR112020010594A2 (pt) método para edição de bases em plantas
WO2019120310A1 (en) Base editing system and method based on cpf1 protein
US11447785B2 (en) Method for base editing in plants
AU2014378946B2 (en) Modified plants
WO2018205995A1 (en) Creation of herbicide resistant gene and use thereof
US20160264982A1 (en) Method for plant genome site-directed modification
WO2021032155A1 (zh) 一种碱基编辑系统和其使用方法
WO2019038417A1 (en) METHODS FOR INCREASING GRAIN YIELD
BR112019025498A2 (pt) Planta de banana e sua parte, método para produção e aumento da meia-vida de banana, fruto, construto de ácido nucleico, planta ou método ou produtos processados
CN112805385B (zh) 基于人apobec3a脱氨酶的碱基编辑器及其用途
JP2021519098A (ja) 植物におけるアミノ酸含有量の調節
US20230323384A1 (en) Plants having a modified lazy protein
BR112020008016A2 (pt) resistência ao alojamento em plantas
CN116782762A (zh) 植物单倍体诱导
BR112020008180A2 (pt) promotor de planta para expressão de transgene
BR112017021903B1 (pt) Promotor de planta para expressão de transgene
US20230227835A1 (en) Method for base editing in plants
AU2023276739A1 (en) Compositions and methods for targeting donor polynucelotides in soybean genomic loci
WO2023199304A1 (en) Controlling juvenile to reproductive phase transition in tree crops
US20240309394A1 (en) Herbicide resistant cannabis plant
BR102017008936B1 (pt) Vetor de ácido nucleico e uso de uma planta ou semente não-zea mays c.v. b73
Cai et al. CRISPR/Cas9-mediated targeted mutagenesis of GmFT2a delays flowering time in

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]