BR112020011011A2 - variantes de cas9 e métodos de uso - Google Patents

variantes de cas9 e métodos de uso Download PDF

Info

Publication number
BR112020011011A2
BR112020011011A2 BR112020011011-6A BR112020011011A BR112020011011A2 BR 112020011011 A2 BR112020011011 A2 BR 112020011011A2 BR 112020011011 A BR112020011011 A BR 112020011011A BR 112020011011 A2 BR112020011011 A2 BR 112020011011A2
Authority
BR
Brazil
Prior art keywords
cas9
endonuclease
variant
sequence
seq
Prior art date
Application number
BR112020011011-6A
Other languages
English (en)
Inventor
Ryan L. Frisch
Hongxian He
Original Assignee
Danisco Us Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco Us Inc. filed Critical Danisco Us Inc.
Publication of BR112020011011A2 publication Critical patent/BR112020011011A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Trata-se de composições e métodos para sistemas de Cas variante e elementos que compreendem tais sistemas que incluem, porém, sem limitação, variantes de endonuclease Cas, complexos de polinucleotídeo-guia/endonuclease Cas que compreendem variantes de endonuclease Cas, assim como elementos de polinucleotídeos-guia e RNA-guia que podem interagir com variantes de endonuclease Cas. Composições e métodos são fornecidos para modificação de genoma de uma sequência-alvo no genoma de uma célula. Os métodos e composições empregam um sistema de polinucleotídeo-guia/endonuclease Cas que compreende uma variante de endonuclease Cas9 para fornecer um sistema eficaz para modificar ou alterar sequências-alvo dentro do genoma de uma célula ou organismo.

Description

Relatório Descritivo da Patente de Invenção para “VARIAN- TES DE CAS9 E MÉTODOS DE USO”.
[1] Este pedido reivindica o benefício do Pedido de Patente Pro- visório no U.S. 62/599.176, depositado em 15 de dezembro de 2017, incorporado no presente documento em sua totalidade a título de refe- rência.
[2] CAMPO
[3] A presente descrição se refere ao campo de biologia mole- cular, em particular, às composições de sistemas de polinucleotídeo- guia/endonuclease Cas, e composições e métodos das mesmas para modificar o genoma de uma célula.
[4] REFERÊNCIA À LISTAGEM DE SEQUÊNCIAS SUBME-
TIDA ELETRONICAMENTE
[5] A cópia oficial da listagem de sequências é submetida ele- tronicamente através de EFS-Web como uma listagem de sequência em formato ASCII com um arquivo nomeado 20181129_NB41317PCT_ST25.txt, criado em 29 de novembro de 2018, e que tem um tamanho de 476 quilobites e é depositado simultanea- mente com o relatório descritivo. A listagem de sequências contida neste documento formatado de acordo com ASCII é parte do relatório descritivo e está incorporada no presente documento em sua totalidade a título de referência.
[6] ANTECEDENTES
[7] A tecnologia de DNA recombinante tornou possível inserir sequências de DNA em locais genômicos alvejados e/ou modificar se- quências cromossômicas endógenas específicas. As técnicas de inte- gração de sítio específico, que empregam sistemas de recombinação de sítio específico, assim como outros tipos de tecnologias de recombi- nação, têm sido usadas para gerar inserções direcionadas de genes de interesse em uma variedade de organismos. Dada a natureza de sítio específico dos sistemas de Cas, as técnicas de modificação/engenharia de genoma com base nesses sistemas foram descritas, que incluem em células de mamífero (consultar, por exemplo, Hsu et al., 2014). Enge- nharia de genoma com base em Cas, quando funciona conforme dese- jado, confere a habilidade de alvejar virtualmente qualquer local especí- fico dentro de um genoma complexo, projetando-se um crRNA recom- binante (ou polinucleotídeo-guia equivalentemente funcional) no qual a região de alvejamento de DNA (isto é, o domínio de alvejamento variá- vel) do crRNA é homóloga a um sítio-alvo desejado no genoma, e com- binando-se o crRNA com uma endonuclease Cas (através de qualquer meio conveniente e convencional) em um complexo funcional em uma célula hospedeira.
[8] Embora técnicas de engenharia de genoma com base em Cas tenham sido aplicadas em diversos tipos diferentes de célula hos- pedeira, essas técnicas têm limitações conhecidas. Por exemplo, a efi- ciência de transformar determinadas células hospedeiras, tais como, porém, sem limitação espécies de Bacillus, permanece baixa e onerosa.
[9] Portanto, ainda há uma necessidade em desenvolver méto- dos de modificação de genoma com base em Cas mais eficazes, efici- entes ou, de outra forma, mais robustos ou flexíveis e composições dos mesmos para modificar/alterar um sítio-alvo genômico em uma célula procariótica ou eucariótica.
[10] BREVE SUMÁRIO
[11] Composições e métodos são fornecidos para sistemas de Cas variante e elementos que compreendem tais sistemas que incluem, porém, sem limitação, variantes de endonuclease Cas, polinucleotí- deos-guia, complexos de polinucleotídeo-guia/endonuclease Cas, siste- mas de RNA-guia/endonuclease Cas, em particular, variantes de endo- nuclease Cas9 que compreendem pelo menos uma modificação de ami- noácido localizada fora de seus domínios HNH e RuvC, e opcionalmente em que a variante de endonuclease Cas9 tem pelo menos uma propri- edade melhorada quando comparada com sua endonuclease Cas9 pa- rente que não tem a pelo menos uma modificação de aminoácido.
[12] Composições e métodos também são fornecidos para en- trega direta de variantes de endonuclease Cas9, polinucleotídeos-guia e sistemas de polinucleotídeo-guia/endonuclease Cas que compreen- dem pelo menos uma variante de endonuclease Cas9 e pelo menos um RNA-guia, assim como para modificação de genoma de uma sequência- alvo no genoma de uma célula procariótica ou eucariótica, para edição de gene e para inserir ou deletar um polinucleotídeo de interesse no ou a partir do genoma de um organismo.
[13] Em uma modalidade da descrição, a variante de endonu- clease Cas9 é uma variante de endonuclease Cas9, ou um fragmento ativo da mesma, que tem pelo menos 80% de identidade de aminoácido com um polipeptídeo de Cas9 parente apresentado na SEQ ID NO: 2 e que tem pelo menos uma substituição de aminoácido em uma posição selecionada a partir do grupo que consiste em posição 86, posição 98, posição 155 e uma combinação das mesmas, sendo que as posições de aminoácido da variante são numeradas em correspondência à se- quência de aminoácidos do dito polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem atividade de endonu- clease. A dita variante de endonuclease Cas9 pode ter pelo menos uma substituição de aminoácido selecionada a partir do grupo que consiste em Y155H, Y155N, Y155E, Y155F (na posição 155), F86A (na posição 86) e F98A (na posição 98). A variante de endonuclease Cas9 pode ter elo menos uma propriedade melhorada selecionada a partir do grupo que consiste em eficiência de transformação melhorada e eficiência de edição melhorada, quando comparada com a sua endonuclease Cas9 parente. A variante de endonuclease Cas9, ou fragmento ativo da mesma, pode ter pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 substituições de aminoácido quando comparada com sua endonuclease Cas9 parente.
[14] Em uma modalidade da descrição, a variante de endonu- clease Cas9 é uma variante de endonuclease Cas9, ou fragmento ativo da mesma, sendo que a dita variante compreende uma sequência de aminoácidos que tem 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequência de aminoá- cidos com a sequência de aminoácidos da SEQ ID NO: 2.
[15] Em uma modalidade da descrição, a variante de endonu- clease Cas9 é uma variante de endonuclease Cas9, em que a proprie- dade melhorada é eficiência de transformação melhorada e em que a dita variante, ou fragmento ativo da mesma, também tem uma eficiência de edição melhorada.
[16] Em uma modalidade da descrição, a composição é uma composição que compreende uma variante de endonuclease Cas9 re- velada no presente documento, ou um fragmento funcional da mesma. A composição pode ser selecionada a partir do grupo que consiste em um complexo de polinucleotídeo-guia/endonuclease Cas9, um com- plexo de RNA-guia/endonuclease Cas9 e uma proteína de fusão que compreende a dita variante de endonuclease Cas9.
[17] Em uma modalidade da descrição, o polinucleotídeo é um polinucleotídeo que compreende uma sequência de ácido nucleico que codifica qualquer variante de endonuclease Cas9 revelada no presente documento.
[18] Em uma modalidade da descrição, o complexo de polinucle- otídeo-guia/endonuclease Cas (PGEN) é um PGEN que compreende pelo menos um polinucleotídeo-guia e pelo menos uma variante de en- donuclease Cas9 descrita no presente documento, sendo que o dito po- linucleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural quimérico, em que o dito complexo de polinucleotídeo-guia/endonu- clease Cas tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequência-alvo
[19] Em uma modalidade da descrição, o método compreende um método para modificar um sítio-alvo no genoma de uma célula, sendo que o método compreende introduzir em uma célula pelo menos um PGEN que compreende pelo menos um polinucleotídeo-guia e pelo menos uma variante de endonuclease Cas9 descrita no presente docu- mento, e identificar pelo menos uma célula que tem uma modificação no dito alvo, em que a modificação no dito sítio-alvo é selecionada a partir do grupo que consiste em (i) uma substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
[20] Em uma modalidade da descrição, o método compreende um método para editar uma sequência de nucleotídeos no genoma de uma célula, sendo que o método compreende introduzir em pelo menos um PGEN que compreende pelo menos um polinucleotídeo-guia e pelo menos uma variante de endonuclease Cas9 descrita no presente docu- mento e um modelo de modificação de polinucleotídeo, sendo que o dito modelo de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeo da dita sequência de nucleotídeos
[21] Em uma modalidade da descrição, o método compreende um método para modificar um sítio-alvo no genoma de uma célula, sendo que o método compreende introduzir em uma célula pelo menos um PGEN que compreende pelo menos um polinucleotídeo-guia e pelo menos uma variante de endonuclease Cas9 descrita no presente docu- mento e pelo menos um DNA doador, sendo que o dito DNA doador compreende um polinucleotídeo de interesse.
[22] Em uma modalidade da descrição, o método compreende um método para melhorar pelo menos uma propriedade de uma variante de endonuclease Cas9, sendo que o dito método compreende introduzir pelo menos uma modificação de aminoácido em uma endonuclease Cas9 parente, sendo que a dita pelo menos uma modificação de amino- ácido está localizada fora dos domínios RuvC e HNH da endonuclease Cas9 parente, desse modo, se cria a dita variante de endonuclease Cas9, sendo que a dita variante de endonuclease Cas9 mostra um me- lhoramento em pelo menos uma propriedade quando comparada com a dita endonuclease Cas9 parente. A pelo menos uma modificação de aminoácido pode ser uma substituição de aminoácido em uma posição selecionada a partir do grupo que consiste em posição 86, posição 98, posição 155 e uma combinação das mesmas, sendo que as posições de aminoácido da variante são numeradas em correspondência à se- quência de aminoácidos da dita endonuclease Cas9 parente. A pelo me- nos uma substituição de aminoácido pode ser selecionada a partir do grupo que consiste em Y155H, Y155N, Y155E, Y155F (na posição 155), F86A (na posição 86) e F98A (na posição 98).
[23] Também são fornecidos cassetes de expressão, DNAs re- combinantes, construtos de ácido nucleico, células procarióticas e eu- carióticas que têm uma sequência-alvo modificada ou que têm uma mo- dificação em uma sequência de nucleotídeos no genoma das células procarióticas e eucarióticas produzida através dos métodos descritos no presente documento. Modalidades adicionais dos métodos e composi- ções da presente descrição são mostradas no presente documento.
[24] BREVE DESCRIÇÃO DOS DESENHOS E DA LISTAGEM
DE SEQUÊNCIAS
[25] A descrição pode ser compreendida mais completamente a partir da descrição detalhada a seguir e dos desenhos e Listagem de Sequências anexos que fazem parte deste pedido. As descrições de sequência e a listagem de sequências anexadas ao presente docu- mento cumprem as regras que regem as revelações de sequências de nucleotídeos e aminoácidos nos pedidos de patente, conforme apresen- tado no Título 37 do C.F.R §§ 1.821 a 1.825. As descrições da sequên- cia contêm os códigos de três letras para aminoácidos conforme defi- nido no Título 37 do C.F.R. §§ 1.821 a 1.825, que são incorporados ao presente documento a título de referência.
[26] Figuras
[27] A Figura 1 mostra uma representação esquemática de um polipeptídeo de Cas9 e seus domínios de proteína Cas9. O domínio de nuclease RuvC é mostrado em preenchimento preto, hachura indica a ponte em hélice, preenchimento em traço diagonal indica o domínio REC I, preenchimento cinza médio indica o domínio REC II, preenchi- mento cinza claro indica o domínio de nuclease HNH, preenchimento em bola indica o domínio de reconhecimento PAM. (Adaptado de Jinek M., Jiang F.,Taylor D.W. et al. 2014, Science 343, 1247997). A modifi- cação Y155 da variante de endonuclease Cas9 descrita no presente do- cumento está localizada no domínio REC1.
[28] A Figura 2 mostra a arquitetura de domínio mapeada na es- trutura de aminoácido primário de uma endonuclease Cas9. O local da modificação Y155 da variante de endonuclease Cas9 Y155 (no domínio REC1) descrita no presente documento é indicado por uma seta.
[29] A Figura 3 mostra a arquitetura de domínio mapeada na es- trutura de aminoácido primário de uma endonuclease Cas9. O local das modificações F86 e F98 da variante de endonuclease Cas9 F86 a F98 descrita no presente documento é indicado por uma seta.
[30] As seguintes sequências cumprem com o Título 37, Seções
1.821 a 1.825 do C.F.R. ("Requirements for Patent Applications Contai- ning Nucleotide Sequences and/or Amino Acid Sequence Disclosures -
the Sequence Rules") e são consistentes com o Padrão ST.25 da Orga- nização Mundial de Propriedade Intelectual (WIPO) (2009) e as solicita- ções de listagem de sequência das Regras da Convenção Europeia de Patente (EPC) e do Tratado de Cooperação em Matéria de Patente (PCT) 5.2 e 49.5(a-bis), e Seção 208 e Anexo C das Instruções Admi- nistrativas. Os símbolos e formato usados para dados de sequência de nucleotídeos e aminoácidos cumprem com as regras apresentadas no Título 37 seção 1.822 do C.F.R.
[31] A SEQ ID NO:1 apresenta a sequência de aminoácidos de Streptococcus pyogenes Cas9.
[32] A SEQ ID NO:2 apresenta a sequência de nucleotídeos de gene Cas9 de códon otimizado de Bacillus, que codifica a proteína Cas9 de tipo selvagem de Streptococcus pyogenes Cas9.
[33] A SEQ ID NO:3 apresenta a sequência de aminoácidos de NLS de terminal N.
[34] A SEQ ID NO:4 apresenta a sequência de aminoácidos de NLS de terminal C.
[35] A SEQ ID NO:5 apresenta a sequência de aminoácidos de marcador de deca-Histidina.
[36] A SEQ ID NO:6 apresenta a sequência de nucleotídeos de promotor de 6 aprE.
[37] A SEQ ID NO:7 apresenta a sequência de nucleotídeos de terminador.
[38] As SEQ ID NOs: 8-9, 12-13, 38-39, 41-42, 50-51, 54-55, 59- 60, 67-68, 71-72, 79-80, 88-89, 91-92, 111-112, 119-120, 138-139, 145- 146, 151-152, 156-157 apresentam a sequência de nucleotídeos de um iniciador.
[39] A SEQ ID NO: 10 apresenta a sequência de nucleotídeos da estrutura principal pKB320.
[40] A SEQ ID NO: 11 apresenta a sequência de nucleotídeos de pKB320.
[41] A SEQ ID NO: 14 apresenta a sequência de nucleotídeos de plasmídeo RSP1.
[42] A SEQ ID NO: 15 apresenta a sequência de nucleotídeos de plasmídeo RSP2.
[43] As SEQ ID NOs: 16 a 27 apresentam a sequência de nucle- otídeos de plasmídeos FSP1, FSP2, FSP3, FSP4, FSP5, FSP6, FSP7, RSP3, FSP8, pRF694, pRF801 e pRF806, respectivamente.
[44] A SEQ ID NO: 28 apresenta a sequência de nucleotídeos de sítio-alvo 1 de Bacillus licheniformis.
[45] A SEQ ID NO: 29 apresenta a sequência de nucleotídeos de sítio-alvo 1 de Bacillus licheniformis.
[46] A SEQ ID NO: 30 apresenta a sequência de nucleotídeos de quadro de leitura aberto de serA1.
[47] A SEQ ID NO: 31 apresenta a sequência de nucleotídeos de sítio-alvo 1 + PAM de Bacillus licheniformis.
[48] A SEQ ID NO: 32 apresenta a sequência de nucleotídeos de DNA que codifica domínio de alvejamento variável 1
[49] A SEQ ID NO: 33 apresenta a sequência de nucleotídeos de DNA que codifica o domínio CER.
[50] A SEQ ID NO: 34 apresenta a sequência de nucleotídeos de sítio-alvo de alvejamento de gRNA 1.
[51] A SEQ ID NO: 35 apresenta a sequência de nucleotídeos de promotor spac.
[52] A SEQ ID NO: 36 apresenta a sequência de nucleotídeos de terminador t0
[53] A SEQ ID NO: 37 apresenta a sequência de nucleotídeos de braço de homologia serA1 1 de Bacillus licheniformis.
[54] A SEQ ID NO: 40 apresenta a sequência de nucleotídeos de braço de homologia serA1 2 de Bacillus licheniformis.
[55] A SEQ ID NO: 43 apresenta a sequência de nucleotídeos de DNA que codifica cassete de expressão de gRNA ts1.
[56] A SEQ ID NO: 44 apresenta a sequência de nucleotídeos de modelo de edição de deleção de serA1.
[57] A SEQ ID NO: 45 apresenta a sequência de nucleotídeos de quadro de leitura aberto de rghR1 de Bacillus licheniformis.
[58] A SEQ ID NO: 46 apresenta a sequência de nucleotídeos de sítio-alvo 2 de Bacillus licheniformis.
[59] A SEQ ID NO: 47 apresenta a sequência de nucleotídeos de sítio-alvo 2 + PAM de Bacillus licheniformis.
[60] A SEQ ID NO: 48 apresenta a sequência de nucleotídeos de DNA que codifica domínio de alvejamento variável 2.
[61] A SEQ ID NO: 49 apresenta a sequência de nucleotídeos do sítio-alvo de alvejamento de RNA-guia (gRNA) 2.
[62] A SEQ ID NO: 50 apresenta a sequência de nucleotídeos de braço de homologia 1 de rghR1 de Bacillus licheniformis.
[63] A SEQ ID NO: 53 apresenta a sequência de nucleotídeos de braço de homologia 2 de rghR1 de Bacillus licheniformis.
[64] A SEQ ID NO: 56 apresenta a sequência de nucleotídeos de DNA que codifica cassete de expressão de ts2.
[65] A SEQ ID NO: 57 apresenta a sequência de nucleotídeos de modelo de edição de deleção de rghR1.
[66] A SEQ ID NO: 58 apresenta a sequência de aminoácidos de variante de Cas9 Y155H.
[67] A SEQ ID NO: 61 apresenta a sequência de nucleotídeos de pRF827.
[68] A SEQ ID NO: 62 apresenta a sequência de nucleotídeos de cassete de expressão de variante de Cas9 Y155H.
[69] A SEQ ID NO: 63 apresenta a sequência de nucleotídeos de pRF856,
[70] A SEQ ID NO: 64 apresenta a sequência de nucleotídeos de pBL.comK-syn.
[71] A SEQ ID NO: 65 apresenta a sequência de nucleotídeos da localização de sítio-alvo 1 de Bacillus licheniformis.
[72] A SEQ ID NO: 66 apresenta a sequência de nucleotídeos da localização de sítio-alvo 1 editado.
[73] A SEQ ID NO: 69 apresenta a sequência de nucleotídeos da localização de sítio-alvo 2 de Bacillus licheniformis.
[74] A SEQ ID NO: 70 apresenta a sequência de nucleotídeos da localização de sítio-alvo 2 editado.
[75] A SEQ ID NO: 73 apresenta a sequência de nucleotídeos de Cas9 de códon otimizado de Yarrowia.
[76] A SEQ ID NO: 74 apresenta a sequência de nucleotídeos de NLS de SV40.
[77] A SEQ ID NO: 75 apresenta a sequência de nucleotídeos de promotor de FBA1 de Yarrowia.
[78] A SEQ ID NO: 76 apresenta a sequência de nucleotídeos de cassete de expressão de Cas9 de Yarrowia.
[79] A SEQ ID NO: 77 apresenta a sequência de nucleotídeos de pZufCas9.
[80] A SEQ ID NO: 78 apresenta a sequência de nucleotídeos de fusão de Cas9-SV40.
[81] A SEQ ID NO: 81 apresenta a sequência de nucleotídeos de produto de PCR de Cas9-SV40.
[82] As SEQ ID NOs: 82 a 83 apresentam a sequência de nucle- otídeos de pBAD/HisB e pRF48, respectivamente.
[83] A SEQ ID NO: 84 apresenta a sequência de nucleotídeos do cassete de expressão de Cas9 otimizado de E. coli ;
[84] As SEQ ID NOs: 85 a 86 apresentam a sequência de nucle- otídeos de pKO3 e pRF97, respectivamente.
[85] A SEQ ID NO: 87 apresenta a sequência de nucleotídeos do fragmento sintético de codificação de Cas9 Y155H;
[86] A SEQ ID NO: 90 apresenta a sequência de nucleotídeos de fragmento pRF97-Y155H.
[87] A SEQ ID NO: 93 apresenta a sequência de nucleotídeos de pRF861
[88] A SEQ ID NO: 94 apresenta a sequência de nucleotídeos do gene nac de E. coli.
[89] A SEQ ID NO: 95 apresenta a sequência de nucleotídeos de sítio-alvo de nac 1.
[90] A SEQ ID NO: 96 apresenta a sequência de nucleotídeos de sítio-alvo de nac 1+ PAM
[91] E. coli.
[92] A SEQ ID NO: 97 apresenta a sequência de nucleotídeos de sítio-alvo de nac 1.
[93] A SEQ ID NO: 98 apresenta a sequência de nucleotídeos de sítio-alvo de nac 1+ PAM.
[94] A SEQ ID NO: 99 apresenta a sequência de nucleotídeos de promotor de fago N25
[95] A SEQ ID NO: 100 apresenta a sequência de nucleotídeos de cassete de expressão de gRNA de sítio-alvo de nac 1.
[96] A SEQ ID NO: 101 apresenta a sequência de nucleotídeos de cassete de expressão de gRNA de sítio-alvo de nac 2.
[97] A SEQ ID NO: 102 apresenta a sequência de nucleotídeos de braço de deleção a montante de nac.
[98] A SEQ ID NO: 103 apresenta a sequência de nucleotídeos de braço de deleção a jusante de nac.
[99] A SEQ ID NO: 104 apresenta a sequência de nucleotídeos de modelo de edição de deleção de nac.
[100] A SEQ ID NO: 105 apresenta a sequência de nucleotídeos de identidade de pRF97 ou pRF861 de 5’.
[101] A SEQ ID NO: 106 apresenta a sequência de nucleotídeos de identidade de pRF97 ou pRF861 de 3’.
[102] A SEQ ID NO: 107 apresenta a sequência de nucleotídeos de nacETsite1.
[103] A SEQ ID NO: 108 apresenta a sequência de nucleotídeos de nacETsite2.
[104] A SEQ ID NO: 109 apresenta a sequência de nucleotídeos de cassete pRF97.
[105] A SEQ ID NO: 110 apresenta a sequência de nucleotídeos de cassete pRF861.
[106] A SEQ ID NO: 113 apresenta a sequência de nucleotídeos de pRF97-nacETsite1.
[107] A SEQ ID NO: 114 apresenta a sequência de nucleotídeos de pRF97-nacETsite2.
[108] A SEQ ID NO: 115 apresenta a sequência de nucleotídeos de pRF861-nacETsite1.
[109] A SEQ ID NO: 116 apresenta a sequência de nucleotídeos de pRF861-nacETsite2.
[110] A SEQ ID NO: 117 apresenta a sequência de nucleotídeos da localização de nac de tipo selvagem (WT) de E. coli.
[111] A SEQ ID NO: 118 apresenta a sequência de nucleotídeos da localização de nac editada.
[112] A SEQ ID NO: 121 apresenta a sequência de nucleotídeos de Streptococcus pyogenes Cas9.
[113] A SEQ ID NO: 122 apresenta a sequência de nucleotídeos que codifica a variante de Cas9 Y155H.
[114] A SEQ ID NO: 123 apresenta a sequência de aminoácidos da variante de Cas9 Y155N.
[115] A SEQ ID NO: 124 apresenta a sequência de nucleotídeos que codifica a variante de Cas9 Y155N.
[116] A SEQ ID NO: 125 apresenta a sequência de aminoácidos da variante de Cas9 Y155E.
[117] A SEQ ID NO: 126 apresenta a sequência de nucleotídeos que codifica a variante de Cas9 Y155E.
[118] A SEQ ID NO: 127 apresenta a sequência de aminoácidos da variante de Cas9 Y155F.
[119] A SEQ ID NO: 128 apresenta a sequência de nucleotídeos que codifica a variante de Cas9 Y155F.
[120] A SEQ ID NO: 129 apresenta a sequência de aminoácidos da variante de Cas9 F86A-F98A.
[121] A SEQ ID NO: 130 apresenta a sequência de nucleotídeos do fragmento sintético F86A-F98A.
[122] A SEQ ID NO: 131 apresenta a sequência de nucleotídeos de estrutura principal pRF801 para F86A F98A.
[123] A SEQ ID NO: 132 apresenta a sequência de nucleotídeos de estrutura principal pRF801 dianteira.
[124] A SEQ ID NO: 133 apresenta a sequência de nucleotídeos de estrutura principal pRF801 reversa
[125] A SEQ ID NO: 134 apresenta a sequência de nucleotídeos de F86A-F98A sintética dianteira.
[126] A SEQ ID NO: 135 apresenta a sequência de nucleotídeos de F86A-F98A sintética reversa.
[127] A SEQ ID NO: 136 apresenta a sequência de nucleotídeos de cassete de expressão de F86A F98A de Bacillus.
[128] A SEQ ID NO: 137 apresenta a sequência de nucleotídeos de pRF866.
[129] A SEQ ID NO: 140 apresenta a sequência de nucleotídeos de promotor RNR2p.
[130] A SEQ ID NO: 141 apresenta a sequência de nucleotídeos de origem de replicação de 2 mícrons 1.
[131] A SEQ ID NO: 142 apresenta a sequência de nucleotídeos de cassete de expressão de KanMX.
[132] A SEQ ID NO: 143 apresenta a sequência de nucleotídeos de promotor SNR52p.
[133] A SEQ ID NO: 144 apresenta a sequência de nucleotídeos de plasmídeo pSE087.
[134] A SEQ ID NO: 147 apresenta a sequência de nucleotídeos de sgRNA de alvejamento + terminador T(6).
[135] A SEQ ID NO: 148 apresenta a sequência de nucleotídeos de braço de homologia a montante de 50 bp.
[136] A SEQ ID NO: 149 apresenta a sequência de nucleotídeos de sgRNA de alvejamento de URA3 + terminador T(6).
[137] A SEQ ID NO: 150 apresenta a sequência de nucleotídeos de braço de homologia a jusante de 50 bp.
[138] A SEQ ID NO: 153 apresenta a sequência de nucleotídeos de origem de replicação de 2 mícrons 2.
[139] A SEQ ID NO: 154 apresenta a sequência de nucleotídeos de gene resistente à ampicilina 154.
[140] A SEQ ID NO: 155 apresenta a sequência de nucleotídeos de terminador RNR2.
[141] DESCRIÇÃO DETALHADA
[142] Trata-se de composições e métodos para sistemas de Cas variante e elementos que compreendem tais sistemas que incluem, po- rém, sem limitação, variantes de endonuclease Cas, complexos de po- linucleotídeo-guia/endonuclease Cas que compreendem variantes de endonuclease Cas, assim como elementos de polinucleotídeos-guia e RNA-guia que podem interagir com variantes de endonuclease Cas. Composições e métodos também são fornecidos para entrega direta de variantes de endonucleases Cas, RNAs-guia e complexos de RNA- guia/endonucleases Cas. A presente descrição inclui adicionalmente composições e métodos para modificação de genoma de uma sequên- cia-alvo no genoma de uma célula, para edição de gene e para inserir um polinucleotídeo de interesse no genoma de uma célula.
[143] O presente documento está organizado em diversas seções para facilidade de leitura; no entanto, o leitor apreciará que as afirma- ções feitas em uma seção podem se aplicar em outras seções. Dessa maneira, os títulos usados para diferentes seções da divulgação não devem ser interpretados como limitantes.
[144] Os títulos fornecidos no presente documento não são limita- ções dos vários aspectos ou modalidades das presentes composições e métodos que podem ser obtidos em referência ao relatório descritivo como um todo. Consequentemente, os termos definidos imediatamente abaixo são mais completamente definidos em referência ao relatório descritivo como um todo.
[145] A menos que sejam definidos de outro modo, todos os ter- mos técnicos e científicos usados no presente documento têm o mesmo significado como comumente entendido por uma pessoa com habilidade comum na técnica à qual as presentes composições e métodos perten- cem. Embora quaisquer métodos e materiais similares ou equivalentes aos descritos no presente documento também possam ser usados na prática ou para testar as presentes composições e métodos, materiais e métodos ilustrativos representativos são descritos agora.
[146] Todas as publicações e patentes citadas neste relatório des- critivo são incorporadas no presente documento a título de referência, como se cada publicação ou patente individual fosse específica e indi- vidualmente indicada para ser incorporada a título de referência, e são incorporadas no presente documento a título de referência para revelar e descrever os métodos e/ou materiais em conexão com os quais as publicações são citadas.
[147] Genes e proteínas Cas
[148] Localizações de CRISPR (repetições palindrômicas curtas regularmente interespaçadas aglomeradas) se referem a determinadas localizações genéticas que codificam componentes de sistemas de cli- vagem de DNA, por exemplo, usados por células bacterianas e de ar- quea para destruir DNA estranho (Horvath e Barrangou, 2010, Science 327:167 a 170; WO2007/025097, publicado em 1 de março de 2007). Uma localização de CRISPR pode consistir em uma matriz de CRISPR que compreende repetições diretas curtas (repetições de CRISPR) se- paradas por sequências de DNA curtas variáveis (denominadas ‘espa- çadores'), que podem ser flanqueadas por diversos genes Cas (CRISPR-associados). O número de genes CRISPR-associados em uma dada localização de CRISPR pode variar entre espécies. Múltiplos sistemas de CRISPR/Cas foram descritos, que incluem, sistemas de Classe 1, com complexos de efetor de multissubunidade (que compre- endem subtipos de tipo I, tipo III e tipo IV), e sistemas de Classe 2, com efetores de proteína única (que compreendem subtipos de tipo II e tipo V, tais como, porém, sem limitação Cas9, Cpf1, C2c1, C2c2, C2c3). Sis- temas de Classe 1 (Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1 a 15; Zetsche et al., 2015, Cell 163, 1 a 13; Shmakov et al., 2015, Molecular_Cell 60, 1 a 13; Haft et al., 2005, Computational Bio- logy, PLoS Comput Biol 1(6): e60. doi:10.1371 /journal .pcbi. 0010060 e WO 2013/176772 A1 publicado em 23 de novembro de 2013 incorpo- rado a título de referência no presente documento). O sistema de CRISPR/Cas do tipo II de bactérias emprega um crRNA (RNA de CRISPR) e tracrRNA (RNA de CRISPR transativador) para guiar a en- donuclease Cas para seu DNA-alvo. O crRNA contém uma região de espaçador complementar a uma fita do DNA-alvo de fita dupla e uma região que forma pareamento de bases com o tracrRNA (RNA de
CRISPR transativador) que forma um dúplex de RNA que direciona a endonuclease Cas para clivar o DNA-alvo. Os espaçadores são adqui- ridos através de um processo não completamente compreendido que envolve proteínas Cas1 e Cas2. Todas as localizações de CRISPR/Cas de tipo II contêm genes cas1 e cas2 adicionalmente ao gene cas9 (Chylinski et al., 2013, RNA Biology 10:726-737; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1 a 15). As localizações de CRISPR-Cas de tipo II podem codificar um tracrRNA, que é parcial- mente complementar às repetições dentro da respectiva matriz de CRISPR e pode compreender outras proteínas, tais como Csn1 e Csn2. A presença de cas9 nas proximidades dos genes Cas 1 e cas2 é o marco das localizações de tipo II (Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1 a 15). Sistemas CRISPR-Cas (CRISPR-associa- dos) de tipo I consistem em um complexo de proteínas, denominado Cascade (complexo de CRISPR-associado para defesa antiviral), que funciona juntamente com um único RNA de CRISPR (crRNA) e Cas3 para defesa contra DNA viral invasor (Brouns, S.J.J. et al. Science 321:960 a 964; Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1 a 15, que estão incorporados em sua totalidade no presente docu- mento).
[149] O termo "gene Cas" no presente documento se refere a um gene que é geralmente acoplado, associado ou está próximo ou nas redondezas das localizações de CRISPR de flanqueamento. Os termos "gene Cas", "gene cas", "gene CRISPR-associado (Cas)" e "gene de Repetições Palindrômicas Curtas Regularmente Interespaçadas Aglo- merado-associado" são usados intercambiavelmente no presente docu- mento.
[150] O termo "proteína Cas" ou "polipeptídeo Cas" se refere a um polipeptídeo codificado por um gene Cas (CRISPR-associado). Uma proteína Cas inclui uma endonuclease Cas.
[151] Uma proteína Cas pode ser uma proteína bacteriana ou de arquea. Proteínas CRISPR Cas de tipo I a III são, no presente docu- mento, tipicamente de origem procariótica; proteínas Cas de tipo I e III podem ser derivadas de espécies bacterianas ou de arquea, enquanto proteínas Cas de tipo II (isto é, uma Cas9) podem ser derivadas de es- pécies bacterianas, por exemplo. Em outros aspectos, proteínas Cas incluem uma ou mais dentre Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, homólogos das mes- mas, ou versões modificadas das mesmas. Uma proteína Cas inclui uma proteína Cas9, uma proteína Cpf1, uma proteína C2c1, uma prote- ína C2c2, uma proteína C2c3, Cas3, Cas3-HD, Cas 5, Cas7, Cas8, Cas10 ou combinações ou complexos dessas.
[152] O termo "endonuclease Cas" se refere a um polipeptídeo Cas (proteína Cas) que, quando em complexo com um componente de polinucleotídeo adequado, tem capacidade para reconhecer, se ligar e, opcionalmente, cortar ou clivar toda ou parte de uma sequência-alvo de DNA específico. Uma endonuclease Cas é guiada pelo polinucleotídeo- guia para reconhecer, se ligar e, opcionalmente, cortar ou clivar todo ou parte de um sítio-alvo específico em DNA de fita dupla (por exemplo, em um sítio-alvo no genoma de uma célula). Uma endonuclease Cas descrita no presente documento compreende um ou mais domínios de nuclease. As endonucleases Cas empregadas em métodos de inserção de DNA doador descritos no presente documento são endonucleases que introduzem quebras de fita única ou dupla no DNA no sítio-alvo. Alternativamente, uma endonuclease Cas pode carecer de atividade de clivagem ou corte de DNA, mas ainda pode se ligar de forma específica a uma sequência-alvo de DNA quando complexada com um compo- nente de RNA adequado.
[153] Conforme usado no presente documento, um polipeptídeo denominado "Cas9" (anteriormente denominado Cas5, Csn1 ou Csx12) ou uma "endonuclease Cas9" ou que tem "atividade de endonuclease Cas9" se refere a uma endonuclease Cas que forma um complexo com um crNucleotídeo e um tracrNucleotídeo, ou com um único polinucleotí- deo-guia, para se ligar especificamente e, opcionalmente, cortar ou cli- var toda ou parte de uma sequência-alvo de DNA. A endonuclease Cas9 compreende um domínio de nuclease RuvC e um domínio de nuclease HNH (H-N-H), cada um dos quais pode clivar uma única fita de DNA em uma sequência-alvo (a ação conjunta de ambos os domínios leva à cli- vagem de fita dupla de DNA, enquanto a atividade de um domínio leva a um corte). Em geral, o domínio RuvC compreende os subdomínios I, II e III, em que o domínio I está localizado perto do terminal N de Cas9 e os subdomínios II e III estão localizados no meio da proteína, que flan- queia o domínio HNH (Makarova et al. 2015, Nature Reviews Microbio- logy Vol. 13:1 a 15, Hsu et al, 2013, Cell 157:1.262 a 1.278). Endonu- cleases Cas9 são tipicamente derivadas de um sistema de CRISPR de tipo II, que inclui um sistema de clivagem de DNA que utiliza uma endo- nuclease Cas9 em complexo com pelo menos um componente de poli- nucleotídeo. Por exemplo, uma Cas9 pode estar em um complexo com um RNA de CRISPR (crRNA) e um RNA de CRISPR transativador (tracrRNA). Em outro exemplo, uma Cas9 pode estar em um complexo com um RNA-guia único (Makarova et al. 2015, Nature Reviews Micro- biology Vol. 13:1 a 15).
[154] Um "fragmento funcional ", "fragmento que é funcionalmente equivalente" e "fragmento funcionalmente equivalente" de uma endonu- clease Cas são usados intercambiavelmente no presente documento, e se referem a uma porção ou subsequência da endonuclease Cas na qual a habilidade em reconhecer, se ligar e, opcionalmente, desenrolar, cortar ou clivar (introduzir uma quebra de fita única ou dupla) o sítio-alvo é mantida.
[155] Os termos "variante funcional", "variante que é funcional- mente equivalente" e "variante funcionalmente equivalente" de uma en- donuclease Cas da presente descrição, são usados intercambiavel- mente no presente documento, e se referem a uma variante da endonu- clease Cas da presente descrição, em que a habilidade em reconhecer, se ligar e, opcionalmente, desenrolar, cortar ou clivar toda ou parte de uma sequência-alvo é mantida.
[156] Determinação da atividade de ligação e/ou atividade endo- nucleolítica de uma proteína Cas no presente documento em relação a uma sequência de DNA-alvo específica pode ser avaliada por qualquer avaliação adequada conhecida na técnica, tal como revelado no docu- mento de Patente no U.S. 8697359, que é revelado no presente docu- mento a título de referência. Uma determinação pode ser feita, por exemplo, expressando-se uma proteína Cas e componente de RNA adequado em célula hospedeira/organismo e, então, examinando-se o sítio-alvo de DNA previsto para a presença de um indel (uma proteína Cas nesse ensaio particular teria atividade endonucleolítica [atividade de clivagem de fita única ou dupla]). Exame para a presença de um indel no sítio-alvo previsto poderia ser realizado através de um método de sequenciamento de DNA ou inferindo-se a formação de indel avaliando- se a perda de função da sequência-alvo, por exemplo. Em outro exem- plo, a atividade de proteína Cas pode ser determinada expressando-se uma proteína Cas e componente de RNA adequado em uma célula hos- pedeira/organismo que recebeu um DNA doador que compreende uma sequência homóloga a uma sequência no ou próxima ao sítio-alvo. A presença de sequência de DNA doador no sítio-alvo (tal como seria pre-
visto por HR bem-sucedido entre as sequências doadoras e alvo) indi- caria que o alvejamento ocorreu.
[157] Uma variante de uma endonuclease Cas, também denomi- nada "variante de endonuclease Cas", se refere a uma variante de uma endonuclease Cas parente, sendo que a variante de endonuclease Cas mantém a habilidade em reconhecer, se ligar e, opcionalmente, desen- rolar, cortar ou clivar toda ou parte de uma sequência de DNA-alvo, quando associada a um crNucleotídeo e um tracrNucleotídeo, ou com um único polinucleotídeo-guia, (tal como um polinucleotídeo-guia des- crito no presente documento). Uma variante de endonuclease Cas inclui uma variante de endonuclease Cas descrita no presente documento, em que a variante de endonuclease Cas se difere da endonuclease Cas parente, de uma tal maneira que a variante de endonuclease Cas (quando em complexo com um polinucleotídeo-guia para formar um complexo de endonuclease e polinucleotídeo guiado que tem capaci- dade para modificar um sítio-alvo) tenha pelo menos uma propriedade melhorada, tal como, porém, sem limitação, eficiência de transformação aumentada, eficiência de edição de DNA aumentada, clivagem fora do alvo reduzida ou qualquer combinação das mesmas, quando compa- rada com a endonuclease Cas parente (em complexo com o mesmo polinucleotídeo-guia para formar um complexo de endonuclease e poli- nucleotídeo-guiado que tem capacidade para modificar o mesmo sítio- alvo).
[158] Conforme usado no presente documento, o termo "eficiência de transformação” é definido dividindo-se o número de células transfor- madas obtidas quando uma variante de Cas9 é usada em combinação com um polinucleotídeo-guia para formar um complexo PGEN de poli- nucleotídeo-guiado e endonuclease que tem capacidade para modificar um sítio-alvo, pelo número de células transformadas obtidas quando a Cas9 parente (tipo selvagem) é usada em combinação com o mesmo polinucleotídeo-guia para formar um complexo PGEN como o compo- nente de endonuclease Cas de um PGEN que tem capacidade para mo- dificar o mesmo sítio-alvo. Esse número pode ser multiplicado por 100 para expressar uma %.
[159] Eficiência de transformação = (número de células trans- formadas com variante de Cas9)
[160] (número de células transformadas com Cas9 parente WT)
[161] Uma eficiência de transformação de 1 (ou 100%) indica que o número de células transformadas obtidas quando uma variante de Cas9 é usada é aproximadamente igual ou idêntico ao número de célu- las transformadas obtidas com uma variante de Cas9 WT. Nesse caso a variante de Cas9 não teria uma propriedade melhorada quando com- parada com sua endonuclease Cas9 parente. Por outro lado, uma efici- ência de transformação maior que 1 indica que o número de células transformadas obtidas quando uma variante de Cas9 é usada é maior que o número de células transformadas obtidas com uma variante de Cas9 WT. Nesse caso, a variante de Cas9 tem uma propriedade melho- rada, por exemplo, uma eficiência de transformação melhorada, quando comparada com a endonuclease Cas9 parente.
[162] Conforme usado no presente documento, o termo "eficiência de edição" ou "eficiência de edição de DNA” é usado intercambiavel- mente no presente documento e é definido dividindo-se o número de células que compreendem uma edição de DNA (célula editada) obtida quando uma variante de Cas9 é usada em combinação com um polinu- cleotídeo-guia para formar um complexo PGEN de polinucleotídeo-gui- ado e endonuclease que tem capacidade para modificar um sítio-alvo, pelo número de células editadas obtidas quando a Cas9 parente (tipo selvagem) é usada em combinação com o mesmo polinucleotídeo-guia para formar um complexo PGEN como o componente de endonuclease Cas de um PGEN que tem capacidade para modificar o mesmo sítio-
alvo. Esse número pode ser multiplicado por 100 para expressar uma %.
[163] Eficiência de edição = (número de células que compre- endem uma edição de DNA feita pela variante de Cas9)
[164] (número de células que compreendem uma edição de DNA feita pela Cas9 parente)
[165] Uma eficiência de edição de DNA de 1 (ou 100%) indica que o número de células editadas obtidas quando uma variante de Cas9 é usada é aproximadamente igual ou idêntico ao número de células edi- tadas obtidas com uma variante de Cas9 WT. Nesse caso, a variante de Cas9 não teria uma propriedade melhorada quando comparada com sua endonuclease cas9 parente. Por outro lado, uma eficiência de edi- ção de DNA maior que 1 indica que o número de células transformadas obtidas quando uma variante de Cas9 é usada é maior que o número de células transformadas obtidas quando uma variante de Cas9 parente (WT) é usada. Nesse caso, a variante de Cas9 tem uma propriedade melhorada, por exemplo, uma eficiência de edição melhorada, quando comparada com a endonuclease Cas9 parente.
[166] Uma variante de endonuclease Cas pode compreender uma sequência de aminoácidos que é pelo menos cerca de 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% idêntica à sequência de aminoácidos da endonuclease Cas parente.
[167] A gene de endonuclease Cas variante (gene cas variante) pode compreender uma sequência de nucleotídeos que é pelo menos cerca de 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% idêntica à sequência de nucleotídeos de endonuclease Cas parente.
[168] Exemplos sem limitação de endonucleases Cas parentes no presente documento podem ser endonucleases Cas de qualquer um dos seguintes gêneros: Aeropyrum, Pyrobaculum, Sulfolobus, Archaeo- globus, Haloarcula, Methanobacteriumn, Methanococcus, Methanosar- cina, Methanopyrus, Pyrococcus, Picrophilus, Thernioplasnia, Coryne- bacterium, Mycobacterium, Streptomyces, Aquifrx, Porphvromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromo- bacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myro- coccus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Streptococcus, Treponema, Francisella, ou Thermotoga. Adicionalmente, uma endonuclease Cas parente no pre- sente documento pode ser codificada, por exemplo, por qualquer uma das SEQ ID NOs:462-465, 467-472, 474-477, 479-487, 489-492, 494- 497, 499-503, 505-508, 510-516, ou 517-521 conforme revelado na Pu- blicação de Pedido de Patente no U.S. 2010/0093617, que está incorpo- rada no presente documento a título de referência.
[169] Adicionalmente, uma endonuclease Cas9 parente no pre- sente documento pode ser derivada de uma espécie de Streptococcus (p.ex., S. pyogenes, S. pneumoniae, S. thermophilus, S. agalactiae, S. parasanguinis, S. oralis, S. salivarius, S. macacae, S. dysgalactiae, S. anginosus, S. constellatus, S. pseudoporcinus, S. mutans), Listeria (p.ex., L. innocua), Spiroplasma (p.ex., S. apis, S. syrphidicola), Peptos- treptococcaceae, Atopobium, Porphyromonas (p.ex., P. catoniae), Pre- votella (p.ex., P. intermedia), Veillonella, Treponema (p.ex., T. socrans- kii, T. denticola), Capnocytophaga, Finegoldia (p.ex., F. magna), Co- riobacteriaceae (p.ex., C. bacterium), Olsenella (p.ex., O. profusa), Ha- emophilus (p.ex., H. sputorum, H. pittmaniae), Pasteurella (p.ex., P. bettyae), Olivibacter (p.ex., O. sitiensis), Epilithonimonas (p.ex., E. te-
nax), Mesonia (p.ex., M. mobilis), Lactobacillus (p.ex., L. plantarum), Ba- cillus (p.ex., B. cereus), Aquimarina (p.ex., A. muelleri), Chryseobacte- rium (p.ex., C. palustre), Bacteroides (p.ex., B. graminisolvens), Neisse- ria (p.ex., N. meningitidis), Francisella (p.ex., F. novicida), ou Flavobac- terium (p.ex., F. frigidarium, F. soli) , por exemplo. Em um aspecto, uma endonuclease Cas9 parente de S. pyogenes é descrita no presente do- cumento. Como outro exemplo, uma endonuclease Cas9 parente pode ser qualquer uma das proteínas Cas9 reveladas em Chylinski et al. (RNA Biology 10:726 a 737), que é incorporado no presente documento a título de referência.
[170] A sequência de uma endonuclease Cas9 parente no pre- sente documento pode compreender, por exemplo, qualquer uma das sequências de aminoácidos de Cas9 reveladas nos nos de acesso Gen- Bank G3ECR1 (S. thermophilus), WP_026709422, WP_027202655, WP_027318179, WP_027347504, WP_027376815, WP_027414302, WP_027821588, WP_027886314, WP_027963583, WP_028123848, WP_028298935, Q03JI6 (S. thermophilus), EGP66723, EGS38969, EGV05092, EHI65578 (S. pseudoporcinus), EIC75614 (S. oralis), EID22027 (S. constellatus), EIJ69711, EJP22331 (S. oralis), EJP26004 (S. anginosus), EJP30321, EPZ44001 (S. pyogenes), EPZ46028 (S. pyogenes), EQL78043 (S. pyogenes), EQL78548 (S. pyogenes), ERL10511, ERL12345, ERL19088 (S. pyogenes), ESA57807 (S. pyo- genes), ESA59254 (S. pyogenes), ESU85303 (S. pyogenes), ETS96804, UC75522, EGR87316 (S. dysgalactiae), EGS33732, EGV01468 (S. oralis), EHJ52063 (S. macacae), EID26207 (S. oralis), EID33364, EIG27013 (S. parasanguinis), EJF37476, EJO19166 (Strep- tococcus sp. BS35b), EJU16049, EJU32481, YP_006298249, ERF61304, ERK04546, ETJ95568 (S. agalactiae), TS89875, ETS90967 (Streptococcus sp. SR4), ETS92439, EUB27844 (Streptococcus sp. BS21), AFJ08616, EUC82735 (Streptococcus sp. CM6), EWC92088,
EWC94390, EJP25691, YP_008027038, YP_008868573, AGM26527, AHK22391, AHB36273, Q927P4, G3ECR1, ou Q99ZW2 (S. pyogenes), que são incorporados a título de referência. Alternativamente, uma pro- teína Cas9, no presente documento, pode ser codificada por qualquer uma das SEQ ID NOs: 462 (S. thermophilus), 474 (S. thermophilus), 489 (S. agalactiae), 494 (S. agalactiae), 499 (S. mutans), 505 (S. pyogenes) ou 518 (S. pyogenes) conforme revelado na Publicação de Pedido de Patente no U.S. 2010/0093617 (incorporada no presente documento a título de referência), por exemplo.
[171] Dado que determinados aminoácidos compartilham recursos estruturais e/ou de carga similares entre si (isto é, conservados), o ami- noácido em cada posição em uma Cas9 pode ser conforme fornecido nas sequências reveladas ou substituído por um resíduo de aminoácido conservado ("substituição de aminoácido conservadora") com a seguir:
[172] Os seguintes resíduos alifáticos, não polares ou levemente polares pequenos podem substituir entre si: Ala (A), Ser (S), Thr (T), Pro (P), Gly (G);
[173] Os seguintes resíduos polares negativamente carregados e suas amidas podem substituir entre si: Asp (D), Asn (N), Glu (E), Gln (Q);
[174] Os seguintes resíduos polares positivamente carregados po- dem substituir entre si: His (H), Arg (R), Lys (K);
[175] Os seguintes resíduos alifáticos, não polares podem substi- tuir entre si: Ala (A), Leu (L), Ile (I), Val (V), Cys (C), Met (M); e
[176] Os seguintes resíduos aromáticos grandes podem substituir entre si: Phe (F), Tyr (Y), Trp (W).
[177] Os fragmentos e as variantes podem ser obtidos por meio de métodos, como mutagênese dirigida ao sítio e construção sintética. Mé- todos para medir atividade de endonuclease são bem conhecidos na técnica, tal como, porém, sem limitação, PCT/US13/39011, depositado em 1 de maio de 2013, PCT/US16/32073 depositado em 12 de maio de 2016, PCT/US16/32028 depositado em 12 de maio de 2016, incorpora- dos a título de referência no presente documento).
[178] Em uma modalidade, a variante de endonuclease Cas é uma variante de endonuclease Cas9 descrita no presente documento. Con- forme usado no presente documento, uma "variante de endonuclease Cas9" ou "variante de Cas9" se refere a uma variante de uma endonu- clease Cas9 parente, sendo que a variante de endonuclease Cas9 man- tém a habilidade em reconhecer, se ligar e, opcionalmente, desenrolar, cortar ou clivar toda ou parte de uma sequência de DNA-alvo, quando associada a um crNucleotídeo e um tracrNucleotídeo, ou com um único polinucleotídeo-guia, (tal como um polinucleotídeo-guia descrito no pre- sente documento). Uma variante de endonuclease Cas9 inclui uma va- riante de endonuclease Cas9 descrita no presente documento, em que a variante de endonuclease Cas9 se difere da endonuclease Cas9 pa- rente, de uma tal maneira que a variante de endonuclease Cas9 (quando em complexo com um polinucleotídeo-guia para formar um complexo de endonuclease e polinucleotídeo guiado que tem capaci- dade para modificar um sítio-alvo) tenha pelo menos uma propriedade melhorada, tal como, porém, sem limitação, eficiência de transformação aumentada, eficiência de edição de DNA aumentada, clivagem fora do alvo reduzida ou qualquer combinação das mesmas, quando compa- rada com a endonuclease Cas9 parente (em complexo com o mesmo polinucleotídeo-guia para formar um complexo de endonuclease e poli- nucleotídeo-guiado que tem capacidade para modificar o mesmo sítio- alvo).
[179] Uma variante de endonuclease Cas9 descrita no presente documento inclui uma variante que pode se ligar e cortar um sítio-alvo de DNA de fita dupla quando associada a um crNucleotídeo e um tracrNucleotídeo, ou a um polinucleotídeo-guia único, enquanto a endo- nuclease Cas parente pode se ligar e produzir uma quebra (clivagem) de fita dupla no sítio-alvo, quando associada a um crNucleotídeo e um tracrNucleotídeo, ou a um polinucleotídeo-guia único.
[180] Conforme descrito no presente documento, constatou-se de maneira surpreendente e inesperada que uma variante de endonu- clease Cas9 que tem pelo menos uma modificação de aminoácido fora de seus domínios HNH e RuvC (quando em complexo com um polinu- cleotídeo-guia para formar um complexo de polinucleotídeo-guiado e endonuclease que tem capacidade para modificar um sítio-alvo) pode ter pelo menos uma propriedade melhorada tal como, porém, sem limi- tação, uma eficiência de transformação aumentada, uma eficiência de edição de DNA aumentada, ou uma combinação das mesmas, quando comparada com sua endonuclease Cas9 parente (em complexo com o mesmo polinucleotídeo-guia para formar um complexo de polinucleotí- deo-guiado e endonuclease que tem capacidade para modificar o mesmo sítio-alvo).
[181] Em um aspecto, a variante de endonuclease Cas9 descrita no presente documento compreende um domínio de nuclease RuvC e um domínio de nuclease HNH (H-N-H), e pelo menos uma modificação de aminoácido (deleção, substituição ou inserção de pelo menos um aminoácido) localizada fora dos domínios HNH e RuvC.
[182] Em um aspecto, a variante de endonuclease Cas9 descrita no presente documento, ou um fragmento ativo da mesma, compreende pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 substituições de aminoácido quando comparada com a endonuclease Cas9 parente.
[183] Em um aspecto, a variante de endonuclease Cas9 descrita no presente documento tem uma modificação de aminoácido fora de seus domínios HNH e RuvC, em que a dita endonuclease Cas9 tem eficiência de transformação aumentada e/ou eficiência de edição de
DNA quando comparada com uma endonuclease Cas9 parente que não compreende a dita modificação de aminoácido, sendo que o dito polinu- cleotídeo-guia e a variante de endonuclease Cas9 podem formar um complexo que tem capacidade para reconhecer, se ligar e, opcional- mente, cortar, desenrolar ou clivar toda ou parte da dita sequência-alvo.
[184] Em um aspecto, a variante de endonuclease Cas9 descrita no presente documento tem pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade de ami- noácido com um polipeptídeo de Cas9 parente apresentado na SEQ ID NO: 1 e tem pelo menos uma substituição de aminoácido na posição 155, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequência de aminoácidos do polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem ati- vidade de endonuclease.
[185] A substituição de variante de endonuclease Cas9 na posição 155 pode ser selecionada a partir do grupo que consiste em Y155H, Y155 N, Y 155 E, Y155 F que resulta em uma variante de Cas9 Y155H (SEQ ID NO: 58), variante de Cas9 Y155N (SEQ ID NO: 123), variante de Cas9 Y155E (SEQ ID NO: 125 e variante de Cas9 Y155F (SEQ ID NO: 127), respectivamente. Sequências de DNA que codificam as vari- antes de Cas9 Y155 podem ser otimizadas para expressão em um or- ganismo hospedeiro particular conforme bem conhecido na técnica. Exemplos de sequências de DNA que codificam proteínas de variante de Cas9Y155 são apresentados nas SEQ ID NOs: 122, 124, 126 e 128.
[186] Em um aspecto, a variante de endonuclease Cas9 descrita no presente documento tem pelo menos 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade de ami- noácido com um polipeptídeo de Cas9 parente apresentado na SEQ ID
NO: 1 e tem pelo menos duas substituições de aminoácido, uma na po- sição 86 e outra na posição 98, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequência de amino- ácidos do polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem atividade de endonuclease.
[187] A substituição de variante de endonuclease Cas9 na posição 86 pode ser uma substituição de F86A que resulta em uma variante de Cas9 F86A.
[188] A substituição de variante de endonuclease Cas9 na posição 89 pode ser uma substituição de F98A que resulta em uma variante de Cas9 F98A.
[189] A variante de endonuclease Cas9 pode compreender pelo menos duas substituições, uma primeira substituição na posição 86, tal como uma substituição F86A e uma segunda substituição na posição 98, tal como uma substituição F98A, que resulta em uma variante de Cas9 F86A-F98A apresentada na SEQ ID NO: 129
[190] A variante de endonuclease Cas9 pode compreender pelo menos três substituições, sendo que as pelo menos três substituições compreendem uma primeira substituição na posição 86, tal como uma substituição F86A, uma segunda substituição na posição 98, tal como uma substituição F98A e uma terceira substituição a selecionada a partir do grupo que consiste em uma Y155H, Y155 N, Y 155 E, Y155 F.
[191] Sequências de DNA que codificam as variantes de Cas9 Y155 podem ser otimizadas para expressão em um organismo hospe- deiro particular conforme bem conhecido na técnica. Exemplos de se- quências de DNA que codificam proteínas de variante de Cas9Y155 são apresentados nas SEQ ID NOs: 122, 124, 126 e 128. Exemplos de uma sequência de DNA que codifica a proteína de variante de Cas9F86A- F98A são apresentados na SEQ ID NO: 130.
[192] A variante de endonuclease Cas9 que compreende pelo me- nos uma, pelo menos duas ou pelo menos três substituições seleciona- das forma o grupo que consiste nas posições 86, 98 e 155, ou qualquer combinação das mesmas, quando em complexo com um polinucleotí- deo-guia para formar um complexo de polinucleotídeo-guiado e endo- nuclease que tem capacidade para modificar um sítio-alvo, pode ter pelo menos uma propriedade melhorada tal como, porém, sem limitação, uma eficiência de transformação aumentada, uma eficiência de edição de DNA aumentada, ou uma combinação das mesmas, quando compa- rada com sua endonuclease Cas9 parente (em complexo com o mesmo polinucleotídeo-guia para formar um complexo de polinucleotídeo-gui- ado e endonuclease que tem capacidade para modificar o mesmo sítio- alvo).
[193] A pelo menos uma, pelo menos duas ou pelo menos três substituições selecionadas formam o grupo que consiste nas posições 86, 98 e 155 (ou qualquer combinação das mesmas), podem ser com- binadas com qualquer outra modificação de aminoácido conhecida por uma pessoa versada na técnica. Em um aspecto, qualquer uma das substituições (ou qualquer combinação das mesmas) selecionada forma o grupo que consiste nas posições 86, 98 e 155, descritas no presente documento, pode ser combinada com qualquer substituição de aminoá- cido localizada nos domínios HNH e RuvC conhecidos por uma pessoa versada na técnica para fazer com que uma endonuclease Cas9 atue como uma nickase (Trevino A. E. e Feng Zhang, 2014, Methods in Enzymology, volume 546 páginas 161 a 174). Uma Cas9 "nickase" (Cas9n) pode ser gerada através de substituição de alanina em resíduos catalíticos chave dentro dos domínios HNH ou RuvC — SpCas9 D10A inativa RuvC (Jinek, M, et al, 2012, Science, 337(6096), 816 a 821), en- quanto N863A demonstrou inativar HNH (Nishimasu et al., 2014; Shen et al 2014 Nature Methods 11, 399 a 402). Uma mutação H840A (Shen et al 2014 Nature Methods 11, 399 a 402) também foi relatada para con- verter Cas9 em uma enzima de corte, no entanto, esse mutante teve níveis reduzidos de atividade em células de mamífero em comparação com N863A (Nishimasu et al. 2014, Cell, 156(5), 935 a 949.)
[194] Em um aspecto, Cas9(N863A), Cas9(D10A) e/ou Cas9(H840A) podem ser adicionalmente modificados para incluir a pelo menos uma substituição selecionada a partir do grupo que consiste nas posições 86, 98 e 155 (ou qualquer combinação) descritas no presente documento, que resultam, opcionalmente, em uma propriedade melho- rada da Cas9(N863A), Cas9(D10A) e/ou Cas9(H840A) modificada, res- pectivamente.
[195] Em um aspecto, qualquer uma das substituições seleciona- das a partir do grupo que consiste nas posições 86, 98 e 155 (ou qual- quer combinação das mesmas) descritas no presente documento pode ser combinada com as substituições de aminoácido selecionadas a par- tir do grupo que consiste em D10A, H840A ou N863A e H840A.
[196] Em um aspecto, uma variante de endonuclease Cas9 que tem pelo menos uma substituição de aminoácido na posição 155, sendo que as posições de aminoácido da variante são numeradas em corres- pondência à sequência de aminoácidos do polipeptídeo de Cas9 pa- rente, tem pelo menos uma propriedade melhorada selecionada a partir de uma eficiência de transformação aumentada, uma eficiência de edi- ção de DNA aumentada ou uma combinação das mesmas, quando com- parada com a dita endonuclease Cas9 parente.
[197] Em um aspecto, uma variante de endonuclease Cas9 que tem uma substituição Y155H na posição 155, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequên- cia de aminoácidos do polipeptídeo de Cas9 parente, tem uma eficiência de transformação aumentada, quando comparada com a dita endonu- clease Cas9 parente. Em um aspecto, essa eficiência de transformação aumentada é observada em uma célula procariótica hospedeira, tal como, porém, sem limitação uma espécie de Bacillus ou célula hospe- deira de Escherichia coli (E. Coli).
[198] Em um aspecto, uma variante de endonuclease Cas9 que tem uma substituição Y155H na posição 155, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequên- cia de aminoácidos do polipeptídeo de Cas9 parente, tem uma eficiência de transformação aumentada e uma eficiência de edição de DNA au- mentada, quando comparada com a dita endonuclease Cas9 parente. Em um aspecto, essa eficiência de transformação aumentada e eficiên- cia de edição de DNA aumentada são observadas em uma célula pro- cariótica hospedeira, tal como, porém, sem limitação uma espécie de Bacillus ou célula hospedeira de Escherichia coli (E. Coli).
[199] A propriedade melhorada de uma variante de Cas9 descrita no presente documento inclui eficiência de transformação aumentada, sendo que a eficiência de transformação, quando comparada com a en- donuclease Cas parente é aumentada em pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390,400, 410, 420,430, 440, 440, 450, 460, 470, 480, 490, ou até 500 vezes, quando comparada com a endonuclease Cas parente.
[200] A propriedade melhorada de uma variante de Cas9 descrita no presente documento inclui a eficiência de edição de DNA aumentada, sendo que a eficiência de edição de DNA, quando comparada com a endonuclease Cas parente é aumentada em pelo menos 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100%, 110%, 120%, 130%, 140%, 150%,
160%, 170%, 180%, 190%, 200%, 210%, 220%, 230%, ou 250%, ou pelo menos cerca de 2, 3, 4, 5, 6, 7, 8, 9, até 10 vezes, quando compa- rada com a endonuclease Cas parente.
[201] Variantes de endonuclease Cas descritas no presente docu- mento, podem ser usadas para modificação de genoma de células pro- carióticas e eucarióticas e organismos, conforme descrito adicional- mente no presente documento.
[202] A endonuclease Cas, ou fragmento funcional ou variante da mesma, para uso nos métodos revelados, pode ser isolada de uma fonte recombinante quando a célula hospedeira geneticamente modificada (por exemplo, uma célula bacteriana, uma célula de inseto, uma célula fúngica, uma célula de levedura ou linha de célula derivada de ser hu- mano) é modificada para expressar a sequência de ácido nucleico que codifica a proteína Cas. Alternativamente, a proteína Cas pode ser pro- duzida com o uso de sistemas de expressão de proteína isento de célula ou ser sinteticamente produzida.
[203] A endonuclease Cas que inclui a variante de endonuclease Cas9 Y155 descrita no presente documento, pode compreender uma forma modificada do polipeptídeo Cas. A forma modificada do polipeptí- deo Cas pode incluir uma alteração de aminoácido (por exemplo, dele- ção, inserção ou substituição) que reduz a atividade de nuclease de ocorrência natural da proteína Cas. Por exemplo, em alguns casos, a forma modificada da proteína Cas, que inclui a variante de endonu- clease Cas9 Y155 descrita no presente documento, tem menos que 50%, menos que 40%, menos que 30%, menos que 20%, menos que 10%, menos que 5%, ou menos que 1% da atividade de nuclease do polipeptídeo Cas de tipo selvagem correspondente (Pedido de Patente no U.S. US20140068797 A1, publicado em 6 de março de 2014). Em alguns casos, a forma modificada do polipeptídeo Cas não tem atividade de nuclease substancial e é denominada como "Cas inativado" ou "Cas desativado (dCas)” cataliticamente. Uma Cas inativada/Cas desativada inclui uma endonuclease Cas desativada (dCas). Uma Cas catalitica- mente inativa, que inclui uma que se origina da variante de endonu- clease Cas9 Y155 descrita no presente documento pode ser fundida em uma sequência heteróloga, conforme descrito no presente documento.
[204] Construtos de DNA recombinante que expressam a endonu- clease Cas e polinucleotídeos-guia descritos no presente documento (que incluem fragmentos funcionais dos mesmos, proteínas Cas bacte- rianas, fúngicas, vegetais, microbianas ou de códon otimizadas de ma- mífero) podem ser estavelmente integrados no genoma de um orga- nismo. Por exemplo, micro-organismos podem ser produzidos, os quais compreendem um gene Cas estavelmente integrados no genoma do mi- cróbio.
[205] A endonuclease Cas descrita no presente documento (tal como, porém, sem limitação à variante de endonuclease Cas9 Y155 descrita no presente documento) pode ser expressa e purificada através dos métodos conhecidos na técnica (tais como aqueles descritos no Exemplo 2 do documento no WO2016/186946, publicado em 24 de no- vembro de 2016 e incorporado no presente documento a título de refe- rência).
[206] Fusões de proteína Cas
[207] Uma endonuclease Cas, ou variante de endonuclease Cas descrita no presente documento, pode ser parte de uma proteína de fu- são que compreende um ou mais domínios de proteína heterólogos (por exemplo, 1, 2, 3 ou mais domínios adicionalmente ao polipeptídeo Cas). Tal proteína de fusão pode compreender qualquer sequência proteica adicional e, opcionalmente, uma sequência de ligante entre quaisquer dois domínios, tal como entre polipeptídeo Cas e um primeiro domínio heterólogo. Os exemplos de domínios proteicos que podem ser fundidos a um polipeptídeo Cas incluem, mas sem limitação, marcadores de epí- topo (por exemplo, histidina [His], V5, FLAG, hemaglutinina de influenza [HA], myc, VSV-G, tiorredoxina [Trx]), repórteres (por exemplo, glutati- ona-5-transferase [GST], peroxidase de raiz-forte [HRP], cloranfenicol acetiltransferase [CAT], beta-galactosidase, beta-glucuronidase [GUS], luciferase, proteína verde fluorescente [GFP], HcRed, DsRed, proteína ciano fluorescente [CFP], proteína amarela fluorescente [YFP], proteína azul fluorescente [BFP]), e domínios que têm uma ou mais das ativida- des a seguir: atividade de metilase, atividade de desmetilase, atividade de ativação de transcrição (por exemplo, VP16 ou VP64), atividade de repressão de transcrição, atividade de fator de liberação de transcrição, atividade de modificação de histona, atividade de clivagem de RNA e atividade de ligação a ácido nucleico. Uma endonuclease Cas também pode estar em fusão com uma proteína que se liga a moléculas de DNA ou outras moléculas, como a proteína de ligação a maltose (MBP, do inglês “maltose binding protein”), S-tag, o domínio de ligação a DNA (DBD) de Lex A, o domínio de ligação a DNA de GAL4A e VP16 do vírus de herpes simples (HSV).
[208] Uma endonuclease Cas pode compreender um elemento re- gulador heterólogo, tal como uma sequência de localização nuclear (NLS). Uma sequência de aminoácidos de NLS heteróloga pode ter força suficiente para acionar o acúmulo de uma endonuclease Cas em uma quantidade detectável no núcleo de uma célula no presente docu- mento. Uma NLS pode compreender uma (monopartida) ou mais (por exemplo, bipartida) sequências curtas (por exemplo, 2 a 20 resíduos) de resíduos básicos positivamente carregados (por exemplo, lisina e/ou arginina), e pode estar localizada em qualquer lugar em uma sequência de aminoácidos de Cas, mas de modo que esteja exposta na superfície proteica. Uma NLS pode estar operacionalmente ligada ao terminal N ou terminal C de uma proteína Cas no presente documento, por exem- plo. Duas ou mais sequências NLS podem ser ligadas a uma proteína Cas, por exemplo, tal como em ambos os terminais N e C de uma pro- teína Cas. O gene Cas pode estar operacionalmente ligado a um sinal de direcionamento nuclear de SV40 a montante da região de códon de Cas e um sinal de localização nuclear de VirD2 bipartido (Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89:7.442 a 7.446) a jusante da região de códon de Cas. Exemplos sem limitação de sequências NLS adequa- das no presente documento incluem aquelas reveladas nos documentos de Patente no U.S. 6660830 e 7309576, que estão ambos incorporados a título de referência no presente documento. Uma sequência de ami- noácidos NLS heteróloga inclui sinais de localização nuclear vegetal, viral e de mamífero.
[209] Uma endonuclease Cas cataliticamente ativa e/ou inativa pode ser fundida em uma sequência heteróloga (Pedido de Patente nº U.S. US20140068797 A1, publicado em 6 de março de 2014). Os par- ceiros de fusão adequados incluem, porém, sem limitação, um polipep- tídeo que fornece uma atividade que aumenta indiretamente a transcri- ção por atuação direta no DNA-alvo ou em um polipeptídeo (por exem- plo, uma histona ou outra proteína de ligação ao DNA) associado ao DNA-alvo. Parceiros de fusão adequados adicionais incluem, mas sem limitação, um polipeptídeo que fornece atividade de metiltransferase, atividade de desmetilase, atividade de acetiltransferase, atividade de desacetilase, atividade de quinase, atividade de fosfatase, atividade de ubiquitina ligase, atividade de desubiquitinação, atividade de adenila- ção, atividade de desadenilação, atividade de SUMOilação, atividade de deSUMOilação, atividade de ribosilação, atividade de desribosilação, atividade de miristoilação ou atividade de desmiristoilação. Outros par- ceiros de fusão adequados incluem, porém, sem limitação, um polipep- tídeo que fornece diretamente maior transcrição do ácido nucleico-alvo
(por exemplo, um ativador de transcrição ou um fragmento do mesmo, uma proteína ou fragmento da mesma que recruta um ativador de trans- crição, um regulador de transcrição de molécula pequena/responsivo ao fármaco, etc). Uma endonuclease Cas9 cataliticamente inativa também pode estar fundida a uma nuclease FokI para gerar quebras de fita dupla (Guilinger et al. Nature biotechnology, volume 32, número 6, junho de 2014).
[210] Polinucleotídeos-guia
[211] Conforme usado no presente documento, o termo "polinucle- otídeo-guia", se refere a uma sequência de polinucleotídeos que pode formar um complexo com uma endonuclease Cas, e permite que a en- donuclease Cas reconheça, se ligue e, opcionalmente, corte ou clive um sítio-alvo de DNA. O polinucleotídeo-guia pode ser uma molécula única ou uma molécula dupla. A sequência de polinucleotídeos-guia pode ser uma sequência de RNA, uma sequência de DNA ou uma combinação das mesmas (uma sequência de combinação de RNA-DNA). Opcional- mente, o polinucleotídeo-guia pode compreender pelo menos um nucle- otídeo, ligação fosfodiéster ou modificação de ligação como, porém, sem limitação, Ácido Nucleico Bloqueado (LNA), 5-metil dC, 2.6-diami- nopurina, 2'-Fluoro A, 2'-Fluoro U, 2'-O-Metil RNA, ligação de fosforoti- oato, ligação a uma molécula de colesterol, ligação a uma molécula de polietilenoglicol, ligação a uma molécula de espaçador 18 (cadeia de hexaetilenoglicol), ou ligação covalente 5' a 3’ que resulta em circulari- zação. Um polinucleotídeo-guia que compreende somente ácidos ribo- nucleicos também é denominado um "RNA-guia" ou "gRNA".
[212] O polinucleotídeo-guia pode ser uma molécula dupla (tam- bém chamado de polinucleotídeo-guia dúplex) que compreende uma sequência de crNucleotídeo e uma sequência de tracrNucleotídeo. O crNucleotídeo inclui um primeiro domínio de sequência nucleotídica
(chamado de domínio de alvejamento variável, “Variable Targeting do- main” em inglês, ou domínio VT) que pode se hibridizar com uma se- quência de nucleotídeos em um DNA alvo e uma segunda sequência de nucleotídeos (também chamada de uma sequência correspondente a tracr, “tracr mate sequence” em inglês) que faz parte de um domínio de reconhecimento de endonuclease Cas (CER, do inglês “Cas endonu- clease recognition”). A sequência correspondente a tracr pode se hibri- dizar com um tracrNucleotídeo ao longo de uma região de complemen- taridade e juntos formam o domínio de reconhecimento de endonu- clease Cas (do inglês “Cas endonuclease recognition”) ou domínio CER.
O domínio CER tem capacidade para interagir com um polipeptídeo de endonuclease Cas.
O crNucleotídeo e o tracrNucleotídeo do polinucle- otídeo-guia dúplex podem ser sequências de RNA, DNA e/ou de com- binação de RNA-DNA. (Os Pedidos de Patente no U.S.
US20150082478, publicado em 19 de março de 2015 e US20150059010, publicado em 26 de fevereiro de 2015, estão, ambos, incorporados no presente documento a título de referência). Em algu- mas modalidades, a molécula de crNucleotídeo do polinucleotídeo-guia dúplex é denominada como "crDNA" (quando composta por uma exten- são contígua de nucleotídeos de DNA) ou "crRNA" (quando composta por uma extensão contígua de nucleotídeos de RNA), ou "crDNA-RNA" (quando composta por uma combinação de nucleotídeos de DNA e RNA). O crNucleotídeo pode compreender um fragmento do crRNA de ocorrência natural em bactérias e arqueas.
O tamanho do fragmento do crRNA de ocorrência natural em bactérias e arqueas que pode estar presente em um crNucleotídeo revelado no presente documento pode estar na faixa de, porém, sem limitação, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais nucleotídeos.
Em algumas moda- lidades, o tracrNucleotídeo é denominado como "tracrRNA" (quando composto por uma extensão contígua de nucleotídeos de RNA) ou
"tracrDNA" (quando composto por uma extensão contígua de nucleotí- deos de DNA) ou "tracrDNA-RNA" (quando composto por uma combi- nação de nucleotídeos de DNA e RNA). Em determinadas modalidades, o RNA que guia o complexo de RNA/endonuclease Cas9 é um RNA duplexado que compreende um crRNA-tracrRNA dúplex.
[213] Em um aspecto, o polinucleotídeo-guia é um polinucleotídeo- guia que tem capacidade para formar um PGEN que compreende pelo menos um polinucleotídeo-guia e pelo menos uma variante de endonu- clease Cas9 descrita no presente documento, sendo que o dito polinu- cleotídeo-guia compreende um primeiro domínio de sequência de nu- cleotídeos (domínio VT) que é complementar a uma sequência de nu- cleotídeos em um DNA-alvo, e um segundo domínio de sequência de nucleotídeos que interage com o dito polipeptídeo de endonuclease Cas.
[214] Em um aspecto, o polinucleotídeo-guia é um polinucleotídeo- guia descrito no presente documento, em que o primeiro domínio de sequência de nucleotídeos (domínio VT) e o segundo domínio de se- quência de nucleotídeos são selecionados a partir do grupo que con- siste em uma sequência de DNA, uma sequência de RNA, e uma com- binação das mesmas.
[215] Em um aspecto, o polinucleotídeo-guia é um polinucleotídeo- guia descrito no presente documento, em que a primeira sequência de nucleotídeos e o domínio de segunda sequência de nucleotídeos são selecionados a partir do grupo que consiste em modificações de estru- tura principal de RNA que aprimoram a estabilidade, modificações de estrutura principal de DNA que aprimoram estabilidade e uma combina- ção das mesmas (consultar Kanasty et al., 2013, Common RNA-back- bone modifications, Nature Materials 12:976 a 977;)
[216] O polinucleotídeo-guia inclui uma molécula de RNA dupla que compreende um crRNA de ocorrência não natural quimérico (não covalentemente) ligado a pelo menos um tracrRNA. Um crRNA de ocor- rência não natural quimérico inclui um crRNA que compreende regiões que não são encontradas juntas por natureza (isto é, são heterólogas entre si). Por exemplo, um crRNA de ocorrência não natural é um crRNA em que a sequência de espaçador de ocorrência natural é trocada por um domínio de alvejamento variável heterólogo. Um crRNA de ocorrên- cia não natural compreende um primeiro domínio de sequência de nu- cleotídeos (denominado domínio de alvejamento variável ou domínio VT) que pode hibridizar em uma sequência de nucleotídeos em um DNA-alvo, ligado a uma segunda sequência de nucleotídeos (também denominada uma sequência parceira de tracr) de modo que a primeira e a segunda sequências não se encontrem ligadas por natureza.
[217] O polinucleotídeo-guia também pode ser uma molécula única (também chamado de polinucleotídeo-guia único) que compre- ende uma sequência de crNucleotídeo ligada a uma sequência de tracrNucleotídeo. O polinucleotídeo-guia único compreende um primeiro domínio de sequência de nucleotídeos (chamado de domínio de alveja- mento variável, “Variable Targeting domain” em inglês, ou domínio VT) que pode se hibridizar com uma sequência de nucleotídeos em um DNA alvo e um domínio de reconhecimento de endonuclease Cas (domínio CER, do inglês “Cas endonuclease recognition”), que interage com um polipeptídeo de endonuclease Cas. Por “domínio” entende-se um esti- ramento contíguo de nucleotídeos que pode ser uma sequência de RNA, DNA e/ou combinação de RNA-DNA. O domínio VT e/ou o domí- nio CER de um polinucleotídeo-guia único pode compreender uma se- quência de RNA, uma sequência de DNA ou uma sequência de combi- nação de RNA-DNA. O polinucleotídeo-guia único que é compreendido de sequências do crNucleotídeo e do tracrNucleotídeo pode ser deno- minado como "RNA-guia único" (quando composto de uma extensão contígua de nucleotídeos de RNA) ou "DNA-guia único” (quando com- posto de uma extensão contígua de nucleotídeos de DNA) ou "RNA- DNA guia único" (quando composto de uma combinação de nucleotí- deos de RNA e DNA). O polinucleotídeo-guia único pode formar um complexo com uma endonuclease Cas, em que o dito complexo de po- linucleotídeo-guia/endonuclease Cas (também denominado um sistema de polinucleotídeo-guia/endonuclease Cas) pode direcionar a endonu- clease Cas a um sítio-alvo genômico, o que permite que a endonuclease Cas reconheça, se ligue a, e opcionalmente corte ou clive (introduza uma quebra de fita única ou dupla) o sítio-alvo.
[218] O termo "Domínio de Alvejamento Variável" ou "domínio de VT” é usado intercambiavelmente no presente documento e inclui uma sequência de nucleotídeos que pode se hibridizar a (é complementar a) uma fita (sequência de nucleotídeos) de um sítio-alvo de DNA de fita dupla. A % de complementação entre o primeiro domínio de sequência de nucleotídeos (domínio VT) e a sequência-alvo pode ser de pelo me- nos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 63%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100%. O domínio de alvejamento variável pode ser pelo menos 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 de nucleotídeos em comprimento.
[219] O domínio de alvejamento variável pode compreende uma alongamento contíguo de 12 a 30, 12 a 29, 12 a 28, 12 a 27, 12 a 26, 12 a 25, 12 a 26, 12 a 25, 12 a 24, 12 a 23, 12 a 22, 12 a 21, 12 a 20, 12 a 19, 12 a 18, 12 a 17, 12 a 16, 12 a 15, 12 a 14, 12 a 13, 13 a 30, 13 a 29, 13 a 28, 13 a 27, 13 a 26, 13 a 25, 13 a 26, 13 a 25, 13 a 24, 13 a 23, 13 a 22, 13 a 21, 13 a 20, 13 a 19, 13 a 18, 13 a 17, 13 a 16, 13 a 15, 13 a 14, 14 a 30, 14 a 29, 14 a 28, 14 a 27, 14 a 26, 14 a 25,
14 a 26, 14 a 25, 14 a 24, 14 a 23, 14 a 22, 14 a 21, 14 a 20, 14 a 19, 14 a 18, 14 a 17, 14 a 16, 14 a 15, 15 a 30, 15 a 29, 15 a 28, 15 a 27, 15 a 26, 15 a 25, 15 a 26, 15 a 25, 15 a 24, 15 a 23, 15 a 22, 15 a 21, 15 a 20, 15 a 19, 15 a 18, 15 a 17, 15 a 16, 16 a 30, 16 a 29, 16 a 28, 16 a 27, 16 a 26, 16 a 25, 16 a 24, 16 a 23, 16 a 22, 16 a 21, 16 a 20, 16 a 19, 16 a 18, 16 a 17, 17 a 30, 17 a 29, 17 a 28, 17 a 27, 17 a 26, 17 a 25, 17 a 24, 17 a 23, 17 a 22, 17 a 21, 17 a 20, 17 a 19, 17 a 18, 18 a 30, 18 a 29, 18 a 28, 18 a 27, 18 a 26, 18 a 25, 18 a 24, 18 a 23, 18 a 22, 18 a 21, 18 a 20, 18 a 19, 19 a 30, 19 a 29, 19 a 28, 19 a 27, 19 a 26, 19 a 25, 19 a 24, 19 a 23, 19 a 22, 19 a 21, 19 a 20, 20 a 30, 20 a 29, 20 a 28, 20 a 27, 20 a 26, 20 a 25, 20 a 24, 20 a 23, 20 a 22, 20 a 21, 21 a 30, 21 a 29, 21 a 28, 21 a 27, 21 a 26, 21 a 25, 21 a 24, 21 a 23, 21 a 22, 22 a 30, 22 a 29, 22 a 28, 22 a 27, 22 a 26, 22 a 25, 22 a 24, 22 a 23, 23 a 30, 23 a 29, 23 a 28, 23 a 27, 23 a 26, 23 a 25, 23 a 24, 24 a 30, 24 a 29, 24 a 28, 24 a 27, 24 a 26, 24 a 25, 25 a 30, 25 a 29, 25 a 28, 25 a 27, 25 a 26, 26 a 30, 26 a 29, 26 a 28, 26 a 27, 27 a 30, 27 a 29, 27 a 28, 28 a 30, 28 a 29, ou 29 a 30 nucleotídeos.
[220] O domínio de direcionamento variável pode ser composto de uma sequência de DNA, uma sequência de RNA, uma sequência de DNA modificada, uma sequência de RNA modificada ou qualquer com- binação das mesmas. O domínio VT pode ser complementar às sequên- cias-alvo derivadas de DNA procariótico ou eucariótico.
[221] O termo "domínio de reconhecimento de endonuclease Cas" ou "domínio de CER" (de um polinucleotídeo-guia) é usado intercambi- avelmente no presente documento e inclui uma sequência de nucleotí- deos que interage com um polipeptídeo de endonuclease Cas. Um do- mínio CER compreende uma sequência correspondente a tracrNucleo- tídeo seguida por uma sequência de tracrNucleotídeo. O domínio CER pode ser composto de uma sequência de DNA, uma sequência de RNA, uma sequência de DNA modificada, uma sequência de RNA modificada
(consultar, por exemplo, documento no US 2015-0059010 A1, publicado em 26 de fevereiro de 2015, incorporado no presente documento em sua totalidade a título de referência), ou qualquer combinação das mes- mas.
[222] A sequência de nucleotídeos que liga o crNucleotídeo e o tracrNucleotídeo de um polinucleotídeo-guia único pode compreender uma sequência de RNA, uma sequência de DNA ou uma sequência de combinação de RNA-DNA. Em uma modalidade, a sequência de nucle- otídeos que liga o crNucleotídeo e o tracrNucleotídeo de um único poli- nucleotídeo-guia (também denominado "alça") pode ter pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 nucleotídeos em comprimento. . A alça pode ter 3-4, 3-5, 3-6, 3- 7, 3-8, 3-9, 3-10, 3-11, 3-12, 3-13, 3-14, 3-15, 3-20, 3-30, 3-40, 3-50, 3- 60, 3-70, 3-80, 3-90, 3-100, 4-5, 4-6, 4-7, 4-8, 4-9, 4-10, 4-11, 4-12, 4- 13, 4-14, 4-15, 4-20, 4-30, 4-40, 4-50, 4-60, 4-70, 4-80, 4-90, 4-100, 5- 6, 5-7, 5-8, 5-9, 5-10, 5-11, 5-12, 5-13, 5-14, 5-15, 5-20, 5-30, 5-40, 5- 50, 5-60, 5-70, 5-80, 5-90, 5-100, 6-7, 6-8, 6-9, 6-10, 6-11, 6-12, 6-13, 6-14, 6-15, 6-20, 6-30, 6-40, 6-50, 6-60, 6-70, 6-80, 6-90, 6-100, 7-8, 7- 9, 7-10, 7-11, 7-12, 7-13, 7-14, 7-15, 7-20, 7-30, 7-40, 7-50, 7-60, 7-70, 7-80, 7-90, 7-100, 8-9, 8-10, 8-11, 8-12, 8-13, 8-14, 8-15, 8-20, 8-30, 8- 40, 8-50, 8-60, 8-70, 8-80, 8-90, 8-100, 9-10, 9-11, 9-12, 9-13, 9-14, 9- 15, 9-20, 9-30, 9-40, 9-50, 9-60, 9-70, 9-80, 9-90, 9-100, 10-20, 20-30, 30-40, 40-50, 50-60, 70-80, 80-90 ou 90-100 nucleotídeos em compri- mento.
[223] Em outro aspecto, a sequência de nucleotídeos que liga o crNucleotídeo e o tracrNucleotídeo de um polinucleotídeo-guia único pode compreender uma sequência de tetra-alça, tal como, porém, sem limitação, uma sequência de tetra-alça GAAA.
[224] O polinucleotídeo-guia único inclui um RNA-guia único de ocorrência não natural quimérico. Os termos "RNA-guia único", e "sgRNA" são usados intercambiavelmente no presente documento e se referem a uma fusão sintética de duas moléculas de RNA, um crRNA (CRISPR RNA) que compreende um domínio de alvejamento variável (ligado a uma sequência parceira de tracr que hibridiza a uma tracrRNA), fundido a um tracrRNA (RNA de CRISP de transativação). Um RNA-guia de ocorrência não natural quimérico que compreende re- giões que não se encontram juntas por natureza (isto é, são heterólogas entre si). Por exemplo, um RNA-guia de ocorrência não natural quimé- rico que compreende um primeiro domínio de sequência de nucleotí- deos (denominado domínio de alvejamento variável ou domínio VT) que pode hibridizar em uma sequência de nucleotídeos em um DNA-alvo, ligado a uma segunda sequência de nucleotídeos que pode reconhecer a endonuclease Cas, de modo que a primeira e a segunda sequências de nucleotídeos não se encontrem ligadas por natureza.
[225] O RNA-guia de ocorrência não natural quimérico pode com- preender um crRNA ou/e um tracrRNA do sistema de CRISPR/Cas de tipo II que pode formar um complexo com uma endonuclease Cas tipo II, tal como a variante de endonuclease Cas9 descrita no presente do- cumento, sendo que o dito complexo de RNA-guia/endonuclease Cas pode direcionar a endonuclease Cas para um sítio-alvo de DNA, que permite que a endonuclease Cas reconheça, se ligue e, opcionalmente, corte ou clive (introduza uma quebra de fita única ou dupla) o sítio-alvo de DNA.
[226] Produção e Estabilização de polinucleotídeos-guia
[227] O polinucleotídeo guia pode ser produzido por qualquer mé-
todo conhecido na técnica, que inclui a síntese química de polinucleotí- deos guia (tais como, mas sem limitação, Hendel et al. 2015, Nature Biotechnology 33, 985 a 989), polinucleotídeos guia gerados in vitro e/ou RNAs guia de autojunção (tais como, mas sem limitação, Xie et al. 2015, PNAS 112:3570 a 3575).
[228] Um método para expressar componentes de RNA, tal como RNA-guia em células eucarióticas para realizar alvejamento de DNA mediado por Cas9, foi usar promotores de RNA polimerase III (Pol III), que permitem transcrição de RNA com extremidades 5’ e 3’ precisa- mente definidas e não modificadas (DiCarlo et al., Nucleic Acids Res. 41: 4.336 a 4.343; Ma et al., Mol. Ther. Nucleic Acids 3:e161). Essa es- tratégia foi aplicada com sucesso em células de diversas espécies dife- rentes que incluem maís e soja (documento no US20150082478, publi- cado em 19 de março de 2015). Métodos para expressar componentes de RNA que não têm um cap 5' foram descritos (documento no WO2016/025131, publicado em 18 de fevereiro de 2016).
[229] Em alguns aspectos, um ácido nucleico em questão (por exemplo, um polinucleotídeo-guia, um ácido nucleico que compreende uma sequência de nucleotídeos que codifica um polinucleotídeo-guia; um ácido nucleico que codifica a proteína Cas; um crRNA ou um nucle- otídeo que codifica um crRNA, um tracrRNA ou um nucleotídeo que co- difica um tracrRNA, um nucleotídeo que codifica um domínio VT, um nucleotídeo que codifica um domínio CPR, etc.) compreende uma mo- dificação ou sequência que fornece um recurso desejável adicional (por exemplo, estabilidade modificada ou regulada; alvejamento subcelular; rastreio, por exemplo, uma marcação fluorescente; um sítio de ligação para uma proteína ou complexo de proteína; etc.). A modificação de se- quência de nucleotídeos do polinucleotídeo-guia, do domínio VT e/ou do domínio CER pode ser selecionada, porém, sem limitação, a partir do grupo que consiste em um cap 5’, uma cauda poliadenilada de 3’,
uma sequência de riboswitch, uma sequência de controle de estabili- dade, uma sequência que forma um duplex de dsRNA, uma modificação ou sequência que direciona o polinucleotídeo-guia para uma localização subcelular, uma modificação ou sequência que fornece rastreamento, uma modificação ou sequência que fornece um local de ligação para proteínas, um Ácido Nucleico Bloqueado (LNA), um nucleotídeo 5-metil dC, um nucleotídeo 2.6-Diaminopurina, um nucleotídeo 2’-Flúor A, um nucleotídeo 2’-Flúor U; um nucleotídeo de RNA 2’-O-Metil, uma ligação fosforotioato, uma ligação a uma molécula de colesterol, uma ligação a uma molécula de polietileno glicol, uma ligação a uma molécula de es- paçador 18, uma ligação covalente 5’ a 3’ ou qualquer combinação das mesmas. Essas modificações podem resultar em pelo menos um re- curso benéfico adicional, em que o recurso benéfico adicional é seleci- onado dentre o grupo de uma estabilidade modificada ou regulada, um alvejamento subcelular, rastreamento, uma marcação fluorescente, um sítio de ligação para uma proteína ou complexo de proteína, afinidade de ligação modificada a uma sequência-alvo complementar, resistência modificada à degradação celular e permeabilidade celular aumentada.
[230] Os termos "cap 5'" e "cap de 7-metilguanilato (m7G)" são usados intercambiavelmente no presente documento. Um resíduo de 7- metilguanilato está localizado no terminal 5′ do RNA mensageiro (mRNA) em eucariotas. RNA polimerase II (Pol II) transcreve mRNA em eucariotas. O capping de RNA mensageiro ocorre, de modo geral, como a seguir: O grupo fosfato 5' mais terminal da transcrição de mRNA é removido por fosfatase de terminal de RNA, o que deixa dois fosfatos terminais. Um monofosfato de guanosina (GMP) é adicionado ao fosfato terminal da transcrição por uma transferase de guanilila, que deixa uma guanina de 5′-5′ trifosfato ligado no terminal de transcrição. Finalmente, o 7-nitrogênio dessa guanina terminal é metilado por uma transferase de metila.
[231] Sistemas Cas guiados
[232] Conforme usado no presente documento, os termos "com- plexo de polinucleotídeo-guia/endonuclease Cas", “sistema de polinu- cleotídeo-guia/endonuclease Cas", “complexo de polinucleotídeo- guia/Cas”, "sistema de polinucleotídeo-guia/Cas" e "sistema Cas gui- ado", "endonuclease de polinucleotídeo-guiado", "PGEN" são usados intercambiavelmente no presente documento e se referem a pelo menos um polinucleotídeo-guia e pelo menos uma endonuclease Cas que têm capacidade para formar um complexo, em que o dito complexo de poli- nucleotídeo-guia/endonuclease Cas pode direcionar a endonuclease Cas a um sítio-alvo de DNA, que permite que a endonuclease Cas re- conheça, se ligue a, e opcionalmente corte ou clive (introduza uma que- bra de fita única ou dupla) o sítio-alvo de DNA. Um complexo de polinu- cleotídeo-guia/endonuclease Cas no presente documento pode com- preender proteína (ou proteínas) Cas, ou fragmentos e variantes da mesma, e componente (ou componentes) de polinucleotídeo adequado de qualquer um dos sistemas CRISPR conhecidos (Horvath e Barran- gou, 2010, Science 327:167 a 170; Makarova et al. 2015, Nature Revi- ews Microbiology Vol. 13:1 a 15; Zetsche et al., 2015, Cell 163, 1 a 13; Shmakov et al., 2015, Molecular_Cell 60, 1 a 13). Uma endonuclease Cas desenrola o dúplex de DNA na sequência-alvo e, opcionalmente, cliva pelo menos uma fita de DNA, conforme mediado por reconheci- mento da sequência-alvo por um polinucleotídeo (como, mas sem limi- tação, um crRNA ou RNA-guia) que está no complexo com a proteína Cas. Tal reconhecimento e corte de uma sequência-alvo por uma endo- nuclease Cas ocorre tipicamente se o motivo adjacente ao protoespa- çador (PAM) correto estiver localizado na ou adjacente à extremidade 3’ da sequência-alvo de DNA. Alternativamente, uma proteína Cas no presente documento pode carecer de atividade de clivagem ou corte de
DNA, mas ainda pode se ligar de forma específica a uma sequência- alvo de DNA quando complexada com um componente de RNA ade- quado.
[233] Um complexo de polinucleotídeo-guia/endonuclease Cas que pode clivar ambas as fitas de uma sequência-alvo de DNA compre- ende tipicamente uma proteína Cas que tem todos seus domínios de endonuclease em um estado funcional (por exemplo, os domínios de endonuclease do tipo selvagem ou variantes dos mesmos que retêm alguma ou toda a atividade em cada domínio de endonuclease). Desse modo, uma proteína Cas do tipo selvagem (por exemplo, uma proteína Cas revelada no presente documento), ou uma variante da mesma que retém alguma ou toda a atividade em cada domínio de endonuclease da proteína Cas, é um exemplo adequado de uma endonuclease Cas que pode clivar ambas as fitas de uma sequência-alvo de DNA.
[234] Um complexo de polinucleotídeo guia/endonuclease Cas que pode clivar uma fita de uma sequência-alvo de DNA pode ser ca- racterizado no presente documento por ter atividade de nickase (por exemplo, capacidade de clivagem parcial). Uma nickase Cas compre- ende tipicamente um domínio de endonuclease funcional que permite que a Cas clive apenas uma fita (isto é, faça um corte) de uma sequên- cia-alvo de DNA. Por exemplo, uma nickase Cas9 pode compreender (i) um mutante, domínio RuvC disfuncional e (ii) um domínio HNH funcional (por exemplo, domínio HNH do tipo selvagem). Como outro exemplo, uma nickase Cas9 pode compreender (i) um domínio RuvC funcional (por exemplo, domínio RuvC do tipo selvagem) e (ii) um domínio HNH disfuncional mutante. Como outro exemplo, uma nickase Cas9 pode compreender (i) um domínio RuvC funcional (por exemplo, domínio RuvC do tipo selvagem) e (ii) um domínio HNH disfuncional mutante.
[235] Os exemplos não limitantes de nickases Cas9 adequados para uso no presente documento são revelados por Gasiunas et al.
(Proc. Natl. Acad. Sci. U.S.A. 109:E2579 a E2586), Jinek et al. (Science 337:816 a 821), Sapranauskas et al. (Nucleic Acids Res. 39:9.275 a
9.282) e Publicação de Pedido de Patente no U.S. 2014/0189896, que está incorporada a título de referência no presente documento.
[236] Por exemplo, uma nickase Cas9 no presente documento pode compreender uma Cas9 de S. thermophilus que tem uma substi- tuição Asp-31 (por exemplo, Asp-31-Ala) (um exemplo de um domínio RuvC mutante), ou uma substituição His-865 (por exemplo, His-865-Ala), substituição Asn-882 (por exemplo, Asn-882-Ala), ou substituição Asn-891 (por exemplo, Asn-891-Ala) (exemplos de domí- nios HNH mutantes). Além disso, por exemplo, uma nickase Cas9 no presente documento pode compreender uma Cas9 de S. pyogenes que tem uma substituição Asp-10 (por exemplo, Asp-10-Ala), substituição Glu-762 (por exemplo, Glu-762-Ala), ou substituição Asp-986 (por exemplo, Asp-986-Ala) (exemplos de domínios RuvC mutantes), ou uma substituição His-840 (por exemplo, His-840-Ala), substituição Asn-854 (por exemplo, Asn-854-Ala), ou substituição Asn-863 (por exemplo, Asn-863-Ala) (exemplos de domínios HNH mutantes). Com relação à Cas9 de S. pyogenes, os três subdomínios RuvC estão, de modo geral, localizados nos resíduos de aminoácido 1 a 59, 718 a 769 e 909 a 1098, respectivamente, e o domínio HNH está localizado nos resíduos de aminoácido 775 a 908 (Nishimasu et al., Cell 156:935 a 949).
[237] Uma nickase Cas9 no presente documento pode ser usada com vários fins nas células hospedeiras da invenção revelada. Por exemplo, uma nickase Cas9 pode ser usada para estimular HR na ou próximo a uma sequência de sítio-alvo de DNA com um polinucleotídeo doador adequado. Visto que DNA cortado não é um substrato para pro- cessos de NHEJ, porém, é reconhecido por processos de HR, cortar DNA em um sítio-alvo específico deve tornar o sítio mais receptivo à HR com um polinucleotídeo doador adequado.
[238] Um par de nickases Cas pode ser usado para aumentar a especificidade de alvejamento de DNA. Em geral, isso pode ser feito fornecendo-se duas nickases Cas que, em virtude de serem associadas aos componentes de RNA com diferentes sequências-guia, tem como alvo e corta sequências de DNA próximas em fitas opostas na região para o alvejamento desejado. Tal clivagem próxima de cada fita de DNA cria uma quebra de fita dupla (isto é, uma DSB com projeções de fita simples), a qual é depois reconhecida como um substrato para junção de extremidades não homólogas, NHEJ (propensa a reparo imperfeito levando a mutações) ou recombinação homóloga, HR. Cada corte nes- sas modalidades pode ser pelo menos cerca de 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 ou 100 (ou qualquer número inteiro entre 5 e 100) bases separadas entre si, por exemplo. Uma ou duas proteínas nickase Cas no presente documento podem ser usadas em um par de nickase Cas. Por exemplo, uma nickase Cas9 com um domínio RuvC mutante, mas o domínio HNH em funcionamento (isto é, Cas9 HNH+/RuvC-), pode ser usado (por exemplo, Cas9 HNH+/RuvC- de Streptococcus pyogenes). Cada nickase Cas9 (por exemplo, Cas9 HNH+/RuvC-) pode ser direcionada a sítios de DNA específicos próximos um ao outro (se- parados em até 100 pares de base) com o uso de componentes de RNA adequados no presente documento com sequências de RNA-guia que alvejam cada nickase para cada sítio de DNA específico.
[239] Um complexo de polinucleotídeo-guia/endonuclease Cas, em determinadas modalidades, pode se ligar a uma sequência de sítio- alvo de DNA, mas não cliva nenhuma fita na sequência de sítio-alvo. Tal complexo pode compreender uma proteína Cas em que todos os seus domínios de nuclease são mutantes, disfuncionais. Por exemplo, uma proteína Cas9 no presente documento que pode se ligar a uma sequên- cia de sítio-alvo de DNA, mas que não cliva nenhuma fita na sequência de sítio-alvo, pode compreender tanto um domínio RuvC disfuncional e mutante como um domínio HNH disfuncional e mutante. Exemplos sem limitação de tal proteína Cas9 compreendem qualquer uma das muta- ções de domínio de nuclease RuvC e HNH reveladas acima (por exem- plo, uma Cas9 de S. pyogenes com uma substituição Asp-10, tal como Asp-10-Ala e uma substituição His-840, tal como His-840-Ala). Uma pro- teína Cas no presente documento que se liga a, mas não cliva, uma sequência de DNA alvo pode ser usada para modular a expressão gê- nica, por exemplo, caso em que a proteína Cas poderia estar fundida com um fator de transcrição (ou porção do mesmo) (por exemplo, um repressor ou ativador, como qualquer um daqueles revelados no pre- sente documento). Por exemplo, uma Cas9 que compreende uma Cas9 de S. pyogenes com uma substituição Asp-10 (por exemplo, Asp-10-Ala) e uma substituição His-840 (por exemplo, His-840-Ala) pode ser fundida em um domínio ativador transcricional VP16 ou VP64.
[240] Um complexo de polinucleotídeo-guia/endonuclease Cas pode compreender uma variante de endonuclease Cas, ou fragmento ativo da mesma, descrita no presente documento, em que o dito polinu- cleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural qui- mérico, em que o dito complexo de polinucleotídeo-guia/endonuclease Cas tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequência-alvo.
[241] Em um aspecto, o complexo de polinucleotídeo-guia/endo- nuclease Cas é um complexo de um polinucleotídeo-guia e uma variante de endonuclease Cas9 descrito no presente documento, em que o dito polinucleotídeo-guia é um polinucleotídeo-guia de ocorrência não natu- ral quimérico, em que a dita variante de endonuclease Cas9 tem pelo menos uma propriedade melhorada, tal como, porém, sem limitação, eficiência de transformação aumentada, eficiência de edição de DNA aumentada, clivagem fora do alvo reduzida ou qualquer combinação das mesmas, quando comparada com sua endonuclease Cas parente (em complexo com o mesmo polinucleotídeo-guia para formar um complexo de polinucleotídeo-guiado e endonuclease que tem capacidade para modificar o mesmo sítio-alvo).
[242] O complexo de polinucleotídeo-guia/endonuclease Cas pode ser um complexo de um polinucleotídeo-guia e uma variante de endo- nuclease Cas9 descrito no presente documento, em que o dito polinu- cleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural qui- mérico, em que a dita variante de endonuclease Cas9, ou um fragmento ativo da mesma, tem pelo menos 80% de identidade de aminoácido com um polipeptídeo de Cas9 parente descrito no presente documento e tem pelo menos uma substituição de aminoácido em uma posição fora de seu domínio HNH e RuVC, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequência de aminoáci- dos do polipeptídeo de Cas9 parente, em que a dita variante de endo- nuclease Cas9 tem atividade de endonuclease.
[243] O complexo de polinucleotídeo-guia/endonuclease Cas pode ser um complexo de um polinucleotídeo-guia e uma variante de endo- nuclease Cas9 descrito no presente documento, em que o dito polinu- cleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural qui- mérico, em que a dita variante de endonuclease Cas9, ou um fragmento ativo da mesma, tem pelo menos 80% de identidade de aminoácido com um polipeptídeo de Cas9 parente apresentado na SEQ ID NO: 1 e tem pelo menos uma substituição de aminoácido na posição 155, sendo que as posições de aminoácido da variante são numeradas em correspon- dência à sequência de aminoácidos do polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem atividade de en- donuclease.
[244] O complexo de polinucleotídeo-guia/endonuclease Cas pode ser um complexo de um polinucleotídeo-guia e uma variante de endo- nuclease Cas9 descrito no presente documento, em que o dito polinu- cleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural qui- mérico, em que a dita variante de endonuclease Cas9, ou um fragmento ativo da mesma, tem pelo menos 80% de identidade de aminoácido com um polipeptídeo de Cas9 parente apresentado na SEQ ID NO: 1 e tem pelo menos duas substituições de aminoácido, uma primeira na posição 86 e uma segunda na posição 98, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequência de amino- ácidos do polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem atividade de endonuclease.
[245] Os termos "complexo de RNA-guia/endonuclease Cas", "sis- tema de RNA-guia/endonuclease Cas", "complexo de RNA-guia/Cas", "sistema de RNA-guia/Cas", "complexo de gRNA/Cas", "sistema de gRNA/Cas", "endonuclease guiada por RNA", "RGEN" são usados in- tercambiavelmente no presente documento e se referem a pelo menos um componente de RNA e pelo menos uma endonuclease Cas que têm capacidade para formar um complexo, em que o dito complexo de RNA- guia/endonuclease Cas pode direcionar a endonuclease Cas a um sítio- alvo de DNA, o que permite que a endonuclease Cas reconheça, se ligue a, e opcionalmente corte ou clive (introduza uma quebra de fita única ou dupla) o sítio-alvo de DNA.
[246] Os sistemas de Cas guiados descritos no presente docu- mento podem ser expressos em uma célula hospedeira a partir de um ou mais construtos de expressão. Em alguns aspectos, a variante de endonuclease Cas descrita no presente documento pode ser expressa a partir de um cassete de expressão que direciona a expressão da pro- teína Cas em uma célula procariótica ou eucariótica, e o polinucleotídeo- guia pode ser expresso a partir de um segundo cassete de expressão que direciona a expressão do polinucleotídeo-guia na célula procariótica ou eucariótica.
[247] A presente descrição fornece adicionalmente construtos de expressão para expressar em uma célula/organismo procariótica ou eu- cariótica um sistema de RNA-guia/Cas que tem capacidade para reco- nhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequência-alvo.
[248] Cassetes de expressão e construtos de DNA recombinante
[249] Polinucleotídeos revelados no presente documento podem ser fornecidos em um cassete de expressão (também denominado construto de DNA) para expressão em um organismo de interesse. O termo "expressão", conforme usado no presente documento, se refere à produção de um produto final funcional (por exemplo, um crRNA, um tracrRNA, um mRNA, um RNA-guia ou um polipeptídeo (proteína)) na forma de precursor ou madura. O termo "expressão" inclui qualquer etapa envolvida na produção de um polipeptídeo, que inclui, porém, sem limitação a transcrição, modificação pós-transcrição, tradução, modifi- cação pós-tradução, e secreção.
[250] O cassete de expressão pode incluir sequências reguladoras de 5' e 3' ligadas de modo operacional a um polinucleotídeo, conforme revelado no presente documento.
[251] “Ligado de modo operacional" destina-se a significar uma li- gação funcional entre dois ou mais elementos. Por exemplo, uma liga- ção operacional entre um polinucleotídeo de interesse e uma sequência reguladora (por exemplo, um promotor) é uma ligação funcional que per- mite a expressão do polinucleotídeo de interesse (isto é, o polinucleotí- deo de interesse está sob controle transcricional do promotor). Elemen- tos ligados de modo operacional podem ser contíguos ou não contíguos. Quando usados para se referir à união de duas regiões de codificação de proteína, por ligado de modo operável entende-se que as regiões de codificação estão no mesmo quadro de leitura.
[252] Os cassetes de expressão revelados no presente documento podem incluir na direção de transcrição 5’ a 3’, uma região de iniciação transcricional e translacional (isto é, um promotor), um polinucleotídeo de interesse e uma região de terminação transcricional e translacional (isto é, região de terminação) funcional na célula hospedeira (por exem- plo, uma célula eucariótica). Cassetes de expressão também são dota- dos de uma pluralidade de sítios de restrição e/ou sítios de recombina- ção para inserção do polinucleotídeo a estar sob a regulação transcrici- onal das regiões reguladoras descritas em outro lugar no presente do- cumento.
As regiões reguladoras (isto é, promotores, regiões regulado- ras transcricionais, e regiões de terminação translacionais) e/ou o poli- nucleotídeo de interesse podem ser nativos/análogos à célula hospe- deira ou entre si.
Alternativamente, as regiões reguladoras e/ou o poli- nucleotídeo de interesse podem ser heterólogos à célula hospedeira ou entre si.
Conforme usado no presente documento, "heterólogo" em re- ferência a uma sequência de polinucleotídeos ou polipeptídeos é uma sequência que se origina a partir de uma espécie estranha ou, se a partir da mesma espécie, é substancialmente modificada a partir de sua forma nativa em composição e/ou localização genômica por intervenção hu- mana deliberada.
Por exemplo, um promotor ligado de modo operacio- nal a um polinucleotídeo heterólogo é de uma espécie diferente da es- pécie da qual o polinucleotídeo foi derivado, ou, se de espécie igual/aná- loga, um ou ambos são substancialmente modificados em relação à sua forma original e/ou localização genômica, ou o promotor não é o promo- tor nativo para o polinucleotídeo ligado de modo operacional.
Conforme usado no presente documento, a menos que seja especificado de outra forma, um polinucleotídeo quimérico compreende uma sequência de co- dificação ligada de modo operacional a uma região de iniciação de transcrição que é heteróloga à sequência de codificação.
[253] Em determinadas modalidades, os polinucleotídeos revela- dos no presente documento podem ser empilhados com qualquer com- binação de sequências de polinucleotídeo de interesse ou cassetes de expressão, conforme revelado em outro lugar no presente documento ou conhecido na técnica. Os polinucleotídeos empilhados podem ser li- gados de modo operacional ao mesmo promotor como o polinucleotídeo inicial, ou podem ser ligados de modo operacional a um polinucleotídeo de promotor separado.
[254] Cassetes de expressão podem compreender um promotor ligado de modo operacional a um polinucleotídeo de interesse, junta- mente com uma região de terminação correspondente. A região de ter- minação pode ser nativa para a região de iniciação transcricional, pode ser nativa para o polinucleotídeo ligado de modo operacional de inte- resse ou para as sequências de promotor, pode ser nativa para o orga- nismo hospedeiro, ou pode ser derivada de outra fonte (isto é, estranha ou heteróloga). Regiões de terminação convenientes são disponibiliza- das pelas sequências de fago, por exemplo, região de terminação de lambda fago t0 ou terminadores fortes de operons de RNA ribossômico procariótico. Regiões de terminação convenientes são disponibilizadas pelo plasmídeo de Ti de A. tumefaciens, tal como as regiões de termi- nação de octopina sintase e nopalina sintase. Consultar também Gueri- neau et al. (1991) Mol. Gen. Genet. 262:141 a 144; Proudfoot (1991) Cell 64:671 a 674; Sanfacon et al. (1991) Genes Dev. 5:141 a 149; Mo- gen, et al., (1990) Plant Cell 2:1.261 a 1.272; Munroe, et al., (1990) Gene 91:151 a 158; Ballas, et al., (1989) Nucleic Acids Res. 17:7.891 a 7.903; e Joshi, et al., (1987) Nucleic Acids Res. 15:9.627 a 9.639.
[255] Quando apropriado, os polinucleotídeos de interesse podem ser otimizados para expressão aumentada no organismo transformado ou alvejado. Por exemplo, os polinucleotídeos podem ser sintetizados ou alterados para usar códons de organismo preferencial para expres- são melhorada.
[256] São conhecidas modificações de sequências adicionais para aumentar a expressão dos genes em um hospedeiro celular. Essas in- cluem eliminação de sequências codificadoras de sinais de poliadenila- ção artificiais, sinais de local de divisão de éxon e íntron, repetições tipo transpóson e outras tais sequências bastante caracterizadas que po- dem ser prejudiciais à expressão genética. O conteúdo de C-G da se- quência pode ser ajustado para níveis médios para um determinado hospedeiro celular, tal como calculado por referência a genes conheci- dos expressos na célula hospedeira. Quando possível, a sequência é modificada para evitar as estruturas de mRNA secundárias em grampo previstas.
[257] Os cassetes de expressão podem conter adicionalmente se- quências-líder 5'. Tais sequências-líderes podem atuar para aprimorar a tradução. Sequências-líder 5' usadas intercambiavelmente com regi- ões não traduzidas 5' poderiam chegar de UTRs bacterianas bem co- nhecidas e bem caracterizadas, tais como aquelas do gene aprE de Ba- cillus subtilis ou do gene amyl de Bacillus licheniformis ou qualquer gene de proteína ribossômica bacteriana. Líderes de tradução são conheci- dos na técnica e incluem: líderes de picornavírus, por exemplo, líder de EMCV (região não codificadora 5’ de Encefalomiocardite) (Elroy-Stein et al. (1989) Proc. Natl. Acad. Sci. E.U.A. 86:6126 a 6130); líderes de potivírus, por exemplo, líder de TEV (vírus “Etch” do tabaco) (Gallie et al. (1995) Gene 165(2):233 a 238), líder de MDMV (vírus do mosaico do nanismo de maís) (Johnson et al. (1986) Virology 154:9 a 20), e proteína de ligação de cadeia pesada de imunoglobulina humana (BiP) (Macejak et al. (1991) Nature 353:90 a 94); líder não traduzido do mRNA de pro- teína de revestimento de vírus do mosaico da alfafa (AMV RNA 4) (Jobling et al. (1987) Nature 325:622 a 625); líder do vírus do mosaico do tabaco (TMV) (Gallie et al. (1989) em Molecular Biology of RNA, ed. Cech (Liss, Nova Iorque), páginas 237a256); e líder do vírus de mancha clorótica de maís (MCMV) (Lommel et al. (1991) Virology 81:382 a 385). Consultar também, Della-Cioppa et al. (1987) Plant Physiol. 84:965 a
968. Outros métodos conhecidos para aprimorar a tradução também po- dem ser utilizados, por exemplo, íntrons e semelhantes.
[258] No preparo do cassete de expressão, os vários fragmentos de DNA podem ser manipulados de modo a fornecer as sequências de DNA na orientação apropriada e, conforme apropriado, no quadro de leitura apropriado. Para esse fim, podem ser empregados adaptadores ou ligantes para juntar os fragmentos de DNA ou podem estar envolvi- das outras manipulações para proporcionar locais de restrição conveni- entes, remoção de DNA supérfluo, remoção de locais de restrição ou semelhantes. Para esse propósito, podem estar envolvidos mutagênese in vitro, reparo de iniciadores, restrição, emparelhamento, novas substi- tuições, por exemplo, transições e transversões.
[259] Em algumas modalidades, uma sequência de nucleotídeos que codifica um nucleotídeo-guia e/ou uma proteína Cas é ligada de modo operacional a um elemento de controle, por exemplo, um ele- mento de controle transcricional, tal como um promotor. O elemento de controle transcricional pode ser funcional em uma célula eucariótica, por exemplo, uma planta, célula de mamífero ou célula fúngica; ou uma cé- lula procariótica (por exemplo, célula bacteriana ou de arquea). Em al- gumas modalidades, uma sequência de nucleotídeos que codifica um nucleotídeo-guia e/ou uma proteína Cas é ligada de modo operacional aos múltiplos elementos de controle que permitem expressão da se- quência de nucleotídeos que codifica um nucleotídeo-guia e/ou uma proteína Cas em ambas células procarióticas e eucarióticas.
[260] Exemplos sem limitação de promotores eucarióticos adequa- dos (promotores funcionais em uma célula eucariótica) incluem aqueles de citomegalovírus (CMV) imediatamente antes, quinase de timidina de vírus herpes simplex (HSV), SV40 antecipado e tardio, repetições de terminal longo (LTRs) de retrovírus e metalotioneína-I de camundongo. O cassete de expressão também pode conter um sítio de ligação de ribossomo para iniciação de tradução e um terminador de transcrição. O cassete de expressão também pode conter uma ou mais sequências de localização nuclear (sequências NLS) para direcionar o nucleotídeo- guia e/ou uma proteína Cas para o núcleo em uma célula eucariótica. O cassete de expressão também pode incluir sequências apropriadas para amplificar expressão. O cassete de expressão também pode incluir sequências de nucleotídeo que codificam marcações de proteína (por exemplo, marcador de 6x His, marcador de hemaglutinina, proteína verde fluorescente, etc.) que são fundidas na proteína Cas, assim, re- sultam em um polipeptídeo quimérico.
[261] Para transcrição em um hospedeiro fúngico, exemplos sem limitação de promotores úteis incluem aqueles derivados do gene que codifica amilase TAKA de Aspergillus oryzae, proteinase aspártica de Rhizomucor miehei, α-amilase neutra de Aspergillus niger, α-amilase estável de ácido de Aspergillus niger, glicoamilase de Aspergillus niger, lipase de Rhizomucor miehei, protease alcalina de Aspergillus oryzae, isomerase de fosfato de triose de Aspergillus oryzae, acetamidase de Aspergillus nidulans e semelhantes. Quando um gene que codifica uma endonuclease Cas é expressa em uma espécie bacteriana, tal como um E. coli, um promotor adequado pode ser selecionado, por exemplo, a partir de um promotor de bacteriófago que inclui um promotor T7 e um promotor de lambda fago. Nesse sentido, exemplos de promotores ade- quados para a expressão em uma espécie de levedura incluem, porém, sem limitação, os promotores Gal 1 e Gal 10 de Saccharomyces cerevi- siae e os promotores AOX1 ou AOX2 de Pichia pastoris. Expressão em células hospedeiras fúngicas filamentosas envolve frequentemente cbh1, que é um promotor induzível endógeno de T. reesei ou promoto- res glicolíticos constitutivos (por exemplo, pki). Por exemplo, consultar Liu et al. 2008.
[262] Exemplos sem limitação de promotores para direcionar a transcrição de uma sequência de DNA (tal como, porém, sem limitação sequências de DNA que codificam uma variante de endonuclease Cas descrita no presente documento) em um hospedeiro bacteriano, incluem o promotor do operon lac de E. coli, o gene agarase de Streptomyces coelicolor dagA ou promotores de celA, os promotores do gene amilase de Bacillus licheniformis (amyL), os promotores do gene amilase malto- gênico de Bacillus stearothermophilus (amyM), os promotores da ami- lase de Bacillus amyloliquefaciens (amyQ), os promotores dos genes xylA e xylB de Bacillus subtilis e semelhantes.
[263] Cassetes de expressão podem ser compreendidos em DNA linear, em DNA circular, em DNA recombinante, em plasmídeo ou em vetores.
[264] Conforme usado no presente documento, "recombinante" se refere a uma combinação artificial de dois segmentos separados de ou- tro modo da sequência, por exemplo, por síntese química ou pela mani- pulação de segmentos isolados de ácidos nucleicos por técnicas de mo- dificação genética. O termo "recombinante", quando usado em referên- cia a um componente ou composição biológica (por exemplo, uma cé- lula, ácido nucleico, polipeptídeo/enzima, vetor, etc.) indica que o com- ponente ou composição biológica está em um estado que não é encon- trado na natureza. Em outras palavras, o componente ou composição biológica foi modificada por intervenção humana de seu estado natural. Por exemplo, uma célula recombinante abrange uma célula que ex- pressa um ou mais genes que não são encontrados em sua célula pro- genitora nativa (isto é, não recombinante), uma célula que expressa um ou mais genes nativos em uma quantidade que é diferente de sua célula progenitora nativa e/ou uma célula que expressa um ou mais genes na- tivos sob condições diferentes de sua célula progenitora nativa. Os áci- dos nucleicos recombinantes podem se diferir de uma sequência nativa por um ou mais nucleotídeos, podem ser operacionalmente ligados a sequências heterólogas (por exemplo, um promotor heterólogo, uma se- quência que codifica uma sequência de sinalização não nativa ou vari- ante, etc.), podem ser desprovidos de sequências intrônicas e/ou podem estar em uma forma isolada. Os polipeptídeos/enzimas recombinante podem se diferir de uma sequência nativa por um ou mais aminoácidos, podem ser fundidos a sequências heterólogas, podem ser truncados ou ter deleções internas de aminoácidos, podem ser expressos de uma maneira não encontrada em uma célula nativa (por exemplo, a partir de uma célula recombinante que superexpressa o polipeptídeo devido à presença na célula de um vetor de expressão que codifica o polipeptí- deo) e/ou podem estar em uma forma isolada. É enfatizado que, em algumas modalidades, um polinucleotídeo recombinante ou polipeptí- deo/enzima tem uma sequência que é idêntica a sua contraparte do tipo selvagem, mas está em uma forma não nativa (por exemplo, em uma forma isolada ou enriquecida).
[265] Conforme usado no presente documento, "construto de DNA recombinante" ou "DNA recombinante" se refere a um cassete de ex- pressão que compreende uma combinação artificial de fragmentos de ácido nucleico. O construto de DNA recombinante pode incluir sequên- cias reguladoras de 5' e 3' ligadas de modo operacional a um polinucle- otídeo, conforme revelado no presente documento.
[266] Por exemplo, um construto de DNA recombinante pode com- preender sequências reguladoras e sequências codificadoras que são derivadas de diferentes fontes. Tal construto pode ser usado por si só ou pode ser usado em conjunto com um vetor. Se um vetor é usado, então, a escolha de vetor é dependente do método que será usado para introduzir o vetor nas células hospedeiras conforme bem conhecido por aqueles versados na técnica. Por exemplo, um vetor de plasmídeo pode ser usado. O especialista habilidoso está bastante ciente dos elementos genéticos que devem estar presentes no vetor de modo a transformar, selecionar e propagar com sucesso células hospedeiras. O especialista habilidoso também reconhecerá que diferentes eventos de transforma- ção independentes podem resultar em diferentes níveis e modelos de expressão (Jones et al., (1985) EMBO J 4:2.411 a 2.418; De Almeida et al., (1989) Mol Gen Genetics 218:78 a 86) e, assim, que diversos even- tos são tipicamente examinados de modo a obter linhas que exibem o nível e modelo de expressão desejáveis. Tal exame pode ser ensaios biológicos moleculares padrão, bioquímicos e outros ensaios realizados que incluem análise Southern de DNA, análise Northern de expressão de mRNA, PCR, PCR quantitativo em tempo real (qPCR), transcrição reversa de PCR (RT-PCR), análise immunoblotting de expressão de proteína, ensaios de enzima ou atividade, e/ou análise fenotípica.
[267] As técnicas de clonagem molecular e DNA recombinante pa- drão usadas no presente documento são bem conhecidas na técnica e são descritas em mais detalhes em Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Har- bor, NY (1989).
[268] Em um aspecto, o construto de DNA recombinante inclui se- quências reguladoras 5' e 3' heterólogas ligadas de modo operacional a uma variante de endonuclease Cas9, conforme revelado no presente documento. Essas sequências reguladoras incluem, porém, sem limita- ção, uma região de iniciação transcricional e translacional (isto é, um promotor), um sinal de localização nuclear e uma região de terminação transcricional e translacional (isto é, região de terminação) funcional na célula hospedeira (tal como célula bacteriana ou fúngica).
[269] Em um aspecto, o construto de DNA recombinante compre- ende um DNA que codifica uma variante de endonuclease Cas9 descrita no presente documento, sendo que a dita variante de endonuclease Cas9 é ligada de modo operacional a, ou compreende um elemento re- gulador heterólogo, tal como uma sequência de localização nuclear (NLS).
[270] Em um aspecto, o cassete de expressão ou o DNA recombi- nante no presente documento compreende um promotor ligado de modo operacional a uma sequência de nucleotídeos que codifica uma variante de endonuclease Cas9 descrita no presente documento e um promotor ligado de modo operacional a um RNA-guia da presente descrição. O promotor tem capacidade para conduzir a expressão de uma sequência de nucleotídeos ligada de modo operacional em uma célula/organismo procariótica ou eucariótica.
[271] Os termos "plasmídeo" ou "vetor" se referem a um elemento extra cromossômico linear ou circular que carrega, frequentemente, ge- nes que não são parte do metabolismo central da célula, e normalmente na forma de DNA de fita dupla. Tais elementos podem ser sequências autonomamente replicantes, sequências de integração de genoma, fago, ou sequências de nucleotídeos, em forma linear ou circular, de um polinucleotídeo de fita única ou dupla, derivados de qualquer fonte, em que diversas sequências de nucleotídeos foram unidas ou recombina- das em uma única construção que tem capacidade para introduzir um polinucleotídeo de interesse em uma célula.
[272] Sítios-alvo
[273] Os termos "sítio-alvo", "sequência-alvo", "sequência de sítio- alvo, "DNA-alvo", "localização-alvo", "sítio-alvo genômico", "sequência- alvo genômica", "localização-alvo genômica" e "protoespaçador", são usados intercambiavelmente no presente documento e se referem a uma sequência de polinucleotídeos como, mas sem limitação, uma se- quência de nucleotídeos em um cromossomo, epissomo, uma localiza- ção transgênica ou qualquer outra molécula de DNA no genoma (que inclui DNA cromossômico, cloroplástico, mitocondrial, DNA de plasmí- deo) de uma célula, em que um complexo de polinucleotídeo-guia/en- donuclease Cas pode reconhecer, se ligar e, opcionalmente, cortar ou clivar.
[274] O sítio-alvo pode ser um sítio endógeno no genoma de uma célula, ou alternativamente, o sítio-alvo pode ser heterólogo à célula e, desse modo, não é de ocorrência natural no genoma da célula, ou o sítio-alvo pode ser encontrado em um sítio genômico heterólogo com- parado a quando ocorre na natureza. Conforme usado no presente do- cumento, os termos "sequência-alvo endógena” e "sequência-alvo na- tiva" são usados intercambiavelmente no presente documento para se referir a uma sequência-alvo que é endógena ou nativa ao genoma de uma célula e está na posição endógena ou nativa daquela sequência- alvo no genoma da célula. Um "sítio-alvo artificial" ou "sequência-alvo artificial" são usados intercambiavelmente no presente documento e se referem a uma sequência-alvo que foi introduzida no genoma de uma célula. Tal sequência-alvo artificial pode ser idêntica em termos de se- quência a uma sequência-alvo endógena ou nativa no genoma de uma célula, mas pode estar localizada em uma posição diferente (isto é, uma posição não endógena ou não nativa) no genoma de uma célula.
[275] Um “sítio-alvo alterado”, uma “sequência-alvo alterada”, “sí- tio-alvo modificado”, “sequência-alvo modificada” são usados de modo intercambiável no presente documento e se referem a uma sequência- alvo, conforme revelada no presente documento, que compreende pelo menos uma alteração quando comparada a uma sequência-alvo não al- terada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo,
(iii) uma inserção de pelo menos um nucleotídeo ou (iv) qualquer com- binação de (i) a (iii).
[276] O sítio-alvo para uma endonuclease Cas pode ser muito es- pecífico e pode, frequentemente, ser definido na posição de nucleotídeo exata, enquanto, em alguns casos, o sítio-alvo para uma modificação de genoma desejada pode ser definido mais amplamente do que mera- mente o sítio no qual a clivagem de DNA ocorre, por exemplo, uma lo- calização genômica ou região que deve ser deletada do genoma. Assim, em determinados casos, a modificação de genoma que ocorre por meio da atividade de Cas/clivagem de DNA RNA-guia é descrita como ocor- rendo "no ou próxima ao" sítio-alvo.
[277] Os métodos para "modificar um sítio-alvo" e "alterar um sítio- alvo" são usados de forma intercambiável no presente documento e se referem a métodos para produzir um sítio-alvo alterado.
[278] Uma variedade de métodos está disponível para identificar as células que têm um genoma alterado em ou próximo a um sítio alvo sem o uso de um fenótipo de marcador rastreável. Tais métodos podem ser vistos como análise direta de uma sequência-alvo para detectar qualquer mudança na sequência-alvo, incluindo, mas sem limitação, métodos de PCR, métodos de sequenciamento, digestão com nuclease, Southern blots e qualquer combinação dos mesmos.
[279] O comprimento da sequência de DNA-alvo (sítio-alvo) pode variar, e inclui, por exemplo, sítios-alvo que tem pelo menos 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais nucleotídeos em comprimento. É possível ainda que o sítio-alvo possa ser palindrômico, isto é, a sequência em uma fita é lida igual na direção oposta na fita complementar. O sítio de corte/clivagem pode estar dentro da sequência-alvo ou o sítio de corte/clivagem poderia estar fora da se- quência-alvo. Em outra variação, a clivagem poderia ocorrer em posi- ções de nucleotídeo imediatamente opostas uma à outra para produzir um recorte de extremidade cega ou, em outros casos, as incisões po- deriam ser desalinhadas para produzir projeções de fita simples, tam- bém chamadas de "extremidades pegajosas" que podem ser projeções 5' ou projeções 3'. Variantes ativas de sítios genômicos alvo também podem ser usadas. Tais variantes ativas podem compreender pelo me- nos 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência para o dado sítio- alvo, em que as variantes ativas retêm atividade biológica e, portanto, têm capacidade para serem reconhecidas e clivadas por uma endonu- clease Cas.
[280] Os ensaios para medir a quebra de fita simples ou dupla de um sítio-alvo por uma endonuclease são conhecidos na técnica e me- dem, em geral, a atividade total e a especificidade do agente em subs- tratos de DNA que contêm sítios de reconhecimento.
[281] Motivo Adjacente de Protoespaçador (PAM)
[282] Um "motivo adjacente a protoespaçador" (PAM) no presente documento se refere a uma sequência de nucleotídeos curta adjacente a uma sequência-alvo (protoespaçador) que é reconhecida (alvejada) por um sistema de polinucleotídeo-guia/endonuclease Cas (PGEN). A endonuclease Cas pode não reconhecer com sucesso uma sequência de DNA alvo se a sequência de DNA alvo não for seguida por uma se- quência de PAM. A sequência e o comprimento de um PAM no presente documento podem diferir dependendo da proteína Cas ou do complexo de proteína Cas usado. A sequência de PAM pode ter qualquer compri- mento, porém, tem, tipicamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 nucleotídeos em comprimento.
[283] Um PAM, no presente documento, é tipicamente selecionado em vista do tipo de PGEN que é empregado. Uma sequência de PAM no presente documento pode ser uma reconhecida por um PGEN que compreende uma Cas, tais como as variantes de Cas9 descritas no pre- sente documento, derivadas de qualquer uma das espécies reveladas no presente documento das quais uma Cas pode ser derivada, por exemplo. Em determinadas modalidades, a sequência de PAM pode ser uma reconhecida por um RGEN que compreende uma Cas9 derivada de S. pyogenes, S. thermophilus, S. agalactiae, N. meningitidis, T. den- ticola ou F. novicida. Por exemplo, uma Cas9 adequada derivada de S. pyogenes, que inclui as variantes de Cas9 Y155 descritas no presente documento, poderiam ser usadas para alvejar sequências genômicas que têm uma sequência de PAM de NGG; N pode ser A, C, T, ou G). Como outros exemplos, uma Cas9 adequada poderia ser derivada de qualquer uma das seguintes espécies ao alvejar sequências de DNA que têm as seguintes sequências de PAM: S. thermophilus (NNAGAA), S. agalactiae (NGG), NNAGAAW [W é A ou T], NGGNG), N. meningitidis (NNNNGATT), T. denticola (NAAAAC), ou F. novicida (NG) (em que os Ns em todas essas sequências de PAM particulares são A, C, T ou G). Outros exemplos de Cas9/PAMs úteis no presente documento incluem aqueles revelados em Shah et al. (RNA Biology 10:891 a 899) e Esvelt et al. (Nature Methods 10:1.116 a 1.121), que estão incorporados no presente documento a título de referência.
[284] Usos de sistemas de proteína Cas guiados
[285] As composições e métodos fornecidos no presente docu- mento têm uso em uma ampla variedade de células hospedeiras. Con- forme usado no presente documento, uma "célula hospedeira", se refere a qualquer tipo de célula (tal como, porém, sem limitação, uma célula in vivo ou in vitro, uma célula eucariótica, uma célula procariótica ou uma célula de um organismo multicelular (por exemplo, uma linha celular) cultivado como uma entidade unicelular), usada como recipientes para um ácido nucleico ou para um sistema de modificação de genoma (tal como o sistema de polinucleotídeo-guia/endonuclease Cas descrito no presente documento). O termo "célula hospedeira" inclui a progênie da célula original que foi transformada, transfectada ou traduzida pelo ácido nucleico ou complexo de polinucleotídeo-guia/endonuclease Cas des- crito no presente documento. Uma "célula hospedeira recombinante" (também denominada uma "célula hospedeira geneticamente modifi- cada") é uma célula hospedeira na qual foi introduzido um ácido nucleico heterólogo, por exemplo, um construto de DNA recombinante, ou que foi introduzido e compreende um sistema de modificação de genoma, tal como o sistema de polinucleotídeo-guia/endonuclease Cas descrito no presente documento. Por exemplo, uma célula hospedeira bacteri- ana em questão inclui uma célula hospedeira bacteriana geneticamente modificada em virtude da introdução em uma célula hospedeira bacteri- ana adequada de um ácido nucleico exógeno (por exemplo, um plasmí- deo ou construto de DNA recombinante) e uma célula hospedeira euca- riótica em questão inclui uma célula hospedeira eucariótica genetica- mente modificada (por exemplo, uma célula fúngica, célula de germe de mamífero ou célula vegetal), em virtude de introdução em uma célula hospedeira eucariótica adequada de um ácido nucleico exógeno.
[286] Em algumas modalidades, a célula hospedeira é selecionada a partir do grupo que consiste em: uma célula de arquea, uma célula bacteriana, uma célula eucariótica, um organismo de célula eucariótica única, uma célula somática, uma célula de germe, uma célula tronco, uma célula vegetal, uma célula de alga, uma célula animal, em célula de invertebrado, uma célula de vertebrado, uma célula de peixe, uma célula de sapo, uma célula de pássaro, uma célula de inseto, uma célula de mamífero, uma célula de porco, uma célula de vaca, uma célula de bode, uma célula de ovelha, uma célula de roedor, uma célula de rato, uma célula de camundongo, uma célula de primata não humano e uma célula de ser humano. Em alguns casos, a célula está in vitro. Em alguns casos, a célula está in vivo.
[287] Os sistemas de polinucleotídeo-guia/Cas descritos no pre- sente documento podem ser usados para alvejamento de gene.
[288] Os termos "alvejamento de gene", "alvejamento" e "alveja- mento de DNA" são usados intercambiavelmente no presente docu- mento. O alvejamento de DNA no presente documento pode ser a intro- dução específica de um nocaute, edição ou knockin em uma sequência específica de DNA, como em um cromossomo ou plasmídeo de uma célula. Em geral, o direcionamento de DNA pode ser realizado no pre- sente documento através de clivagem de uma ou de ambas as fitas em uma sequência específica de DNA em uma célula com uma endonu- clease Cas associada a um componente polinucleotídico adequado. Uma vez que uma quebra de fita única ou dupla é induzida no DNA, o mecanismo de reparo de DNA da célula é ativado para reparar a quebra por meio de processos de junção de extremidade não homóloga (NHEJ) ou reparo de homologia direcionada (HDR) que podem resultar em mo- dificações no sítio-alvo.
[289] Os termos "nocaute", "nocaute de gene" e "nocaute gené- tico" são usados intercambiavelmente no presente documento. Um no- caute representa uma sequência de DNA de uma célula que se tornou parcial ou completamente inoperante alvejando-se uma endonuclease Cas, tal como uma variante de endonuclease Cas9 descrita no presente documento; tal sequência de DNA antes do nocaute poderia ter codifi- cado uma sequência de aminoácidos, ou poderia ter tido uma função reguladora (por exemplo, promotor), por exemplo.
[290] Conforme descrito no presente documento, uma endonu- clease Cas guiada pode reconhecer, se ligar a uma sequência de DNA- alvo e introduzir uma quebra de fita única (corte) ou fita dupla. Uma vez que uma quebra de fita única ou dupla seja induzida no DNA, o meca- nismo de reparo de DNA da célula é ativado para reparar a quebra. Me- canismos de reparo de DNA propensos a erro podem produzir mutações em sítios de quebra de fita dupla. O mecanismo de reparo mais comum para unir as extremidades rompidas é a através de junção de extremi- dades não homólogas (NHEJ) (Bleuyard et al., (2006) DNA Repair 5:1 a 12). A integridade estrutural dos cromossomos é tipicamente preser- vada pelo reparo, mas deleções, inserções ou outras reorganizações (tais como, translocações cromossômicas) são possíveis (Siebert e Pu- chta, (2002) Plant Cell 14:1.121 a 1.131; Pacher et al., (2007) Genetics 175:21 a 29).
[291] Um nocaute pode ser produzido por uma indel (inserção ou deleção de bases nucleotídicas em uma sequência de DNA alvo através de NHEJ), ou por meio de remoção específica de uma sequência que reduz ou destrói completamente a função da sequência no ou próximo ao sítio-alvo. O termo "indel", no presente documento, se refere a uma inserção ou deleção de bases de nucleotídeo em uma sequência de DNA-alvo em um cromossomo ou epissomo. Tal inserção ou deleção pode ser de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, ou mais bases, por exemplo. Uma indel, em determinadas modalidades, pode ser ainda maior, pelo menos cerca de 20, 30, 40, 50, 60, 70p, 80, 90 ou 100 bases. Se uma indel é introduzida em um quadro de leitura aberto (ORF) de um gene, muitas vezes a indel interrompe a expressão de proteína de tipo selvagem co- dificada pelo ORF criando-se uma mutação de comutação de quadro.
[292] Em uma modalidade, a descrição descreve um método para modificar um sítio-alvo no genoma de uma célula, sendo que o método compreende introduzir em uma célula pelo menos um polinucleotídeo- guia e pelo menos uma variante de endonuclease Cas9 descrita no pre- sente documento, sendo que o dito polinucleotídeo-guia é um polinucle- otídeo-guia de ocorrência não natural quimérico, sendo que o dito poli- nucleotídeo-guia e a variante de endonuclease Cas9 podem formar um complexo (PGEN) que tem capacidade para reconhecer, se ligar e, op-
cionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequên- cia-alvo, e identificar pelo menos uma célula que tem uma modificação no dito alvo, sendo que a modificação no dito sítio-alvo é selecionada a partir do grupo que consiste em (i) uma substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
[293] O sistema de polinucleotídeo-guia/endonuclease Cas pode ser usado em combinação com pelo menos um modelo de polinucleotí- dico de modificação para permitir a edição (modificação) de uma se- quência nucleotídica genômica de interesse.
[294] Um "nucleotídeo modificado" ou "nucleotídeo editado" se re- fere a uma sequência de nucleotídeos de interesse que compreende pelo menos uma alteração quando comparada a sua sequência de nu- cleotídeos não modificada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo ou (iv) qualquer combinação de (i) a (iii).
[295] O termo "modelo de modificação de polinucleotídeo" inclui um polinucleotídeo que compreende pelo menos uma modificação de nucleotídeo quando comparada à sequência de nucleotídeos a ser edi- tada. Uma modificação de nucleotídeo pode ser pelo menos uma subs- tituição, adição ou deleção de nucleotídeo. Opcionalmente, o modelo de modificação de polinucleotídeo pode compreender adicionalmente se- quências nucleotídicas homólogas que flanqueiam a pelo menos uma modificação nucleotídica, em que as sequências nucleotídicas homólo- gas de flanqueamento fornecem homologia suficiente com a sequência nucleotídica desejada a ser editada.
[296] Em uma modalidade, a descrição compreende um método para editar uma sequência de nucleotídeos no genoma de uma célula,
sendo que o método compreende introduzir em uma célula pelo menos um polinucleotídeo-guia, pelo menos uma variante de endonuclease Cas9 descrita no presente documento, e um modelo de modificação de polinucleotídeo, sendo que o dito polinucleotídeo-guia é um polinucleo- tídeo-guia de ocorrência não natural quimérico, sendo que o dito polinu- cleotídeo-guia e a variante de endonuclease Cas9 podem formar um complexo (PGEN) que tem capacidade para reconhecer, se ligar e, op- cionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequên- cia-alvo, sendo que o dito modelo de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeo da dita se- quência de nucleotídeos e, opcionalmente, compreende adicionalmente selecionar pelo menos uma célula que compreende a sequência de nu- cleotídeos editada.
[297] O nucleotídeo a ser editado pode estar localizado dentro ou fora de um sítio alvo reconhecido e clivado por uma endonuclease Cas. Em uma modalidade, a pelo menos uma modificação de nucleotídeo não é uma modificação em um sítio-alvo reconhecido e clivado por uma endonuclease Cas, tal como a variante de endonuclease Cas9 descrita no presente documento. Em outra modalidade, há pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 900 ou 1000 nucleotídeos entre o pelo menos um nucleotídeo a ser editado e o sítio- alvo genômico.
[298] O método para editar uma sequência de nucleotídeos no ge- noma de uma célula pode ser um método sem o uso de um marcador selecionável exógeno restaurando-se a função para um produto de gene não funcional, conforme descrito nos documentos no WO2017/070029, publicado em 27 de abril de 2017 e WO2017/070032, publicado em 27 de abril de 2017.
[299] Os termos "knockin", "knockin de gene”, "inserção de gene"
e "knockin genético" são usados intercambiavelmente no presente do- cumento. Um knockin representa a substituição ou inserção de uma se- quência de DNA em uma sequência de DNA específica na célula alve- jando-se com uma proteína Cas (por exemplo, através de recombinação homóloga (HR), em que um polinucleotídeo de DNA doador adequado também é usado). Os exemplos de knockin são uma inserção específica de uma sequência de codificação de aminoácido heteróloga em uma região de codificação de um gene, ou uma inserção específica de um elemento regulador transcricional em uma localização genética.
[300] Vários métodos e composições podem ser empregados para obter uma célula ou organismo que tem um polinucleotídeo de interesse inserido em um sítio-alvo para uma endonuclease Cas. Tais métodos podem empregar recombinação homóloga (HR) para fornecer a integra- ção do polinucleotídeo de interesse no sítio-alvo. Em um método des- crito no presente documento, um polinucleotídeo de interesse é introdu- zido na célula de organismo por meio de um construto de DNA doador. Conforme usado no presente documento, o “DNA doador” é um cons- truto de DNA que compreende um polinucleotídeo de interesse a ser inserido no sítio-alvo de uma endonuclease Cas. O construto de DNA doador compreende, ainda, uma primeira e uma segunda região de ho- mologia que flanqueiam o polinucleotídeo de interesse. A primeira e a segunda regiões de homologia do DNA doador compartilham homologia com uma primeira e uma segunda regiões genômicas, respectivamente, presentes no ou que flanqueiam o sítio-alvo do genoma da célula ou organismo.
[301] O DNA doador pode ser vinculado ao polinucleotídeo-guia. DNAs doadores vinculados podem permitir a colocalização do DNA alvo e doador, o que é útil na edição genômica, inserção de gene e regulação genômica direcionada, e também podem ser úteis no direcionamento a células pós-mitóticas onde se espera que a função da maquinaria endó- gena de HR seja altamente diminuída (Mali et al., 2013 Nature Methods Vol. 10: 957 a 963).
[302] As moléculas de DNA epissomais também podem ser liga- das na quebra de fita dupla, por exemplo, integração de T-DNAs nas quebras de fita dupla cromossômicas (Chilton e Que, (2003) Plant Physiol 133:956 a 965; Salomon e Puchta, (1998) EMBO J 17:6086 a 6095). Uma vez que a sequência em torno das quebras de fita dupla é alterada, por exemplo, por meio de atividades de exonuclease envolvi- das na maturação de quebras de fita dupla, as vias de conversão gênica podem restaurar a estrutura original caso uma sequência homóloga es- teja disponível, tal como um cromossomo homólogo em células somáti- cas não divisórias, ou uma cromátide irmã após a replicação de DNA (Molinier et al., (2004) Plant Cell 16:342 a 352). As sequências de DNA ectópicas e/ou epigênicas também podem servir como um molde de re- paro de DNA para recombinação homóloga (Puchta, (1999) Genetics 152:1173 a 1181).
[303] O reparo direcionado por homologia (HDR) é um mecanismo em células para reparar quebras de fita dupla e fita simples de DNA. O reparo direcionado por homologia inclui a recombinação homóloga (HR) e anelamento de fita simples (SSA) (Lieber. 2010 Annu. Rev. Biochem. 79:181 a 211). A forma mais comum de HDR é chamada de recombina- ção homóloga (HR), que tem os requisitos de homologia de sequência mais longa entre o DNA doador e receptor. Outras formas de HDR in- cluem anelamento de fita simples (SSA) e replicação induzida por que- bra, e essas exigem homologia de sequência mais curta em relação à HR. O reparo direcionado por homologia em cortes (quebra de fita sim- ples) pode ocorrer por meio de um mecanismo distinto de HDR em que- bras de fita dupla (Davis e Maizels. PNAS (0027-8424), 111 (10), p. E924 a E932).
[304] Por “homologia” entende-se sequências de DNA que são si- milares. Por exemplo, uma "região de homologia com uma região genô- mica" que é encontrada no DNA doador é uma região de DNA que tem uma sequência semelhante a uma dada "região genômica" no genoma da célula ou organismo. Uma região de homologia pode ter qualquer comprimento que seja suficiente para promover a recombinação homó- loga no sítio-alvo clivado. Por exemplo, a região de homologia pode compreender pelo menos 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5- 50, 5-55, 5-60, 5-65, 5- 70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5- 1200, 5-1300, 5-1400, 5-1500, 5-1600, 5-1700, 5-1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 5-2600, 5-2700, 5-2800, 5- 2900, 5-3000, 5-3100 ou mais bases de comprimento de modo que a região de homologia tenha homologia suficiente para passar por recom- binação homóloga com a região genômica correspondente. “Homologia suficiente" indica que duas sequências de polinucleotídeos têm similari- dade estrutural suficiente para atuar como substratos para uma reação de recombinação homóloga. A similaridade estrutural inclui compri- mento geral de cada fragmento de polinucleotídeo, assim como a simi- laridade de sequência dos polinucleotídeos. A similaridade entre se- quências pode ser descrita pela porcentagem de identidade de sequên- cia ao longo de todo o comprimento das sequências e/ou pelas regiões conservadas que compreendem similaridades localizadas, como nucle- otídeos contíguos que têm 100% de identidade de sequência e porcen- tagem de identidade de sequência ao longo de uma porção do compri- mento das sequências.
[305] A quantidade de homologia ou identidade de sequência com- partilhada por um alvo e um polinucleotídeo doador pode variar e inclui comprimentos e/ou regiões totais que têm valores integrais unitários nas faixas de cerca de 1 a 20 bp, 20 a 50 bp, 50 a 100 bp, 75 a 150 bp, 100 a 250 bp, 150 a 300 bp, 200 a 400 bp, 250 a 500 bp, 300 a 600 bp, 350 a 750 bp, 400 a 800 bp, 450 a 900 bp, 500 a 1.000 bp, 600 a 1.250 bp, 700 a 1.500 bp, 800 a 1.750 bp, 900 a 2.000 bp, 1 a 2,5 kb, 1,5 a 3 kb, 2 a 4 kb, 2,5 a 5 kb, 3 a 6 kb, 3,5 a 7 kb, 4 a 8 kb, 5 a 10 kb, ou até e incluindo o comprimento total do sítio-alvo. Essas faixas incluem todo número inteiro dentro da faixa, por exemplo, a faixa de 1 a 20 bp inclui 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20 bps. A quantidade de homologia também pode ser descrita pela porcentagem de identidade de sequência sobre o comprimento completo alinhado dos dois polinucleotídeos que inclui a porcentagem de identidade de se- quência de cerca de pelo menos 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100%. Homologia suficiente inclui qualquer combi- nação de comprimento de polinucleotídeo, porcentagem de identidade de sequência global e, opcionalmente, regiões conservadas de nucleo- tídeos contíguos ou porcentagem de identidade de sequência sítio, por exemplo, homologia suficiente pode ser descrita como uma região de 75 a 150 pb que tem pelo menos 80% de identidade de sequência com uma região da localização-alvo. Homologia suficiente também pode ser descrita pela capacidade prevista de dois polinucleotídeos sofrerem hi- bridização específica sob condições de alta estringência, consulte, por exemplo, Sambrook et al., (1989) Molecular Cloning: A Laboratory Ma- nual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Edições (1994) Current Protocols, (Greene Publishing Associates, Inc. e John Wiley & Sons, Inc.); e, Tijs- sen (1993) Laboratory Techniques in Biochemistry and Molecular Bio- logy--Hybridization with Nucleic Acid Probes, (Elsevier, Nova Iorque).
[306] Conforme usado no presente documento, uma "região genô- mica” é um segmento de um cromossomo no genoma de uma célula que está presente em qualquer lado do sítio-alvo ou, alternativamente, também compreende uma porção do sítio-alvo. A região genômica pode compreender pelo menos 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5- 50, 5-55, 5-60, 5-65, 5- 70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5- 1200, 5-1300, 5-1400, 5-1500, 5-1600, 5-1700, 5-1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 5-2600, 5-2700, 5-2800. 5- 2900, 5-3000, 5-3100 ou mais bases, de modo que a região genômica tenha homologia suficiente para passar por recombinação homóloga com a região correspondente de homologia.
[307] A similaridade estrutural entre uma dada região genômica e a região correspondente de homologia encontrada no DNA doador pode ter qualquer grau de identidade de sequência que permita que a recom- binação homóloga ocorra. Por exemplo, a quantidade de homologia ou identidade de sequência compartilhada pela "região de homologia" do DNA doador e pela "região genômica" do genoma do organismo pode ter pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência, de modo que as sequências passem por recombinação homóloga
[308] A região de homologia no DNA doador pode ter homologia com qualquer sequência que flanqueia o sítio-alvo. Embora em alguns casos as regiões de homologia compartilhem homologia de sequência significativa com a sequência genômica que flanqueia imediatamente o sítio-alvo, reconhece-se que as regiões de homologia podem ser proje- tadas para ter homologia suficiente com as regiões que podem estar mais 5’ ou 3’ em relação ao sítio-alvo. As regiões de homologia também podem ter homologia com um fragmento do sítio-alvo juntamente com regiões genômicas a jusante.
[309] Em uma modalidade, a primeira região de homologia com- preende, adicionalmente, um primeiro fragmento do sítio-alvo e a se- gunda região de homologia compreende um segundo fragmento do sí- tio-alvo, em que o primeiro e o segundo fragmentos são dissimilares.
[310] Conforme usado no presente documento, “recombinação ho- móloga” inclui a troca de fragmentos de DNA entre duas moléculas de DNA nos sítios de homologia. A frequência de recombinação homóloga é influenciada por vários fatores. Organismos diferentes variam em re- lação à quantidade de recombinação homóloga e à proporção relativa entre recombinação homóloga e não homóloga. Em geral, o compri- mento da região de homologia afeta a frequência de eventos de recom- binação homóloga: quanto mais longa a região de homologia, maior a frequência. O comprimento da região de homologia necessário para se observar recombinação homóloga também é variável entre espécies. Em muitos casos, pelo menos 5 kb de homologia foram utilizados, mas recombinação homóloga tem sido observada com apenas 25 a 50 pb de homologia. Consulte, por exemplo, Singer et al., (1982) Cell 31:25 a 33; Shen e Huang, (1986) Genetics 112:441 a 457; Watt et al., (1985) Proc. Natl. Acad. Sci. E.U.A 82:4768 a 4772, Sugawara e Haber, (1992) Mol Cell Biol 12:563 a 575, Rubnitz e Subramani, (1984) Mol Cell Biol 4:2253 a 2258; Ayares et al., (1986) Proc. Natl. Acad. Sci. EUA 83:5199 a 5203; Liskay et al., (1987) Genetics 115:161 a 167.
[311] A alteração do genoma de uma célula ou organismo proca- riótico ou eucariótico, por exemplo, através de recombinação homóloga (HR), é uma ferramenta poderosa para manipulação genética. Recom- binação homóloga foi demonstrada em plantas (Halfter et al., (1992) Mol Gen Genet 231:186 a 93) e insetos (Dray e Gloor, 1997, Genetics 147:689 a 99). A recombinação homóloga também foi realizada em ou- tros organismos. Por exemplo, pelo menos 150 a 200 bp de homologia foram exigidos para a recombinação homóloga no protozoário parasita
Leishmania (Papadopoulou e Dumas, (1997) Nucleic Acids Res 25:4278 a 4286). No fungo filamentoso Aspergillus nidulans, a substituição de gene foi concluída com apenas 50 bp de homologia de flanqueamento (Chaveroche et al., (2000) Nucleic Acids Res 28:e97). Substituição de gene alvejado também foi demonstrada no ciliado Tetrahymena ther- mophila (Gaertig et al., (1994) Nucleic Acids Res 22:5.391 a 8). Em ma- míferos, a recombinação homóloga foi mais bem-sucedida no camun- dongo com o uso de linhagens de células-tronco embrionárias pluripo- tentes (ES) que podem se desenvolver em cultura, transformadas, se- lecionadas e introduzidas em um embrião de camundongo (Watson et al., 1992, Recombinant DNA, 2ª edição, (Scientific American Books dis- tribuído por WH Freeman & Co.).
[312] As quebras de fita dupla de DNA parecem ser um fator eficaz para estimular as vias de recombinação homóloga (Puchta et al., (1995) Plant Mol Biol 28:281 a 292; Tzfira e White, (2005) Trends Biotechnol 23:567 a 569; Puchta, (2005) J Exp Bot 56:1 a 14). Com o uso de agen- tes de quebra de DNA, um aumento de duas a nove vezes de recombi- nação homóloga foi observado entre repetições de DNA homólogo arti- ficialmente construídas em plantas (Puchta et al., (1995) Plant Mol Biol 28:281 a 292). Em protoplastos de milho, os experimentos com molécu- las de DNA lineares demonstraram recombinação homóloga acentuada entre plasmídeos (Lyznik et al., (1991) Mol Gen Genet 230:209 a 218).
[313] Em um aspecto, a descrição compreende um método para modificar um sítio-alvo no genoma de uma célula, sendo que o método compreende introduzir em uma célula pelo menos um polinucleotídeo- guia, pelo menos uma variante de endonuclease Cas9 descrita no pre- sente documento, e pelo menos um DNA doador, em que o dito polinu- cleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural qui- mérico, em que o dito polinucleotídeo-guia e a variante de endonuclease Cas9 podem formar um complexo (PGEN) que tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequência-alvo, em que o dito DNA doador compre- ende um polinucleotídeo de interesse e, opcionalmente, compreende adicionalmente identificar pelo menos uma célula que o dito polinucleo- tídeo de interesse integrou ou próxima ao dito sítio-alvo.
[314] Em um aspecto, a descrição compreende um método para modificar o genoma de uma célula hospedeira de Bacillus, sendo que o dito método compreende
[315] fornecer a uma célula hospedeira Bacillus que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9 descrita no presente documento, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capacidade para formar um com- plexo (PGEN), em que o dito complexo tem capacidade para reconhe- cer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[316] identificar pelo menos uma célula hospedeira Bacillus, em que a pelo menos uma sequência-alvo de genoma foi modificada. A mo- dificação no dito sítio-alvo pode ser selecionada a partir do grupo que consiste em (i) uma substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo me- nos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
[317] Em um aspecto, a descrição compreende um método para modificar o genoma de uma célula hospedeira E. coli, sendo que o dito método compreende
[318] fornecer a uma célula hospedeira E. coli que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9 descrita no presente documento, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capacidade para formar um com- plexo (PGEN), em que o dito complexo tem capacidade para reconhe- cer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[319] identificar pelo menos uma célula hospedeira E. coli, em que a pelo menos uma sequência-alvo de genoma foi modificada.
[320] Em um aspecto, a descrição compreende um método para modificar o genoma de uma célula hospedeira Saccharomyces cerevi- siae, em que o dito método compreende
[321] fornecer a uma célula hospedeira Saccharomyces cerevisiae que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA-guia de ocorrência não natural e pelo menos uma vari- ante de endonuclease Cas9 descrita no presente documento, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capacidade para formar um complexo (PGEN), em que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[322] identificar pelo menos uma célula hospedeira Saccha- romyces cerevisiae, em que a pelo menos uma sequência-alvo de ge- noma foi modificada.
[323] Usos adicionais de sistemas de RNA guia/endonuclease Cas foram descritos (Consulte o Pedido de Patente dos E.U.A. US 2015- 0082478 A1, publicado em 19 de março de 2015, WO2015/026886 A1, publicado em 26 de fevereiro de 2015, US 2015-0059010 A1, publicado em 26 de fevereiro de 2015, pedido dos E.U.A. 62/023246, depositado em 7 de julho de 2014 e pedido dos E.U.A. 62/036,652, depositado em 13 de agosto de 2014, sendo todos aqui incorporados a título de refe- rência) e incluem, mas não são limitados à, modificação ou substituição de sequências nucleotídicas de interesse (tais como elementos regula- dores), inserção de polinucleotídeos de interesse, nocaute gênico,
knock-in gênico, modificação de sítios de junção e/ou introdução de sí- tios de junção alternativos, modificações de sequências nucleotídicas que codificam uma proteína de interesse, fusões de aminoácido e/ou proteína e silenciamento gênico através da expressão de uma repetição invertida em um gene de interesse.
[324] Multiplexação
[325] Um método de alvejamento no presente documento pode ser realizado de uma tal maneira que dois ou mais sítios-alvo de DNA sejam alvejados no método, por exemplo. Tal método pode ser opcionalmente caracterizado como um método multiplex. Dois, três, quatro, cinco, seis, sete, oito, nove, dez ou mais sítios-alvo podem ser alvejados ao mesmo tempo em determinadas modalidades. Um método multiplex é tipica- mente realizado por um método de alvejamento no presente documento em que múltiplos componentes de RNA diferentes são fornecidos, cada um projetado para guiar um complexo de polinucleotídeo-guia/endonu- clease Cas para um sítio-alvo de DNA exclusivo.
[326] As variantes de endonuclease Cas9 descritas no presente documento podem ser usadas para edição de genoma alvejada (através de quebras e cortes de fita dupla simplex e multiplex) e regulação genô- mica alvejada (através da ligação de domínios efetores epigenéticos à Cas9 ou sgRNA). Variantes de endonuclease Cas9 descritas no pre- sente documento também podem ser modificadas para funcionar como uma recombinase guiada por RNA e através de ligantes de RNA poderia servir como um arcabouço para a montagem de complexos multiprotei- cos e de ácido nucleico (Mali et al. 2013 Nature Methods Vol. 10: 957-
963.).
[327] Localizações de Traço Complexo
[328] Os polinucleotídeos de interesse e/ou traços podem ser em- pilhados em conjunto em uma localização de traço complexo, conforme descrito no documento W02012/129373, publicado em 14 de março de
2013 e no documento PCT/US13/22891, publicado em 24 de janeiro de 2013, ambos incorporados no presente documento a título de referên- cia. O sistema de polinucleotídeo-guia/endonuclease Cas, tal como o sistema que compreende uma variante de endonuclease Cas9 descrita no presente documento, fornece um sistema eficiente para gerar que- bras de fita única ou dupla e permite que traços sejam empilhados em uma localização de traço complexo.
[329] Introdução de polinucleotídeos, polipeptídeos, cassetes de expressão, DNA recombinante ou qualquer componente de um sistema de proteína Cas guiado
[330] Os polinucleotídeos, polipeptídeos, cassetes de expressão ou DNA recombinante revelados no presente documento podem ser in- troduzidos em um organismo com o uso de qualquer método conhecido na técnica. Qualquer um dentre os componentes do sistema de polinu- cleotídeo-guia/Cas, o próprio complexo de polinucleotídeo-guia/Cas, as- sim como o modelo (ou modelos) de modificação de polinucleotídeo e/ou DNA (DNAs) doador, pode ser introduzido em uma célula através de qualquer método conhecido na técnica.
[331] "Introdução" deve significar entregar ao organismo, tal como uma célula ou organismo, o polinucleotídeo ou polipeptídeo ou com- plexo de polinucleotídeo e proteína (tal como um RGEN ou PGEN), de uma tal maneira que o componente (ou componentes) ganhe acesso ao interior de uma célula do organismo ou à própria célula. Os métodos e composições não dependem de um método particular para introduzir uma sequência em um organismo ou célula, apenas que o polinucleotí- deo ou polipeptídeo ganhe acesso ao interior de pelo menos uma célula do organismo. Introdução inclui referência à incorporação de um ácido nucleico em uma célula eucariótica ou procariótica, em que o ácido nu- cleico pode ser incorporado no genoma da célula, e inclui a referência à provisão transiente (direta) de um ácido nucleico, proteína ou complexo de polinucleotídeo e proteína (PGEN, RGEN) na célula.
[332] Métodos para introduzir polinucleotídeos, polipeptídeos, cas- setes de expressão, DNA recombinante ou complexos de polinucleotí- deo e proteína (PGEN, RGEN) em células ou organismos são conheci- dos na técnica, que incluem, porém, sem limitação, competência natural (conforme descrito no documentos nº WO2017/075195, WO2002/14490 e WO2008/7989), Crossway de microinjeção et al., (1986) Biotechni- ques 4:320 a 34 e documento de Patente no U.S. 6.300.543), transfor- mação de meristema (documento de patente no U.S. 5.736.369), eletro- poração (Riggs et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602 a 6), métodos de transformação estável, métodos de transformação transi- ente, aceleração de partícula balística (bombardeamento de partícula) (documentos de Patente no U.S. 4.945.050; 5.879.918; 5.886.244;
5.932.782), transformação mediada por fibra (Ainley et al. 2013, Plant Biotechnology Journal 11:1.126 a 1.134; Shaheen A. e M. Arshad 2011 Properties and Applications of Silicon Carbide (2011), 345 a 358 Edi- tor(s): Gerhardt, Rosario. Publicação: InTech, Rijeka, Croácia. CODEN: 69PQBP; ISBN: 978-953-307-201-2), transformação mediada por Agrobacterium (documentos de Patente no U.S. 5.563.055 e 5.981.840), transferência de gene direta (Paszkowski et al., (1984) EMBO J 3:2717 a 22), introdução mediada por vírus (documentos de Patente no U.S.
5.889.191, 5.889.190, 5.866.785, 5.589.367 e 5.316.931), transfecção, transdução, peptídeos de penetração em célula, entrega de proteína di- reta mediada por nanopartícula de sílica mesoporosa (MSN), aplicações tópicas, cruzamento sexual, melhoramento sexual e qualquer combina- ção dos mesmos. “Transformação estável" pretende significar que o construto de nucleotídeos introduzido em um organismo se integra em um genoma do organismo e tem capacidade para ser herdado pela pro- gênie da mesma. A transformação transiente pretende significar que um polinucleotídeo é introduzido (direta ou indiretamente) no organismo e não se integra em um genoma do organismo ou um polipeptídeo é in- troduzido em um organismo. A transformação transiente indica que a composição introduzida é apenas temporariamente expressa ou pre- sente no organismo.
[333] O polinucleotídeo-guia (RNA-guia, crNucleotídeo + tracrNu- cleotídeo, DNA-guia e/ou molécula de RNA-DNA-guia) pode ser intro- duzido em uma célula diretamente (transientemente) como uma molé- cula de polinucleotídeo de fita única ou dupla. O RNA-guia (ou crRNA + tracrRNA) também pode ser introduzido e uma célula indiretamente in- troduzindo-se uma molécula de DNA recombinante que compreende um fragmento de ácido nucleico heterólogo que codifica o RNA-guia (ou crRNA + tracrRNA), ligado de modo operacional a um promotor especí- fico que tem capacidade para transcrever o RNA-guia (moléculas de crRNA+tracrRNA) na dita célula. O promotor específico pode ser, mas sem limitação, um promotor de RNA polimerase III, o que permite a transcrição de RNA com extremidades 5' e 3' não modificadas precisa- mente definidas (Ma et al., 2014, Mol. Ther. Nucleic Acids 3:e161; Di- Carlo et al., 2013, Nucleic Acids Res. 41: 4.336 a 4.343; documento nº WO2015026887, publicado em 26 de fevereiro de 2015). Qualquer pro- motor com capacidade para transcrever o RNA-guia e uma célula pode ser usado e inclui um promotor de choque térmico/induzível por calor ligado de modo operacional a uma sequência de nucleotídeo que codi- fica o RNA-guia.
[334] Uma endonuclease Cas no presente documento pode ser in- troduzida em uma célula introduzindo-se diretamente o polipeptídeo Cas em si (denominado como entrega direta de endonuclease Cas), em que o mRNA codifica a proteína Cas, e/ ou o complexo de polinucleotí- deo-guia/endonuclease Cas em si, com o uso de qualquer método co- nhecido na técnica. A endonuclease Cas também pode ser introduzida em uma célula indiretamente introduzindo-se uma molécula de DNA re- combinante que codifica a endonuclease Cas. A endonuclease pode ser introduzida em uma célula transientemente ou pode ser incorporada ao genoma da célula hospedeira com o uso de qualquer método conhecido na técnica. A ingestão da endonuclease e/ou do polinucleotídeo guiado na célula pode ser facilitada com um Peptídeo Penetrante de Célula (CPP) conforme descrito no documento nº WO2016/073433, publicado em 12 de maio de 2016. Qualquer promotor com capacidade para ex- pressar a variante de endonuclease Cas no presente documento em uma célula pode ser usado e inclui um promotor de choque térmico/in- duzível por calor ligado de modo operacional a uma sequência de nu- cleotídeo que codifica a endonuclease Cas.
[335] A entrega direta de um modelo de modificação de polinucle- otídeo em células pode ser alcançado através de entrega mediada por partículas, e qualquer outro método direto de entrega, como, mas sem limitação, transfecção mediada por polietileno glicol (PEG) a protoplas- tos, transformação mediada por cristais capilares, eletroporação, bom- bardeio de partículas, peptídeos penetrantes de célula, ou entrega de proteína direta mediada por nanopartícula de sílica mesoporosa (MSN) pode ser usada de modo bem-sucedido para entregar um modelo de modificação de polinucleotídeo em células, como células eucarióticas.
[336] O DNA doador pode ser introduzido por quaisquer meios co- nhecidos na técnica. O DNA doador pode ser fornecido por qualquer método de transformação conhecido na técnica incluindo, por exemplo, transformação mediada por Agrobacterium ou bombardeio de partícula biolístico. O DNA doador pode estar presente temporariamente na cé- lula ou poderia ser introduzido por meio de um replicon viral. Na pre- sença da endonuclease Cas e do sítio-alvo, o DNA doador é inserido no genoma transformado do organismo, como uma planta.
[337] A entrega direta de qualquer um dos componentes de sis- tema Cas guiados descrita no presente documento pode ser acompa- nhada por entrega direta (coentrega) de outros mRNAs que podem pro- mover o enriquecimento e/ou visualização de células que recebem o complexo de componentes de polinucleotídeo-guia/endonuclease Cas. Por exemplo, a coentrega direta dos componentes de polinucleotídeo- guia/endonuclease Cas (e/ou complexo de polinucleotídeo-guia/endo- nuclease Cas em si) junto com marcadores fenotípicos de codificação de mRNA (como, mas sem limitação, ativadores de transcrição, como CRC (Bruce et al. 2000 The Plant Cell 12:65 a 79) podem possibilitar a seleção e o enriquecimento de células sem o uso de um marcador se- lecionável endógeno restaurando-se a função para um produto de gene não funcional, conforme descrito no documento nº WO2017/070029, pu- blicado em 27 de abrl de 2017 e no documento nº WO 2017/070032, publicado em 27 de abril de 2017.
[338] Introduzir um complexo de RNA-guia/endonuclease Cas (RGEN) conforme descrito no presente documento em uma célula inclui introduzir o complexo de RNA-guia/endonuclease Cas como um ribonu- cleotídeo-proteína na célula. O ribonucleotídeo-proteína pode ser mon- tado antes de ser introduzido na célula conforme descrito no presente documento. Os componentes que compreendem o RNA-guia/proteína de ribonucleotídeo de endonuclease Cas podem ser montados in vitro ou montados por quaisquer meios conhecidos na técnica antes de se- rem introduzidos em uma célula (alvejada para modificação de genoma conforme descrito no presente documento).
[339] As células vegetais, fúngicas e bacterianas diferem de célu- las humanas e animais nessas células vegetais, fúngicas e bacterianas contêm uma parede celular que pode atuar como uma barreira para a entrega direta das ribonucleoproteínas RGEN e/ou da entrega direta dos componentes RGEN.
[340] Entrega direta das ribonucleoproteínas RGEN em células ve- getais, fúngicas e bacterianas pode ser alcançada através de entrega mediada por partícula (bombardeio de partículas). Com base nos expe- rimentos descritos no presente documento, um indivíduo versado na técnica pode agora garantir que qualquer outro método direto de en- trega, como, mas sem limitação, transfecção mediada por polietileno gli- col (PEG) a protoplastos, eletroporação, peptídeos penetrantes de cé- lula, ou entrega de proteína direta mediada por nanopartícula de sílica mesoporosa (MSN), pode ser usada de modo bem-sucedido para en- tregar ribonucleoproteínas RGEN em células fúngicas e bacterianas.
[341] A entrega direta da ribonucleoproteína RGEN permite a edi- ção de genoma em um sítio alvo no genoma de uma célula que pode ser seguida por degradação rápida do complexo, e apenas uma pre- sença transiente do complexo na célula. Essa presença transiente do complexo de RGEN pode levar à redução dos efeitos off-target. Em con- trapartida, a entrega de componentes de RGEN (RNA guia, endonu- clease Cas9) através de sequências de DNA plasmidial pode resultar em expressão constante de RGENs a partir desses plasmídeos, o que pode intensificar os efeitos off-target (Cradick, T. J. et al (2013) Nucleic Acids Res 41:9584 a 9592; Fu, Y et al (2014) Nat. Biotechnol. 31:822 a
826.
[342] A entrega direta pode ser alcançada combinando-se qual- quer componente do complexo de RNA-guia/endonuclease Cas (RGEN), descrito no presente documento, (como pelo menos um RNA- guia, pelo menos uma variante de endonuclease Cas9), com uma matriz de entrega de partícula que compreende uma micropartícula, como, mse sem limitação, uma partícula de ouro, partícula de tungstênio e par- tícula de cristal capilar de carbeto de silício)(também consultar o docu- mento nº WO2017/070029, publicado em 27 de abril de 2017 e docu- mento nº WO 2017/070032, publicado em 27 de abril de 2017, que são incorporados ao presente documento em sua totalidade, a título de re- ferência).
[343] Em um aspecto, o complexo de polinucleotídeo-guia/endo- nuclease Cas (RGEN), é um complexo em que o RNA-guia e variante de endonuclease Cas9 descrito no presente documento formando o complexo de RNA-guia/endonuclease Cas são introduzidos na célula como RNA e proteína, respectivamente.
[344] Em um aspecto, o complexo de polinucleotídeo-guia/endo- nuclease Cas, é um complexo em que o RNA-guia e variante de endo- nuclease Cas9 descrito no presente documento formando o complexo de RNA-guia/endonuclease Cas são pré-montados in vitro e introduzi- dos na célula como um complexo de ribonucleotídeo-proteína.
[345] Os ácidos nucleicos e proteínas podem ser fornecidos por uma célula por qualquer método incluindo métodos com o uso de molé- culas para facilitar a ingestão de qualquer um ou todos os componen- tesd e um sistema Cas guiado (proteína e/ou ácidos nucleicos), como peptídeos penetrantes de célula e nanocarreadores (documento nº US20110035836, publicado em 20 de fevereiro de 2011), incorporado ao presente documento a título de referência.
[346] Células , Organismos
[347] As variantes de endonuclease Cas presentemente revela- das, polinucleotídeos, peptídeos, polinucleotídeos-guia, endonucleases Cas, modelos de modificação de polinucleotídeo, DNAs doadores, sis- temas de polinucleotídeo-guia/endonuclease Cas e qualquer uma com- binação dos mesmos podem ser introduzidas em uma célula.
[348] As células incluem, mas sem limitação, células humanas, não humanas, animais, bacterianas, fúngicas, de inseto, levedura, leve- dura não convencional, microbianas e vegetais, assim como plantas e sementes produzidas pelos métodos descritos no presente documento.
[349] As células microbianas empregadas nos métodos e compo- sições revelados no presente documento podem ser quaisquer células hospedeiras fúngicas, células fúngicas filamentosas e células bacteria- nas. Conforme usado no presente documento, o termo "célula fúngica", "fungos", "célula hospedeira fúngica", e semelhantes, conforme usado no presente documento, inclui os filos Ascomycota, Basidiomycota, Chytridiomycota, e Zygomycota (conforme definido por Hawksworth et al., 1995), assim como os fungos Oomycota (Hawksworth et al.,1995) e todos os fungos mitospóricos (Hawksworth et al.,1995). Em certas mo- dalidades, a célula hospedeira fúngica é uma célula de levedura, em que o termo "levedura" significa levedura ascoesporogenosa (En- domycetales), levedura basidioesporogenosa e levedura que pertence a Fungi Imperfecti (Blastomycetes). Como tal, uma célula hospedeira de levedura inclui uma célula Candida, Hansenula, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, ou Yarrowia. Espécies de leve- dura incluem, mas sem limitação, Saccharomyces carlsbergensis, Sac- charomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccha- romyces oviformis, Kluyveromyces lactis, e Yarrowia lipolytica.
[350] O termo "levedura não convencional" se refere, no presente documento, a qualquer levedura que não é uma espécie de levedura Saccharomyces (por exemplo, S. cerevisiae) ou Schizosaccharomyces. (consultar Non-Conventional Yeasts in Genetics, Biochemistry and Bio- technology: Practical Protocols" (K. Wolf, K.D. Breunig, G. Barth, Eds., Springer-Verlag, Berlim, Alemanha, 2003). A levedura não convencional inclui o membro de um gênero selecionado a partir do grupo que con- siste em Yarrowia, Pichia, Schwanniomyces, Kluyveromyces, Arxula, Trichosporon, Candida, Ustilago, Torulopsis, Zygosaccharomyces, Tri- gonopsis, Cryptococcus, Rhodotorula, Phaffia, Sporobolomyces, e Pachysolen. A levedura não convencional inclui a levedura que favorece processos de reparo de DNA de união de extremidade não homóloga (NHEJ) sobre processos de reparo mediados por recombinação homó- loga (HR). A definição de uma levedura não convencional nestes termos – preferência de NHEJ sobre HR – é adicionalmente revelada por Chen et al. (PLoS ONE 8:e57952), que é incorporado ao presente documento, a título de referência.
O termo "levedura", no presente documento, se refere a espécies fúngicas que existem predominantemente em forma unicelular.
A levedura pode ser alternativamente denominada como "cé- lulas de levedura" no presente documento.
Um exemplo adequado de uma espécie Yarrowia é Y. lipolytica.
Exemplos adequados de espécies Pichia incluem P. pastoris, P. methanolica, P. stipitis, P. anomala e P. angusta.
Exemplos adequados de espécies Schwanniomyces incluem S. castellii, S. alluvius, S. hominis, S. occidentalis, S. capriottii, S. et- chellsii, S. polymorphus, S. pseudopolymorphus, S. vanrijiae e S. yama- dae.
Exemplos adequados de espécies Kluyveromyces incluem K. lac- tis, K. marxianus, K. fragilis, K. drosophilarum, K. thermotolerans, K. phaseolosporus, K. vanudenii, K. waltii, K. africanus e K. polysporus.
Exemplos adequados de espécies Arxula incluem A. adeninivorans e A. terrestre.
Exemplos adequados de espécies Trichosporon incluem T. cutaneum, T. capitatum, T. inkin e T. beemeri.
Exemplos adequados de espécies Candida incluem C. albicans, C. ascalaphidarum, C. amphi- xiae, C. antarctica, C. argentea, C. atlantica, C. atmosphaerica, C. blat- tae, C. bromeliacearum, C. carpophila, C. carvajalis, C. cerambyci- darum, C. chauliodes, C. corydali, C. dosseyi, C. dubliniensis, C. erga- tensis, C. fructus, C. glabrata, C. fermentati, C. guilliermondii, C. haemu- lonii, C. insectamens, C. insectorum, C. intermedia, C. jeffresii, C. kefyr, C. keroseneae, C. krusei, C. lusitaniae, C. lyxosophila, C. maltosa, C. marina, C. membranifaciens, C. milleri, C. mogii, C. oleophila, C. orego- nensis, C. parapsilosis, C. quercitrusa, C. rugosa, C. sake, C. shehatea,
C. temnochilae, C. tenuis, C. theae, C. tolerans, C. tropicalis, C. tsuchi- yae, C. sinolaborantium, C. sojae, C. subhashii, C. viswanathii, C. utilis, C. ubatubensis e C. zemplinina.
Exemplos adequados de espéies Usti- lago incluem U. avenae, U. esculenta, U. hordei, U. maydis, U. nuda e U. tritici.
Exemplos adequados de espécies Torulopsis incluem T. geo- chares, T. azyma, T. glabrata e T. candida.
Exemplos adequados de espécies Zygosaccharomyces incluem Z. bailii, Z. bisporus, Z. cidri, Z. fermentati, Z. florentinus, Z. kombuchaensis, Z. lentus, Z. mellis, Z. mi- croellipsoides, Z. mrakii, Z. pseudorouxii e Z. rouxii.
Exemplos adequa- dos de espécies Trigonopsis incluem T. variabilis.
Exemplos adequados de espécies Cryptococcus incluem C. laurentii, C. albidus, C. neofor- mans, C. gattii, C. uniguttulatus, C. adeliensis, C. aerius, C. albidosimilis, C. antarcticus, C. aquaticus, C. ater, C. bhutanensis, C. consortionis, C. curvatus, C. phenolicus, C. skinneri, C. terreus e C. vishniacci.
Exemplos adequados de espécies Rhodotorula incluem R. acheniorum, R. tula, R. acuta, R. americana, R. araucariae, R. arctica, R. armeniaca, R. auran- tiaca, R. auriculariae, R. bacarum, R. benthica, R. biourgei, R. bogorien- sis, R. bronchialis, R. buffonii, R. calyptogenae, R. chungnamensis, R. cladiensis, R. corallina, R. cresolica, R. crocea, R. cycloclastica, R. dai- renensis, R. diffluens, R. evergladiensis, R. ferulica, R. foliorum, R. fra- garia, R. fujisanensis, R. futronensis, R. gelatinosa, R. glacialis, R. glu- tinis, R. gracilis, R. graminis, R. grinbergsii, R. himalayensis, R. hinnulea, R. histolytica, R. hylophila, R. incarnata, R. ingeniosa, R. javanica, R. koishikawensis, R. lactosa, R. lamellibrachiae, R. laryngis, R. lignophila, R. lini, R. longissima, R. ludwigii, R. lysinophila, R. marina, R. martyniae- fragantis, R. matritensis, R. meli, R. minuta, R. mucilaginosa, R. nitens, R. nothofagi, R. oryzae, R. pacifica, R. pallida, R. peneaus, R. philyla, R. phylloplana, R. pilatii, R. pilimanae, R. pinicola, R. plicata, R. polymor- pha, R. psychrophenolica, R. psychrophila, R. pustula, R. retinophila, R. rosacea, R. rosulata, R. rubefaciens, R. rubella, R. rubescens, R. rubra,
R. rubrorugosa, R. rufula, R. rutila, R. sanguinea, R. sanniei, R. sartoryi, R. silvestris, R. simplex, R. sinensis, R. slooffiae, R. sonckii, R. strami- nea, R. subericola, R. suganii, R. taiwanensis, R. taiwaniana, R. terpe- noidalis, R. terrea, R. texensis, R. tokyoensis, R. ulzamae, R. vanillica, R. vuilleminii, R. yarrowii, R. yunnanensis e R. zsoltii. Exemplos adequa- dos de espécies Phaffia incluem P. rhodozyma. Exemplos adequados de espécies Sporobolomyces incluem S. alborubescens, S. bannaensis, S. beijingensis, S. bischofiae, S. clavatus, S. coprosmae, S. coprosmi- cola, S. corallinus, S. dimmenae, S. dracophylli, S. elongatus, S. gracilis, S. inositophilus, S. johnsonii, S. koalae, S. magnisporus, S. novozealan- dicus, S. odorus, S. patagonicus, S. productus, S. roseus, S. sasicola, S. shibatanus, S. singularis, S. subbrunneus, S. symmetricus, S. syzygii, S. taupoensis, S. tsugae, S. xanthus e S. yunnanensis. Exemplos ade- quados de espécies Pachysolen incluem P. tannophilus.
[351] Conforme usado no presente documento, o termo "célula fúngica filamentosa" inclui todas as formas filamentosas da subdivisão Eumycotina. As células adequadas de gêneros fúngicos filamentosos incluem, mas sem limitação, células de Acremonium, Aspergillus, Au- reobasidium, Bjerkandera, Ceriporiopsis, Chrysoporium, Coprinus, Co- riolus, Corynascus, Chaertomium, Cryptococcus, Filobasidium, Fusa- rium, Gibberella, Humicola, Magnaporthe, Mucor, Myceliophthora, Mu- cor, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanero- chaete, Phlebia, Piromyces, Pleurotus, Scytaldium, Schizophyllum, Spo- rotrichum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Tra- metes, e Trichoderma.
[352] As células adequadas de espécies fúngicas filamentosas in- cluem, mas sem limitação, células de Aspergillus awamori, Aspergillus fumigatus, Aspergillus foetidus, Aspergillus japonicus, Aspergillus nidu- lans, Aspergillus niger, Aspergillus oryzae, Chrysosporium luckno-
wense, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwel- lense, Fusarium culmorum, Fusarium graminearum, Fusarium grami- num, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusa- rium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis aneirina, Ce- riporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermis- pora, Coprinus cinereus, Coriolus hirsutus, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Neurospora intermedia, Penicillium purpurogenum, Penicillium canescens, Penicillium solitum, Penicillium funiculosum Phanerochaete chrysosporium, Phlebia radiate, Pleurotus eryngii, Talaromyces flavus, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Tricho- derma reesei, e Trichoderma viride.
[353] Em certas modalidades, as células hospedeiras microbianas são células bacterianas, por exemplo, um Bacillus alkalophilus, Bacillus amyloliquefaciens, Bacillus brevis, Bacillus circulans, Bacillus coagu- lans, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus me- gaterium, Bacillus stearothermophilus, Bacillus subtilis, ou Bacillus thu- ringiensis ou um Streptomyces, como, por exemplo, um Streptomyces lividans ou Streptomyces murinus ou uma bactéria gram negativa, como, por exemplo, um E. coli ou um Pseudomonas sp.
[354] Para as espécies supracitadas, é entendido que a descrição e as espécies de origem abrangeriam tanto os estados perfeito e imper- feito de tais organismos, e outros equivalentes taxonômicos dos mes- mos, por exemplo, anamorfos, independentemente do nome de espé-
cies pelos quais são conhecidos. Os indivíduos versados na técnica re- conhecerão prontamente a identidade de equivalentes apropriados de tais espécies de origem.
[355] As cepas da espécie mencionada acima são prontamente acessíveis ao público em várias coletâneas de cultura, como a American Type Culture Collection (ATCC), Deutsche Sammlung von Mikroorga- nismen und Zellkulturen GmbH (DSM), Centraalbureau Voor Schimmel- cultures (CBS), e Agricultural Research Service Patent Culture Collec- tion, Northern Regional Research Center (NRRL).
[356] As variantes de endonuclease Cas9 descritas no presente documento podem ser usadas em métodos para recombinação homó- loga em uma célula microbiana e/ou em métodos para edição de ge- noma em uma célula microbiana. Os métodos que empregam um sis- tema de RNA-guia/endonuclease Cas para inserir um DNA doador com um ou mais braços de homologia curta em um sítio-alvo no genoma de uma célula microbiana (por exemplo, uma célula fúngica filamentosa) foram revelados (documento nº WO2017/019867, publicado em 2 de fe- vereiro de 2017). Quando a modificação do genoma da célula microbi- ana resulta em um efeito fenotípico, um DNA doador é frequentemente empregado incluindo um polinucleotídeo de interesse que é (ou codifica) um marcador fenotípico. Qualquer marcador fenotípico conveniente pode ser usado, incluindo qualquer marcador selecionável ou triável que permite que um indivíduo identifique, ou selecione para ou contra uma célula fúngica que contém o mesmo, frequentemente condições de cul- tura particular. Desse modo, em alguns aspectos da presente descrição, a identificação de células microbianas que têm uma modificação de ge- noma desejável inclui cultivar a população microbiana de células que receberam a variante de endonuclease Cas9 e o polinucleotídeo-guia (e opcionalmente a DNA doador) sob condições para selecionar as células que têm a modificação no sítio-alvo. Qualquer tipo de sistema de sele- ção pode ser empregado, incluindo avaliação pelo ganho ou perda de uma atividade enzimática na célula fúngica (também denominada como um marcador selecionável), por exemplo, a aquisição de resistência an- tibiótica ou ganho/perda de um marcador auxotrófico.
[357] Conforme usado no presente documento, o termo planta in- clui células vegetais, protoplastos vegetais, culturas de tecido de célula vegetal a partir das quais uma planta pode ser regenerada, caules ve- getais, grupos de plantas e células vegetais que são intactas em plantas ou partes de plantas, como embriões, pólen, óvulos, sementes, folhas, flores, galhos, frutos, núcleos, espigas, sabugos, cascos, talos, raízes, pontas de raiz, anteras, grãos e semelhantes. Conforme usado no pre- sente documento, por "grão" entende-se a semente madura produzida por cultivadores comerciais com propósitos diferentes de cultivar ou re- produzir a espécie. A progênie, variantes e mutantes das plantas rege- neradas também são incluídos no escopo da descrição, visto que estas partes compreendem modificações genômicas da planta regenerada, como aquelas resultantes da transformação ou edição de genoma.
[358] Qualquer planta ou parte vegetal pode ser usada, incluindo plantas monocotiledôneas e dicotiledôneas ou partes vegetais.
[359] Exemplos de plantas monocotiledôneas que podem ser usa- das incluem, mas sem limitação, milho (Zea mays), arroz (Oryza sativa), centeio (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), milhete (por exemplo, milheto-pérola (Pennisetum glaucum), painço (Panicum miliaceum), milheto cauda-de-raposa (Setaria italica), milheto- dedo (Eleusine coracana)), trigo (espécie Triticum, Triticum aestivum, Triticum monococcum), cana-de-açúcar (Saccharum spp.), aveia-co- mum (Avena), cevada (Hordeum), painço amarelo (Panicum virgatum), abacaxi (Ananas comosus), banana (Musa spp.), palma, plantas orna- mentais, gramados e outras gramíneas.
[360] O termo "dicotiledônea"ou "dicot" se refere á subclasse de plantas angiospermas também conhecidas como "dicotyledoneae" e in- clui referência a plantas inteiras, órgãos vegetais (por exemplo, folhas, troncos, raízes, etc.), sementes, células vegetais e progênie das mes- mas. Exemplos de plantas dicotiledôneas que podem ser usadas in- cluem, mas sem limitação, soja (Glycine max), espécie Brassica (Ca- nola) (Brassica napus, B. campestris, Brassica rapa, Brassica. juncea), alfafa (Medicago sativa),), alfafa (Medicago sativa), tabaco (Nicotiana tabacum), Arabidopsis (Arabidopsis thaliana), girassol (Helianthus an- nuus), algodão (Gossypium arboreum, Gossypium barbadense), e amendoim (Arachis hypogaea), tomate (Solanum lycopersicum), batata (Solanum tuberosum.
[361] As plantas que podem ser usadas incluem açafrão-bastardo (Carthamus tinctorius), batata-doce (Ipomoea batatus), mandioca (Ma- nihot esculenta), café (Coffea spp.), coco (Cocos nucifera), árvores cí- tricas (Citrus spp.), cacau (Theobroma cacao), chá (Camellia sinensis), banana (Musa spp.), abacate (Persea americana), figo (Ficus casica), goiaba (Psidium guajava), manga (Mangifera indica), oliva (Olea euro- paea), mamão (Carica papaya), caju (Anacardium occidentale), maca- dâmia (Macadamia integrifolia), amêndoa (Prunus amygdalus), beter- raba sacarina (Beta vulgaris), vegetais, plantas ornamentais e coníferas.
[362] Os vegetais incluem tomates (Lycopersicon esculentum), al- face (por exemplo, Lactuca sativa), feijões-verdes (Phaseolus vulgaris), feijões-lima (Phaseolus limensis), peras (Lathyrus spp.) e membros do gênero Cucumis, como pepino (C. sativus), cantalupo (C. cantalupensis) e melão-de-casca-de-carvalho (C. melo). As plantas ornamentais in- cluem azaleia (Rhododendron spp.), hortênsia (Macrophylla hydran- gea), hibisco (Hibiscus rosasanensis), rosas (Rosa spp.), tulipa (Tulipa spp.), narcisos (Narcissus spp.), petúnias (Petunia hybrida), cravo (Di- anthus caryophyllus), poinsétia (Euphorbia pulcherrima) e crisântemo.
[363] Coníferos que podem ser empregados na prática da pre- sente invenção incluem, por exemplo, pinheiros, como pinheiro-amarelo (Pinus taeda), pinheiro-americano (Pinus elliotii), pinheiro ponderosa (Pinus ponderosa), pinheiro lodgepole (Pinus contorta) e pinheiro Mon- terey (Pinus radiata); abeto-de-Douglas (Pseudotsuga menziesii); cicuta oriental (Tsuga canadensis); espruce-branco (Picea glauca); sequoia- vermelha (Sequoia sempervirens); abetos verdadeiros, como abeto-pra- teado (Abies amabilis) e abeto balsâmico (Abies balsamea); e cedros, como tuia-gigante (Thuja plicata) e cedro amarelo (Chamaecyparis no- otkatensis).
[364] O termo "planta" inclui plantas inteiras, órgãos vegetais, teci- dos vegetais, sementes, células vegetais, sementes e progênie dos mesmos. As células vegetais incluem, sem limitação, células de semen- tes, culturas de suspensão, embriões, regiões meristemáticas, tecido de calo, folhas, raízes, brotos, gametófitos, esporófitos, pólen e microespo- ros. As partes vegetais incluem tecidos diferenciados e não diferencia- dos incluindo, mas sem limitação, raízes, troncos, brotos, folhas, pólens, sementes, tecido tumoral e várias formas de células e cultura (por exem- plo, células únicas, protoplastos, embriões e tecido de calo). O tecido vegetal pode estar em planta ou em um órgão vegetal, tecido ou cultura celular. O termo "órgão vegetal" se refere a tecido vegetal ou um grupo de tecidos que constituem uma parte morfológica e funcionalmente dis- tinta de uma planta. O termo "genoma" se refere ao complemento inteiro de material genético (genes e sequências não codificantes) que está presente em cada célula de um organismo, ou vírus ou organela; e/ou um conjunto completo de cromossomos herdados como uma unidade (haploide) de um parente. "Progênie" compreende qualquer geração subsequente de uma planta.
[365] Conforme usado no presente documento, o termo "parte ve- getal" se refere a células vegetais, protoplastos vegetais, culturas de tecido de célula vegetal a partir das quais plantas podem ser regenera- das, caules vegetais, grupos de plantas e células vegetais que são in- tactas em plantas ou partes de plantas, como embriões, pólen, óvulos, sementes, folhas, flores, galhos, frutos, núcleos, espigas, sabugos, cas- cos, talos, raízes, pontas de raiz, anteras e semelhantes, assim como as partes em si. Grão é destinado a significar a semente madura produ- zida por cultivadores comerciais com propósitos diferentes de cultivar ou reproduzir a espécie. Progênie, variantes, e mutantes das plantas regeneradas também são incluídas no escopo da invenção, visto que estas partes compreendem os polinucleotídeos introduzidos.
[366] Uma planta transgênica inclui, por exemplo, uma planta que compreende em seu genoma um polinucleotídeo heterólogo introduzido por uma etapa de transformação. O polinucleotídeo heterólogo pode ser estavelmente integrado no genoma, de modo que o polinucleotídeo seja passado para gerações sucessivas. O polinucleotídeo heterólogo pode ser integrado ao genoma sozinho ou como parte de um construto de DNA recombinante. Uma planta transgênica também pode compreen- der mais do que um polinucleotídeo heterólogo em seu genoma. Cada polinucleotídeo heterólogo pode conferir um traço diferente à planta transgênica. Um polinucleotídeo heterólogo pode incluir uma sequência que se origina de uma espécie estranha, ou, se da mesma espécie, pode ser substancialmente modificada a partir de sua forma nativa. Transgênico pode incluir qualquer célula, linhagem celular, calo, tecido, parte vegetal ou planta, o genótipo que foi alterado pela presença de ácido nucleico heterólogo incluindo aqueles transgênicos inicialmente então alterados, assim como aqueles criados por cruzamentos sexuais ou propagação assexual do transgênico inicial. As alterações do ge- noma (cromossômico ou extracromossômico) por métodos de reprodu- ção de planta convencionais, pelo procedimento de edição de genoma descrito no presente documento que não resultam em uma inserção de um polinucleotídeo estranho, ou por eventos de ocorrência natural, como fertilização cruzada, infecção viral não recombinante, transforma- ção bacteriana não recombinante, transposição não recombinante ou mutação espontânea não devem ser consideradas como transgênicas.
[367] Uma planta fértil é uma planta que produz gametas macho e fêmea viáveis e é autofértil. Tal planta autofértil pode produzir uma planta de progênie sem a contribuição de qualquer outra planta de um gameta e o material genético contido na mesma.
[368] Definições
[369] Um "alelo" ou "variante alélica" é uma de diversas formas al- ternativas de um gene que ocupa uma dada localização em um cromos- somo. Quando todos os alelos presentes em uma dada localização em um cromossomo são iguais, esse organismo é homozigoto nessa loca- lização. Se os alelos presentes em uma dada localização em um cro- mossomo são diferentes, esse organismo é heterozigoto nessa locali- zação. Uma variante alélica de um polipeptídeo é um polipeptídeo codi- ficado por uma variante alélica de um gene.
[370] "Sequência de codificação" se refere a uma sequência de polinucleotídeo que codifica uma sequência de aminoácidos específica. As delimitações da sequência codificante são geralmente determinadas por um quadro de leitura aberto, o qual começa com um códon de início, como ATG, GTG, ou TTG e termina com um códon de parada, como TAA, TAG, ou TGA. A sequência codificante pode ser um DNA genô- mico, cDNA, DNA sintético ou uma combinação dos mesmos.
[371] "Sequências reguladoras" se referem a sequências de nucle- otídeo localizadas a montante (sequências não codificantes 5'), em ou a jusante (sequências não codificantes 3’) de uma sequência codifi- cante, e que influencia a transcrição, processamento de RNA ou estabi- lidade, ou tradução da sequência codificante associada. As sequências reguladoras incluem, mas sem limitação, promotores, sequências-líde- res de tradução, sequências não traduzidas 5’, sequências não traduzi- das 3’, íntrons, sequências-alvo de poliadenilação, sítios de processa- mento de RNA, sítios de ligação efetores, e estruturas de haste e alça.
[372] Um “gene modificado por códon" ou "gene preferencial de códon" ou "gene otimizado por códon" é um gene que tem sua frequên- cia de uso de códon designada para imitar a frequênciad e uso de códon preferencial da célula hospedeira. As mudanças de ácido nucleico chan- ges feitas para otimizar por códon um gene são "sinônimas", o que sig- nifica que não alteram a sequência de aminoácidos do polipeptídeo co- dificado do gene parental. Entretanto, tanto genes nativos quanto vari- antes podem ser otimizados por códon para uma célula hospedeira par- ticular, e como tal, nenhuma limitação nesse aspecto é pretendida. Os métodos estão disponíveis na técnica para sintetizar genes preferenci- ais de códon. Consultar, por exemplo, Patentes nº U.S. 5.380.831, e
5.436.391, e Murray et al. (1989) Nucleic Acids Res. 17:477 a 498, in- corporadas ao presente documento a título de referência.
[373] As modificações de sequência adicionais são conhecidas por intensificar a expressão de gene em um organismo hospedeiro. Estes incluem, por exemplo, a eliminação de: uma ou mais sequências que codifica sinais de poliadenilação de espúrio, um ou mais sinais de sítio de junção de éxon-íntron, uma ou mais repetições semelhantes a trans- poson, e outras tais sequências bem caracterizadas que podem ser pre- judiciais à expressão de gene. O teor de G-C da sequência pode ser ajustado a níveis médios para um dado organismo hospedeiro (como uma planta), conforme calculado por referência a genes conhecidos ex- pressados na célula hospedeira. Quando possível, a sequência é modi- ficada para evitar uma ou mais estruturas de mRNA secundário em for- mato de grampo previstas.
[374] O termo “domínio conservado" ou "motivo" significa um con- junto de aminoácidos conservado em posições específicas ao longo de uma sequência alinhada de proteínas relacionadas de modo evolucio- nário. Embora os aminoácidos em outras posições possam variar entre proteínas homólogas, os aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que são essenciais à es- trutura, a estabilidade ou à atividade de uma proteína. Devido ao fato de que são identificados por seu alto grau de conservação em sequências alinhadas de uma família de homólogos de proteína, os mesmos podem ser usados como identificadores, ou "assinaturas", para determinar se uma proteína com uma sequência recém-determinada pertence a uma família de proteína anteriormente identificada.
[375] Conforme usado no presente documento, "ácido nucleico" significa um polinucleotídeo e inclui um polímero de fita simples ou dupla de desoxirribonucleotídeo ou bases de ribonucleotídeo. Os ácidos nu- cleicos também podem incluir fragmentos e nucleotídeos modificados. Desse modo, os termos "polinucleotídeo", "sequência de ácido nu- cleico", "sequência de nucleotídeos" e "fragmento de ácido nucleico" são usados de modo intercambiável para denotar um polímero de RNA e/ou DNA e/ou RNA-DNA que é de fita simples ou dupla, que contém opcionalmente bases de nucleotídeo sintéticas, não naturais ou altera- das. Os nucleotídeos (usualmente encontrados em sua forma 5'-mono- fosfato) são denominados por sua designação de letra única conforme o seguinte: “A" para adenosina ou desoxiadenosina (para RNA ou DNA, respectivamente), "C" para citosina ou desoxicitosina, "G" para guano- sina ou desoxiguanosina, "U" para uridina, "T" para desoxitimidina, "R" para purinas (A ou G), "Y" para pirimidinas (C ou T), "K" para G ou T, "H" para A ou C ou T, "I" para inosina, e "N" para qualquer nucleotídeo (nucleotídeo (por exemplo, N pode ser A, C, T, ou G, se referente a uma sequência de DNA; N pode ser A, C, U, ou G, se referente a uma se- quência de RNA).
[376] O termo "aumentado" conforme usado no presente docu- mento pode se referir a uma quantidade ou atividade que é pelo menos 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 100%, ou pelo menos cerca de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390,400, 410, 420,430, 440, 440, 450, 460, 470, 480, 490, ou 500 vezes mais do que a quantidade ou atividade com a qual a quantidade ou atividade aumentada está sendo comparada. Os termos "aumentado", "maior do que", e "melhorado" são usados de modo intercambiável no presente documento. O termo "aumentado" pode ser usado para caracterizar a transformação ou eficiência de edi- ção de gene de uma proteína, como a variante de endonuclease Cas9 descrita no presente documento.
[377] Em um aspecto, o aumento é um aumento em eficiência de transformação de uma célula procariótica ou eucariótica quando uma variante Cas9 descrita no presente documento, como, mas sem limita- ção, uma variante Cas9 Y155 ou uma variante Cas9 F86A+F98A, é usada como parte de um PGEN quando comparado com o mesmo PGEN, mas que compreende seu Cas9 parente (tipo selvagem) em vez disso, em que o aumento em eficiência de transformação é pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350,
360, 370, 380, 390,400, 410, 420,430, 440, 440, 450, 460, 470, 480, 490, ou 500 vezes
[378] Em um aspecto, o aumento é um aumento em eficiência de edição de DNA de uma célula procariótica ou eucariótica quando uma variante Cas9 descrita no presente documento, como, mas sem limita- ção, uma variante Cas9 Y155 ou uma variante Cas9 F86A+F98A, é usada como parte de um PGEN quando comparado com o mesmo PGEN, mas que compreende seu Cas9 parente (tipo selvagem) em vez disso, em que o aumento em eficiência de edição de DNA é pelo menos 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%.
[379] "Quadro de leitura aberto" é abreviado como ORF.
[380] "Gene" inclui um fragmento de ácido nucleico que expressa uma molécula funcional como, mas sem limitação, uma proteína espe- cífica, incluindo sequências reguladoras anteriores (sequências não co- dificantes 5') e após (sequências não codificantes 3’) a sequência codi- ficante. “Gene nativo” se refere a um gene, conforme encontrado na na- tureza com suas próprias sequências reguladoras.
[381] Um "gene que sofreu mutação" é um gene que foi alterado através de intervenção humana. Tal "gene que sofreu mutação" tem uma sequência que difere da sequência do gene que não sofreu muta- ção correspondente por pelo menos uma adição de nucleotídeo, dele- ção ou substituição. Em certas modalidades da descrição, o gene que sofreu mutação compreende uma alteração que resulta de um sistema de polinucleotídeo-guia/proteína Cas conforme revelado no presente documento. Uma célula ou organismo que sofreu mutação é uma célula ou organismo que compreende um gene que sofreu mutação.
[382] O termo "genoma" conforme se aplica a uma célula a proca- riótica e eucariótica ou células de organismo abrange não apenas o DNA cromossômico encontrado no núcleo, como também o DNA de or- ganela encontrado em componentes subcelulares (por exemplo, mito- côndria ou plastídeo) da célula.
[383] Polinucleotídeos de interesse são adicionalmente descritos no presente documento e incluem polinucleotídeos reflexivos dos mer- cados e interesse comerciais daqueles envolvidos na produção de en- zimas (como, mas sem limitação, através da fermentação de bactérias ou fungos assim produzindo as enzimas ou por plantas que produzem as enzimas) e desenvolvimento das safras.
[384] As culturas e mercados de interesse mudam e, conforme na- ções em desenvolvimento abrem mercados mundiais, as culturas e tec- nologias novas também emergem. Além disso, à medida que o entendi- mento de traços agronômicos e características, como rendimento e he- terose, aumentam, a escolha de genes para manipulação genética mu- dará consequentemente. Os polinucleotídeos de interesse incluem, mas sem limitação, polinucleotídeos que codificam traços importantes para agronomia, resistência a herbicidas, resistência a inseticidas, resistên- cia às doenças, resistência a nemátodos, resistência a herbicidas, re- sistência microbiana, resistência fúngica, resistência viral, fertilidade ou esterilidade, características de grão, e produtos comerciais.
[385] As categorias gerais de polinucleotídeos de interesse in- cluem, por exemplo, genes de interesse envolvidos em informações, como dedos de zinco, aquelas envolvidas em comunicação, como qui- nases, e aquelas envolvidas em administração doméstica, como prote- ínas de choque térmico. Os polinucleotídeos mais específicos de inte- resse incluem, mas sem limitação, genes envolvidos em rendimento de safra, qualidade de grão, teor de nutrientes de safra, qualidade e quan- tidade de amido e carboidrato assim como aqueles que afetam tamanho de núcleo, carregamento de sacarose, qualidade e quantidade de pro- teína, fixação e/ou utilização de nitrogênio, composição de ácido graxo e óleo, genes que codificam proteínas que conferem resistência ao es- tresse abiótico (como seca, nitrogênio, temperatura, salinidade, metais tóxicos ou elementos-traço, ou aqueles que conferem resistência a toxi- nas, como pesticidas e herbicidas), genes que codificam proteínas que conferem resistência a estresse biótico (como ataques por fungos, vírus, bactérias, insetos e nemátodos, e desenvolvimento de doenças associ- adas a esses organismos).
[386] Adicionalmente, é reconhecido que o polinucleotídeo de in- teresse também pode compreender sequências antissenso complemen- tares a pelo menos uma porção do RNA mensageiro (mRNA) para uma sequência de gene alvejada de interesse. Os nucleotídeos antissenso são construídos para hibridizar com o mRNA correspondente. As modi- ficações das sequências antissenso podem ser produzidas enquanto as sequências hibridizarem e interferirem na expressão do mRNA corres- pondente. Dessa maneira, as construções antissenso que têm 70%, 80%, ou 85% de identidade de sequência com as sequências antis- senso correspondentes podem ser usadas. Adicionalmente, porções dos nucleotídeos antissenso podem ser usadas para perturbar a expres- são do gene-alvo. Em geral, as sequências de pelo menos 50 nucleotí- deos, 100 nucleotídeos, 200 nucleotídeos ou maiores podem ser usa- das.
[387] Além disso, o polinucleotídeo de interesse também pode ser usado na orientação senso para suprimir a expressão de genes endó- genos em organismos. Os métodos para suprimir a expressão de gene em organismos com o uso de polinucleotídeos na orientação senso são conhecidos na técnica. Os métodos envolvem geralmente transformar um organismo com um construto de DNA que compreende um promotor que aciona a expressão em um organismo ligado de modo operacional a pelo menos uma porção de uma sequência de nucleotídeos que cor- responde à transcrição do gene endógeno. Tipicamente, tal sequência de nucleotídeos tem identidade de sequência substancial com a se- quência da transcrição do gene endógeno, geralmente maior do que cerca de 65% de identidade de sequência, cerca de 85% identidade de sequência, ou maior do que cerca de 95% identidade de sequência. Consultar, as Patentes nº U.S. 5.283.184 e 5.034.323; incorporadas ao presente documento a título de referência.
[388] O polinucleotídeo de interesse também pode ser um marca- dor fenotípico. Um marcador fenotípico é triável ou um marcador seleci- onável que inclui marcadores visuais e marcadores selecionáveis, seja um marcador selecionável positivo ou negativo. Qualquer marcador fe- notípico pode ser usado. Especificamente, um marcador selecionável ou triável compreende um segmento de DNA que permite que um indi- víduo identifique, ou selecione para ou contra uma molécula ou uma célula que contém o mesmo, frequentemente sob condições particula- res. Esses marcadores podem codificar uma atividade, como, mas sem limitação, produção de RNA, peptídeo, ou proteína, ou pode fornecer um sítio de ligação para RNA, peptídeos, proteínas, compostos inorgâ- nicos e orgânicos ou composições e semelhantes.
[389] Os exemplos de marcadores selecionáveis incluem, mas sem limitação, segmentos de DNA que compreendem sítios de enzima de restrição; segmentos de DNA que codificam produtos que fornecem resistência contra compostos tóxicos de outro modo, incluindo antibióti- cos, como espectinomicina, ampicilina, canamicina, tetraciclina, Basta, neomicina fosfotransferase II (NEO) e higromicina fosfotransferase (HPT)); segmentos de DNA que codificam produtos que estão de outro modo ausentes na célula receptora (por exemplo, genes de tRNA, mar- cadores auxotróficos); segmentos de DNA que codificam produtos que podem ser prontamente identificados (por exemplo, marcadores fenotí- picos, como β-galactosidase, GUS; proteínas fluorescentes, como pro- teína fluorescente verde (GFP), ciano (CFP), amarelo (YFP), vermelho (RFP), e proteínas de superfície de célula); a geração de novos sítios de iniciador para PCR (por exemplo, a justaposição de duas sequências de DNA não anteriormente justapostas), a inclusão de sequências de DNA não atuadas mediante ou atuadas mediante uma endonuclease de restrição ou outra enzima modificadora de DNA, química, etc.; e, a in- clusão de uma sequências de DNA necessária para uma modificação específica (por exemplo, metilação) que permite sua identificação.
[390] Os marcadores selecionáveis adicionais incluem genes que conferem resistência a compostos herbicidas, como sulfonilureias, glu- fosinato amônio, bromoxinila, imidazolinonas, e 2,4-diclorofenoxiacetato (2,4-D). Consultar, por exemplo, acetolactase sintase (ALS) para resis- tência a sulfonilureias, imidazolinonas, triazolopirimidina sulfonamidas, pirimidinilsalicilatos e sulfonilaminocarbonil-triazolinonas Shaner e Singh, 1997, Herbicide Activity: Toxicol Biochem Mol Biol 69 a 110); 5- enolpiruvilshiquimato-3-phosphate resistente a glifosato (EPSPS) (Sa- roha et al. 1998, J. Plant Biochemistry & Biotechnology Vol 7:65 a 72);
[391] Os polinucleotídeos de interesse incluem genes que podem ser empilhados ou usados em combinação com outros traços, como, mas sem limitação, resistência a herbicidas ou qualquer outro traço des- crito no presente documento. Os polinucleotídeos de interesse e/ou tra- ços podem ser empilhados em conjunto em uma localização de traço complexo, conforme descrito no documento US-2013-0263324-A1, pu- blicado em 3 de outubro de 2013 e no documento PCT/US13/22891, publicado em 24 de janeiro de 2013, ambos os pedidos são incorpora- dos ao presente documento a título de referência.
[392] Uma variedade de métodos está disponível para identificar aquelas células com inserção no genoma em ou próximo do sítio-alvo.
Tais métodos podem ser vistos como análise direta de uma sequência- alvo para detectar qualquer mudança na sequência-alvo, incluindo, mas sem limitação, métodos de PCR, métodos de sequenciamento, digestão com nuclease, Southern blots e qualquer combinação dos mesmos. Consulte, por exemplo, o Pedido de Patente no U.S. 12/147.834, aqui incorporado a título de referência até onde necessário para os métodos descritos no presente documento. O método também compreende re- cuperar um organismo a partir da célula que compreende um polinucle- otídeo de interesse integrado em seu genoma.
[393] Um polipeptídeo de interesse inclui qualquer proteína ou po- lipeptídeo que é codificado por um polinucleotídeo de interesse descrito no presente documento.
[394] As sequências de polinucleotídeos e polipeptídeos, variantes das mesmas e as relações estruturais dessas sequências podem ser descritas pelos termos “homologia”, “homólogo”, “substancialmente idêntico”, “substancialmente similar” e “substancialmente correspon- dente” que são usados de modo intercambiável no presente documento. Estes se referem a sequências de polipeptídeo ou ácido nucleico em que as mudanças em um ou mais aminoácidos ou bases de nucleotídeo não afetam a função da molécula, como a capacidade para mediar a expressão de gene ou produzir um certo fenótipo. Esses termos também se referem a modificação (ou modificações) de sequências de ácido nu- cleico que não alteram substancialmente as propriedades funcionais do ácido nucleico resultante em relação ao ácido nucleico não modificado inicial. Essas modificações incluem a deleção, substituição e/ou inser- ção de um ou mais nucleotídeos no fragmento de ácido nucleico.
[395] As sequências de ácido nucleico substancialmente similares abrangidas podem ser definidas por sua capacidade para se hibridiza- rem (sob condições moderadamente estringentes, por exemplo, SSC
0,5X, SDS a 0,1%, 60 °C) com as sequências exemplificadas no pre- sente documento, ou qualquer porção das sequências nucleotídicas re- veladas no presente documento e que são funcionalmente equivalentes a quaisquer sequências de ácido nucleico reveladas no presente docu- mento. As condições de estringência podem ser ajustadas para o ras- treamento de fragmentos moderadamente similares, tais como sequên- cias homólogas de organismos distantemente relacionadas, fragmentos altamente similares, tais como genes que duplicam enzimas funcionais de organismos estreitamente relacionados. As lavagens pós-hibridiza- ção determinam as condições de estringência.
[396] O termo ‘hibridiza seletivamente” inclui referência à hibridiza- ção, sob condições estringentes de hibridização, de uma sequência de ácido nucleico com uma sequência-alvo de ácido nucleico especificada até grau detectável maior (por exemplo, pelo menos 2 vezes em relação ao fundo) do que sua hibridização com sequências de ácido nucleico não alvo e à exclusão substancial de ácidos nucleicos não alvo. As se- quências de hibridização seletiva têm, tipicamente, cerca de pelo menos 80% de identidade de sequência ou 90% de identidade de sequência, até e incluindo 100% de identidade de sequência (isto é, totalmente complementar) entre si.
[397] O termo “condições estringentes” ou “condições de hibridiza- ção estringentes” inclui a referência a condições sob as quais uma sonda se hibridizará seletivamente com sua sequência-alvo em um en- saio de hibridização in vitro. As condições estringentes dependem das sequências e serão diferentes em circunstâncias diferentes. Contro- lando-se a estringência das condições de hibridização e/ou lavagem, podem ser identificadas as sequências alvo que são 100% complemen- tares à sonda (sondagem homóloga). Alternativamente, as condições de estringência podem ser ajustadas para permitir alguma não corres-
pondência entre as sequências de modo que graus menores de simila- ridade sejam detectados (sondagem heteróloga). Em geral, uma sonda tem menos que cerca de 1.000 nucleotídeos de comprimento, opcional- mente, menos que 500 nucleotídeos de comprimento.
[398] Tipicamente, as condições estringentes serão aquelas nas quais a concentração de sal é inferior a cerca de 1,5 M de íon de Na, tipicamente, cerca de 0,01 a 1,0 M de concentração de íon de Na (ou outro sal (ou sais)) em pH 7,0 a 8,3, e pelo menos cerca de 30°C para sondas curtas (por exemplo, 10 a 50 nucleotídeos) e pelo menos cerca de 60°C para sondas longas (por exemplo, maiores que 50 nucleotí- deos). As condições estringentes também podem ser alcançadas com a adição de agentes desestabilizantes, como formamida. Condições de baixa estringência exemplificativas incluem hibridação com uma solu- ção tampão de 30 a 35% de formamida, NaCl 1 M, SDS a 1% (dodecil sulfato de sódio) a 37°C e uma lavagem em SSC 1X a 2X (SSC 20X = NaCl 3,0 M/Citrato trissódico 0,3 M) a 50 a 55°C. As condições de es- tringência moderada exemplificativas incluem hibridização em 40 a 45% de formamida, NaCl 1 M, SDS a 1% a 37°C e uma lavagem em SSC 0,5X a 1X a 55 a 60°C. As condições de alta estringência exemplificati- vas incluem hibridização em 50% de formamida, NaCl 1 M, SDS a 1% a 37°C e uma lavagem em SSC 0,1X a 60 a 65°C.
[399] Conforme usado no presente documento, o termo "promotor" se refere a uma sequência de DNA com capacidade para controlar a expressão de uma sequência codificante ou RNA funcional. A sequên- cia promotora consiste em elementos a montante proximais e mais dis- tais, os últimos elementos sendo frequentemente chamados de intensi- ficadores. Um "acentuador" é uma sequência de DNA que pode estimu- lar a atividade de promotor e pode ser um elemento inato do promotor ou um elemento heterólogo inserido para acentuar o nível ou a especi-
ficidade para tecido de um promotor. Os promotores podem ser deriva- dos em sua totalidade a partir de um gene nativo, ou ser composto de elementos diferentes derivados de promotores diferentes constatados na natureza, e/ou compreender segmentos de DNA sintéticos. É enten- dido por aqueles versados na técnica que diferentes promotores podem direcionar a expressão de um gene em diferentes tecidos ou tipos de célula, ou em diferentes estágios de desenvolvimento, ou em resposta a diferentes condições ambientais. É adicionalmente reconhecido que, já que, na maioria dos casos, os limites exatos das sequências regula- doras não foram completamente definidos, os fragmentos de DNA com alguma variação podem ter atividade de promotor idêntica. Conforme é bem conhecido na técnica, os promotores podem ser categorizados de acordo com sua força e/ou as condições sob as quais os mesmos são ativos, por exemplo, promotores constitutivos, promotores fortes, pro- motores fracos, promotores induzíveis/reprimíveis, promotores específi- cos para tecido/regulados de modo desenvolvido, promotores depen- dentes de ciclo celular, etc.
[400] Exemplos de promotores fortes úteis no presente documento incluem aqueles revelados nas Publicações de Pedido de Patente nº U.S. 2012/0252079 (DGAT2), 2012/0252093 (EL1), 2013/0089910 (ALK2), 2013/0089911 (SPS19), 2006/0019297 (GPD e GPM), 2011/0059496 (GPD e GPM), 2005/0130280 (FBA, FBAIN, FBAINm), 2006/0057690 (GPAT) e 2010/0068789 (YAT1), os quais são incorpo- rados ao presente documento, a título de referência. Outros exemplos de promotores fortes adequados incluem aqueles listados na Tabela 2 do documento nº WO2016/025131, publicado em 19 de fevereiro de 2016, incorporado ao presente documento, a título de referência.
[401] "Identidade de sequência" ou "identidade" no contexto de se- quências de ácidos nucleicos ou polipeptídeos se refere às bases de ácido nucleico ou resíduos de aminoácido em duas sequências que são iguais quando alinhadas para correspondência máxima ao longo de uma janela de comparação especificada.
[402] O termo "porcentagem de identidade de sequência" se refere ao valor determinado comparando-se duas sequências idealmente ali- nhadas ao longo de uma janela de comparação, em que a porção da sequência de polinucleotídeos ou polipeptídeos na janela de compara- ção pode compreender adições ou deleções (isto é, lacunas) em com- paração à sequência de referência (que não compreende adições ou deleções) para alinhamento ideal das duas sequências. A porcentagem é calculada determinando-se o número de posições em que a base de ácido nucleico ou resíduo de aminoácido idêntico ocorre em ambas as sequências para gerar o número de posições correspondentes, divi- dindo o número de posições correspondentes pelo número total de po- sições na janela de comparação e multiplicando os resultados por 100 para gerar a porcentagem de identidade de sequência. Os exemplos úteis de identidades de sequência percentuais incluem, mas sem limita- ção, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou qual- quer porcentagem de número inteiro de 50% a 100%. Essas identidades podem ser determinadas com o uso de qualquer um dos programas descritos no presente documento.
[403] Os alinhamentos de sequência e cálculos de porcentagem de identidade ou similaridade podem ser determinados com o uso de uma variedade de métodos de comparação projetados para detectar se- quências homólogas incluindo, mas sem limitação, o programa MegA- lign do pacote de computação de bioinformática LASERGENE (DNAS- TAR Inc., Madison, WI). Dentro do contexto deste pedido, será enten- dido que, quando o software para análise de sequências é usado para a análise, os resultados da análise terão como base os "valores padrão" do programa referido, a não ser que especificado de outro modo. Con- forme usado no presente documento, "valores-padrão" significarão qualquer conjunto de valores ou parâmetros que carrega originalmente com o software quando inicializado primeiro.
[404] O "método de alinhamento Clustal V" corresponde ao mé- todo de alinhamento identificado como Clustal V (descrito por Higgins e Sharp, (1989) CABIOS 5:151 a 153; Higgins et al., (1992) Comput Appl Biosci 8:189 a 191) e encontrado no programa MegAlign  do pacote de computação de bioinformática LASERGENE (DNASTAR Inc., Madison, WI, EUA). Para múltiplos alinhamentos, os valores padrão correspon- dem a PENALIDADE PARA LACUNAS=10 e PENALIDADE PARA COMPRIMENTO DE LACUNA=10 Os parâmetros padrão para alinha- mentos em pares e cálculo da porcentagem de identidade de sequên- cias proteicas com o uso do método Clustal são K-TUPLA=1, PENALI- DADE PARA LACUNAS=3, JANELA=5 e DIAGONAIS SALVAS=5. Para ácidos nucleicos, esses parâmetros são K-TUPLA=2, PENALIDADE POR LACUNA=5, JANELA=4 e DIAGONAIS SALVAS=4. Após o alinha- mento das sequências com o uso do programa Clustal V, é possível obter uma "identidade percentual" visualizando-se a tabela de "distân- cias de sequência" no mesmo programa.
[405] O "método de alinhamento Clustal W" corresponde ao mé- todo de alinhamento identificado como Clustal W (descrito por Higgins e Sharp, (1989) CABIOS 5:151 a 153; Higgins et al., (1992) Comput Appl Biosci 8:189 a 191) e encontrado no programa MegAlign  v6.1 do pa- cote de computação de bioinformática LASERGENE (DNASTAR Inc., Madison, WI). Os parâmetros padrão para alinhamento múltiplo (PENA- LIDADE DE LACUNA=10, PENALIDADE DE COMPRIMENTO DE LA- CUNA=0.2, Sequências Divergentes de Intervalo (%)=30, Peso de Tran- sição de DNA=0,5, Matriz de Peso de Proteína=Gonnet Series, Matriz de Peso de DNA=IUB). Após o alinhamento das sequências com o uso do programa Clustal W, é possível obter uma "identidade percentual"
visualizando-se a tabela de "distâncias de sequência" no mesmo pro- grama.
[406] A não ser que seja determinado de outro modo, os valores de identidade/similaridade de sequência fornecidos no presente docu- mento se referem ao valor obtido com o uso de GAP Versão 10 (GCG, Accelrys, San Diego, CA) com o uso dos seguintes parâmetros: % de identidade e % de similaridade para uma sequência de nucleotídeos com o uso de um peso de penalidade de criação de lacuna de 50 e um peso de penalidade de extensão de comprimento de lacuna de 3, e a matriz de pontuação nwsgapdna.cmp; % de identidade e % de similari- dade para uma sequência de aminoácidos com o uso de um peso de penalidade de criação de lacuna de 8 e uma penalidade de extensão de comprimento de lacuna de 2, e a matriz de pontuação BLOSUM62 (He- nikoff e Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89:10.915). GAP usa o algoritmo de Needleman e Wunsch, (1970) J Mol Biol 48:443 a 453 para encontrar um alinhamento de duas sequências completas que ma- ximize o número de correspondências e minimize o número de lacunas. GAP considera todos os alinhamentos e posições de lacuna possíveis e cria o alinhamento com o maior número de bases correspondentes e menos lacunas, com o uso de uma penalidade para criação de lacunas e uma penalidade para extensão de lacunas em unidades de bases cor- respondentes.
[407] "BLAST" é um algoritmo de pesquisa fornecido pelo National Center for Biotechnology Information (NCBI) usado para encontrar regi- ões de similaridade entre sequências biológicas. O programa compara sequências proteicas ou nucleotídicas com bancos de dados de sequên- cias e calcula a significância estatística de correspondências para iden- tificar sequências que têm similaridade suficiente a uma sequência de consulta, de modo que a similaridade não seria prevista por ter ocorrido de maneira aleatória. BLAST relata as sequências identificadas e seu alinhamento local à sequência de consulta.
[408] É bem entendido por um indivíduo versado na técnica que muitos níveis de identidade de sequência são úteis na identificação de polipeptídeos de outras espécies ou natural ou sinteticamente modifica- dos em que tais polipeptídeos têm função ou atividade igual ou similar. Exemplos úteis de porcentagens de identidade incluem, mas não são limitados a, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% ou qualquer porcentagem de número inteiro de 50% a 100%. Certa- mente, qualquer identidade de aminoácido de número inteiro de 50% a 100% pode ser útil na descrição da presente descrição, como 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%.
[409] "Sequência-líder de translação" se refere a uma sequência de polinucleotídeos situada entre a sequência promotora de um gene e a sequência de codificação. A sequência líder de tradução está presente no RNAm a montante da sequência de iniciação de tradução. A sequên- cia líder de tradução pode afetar o processamento do transcrito primário em RNAm, a estabilidade do RNAm ou a eficiência de tradução. Exem- plos de sequências líder de tradução foram descritos (por exemplo, Tur- ner e Foster, (1995) Mol Biotechnol 3:225 a 236).
[410] "Sequências de não codificação 3'", "terminador de transcri- ção" ou "sequências de terminação" se referem a sequências de DNA situadas a jusante de uma sequência de codificação e incluem sequên- cias de reconhecimento de poliadenilação e outras sequências que co- dificam sinais reguladores com capacidade para afetar o processa- mento de mRNA ou expressão de genes. O sinal de poliadenilação é normalmente caracterizado por afetar a adição de traços de ácido poli- adenílico à extremidade 3' do precursor de mRNA. O uso de sequências de não codificação 3' diferentes é exemplificado por Ingelbrecht et al., (1989) Plant Cell 1:671 a 680.
[411] Conforme usado no presente documento, "transcrição de RNA" se refere ao produto resultante da transcrição catalisada por RNA polimerizada de uma sequência de DNA. Quando o transcrito de RNA for uma cópia complementar perfeita da sequência de DNA, é chamado de transcrito primário ou pré-RNAm. Uma transcrição de RNA é deno- minada como o RNA maduro ou mRNA quando é uma sequência de RNA derivada de processamento pós-transcrição da transcrição primá- ria pré-mRNA. "RNA mensageiro" ou "mRNA" se refere ao RNA que está sem íntrons e que pode ser traduzido na proteína pela célula. "cDNA" se refere a um DNA que é complementar a, e sintetizado a partir de, um modelo de mRNA com o uso da enzima transcriptase reversa. O cDNA pode ser de fita simples ou convertido na forma de fita dupla com o uso do fragmento Klenow de DNA polimerase I. RNA "senso" se refere à transcrição de RNA que inclui o mRNA e pode ser traduzida em pro- teína dentro de uma célula ou in vitro. “RNA antissenso" se refere a uma transcrição de RNA que é complementar a toda ou parte de uma trans- crição primária alvo ou mRNA, e que bloqueia a expressão de um gene- alvo (consulte, por exemplo, patente nº US 5.107.065). A complementa- ridade de um RNA antissenso pode ser com qualquer parte do transcrito de gene específico, isto é, na sequência de não codificação 5', sequên- cia de não codificação 3', íntrons ou a sequência de codificação. "RNA funcional" se refere a RNA antissenso, RNA de ribozima ou outro RNA que pode não ser traduzido, mas ainda tem um efeito em processos celulares. Os termos "complemento" e "complemento reverso" são usa- dos de forma intercambiável no presente documento em relação a trans- critos de mRNA e se destinam a definir o RNA antissenso da mensa- gem.
[412] Proteína "madura" se refere a um polipeptídeo pós-traducio- nalmente processado (isto é, um a partir do qual quaisquer pré- ou pró- peptídeos presentes no produto de translação primário foram removi- dos). Proteína "precursora" se refere ao produto primário da translação de mRNA (isto é, com pré- ou pró-peptídeos ainda presentes). Os pré- ou pró-peptídeos podem ser, porém, sem limitação, sinais de localiza- ção intracelulares.
[413] Conforme usado no presente documento, uma "mutação al- vejada" é uma mutação em um gene (denominado como o gene-alvo), incluindo um gene nativo, que foi feito alterando-se uma sequência-alvo no gene-alvo com o uso de qualquer método conhecido por um indivíduo versado na técnica, incluindo um método que envolve um sistema de proteína de Cas guiado. Quando a proteína de Cas é uma endonuclease Cas, uma mutação alvejada induzida por polinucleotídeo-guia/endonu- clease Cas pode ocorrer em uma sequência de nucleotídeos que está localizada dentro ou fora de um sítio-alvo genômico que é reconhecido e clivado pela endonuclease Cas.
[414] As proteínas podem ser alteradas de várias maneiras que incluem substituições, deleções, truncamentos e inserções de aminoá- cido. Os métodos para tais manipulações são geralmente conhecidos. Por exemplo, as variantes de sequências de aminoácidos da(s) prote- ína(s) podem ser preparadas por mutações no DNA. Os métodos para mutagênese e alterações de sequência nucleotídica incluem, por exem- plo, Kunkel, (1985) Proc. Natl. Acad. Sci. E.U.A 82:488 a 492; Kunkel et al., (1987) Meth Enzymol 154:367 a 382; patente dos E.U.A. N.º
4.873.192; Walker e Gaastra, editores (1983) Techniques in Molecular Biology (MacMillan Publishing Company, Nova Iorque) e as referências citadas nos mesmos. Orientação a respeito de substituições de amino- ácido que provavelmente não afetam a atividade biológica da proteína é encontrada, por exemplo, no modelo de Dayhoff, et al., (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Wa- shington, D.C.). As substituições conservantes, como trocando um ami- noácido por outro que tem propriedades similares, podem ser preferen- ciais. Não é esperado que as deleções, inserções e substituições con- servativas de aminoácidos produzam alterações radicais nas caracte- rísticas da proteína, e o efeito de qualquer substituição, deleção, inser- ção ou combinação das mesmas pode ser avaliado por ensaios de ras- treamento habituais. Os ensaios para atividade de indução de quebra de fita dupla são conhecidos e geralmente medem a atividade e especi- ficidade total do agente em substratos de DNA que contêm sítios alvo.
[415] Os métodos padrão de isolamento e purificação de DNA, clo- nagem molecular, construção de vetor e verificação/caracterização são bem estabelecidos, consulte, por exemplo, Sambrook et al., (1989) Mo- lecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY). Vetores e construções incluem plasmídeos circulares e po- linucleotídeos lineares que compreendem um polinucleotídeo de inte- resse e, opcionalmente, outros componentes que incluem ligantes, adaptadores, reguladores ou análise. Em alguns exemplos, um sítio de reconhecimento e/ou sítio alvo pode estar contido dentro de um íntron, sequência codificante, UTRs 5’, UTRs 3’ e/ou regiões reguladoras.
[416] O significado das abreviações ocorre conforme o seguinte: "s" significa segundo (ou segundos), "min." significa minuto (ou minu- tos), "h" significa hora (ou horas), "d" significa dia (ou dias), "µl" significa microlitro (ou microlitros), "ml" significa mililitro (ou mililitros), "l" significa litro (litros), "µM" significa micromolar, "mM" significa milimolar, "M" sig- nifica molar, "mmol" significa milimol (milimoles), "µmol" significa micro- mol (micromoles), "g" significa grama (ou gramas), "µg" significa micro- grama (ou microgramas), "ng" significa nanograma (ou nanogramas), "U" significa unidade (unidades), "bp" significa par de bases (ou pares de bases) e "kb" significa quilobase (ou quilobases).
[417] Os exemplos não limitadores de composições e métodos re- velados no presente documento são conforme segue:
[418] Uma variante de endonuclease Cas9, ou um fragmento ativo da mesma, que tem pelo menos 80% de identidade de aminoácido com um polipeptídeo de Cas9 parente apresentado na SEQ ID NO: 1 e que tem pelo menos uma substituição de aminoácido em uma posição sele- cionada a partir do grupo que consiste em posição 86, posição 98, po- sição 155 e uma combinação das mesmas, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequên- cia de aminoácidos do dito polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem atividade de endonuclease.
[419] A variante de endonuclease Cas9 da modalidade 1, em que pelo menos uma substituição de aminoácido é selecionada a partir do grupo que consiste em Y155H, Y155N, Y155E, Y155F (na posição 155), F86A (na posição 86) e F98A (na posição 98).
[420] A variante de endonuclease Cas9 da modalidade 1, em que a variante de endonuclease Cas9 tem pelo menos uma propriedade me- lhorada selecionada a partir do grupo que consiste em eficiência de transformação melhorada e eficiência de edição melhorada, quando comparada com a dita endonuclease Cas9 parente.
[421] A variante de endonuclease Cas9, ou fragmento ativo da mesma, de quaisquer modalidades anteriores, em que a dita variante compreende uma sequência de aminoácidos que tem 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%,89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identi- dade de sequência de aminoácidos com a sequência de aminoácidos da SEQ ID NO: 1.
[422] A variante de endonuclease Cas9 da modalidade 3, em que a propriedade melhorada é eficiência de transformação melhorada e em que a dita variante, ou fragmento ativo da mesma, também tem uma eficiência de edição melhorada.
[423] A variante de endonuclease Cas9, ou fragmento ativo da mesma, de quaisquer modalidades anteriores, que compreende pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9,10 substituições de aminoácido quando comparada com a endonuclease Cas9 parente.
[424] Uma composição que compreende a endonuclease Cas9, ou um fragmento funcional da mesma, de qualquer uma das modalidades anteriores.
[425] A composição da modalidade 7, em que a dita composição é selecionada a partir do grupo que consiste em um complexo de poli- nucleotídeo-guia/endonuclease Cas9, um complexo de RNA-guia/endo- nuclease Cas9 e uma proteína de fusão que compreende a dita variante de endonuclease Cas9.
[426] Um polinucleotídeo que compreende uma sequência de ácido nucleico que codifica a variante de endonuclease Cas9 de qual- quer uma das modalidades anteriores.
[427] Um complexo de polinucleotídeo-guia/endonuclease Cas (PGEN) que compreende pelo menos um polinucleotídeo-guia e pelo menos uma variante de endonuclease Cas9 de qualquer uma das mo- dalidades 1 a 6, sendo que o dito polinucleotídeo-guia é um polinucleo- tídeo-guia de ocorrência não natural quimérico, sendo que o dito com- plexo de polinucleotídeo-guia/endonuclease Cas tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequência-alvo.
[428] Um construto de DNA recombinante que compreende o poli- nucleotídeo da modalidade 9.
[429] Uma célula hospedeira que compreende a endonuclease Cas9, ou fragmento funcional da mesma, de qualquer uma das modali- dades 1 a 6.
[430] Uma célula hospedeira que compreende o polinucleotídeo da modalidade 9.
[431] A célula hospedeira da modalidade 13, em que a célula é uma célula procariótica ou célula eucariótica.
[432] A célula hospedeira da modalidade 14, em que a célula é selecionada a partir do grupo que consiste em uma célula humana, não humana, animal, bacteriana, fúngica, de inseto, levedura, levedura não convencional e vegetal.
[433] 15b. Um kit que compreende o PGEN da modalidade 7.
[434] 15c. Uma partícula de entrega que compreende a variante de endonuclease Cas9 de acordo com as modalidades 1, 2, 3, 4, 5, ou
6.
[435] 15d. A partícula de entrega da modalidade 15c, em que a proteína de variante de endonuclease Cas9 é complexada com um po- linucleotídeo-guia.
[436] 16. Um método para modificar um sítio-alvo no genoma de uma célula, em que o método compreende introduzir em uma célula pelo menos um PGEN da modalidade 10, e identificar pelo menos uma célula que tem uma modificação no dito alvo, sendo que a modificação no dito sítio-alvo é selecionada a partir do grupo que consiste em (i) uma subs- tituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
[437] 17. Um método para editar uma sequência de nucleotídeos no genoma de uma célula, em que o método compreende introduzir em pelo menos um PGEN da modalidade 10, e um modelo de modificação de polinucleotídeo, sendo que o dito modelo de modificação de polinu- cleotídeo compreende pelo menos uma modificação de nucleotídeo da dita sequência de nucleotídeos.
[438] 18. O método da modalidade 17 que compreende adicional- mente selecionar pelo menos uma célula que compreende a sequência de nucleotídeos editada.
[439] 19. Um método para modificar um sítio-alvo no genoma de uma célula, em que o método compreende introduzir em uma célula pelo menos um PGEN da modalidade 10, e pelo menos um DNA doador, sendo que o dito DNA doador compreende um polinucleotídeo de inte- resse.
[440] 20. O método da modalidade 19 que compreende adicional- mente identificar pelo menos uma célula a qual o dito polinucleotídeo de interesse se integrou ou próxima ao dito sítio-alvo.
[441] 21. O método de qualquer uma das modalidades 16 a 21, em que a célula é selecionada a partir do grupo que consiste em uma célula humana, não humana, animal, bacteriana, fúngica, de inseto, levedura, levedura não convencional e vegetal.
[442] 22. Os métodos das modalidades 16 a 21, em que o PGEN é introduzido na célula como um complexo de polinucleotídeo e proteína pré-montado.
[443] 23. O método de qualquer uma das modalidades 16 a 21, em que o polinucleotídeo-guia/endonuclease Cas é um RNA-guia/endonu- clease Cas.
[444] 24. O método da modalidade 22, em que o complexo de RNA-guia/endonuclease Cas é montado in vitro antes de ser introduzido na célula como um complexo de ribonucleotídeo e proteína.
[445] 25. Um método para melhorar pelo menos uma propriedade de uma variante de endonuclease Cas9, em que o dito método compre- ende introduzir pelo menos uma modificação de aminoácido em uma endonuclease Cas9 parente, sendo que a dita pelo menos uma modifi- cação de aminoácido está localizada fora dos domínios RuVC e HNH da endonuclease Cas9 parente, desse modo, se cria a dita variante de endonuclease Cas9, sendo que a dita variante de endonuclease Cas9 mostra um melhoramento em pelo menos uma propriedade quando comparada com a dita endonuclease Cas9 parente.
[446] 26. O método da modalidade 25, em que a dita pelo menos uma modificação de aminoácido é uma substituição de aminoácido em uma posição selecionada a partir do grupo que consiste em posição 86, posição 98, posição 155 e uma combinação das mesmas, sendo que as posições de aminoácido da variante são numeradas em correspondên- cia à sequência de aminoácidos da dita endonuclease Cas9 parente.
[447] 27. O método da modalidade 26, em que pelo menos uma substituição de aminoácido é selecionada a partir do grupo que consiste em Y155H, Y155N, Y155E, Y155F (na posição 155), F86A (na posição 86) e F98A (na posição 98).
[448] 28. O método da modalidade 25, em que a variante de endo- nuclease Cas9 tem pelo menos uma propriedade melhorada selecio- nada a partir do grupo que consiste em eficiência de transformação me- lhorada e eficiência de edição melhorada, quando comparada com a dita endonuclease Cas9 parente.
[449] 29. Uma endonuclease Cas9 variante produzida pelo método de qualquer uma das modalidades 24 a 27.
[450] 30. Um método para modificar o genoma de uma célula hos- pedeira Bacillus, em que o dito método compreende
[451] fornecer a uma célula hospedeira Bacillus que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9, de qualquer uma das modalidades 1 a 6, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capacidade para for- mar um complexo (PGEN), em que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[452] identificar pelo menos uma célula hospedeira Bacillus, em que a pelo menos uma sequência-alvo de genoma foi modificada.
[453] 31. O método da modalidade 30, em que a modificação no dito sítio-alvo é selecionada a partir do grupo que consiste em (i) uma substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
[454] 32. O método da modalidade 29, em que a célula hospedeira Bacillus é selecionada a partir do grupo de espécies Bacillus que con- siste em Bacillus alkalophilus, Bacillus altitudinis, Bacillus amyloliquefa- ciens, B. amyloliquefaciens subsp. plantarum, Bacillus brevis, Bacillus circulans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus lautus, Bacillus lentus, Bacillus licheniformis, Bacillus megaterium, Baci- llus methylotrophicus, Bacillus pumilus, Bacillus safensis, Bacillus stea- rothermophilus, Bacillus subtilis e Bacillus thuringiensis.
[455] 33. Um método para modificar o genoma de uma célula hos- pedeira E. coli, em que o dito método compreende
[456] fornecer a uma célula hospedeira E. coli que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9, de qualquer uma das modalidades 1 a 6, em que o RNA- guia e a variante de endonuclease Cas9 têm capacidade para formar um complexo (PGEN), em que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[457] identificar pelo menos uma célula hospedeira E. coli, em que a pelo menos uma sequência-alvo de genoma foi modificada.
[458] 34. Um método para modificar o genoma de uma célula hos- pedeira Saccharomyces cerevisiae, em que o dito método compreende
[459] fornecer a uma célula hospedeira Saccharomyces cerevisiae que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA-guia de ocorrência não natural e pelo menos uma vari- ante de endonuclease Cas9, de qualquer uma das modalidades 1 a 6, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capaci- dade para formar um complexo (PGEN), em que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desen- rolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[460] identificar pelo menos uma célula hospedeira Saccha- romyces cerevisiae, em que a pelo menos uma sequência-alvo de ge- noma foi modificada.
[461] 35. Um método para modificar o genoma de uma célula hos- pedeira fúngica, em que o dito método compreende
[462] fornecer a uma célula hospedeira fúngica que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9, de qualquer uma das modalidades 1 a 6, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capacidade para for- mar um complexo (PGEN), em que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desenrolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e,
[463] identificar pelo menos uma célula hospedeira fúngica, em que a pelo menos uma sequência-alvo de genoma foi modificada.
[464] 36. Uma variante de endonuclease Cas9 para a modifi- cação de um sítio-alvo em uma célula, em que a dita variante de endo- nuclease Cas9 compreende uma modificação de aminoácido fora de seu domínio HNH e domínio RuVC, em que a dita endonuclease Cas9 tem pelo menos uma propriedade melhorada, quando comparada com uma endonuclease Cas9 parente que não compreende a dita modifica- ção de aminoácido, em que a variante de endonuclease Cas9 pode for- mar um complexo com um dito polinucleotídeo-guia em que o dito com-
plexo tem capacidade para reconhecer, se ligar e, opcionalmente, cor- tar, desenrolar ou clivar toda ou parte da dita sequência-alvo.
[465] 37. A variante de endonuclease Cas9 da modalidade 34, sendo que a variante de endonuclease Cas9 tem pelo menos uma pro- priedade melhorada selecionada a partir do grupo que consiste em efi- ciência de transformação melhorada, transformação em vezes melho- rada, eficiência de edição melhorada e edição em vezes melhorada, quando comparada com a dita endonuclease Cas9 parente.
[466] 38. Um método para modificar um organismo ou um orga- nismo não humano aumentando-se a eficiência de edição usando-se uma variante de endonuclease Cas9 para a modificação de um sítio- alvo em uma localização genômica de interesse em uma célula, em que o dito método compreende fornecer um polinucleotídeo-guia de ocor- rência não natural e uma variante de endonuclease Cas9 à dita célula, em que a dita variante de endonuclease Cas9 compreende uma modifi- cação de aminoácido fora de seus domínios HNH e RuvC, em que a dita endonuclease Cas9 tem eficiência de edição de gene aumentada quando comparada com uma endonuclease Cas9 parente que não com- preende a dita modificação de aminoácido, em que o dito polinucleotí- deo-guia e variante de endonuclease Cas9 podem formar um complexo com capacidade para reconhecer, se ligar, e, opcionalmente, cortar, de- senrolar ou clivar toda ou parte da dita sequência-alvo.
[467] 39. Um método para expressar uma endonuclease Cas vari- ante em uma célula procariótica ou eucariótica, em que o método com- preende:
[468] introduzir em uma célula procariótica ou eucariótica um cons- truto de DNA recombinante da modalidade 11; e,
[469] incubar a célula procariótica ou eucariótica da etapa (a) sob condições que permitem a expressão da dita endonuclease Cas vari- ante.
[470] 38. Uma variante de endonuclease Cas9 selecionad a partir do grupo que consiste na SEQ ID NO: 58 (variante CasY155H), SEQ ID NO: 123 (variante CasY155N), SEQ ID NO: 125 (variante Cas9 Y155E), SEQ ID NO: 127 (variante Cas9 Y155F), SEQ ID NO: 129 (variante Cas9 F86A-F98A).
[471] EXEMPLOS
[472] Nos seguintes exemplos, a menos que declarado de outro modo, partes e porcentagens são em peso e graus são Celsius. Deve ser entendido que esses Exemplos, enquanto indicam modalidades da descrição, são dados apenas a título de ilustração. A partir da discussão acima e desses Exemplos, um indivíduo versado na técnica pode fazer várias mudanças e modificações da descrição para adaptar a mesma a vários usos e condições. Tais modificações também são destinadas a estar dentro do escopo das reivindicações anexas.
[473] EXEMPLO 1
[474] Construção de cassetes de expressão de Cas9 que alvejam sítio-alvo 1 e sítio-alvo 2 em Bacillus.
[475] A proteína Cas9 de Streptococcus pyogenes (SEQ ID NO: 1) foi otimizada por códon para expressão em Bacillus (SEQ ID NO: 2) e com a adição de uma sequência de localização nuclear N-terminal (NLS; "APKKKRKV"; SEQ ID NO: 3), um NLS C-terminal ("KKKKLK"; SEQ ID NO: 4), uma etiqueta de deca-histidina ("HHHHHHHHHH"; SEQ ID NO: 5), o promotor aprE de B. subtilis (SEQ ID NO: 6) e uma sequência ter- minadora (SEQ ID NO: 7) e foi amplificado com o uso de DNA polime- rase Q5 (NEB) de acordo com as instruções do fabricante com o par iniciador direto/reverso apresentado abaixo na Tabela 1.
[476] Tabela 1. Par de iniciadores direto e reverso Direto ATATATGAGTAAACTTGGTCTGACAGAATTCCTCCATTTTCTTCTGCTAT SEQ ID NO: 8 Reverso TGCGGCCGCGAATTCGATTACGAATGCCGTCTCCC SEQ ID NO: 9
[477] A cadeia principal (SEQ ID NO: 10) de plasmídeo pKB320 (SEQ ID NO: 11) foi amplificada com o uso de DNA polimerase Q5
(NEB) de acordo com as instruções do fabricante com o par iniciador direto/reverso apresentado abaixo na Tabela 2.
[478] Tabela 2. Par de iniciadores direto e reverso Direto GGGAGACGGCATTCGTAATCGAATTCGCGGCCGCA SEQ ID NO: 12 Reverso ATAGCAGAAGAAAATGGAGGAATTCTGTCAGACCAAGTTTACTCATATAT SEQ ID NO: 13
[479] Os produtos de PCR foram purificados com o uso de Zymo clean e concentram 5 colunas de acordo com as instruções do fabri- cante. Subsequentemente, os produtos de PCR foram agrupados com o uso de PCR de extensão de sobreposição prolongada (POE-PCR) com Q5 Polimerase (NEB) que mistura os dois fragmentos em razão equimolar. As reações de POE-PCR foram circuladas: 98ºC por cinco (5) segundos, 64ºC por dez (10) segundos, 72ºC por quatro (4) minutos e quinze (15) segundos por 30 ciclos. Cinco (5) µl do POE-PCR (DNA) foram transformados em Top10 E. coli (Invitrogen) de acordo com as instruções do fabricante e selecionados em caldo de lisogenia (L) (re- ceita Miller; 1% (p/v) Triptona, extrato de levedura 0,5% (p/v), NaCl 1% (p/v)), que contém sulfato de canamicina cinquenta (50) µg/ml e solidifi- cado com ágar 1,5%. Permitiu-se que as colônias crescessem por de- zoito (18) horas a 37°C. As colônias foram colhidas e o DNA de plasmí- deo foi preparado com o uso de kit miniprep de DNA Qiaprep de acordo com as instruções do fabricante e eluídos em cinquenta e cinco (55) µl de ddH2O. O DNA de plasmídeo foi sequenciado por Sanger para veri- ficar a montagem correta, com o uso dos iniciadores de sequenciamento apresentados abaixo na Tabela 3.
[480] Tabela 3. Iniciadores de sequenciamento Inverso CCGACTGGAGCTCCTATATTACC SEQ ID NO: 14 Dianteiro GTCTTTTAAGTAAGTCTACTCT SEQ ID NO: 16 Dianteiro CCAAAGCGATTTTAAGCGCG SEQ ID NO: 17 Dianteiro CCTGGCACGTGGTAATTCTC SEQ ID NO: 18 Dianteiro GGATTTCCTCAAATCTGACG SEQ ID NO: 19 Dianteiro GTAGAAACGCGCCAAATTACG SEQ ID NO: 20 Dianteiro GCTGGTGGTTGCTAAAGTCG SEQ ID NO: 21 Dianteiro GGACGCAACCCTCATTCATC SEQ ID NO: 22 Inverso CAGGCATCCGATTTGCAAGG SEQ ID NO: 23
Dianteiro GCAAGCAGCAGATTACGCG SEQ ID NO: 24
[481] O plasmídeo montado corretamente, pRF694 (SEQ ID NO: 25) foi usado para construir plasmídeos pRF801 (SEQ ID NO: 26) e pRF806 (SEQ ID NO: 27) para editar o genoma de Bacillus licheniformis no sítio-alvo 1 (SEQ ID NO: 28) e no sítio-alvo 2 (SEQ ID NO: 29) con- forme descrito abaixo.
[482] O quadro de leitura aberto serA1 (SEQ ID NO: 30) de B. li- cheniformis contém um sítio-alvo único, sítio-alvo 1 (SEQ ID NO: 28) na orientação reversa. O sítio-alvo reside adjacente a um motivo adjacente protoespaçador (SEQ ID NO: 31) na orientação reversa. O sítio-alvo pode ser convertido no DNA que codifica um domínio de alvejamento variável (SEQ ID NO: 32). A sequência de DNA que codifica o domínio VT (SEQ ID NO: 32) é fundida de modo operacional à sequência de DNA que codifica o domínio de reconhecimento de endonuclease Cas9 (CER, SEQ ID NO: 33) de modo que, quando transcrita por RNA poli- merase da célula bacteriana, produza um sítio-alvo de alvejamento de gRNA funcional 1 (SEQ ID NO: 34). O DNA que codifica o gRNA foi ligado de modo operacional a um promotor operável em células Bacillus sp. (por exemplo, o promotor spac; SEQ ID NO: 35) e um terminador operável em células Bacillus sp. (por exemplo, o terminador t0 de fago lâmbda; SEQ ID NO: 36), de modo que o promotor tenha sido posicio- nado 5' do DNA que codifica o gRNA (SEQ ID NO: 33) e o terminador seja posicionado 3' do DNA que codifica o gRNA (SEQ ID NO: 33).
[483] Um modelo de modificação de polinucleotídeo (também de- nominado um modelo de edição) para deletar o gene serA1 em resposta à clivagem de Cas9/gRNA foi criado por amplificação de dois braços de homologia a partir de DNA genômico de B. licheniformis (gDNA). O pri- meiro fragmento corresponde aos 500 bp diretamente a montante do quadro de leitura aberto serA1 (SEQ ID NO: 37). Esse fragmento foi amplificado com o uso de DNA polimerase Q5 de acordo com as instru-
ções do fabricante e os iniciadores listados na Tabela 4 abaixo. Os ini- ciadores incorporam os 18bp homólogos à extremidade 5' do segundo fragmento na extremidade 3' do primeiro fragmento e 20 bp homólogos a pRF694 á extremidade 5' do primeiro fragmento.
[484] Tabela 4. Par de iniciadores direto e reverso. Dianteiro TGAGTAAACTTGGTCTGACAAATGGTTCTTTCCCCTGTCC SEQ ID NO: 38 Inverso AGGTTCCGCAGCTTCTGTGTAAGATTTCCTCCTAAATAAGCGTCAT SEQ ID NO: 39
[485] O segundo fragmento corresponde aos 500 bp diretamente a jusante da extremidade 3' do quadro de leitura aberto serA1 (SEQ ID NO: 40). Esse fragmento foi amplificado com o uso de DNA polimerase Q5 de acordo com as instruções do fabricante e os iniciadores listados na Tabela 5 abaixo. Os iniciadores incorporam 28 bp homólogos à ex- tremidade 3' do primeiro fragmento na extremidade 5' do segundo frag- mento e 21 bp homólogos a pRF694 na extremidade 3' do segundo fra- gmento.
[486] Tabela 5. Par de iniciadores direto e reverso. Dianteiro ATGACGCTTATTTAGGAGGAAATCTTACACAGAAGCTGCGGAACCT SEQ ID NO: 41 Inverso CAGAAGAAAATGGAGGAATTCGAATATCGACCGGAACCCAC SEQ ID NO: 42
[487] O DNA que codifica o cassete de expressão de gRNA de sí- tio-alvo 1 gRNA (SEQ ID NO: 43), o primeiro (SEQ ID NO: 37) e o se- gundo braços de homologia (SEQ ID NO: 40) foram montados em pRF694 (SEQ ID NO: 25) com o uso de técnicas de biologia molecular padrão que geram pRF801 (SEQ ID NO: 26), um plasmídeo shuttle E. coli-B. licheniformis que contém um cassete de expressão Cas9 (SEQ ID NO: 2), um cassete de expressão de gRNA (SEQ ID NO: 43) que codifica um sítio-alvo de alvejamento de gRNA 1 no quadro de leitura aberto serA1 e um modelo de edição (SEQ ID NO: 44) composto do primeiro (SEQ ID NO: 37) e do segundo (SEQ ID NO: 40) braços de homologia. O plasmídeo foi verificado por sequenciamento Sanger com os oligos apresentados na Tabela 3.
[488] O quadro de leitura aberto rghR1 de B. licheniformis (SEQ ID NO: 45) contém um sítio-alvo único na fita reversa, sítio-alvo 2 (SEQ ID
NO: 46). O sítio-alvo reside adjacente a um motivo adjacente protoes- paçador (as últimas três bases da SEQ ID NO: 47) na fita reversa. O sítio-alvo pode ser convertido no DNA que codifica um domínio de alve- jamento variável (VT) (SEQ ID NO: 48) de um RNA-guia. A sequência de DNA que codifica o domínio VT (SEQ ID NO: 48) é fundida de modo operacional à sequência de DNA que codifica o domínio de reconheci- mento de endonuclease Cas9 (CER, SEQ ID NO: 33) de modo que, quando transcrita por RNA polimerase da célula bacteriana, produza um sítio-alvo de alvejamento de RNA-guia (gRNA) funcional 2 (SEQ ID NO: 49). O DNA que codifica o gRNA foi ligado de modo operacional a um promotor operável em células de Bacillus sp. (por exemplo, o promotor spac de B. cutilis; SEQ ID NO: 35) e um terminador operável em células Bacillus sp. (por exemplo, o terminador t0 de fago lâmbda; SEQ ID NO: 36), de modo que o promotor tenha sido posicionado 5' do DNA que codifica o gRNA (SEQ ID NO: 43) e o terminador seja posicionado 3' do DNA que codifica o gRNA (SEQ ID NO: 43).
[489] Um modelo de modificação de polinucleotídeo (também de- nominado um modelo de edição) para modificar o gene rghR1 em res- posta à clivagem de Cas9/gRNA foi criado por amplificação de dois bra- ços de homologia a partir de DNA genômico de B. licheniformis (gDNA). O primeiro fragmento corresponde aos 500 bp diretamente a montante do quadro de leitura aberto rghR1 (SEQ ID NO: 50). Esse fragmento foi amplificado com o uso de DNA polimerase Q5 de acordo com as instru- ções do fabricante e os iniciadores listados na Tabela 6 abaixo. Os ini- ciadores incorporam os 23 bp homólogos à extremidade 5' do segundo fragmento na extremidade 3' do primeiro fragmento e 20 bp homólogos a pRF694 á extremidade 5' do primeiro fragmento.
[490] Tabela 6. Par de iniciadores direto e reverso. Dianteiro TGAGTAAACTTGGTCTGACATTGATATTCAGCACCCTGCG SEQ ID NO: 51 Inverso TGTGCCGCGGAGAAGTATGGCCAAAACCTCGCAATCTC SEQ ID NO: 52
[491] O segundo fragmento corresponde aos 500 bp diretamente a jusante da extremidade 3' do quadro de leitura aberto rghR1 (SEQ ID NO: 53). Esse fragmento foi amplificado com o uso de DNA polimerase Q5 de acordo com as instruções do fabricante e os iniciadores listados na Tabela 7 abaixo. Os iniciadores incorporam 20 bp homólogos à ex- tremidade 3' do primeiro fragmento na extremidade 5' do segundo frag- mento e 21 bp homólogos a pRF694 na extremidade 3' do segundo fra- gmento.
[492] Tabela 7. Par de iniciadores direto e reverso. Dianteiro GAGATTGCGAGGTTTTGGCCATACTTCTCCGCGGCACA SEQ ID NO: 54 Inverso CAGAAGAAAATGGAGGAATTCATTTCTCGGGTTTAAACAGCCAC SEQ ID NO: 55
[493] O DNA que codifica o cassete de expressão de gRNA de sí- tio-alvo 2 gRNA (SEQ ID NO: 56), o primeiro (SEQ ID NO: 50) e o se- gundo braços de homologia (SEQ ID NO: 53) foram montados em pRF694 (SEQ ID NO: 25) com o uso de técnicas de biologia molecular padrão que geram pRF806 (SEQ ID NO: 27), um plasmídeo shuttle E. coli-B. licheniformis que contém um cassete de expressão Cas9 (SEQ ID NO: 2), um cassete de expressão de gRNA (SEQ ID NO: 56) que codifica um sítio-alvo de alvejamento de gRNA 2 no quadro de leitura aberto rghR1 e um modelo de edição (SEQ ID NO: 57) composto do primeiro (SEQ ID NO: 50) e do segundo (SEQ ID NO: 53) braços de homologia. O plasmídeo foi verificado por sequência Sanger com os oli- gos apresentados na Tabela 3.
[494] EXEMPLO 2
[495] Criação de variantes Cas9 Y155
[496] No presente exemplo, a variante Y155H de S. pyogenes Cas9 (denominada variante Cas9 Y155H, no presente documento, SEQ ID NO: 58) foi criada nos plasmídeos pRF801 (SEQ ID NO: 26) e pRF806 (SEQ ID NO: 27). Para introduzir a variante Cas9 Y155H no plasmídeo pRF801 (SEQ ID NO: 26) ou no plasmídeo pRF806 (SEQ ID NO: 27) a mutagênese sítio-dirigida foi realizada com o uso de kit de mutagênese Quikchange de acordo com as instruções do fabricante e dos oligos na Tabela 8 abaixo com o uso de pRF801 (SEQ ID NO: 26) ou pRF806 (SEQ ID NO: 27) como DNA modelo.
[497] Tabela 8. Par de iniciadores direto e reverso. Dianteiro GATCTGCGTTTAATCCATCTTGCGTTAGCGCAC SEQ ID NO: 59 Inverso GTGCGCTAACGCAAGATGGATTAAACGCAGATC SEQ ID NO: 60
[498] Os produtos resultantes da reação, pRF827 (SEQ ID NO: 61) continham um cassete de expressão de variante Cas9 Y155H (SEQ ID NO: 62), um cassete de expressão de gRNA (SEQ ID NO: 43) que co- difica um sítio-alvo de alvejamento de gRNA 1 no quadro de leitura aberto serA1 e um modelo de edição (SEQ ID NO: 44) composto do primeiro (SEQ ID NO: 37) e do segundo (SEQ ID NO: 40) braços de homologia ou pRF856 (SEQ ID NO: 63) que continham um cassete de expressão de variante Cas9 Y155H (SEQ ID NO: 62), um cassete de expressão de gRNA (SEQ ID NO: 56) que alveja o sítio-alvo 2 no quadro de leitura aberto rghR1 e um modelo de edição (SEQ ID NO: 57) com- posto do primeiro (SEQ ID NO: 50) e do segundo (SEQ ID NO: 53) bra- ços de homologia. Os DNAs de plasmídeo foram sequenciados por San- ger para verificar a montagem correta, com o uso dos iniciadores de sequenciamento apresentados na Tabela 3.
[499] Outras variantes Cas9 Y155 foram criadas de maneira simi- lar, conforme descrito acima. Uma variante Cas9 Y155N foi criada e é apresentada na SEQ ID NO: 123 (sequência de aminoácidos codificada pela SEQ ID NO: 124), uma variante Cas9 Y155E foi criada e é apre- sentada na SEQ ID NO: 125 (sequência de aminoácidos codificada pela SEQ ID NO: 126), uma variante Cas9 Y155F foi criada e é apresentada na SEQ ID NO: 127 (sequência de aminoácidos codificada pela SEQ ID NO: 128).
[500] EXEMPLO 3
[501] A variante Y155H de Streptococcus pyogenes Cas9 (Cas9 Y155H variante) tem eficiência de transformação aumentada e eficiên-
cia de edição de DNA igual ou aumentada em células Bacillus compa- radas com Streptococcus pyogenes Cas9 de tipo selvagem (WT Cas9).
[502] No presente exemplo, os plasmídeos pRF694 (SEQ ID NO: 25), pRF801 (SEQ ID NO: 26), pRF806 (SEQ ID NO: 27), pRF827 (SEQ ID NO: 61) e pRF856 (SEQ ID NO: 63) descritos acima foram amplifica- dos com o uso de amplificação de círculo de rolamento (Sygnis) por 18 horas de acordo com as instruções do fabricante. Os plasmídeos ampli- ficados de círculo de rolamento foram transformados em células de B. licheniformis (parentais) competentes que compreendem (contêm) um plasmídeo pBL.comK (SEQ ID NO: 64) conforme geralmente descrito nas publicações PCR internacionais nº WO2017/075195, WO2002/14490 e WO2008/7989. As misturas de célula/transformação de DNA foram transferidas para placa em caldo L (receita Miller) que contém 20 µg/ml de canamicina e solidificadas com Ágar 1,5%. Se per- mitiu que as colônias se formassem a 37ºC. As colônias que cresceram nas placas ágar L que contêm canamicina foram coletadas e semeadas em placas ágar L para se recuperar. As colônias de transformações com pRF801 (SEQ ID NO: 26) e pRF827 (SEQ ID NO: 61) foram triadas para edição amplificando-se a localização de sítio-alvo 1 (SEQ ID NO: 65) com o uso de DNA polimerase Q5 de acordo com as instruções do fa- bricante e o par de iniciadores direto/reverso apresentado abaixo na Ta- bela 9. O WT e a localização de sítio-alvo 1 editada em células Bacillus podem ser diferenciadas com base no tamanho da localização amplifi- cada com o amplicon WT (SEQ ID NO: 65) maior em tamanho do que o amplicon editado (SEQ ID NO: 66).
[503] Tabela 9. Par de iniciadores direto e reverso. Dianteiro TAGAGACGAGACGTCTCACC SEQ ID NO: 67 Inverso GTATCAATCCGACTCCTACGG SEQ ID NO: 68
[504] As colônias da transformação com plasmídeos pRF806 (SEQ ID NO: 27) ou pRF856 (SEQ ID NO: 63) foram analisadas por eficiência de edição amplificando-se a localização de sítio-alvo 2 (SEQ
ID NO: 69) com o uso de DNA polimerase Q5 de acordo com as instru- ções do fabricante e o par de iniciadores direto/reverso apresentado abaixo na Tabela 10. O WT (SEQ ID NO: 69) e a localização de sítio- alvo 2 editada (SEQ ID NO: 70) podem ser diferenciados com base no tamanho da localização editada (SEQ ID NO: 70) com o amplicon WT (SEQ ID NO: 69) sendo maior em tamanho.
[505] Tabela 10. Par de iniciadores direto e reverso. Dianteiro ATCAAACATGCCATGTTTGC SEQ ID NO: 71 Inverso AGGTTGAGCAGGTCTTCG SEQ ID NO: 72
[506] O número de transformantes obtidos no meio seletivo para o plasmídeo (ágar L que contém sulfato de canamicina 20 µg∙ml-1) é exi- bido na Tabela 11. A eficiência de transformação é a razão entre o nú- mero de transformantes obtidos a partir de uma dada variante Cas9 com um gRNA específico e modelo de edição pelo número de transformantes do Cas9 parental (WT) o mesmo cassete de expressão de gRNA e mo- delo de edição. Os resultados são exibidos na Tabela 11 que demonstra que a variante Cas9 Y155H aumentou a eficiência de transformação de variantes Cas9 (entregues por plasmídeos) por pelo menos 84 a 402 vezes.
[507] Tabela 11: Eficiência de transformação e frequência de edi- ção em alvos B. licheniformis. Cas9 Sítio alvo Transformantes Eficiência de Transforma- Frequência de Eficiência de Edição ção (Variante ou WT/ WT) Edição (Variante ou WT/ WT) WT Sítio 1 1 1 1,00 1,0 Y155H Sítio 1 402 402 1,00 1,0 WT Sítio 2 3 1 0,33 1,0 Y155H Sítio 2 84 28 0,75 2,3
[508] Os resultados mostrados na Tabela 11 demonstram que a variante Cas9 Y155H teve uma eficiência de edição que é pelo menos igual a ou pelo menos 2,3 vezes (ou 230%) maior do que a eficiência de edição de DNA do WT Cas9.
[509] EXEMPLO 4
[510] Construção de variante Cas9 F86A-F98A.
[511] No presente exemplo, uma variante Cas9 F86A-F98A (SEQ
ID NO: 129) foi construída na cadeia principal do plasmídeo pRF801 (SEQ ID NO: 26) a fim de testar a variante Cas9 F86A-F98A pela efici- ência de transformação e frequência de edição em B. licheniformis.
[512] Um fragmento sintético que contém uma porção de Cas9 que inclui F86A e F98A (SEQ ID NO: 130) foi solicitada por um vendedor externo. A cadeia principal de pRF801 (SEQ ID NO: 131) foi amplificada com o uso dos oligos apresentados na Tabela 12 com o uso de técnicas de PCR padrão.
[513] Tabela 12. Par de iniciadores direto e reverso. Dianteiro AAAGAAAAATGGTCTGTTTG SEQ ID NO: 132 Inverso AATACGATTTTTACGACGTG SEQ ID NO: 133
[514] O fragmento sintético (SEQ ID NO: 130) foi amplificado com o uso dos oligos apresentados na Tabela 13 abaixo com o uso de téc- nicas de PCR padrão.
[515] Tabela 13. Par de iniciadores direto e reverso. Dianteiro AAAGAAAAATGGTCTGTTTG SEQ ID NO: 134 Inverso AATACGATTTTTACGACGTG SEQ ID NO: 135
[516] O fragmento de cadeia principal pRF801 (SEQ ID NO: 131) foi montado com o fragmento sintético F86A-F98A com o uso de técni- cas de biologia molecular padrão para criar o plasmídeo pRF866 (SEQ ID NO: 137). pRF866 contém o cassete de expressão F86A F98A Cas9 para Bacillus (SEQ ID NO: 136), o DNA que codifica o cassete de ex- pressão para o gRNA que alveja serA1 ts1 (SEQ ID NO: 43), e o modelo de edição de deleção serA1 (SEQ ID NO: 44).
[517] O plasmídeo pRF866 foi transformado em células de B. li- cheniformis.
[518] EXEMPLO 5
[519] Uma variante Cas9 de Streptococcus pyogenes que compre- ende uma primeira substituição de aminoácido em F86 e uma segunda substituição de aminoácido em F98 tem eficiência de transformação au- mentada e eficiência de edição de DNA igual em células Bacillus em comparação com seu parental (tipo selvagem) Cas9 de Streptococcus pygenes (WT Cas9).
[520] Uma variante Cas9 (denominada variante Cas9 F86-F98) de Streptococcus pyogenes que compreende uma primeira substituição de aminoácido em F86 (como F86A) e uma segunda substituição de ami- noácido em F98 (como F98A), em que as posições de aminoácido da variante são numeradas em correspondência com a sequência de ami- noácidos do polipeptídeo de Cas9 parente apresentado na SEQ ID NO 1 (Streptococcus pyogenes WT Cas9) foi criado conforme descrito no Exemplo 4. A eficiência de transformação e a eficiência de edição foram analisadas conforme descrito no Exemplo 3 e mostrado na Tabela 14.
[521] Tabela 14: Eficiência de transformação e frequência de edi- ção em alvos B. licheniformis com o uso de uma variante Cas9 F86-F98. Cas9 Sítio alvo Transformantes Eficiência de Transformação Frequência de Eficiência de edição (variante de razão ou WT/WT) Edição (variante de razão ou WT/WT) WT Sítio 1 1 1 1,0 1,0 F86A F98A Sítio 1 248 248 1,0 1,0
[522] A Tabela 14 mostra claramente que a variante Cas9 F86- F98A aumentou a eficiência de transformação em 248 vezes (ou
24.800%) quando comparada com o WT Cas9. As colônias transforma- das com plasmídeos de edição foram triadas conforme descrito no Exemplo 3 para eficiência de edição determinando-se a porcentagem de colônias triadas que contêm a edição desejável. Os resultados mos- trados na Tabela 14 demonstram que a variante Cas9 F86A-F98A teve uma eficiência de edição igual àquela do WT Cas9.
[523] EXEMPLO 6
[524] Construção de um vetor Cas9 de Escherichia coli
[525] No presente exemplo, um vetor de expressão Cas9 induzido para edição de genoma em Escherichia coli (E. coli) foi construído. A expressão de Cas9 em resposta a um indutor foi confirmada.
[526] A proteína Cas9 de Streptococcus pyogenes M1 GAS SF370 (SEQ ID NO: 1) foi otimizada por códon por técnicas padrão conhecidas na arte (SEQ ID NO: 73). A fim de localizar a proteína de Cas9 para o núcleo das células, o sinal de localização nuclear monopartido de vírus símio 40 (SV40) (MAPKKKRKV, SEQ ID NO: 74) foi incorporado ao ter- minal carbóxi do quadro de leitura aberto Cas9. O gene Cas9 otimizado de códon Yarrowia foi fundido a um promotor constitutivo Yarrowia, FBA1 (SEQ ID NO: 75), por técnicas de biologia molecular padrão. Um exemplo de um cassete de expressão Cas9 otimizado por códon Yar- rowia (SEQ ID NO: 76) que contém o promotor FBA constitutivo, Cas9 otimizado por códon Yarrowia e o sinal de localização nuclear SV40. O cassete de expressão Cas9 foi clonado no plasmídeo pZuf e o novo construto chamado pZufCas9 (SEQ ID NO: 77).
[527] O gene de fusão Cas9-SV40 otimizado por códon Yarrowia (SEQ ID NO: 78) foi amplificado a partir de pZufCas9 com o uso de téc- nicas de biologia molecular padrão com o uso dos iniciadores da Tabela 15 abaixo.
[528] Tabela 15. Par de iniciadores direto e reverso. Dianteiro GGGGGAATTCGACAAGAAATACTCCATCGGCCTGG SEQ ID NO: 79 Inverso CCCCAAGCTTAGCGGCCGCTTAGACCTTTCG SEQ ID NO: 80
[529] Os iniciadores na Tabela 12 adicionaram um sítio EcoRI 5' e um sítio HindIII 3' à fusão. O produto PCR (SEQ ID NO: 81) foi purificado com o uso de técnicas padrão. O fragmento purificado foi clonado nos sítios EcoRI e HindIII de pBAD/HisB de life technologies (SEQ ID NO: 82) para criar pRF48 (SEQ ID NO: 83).
[530] O cassete de expressão E. coli Cas9 (SEQ ID NO: 84) foi inserido em um plasmídeo de baixa cópia pKO3 (SEQ ID NO: 85) para criar pRF97 (SEQ ID NO: 86) um plasmídeo de E. coli de baixa cópia que contém um cassete de expressão Cas9.
[531] EXEMPLO 7
[532] Criar a variante Cas9 Y155H no plasmídeo E. coli Cas9
[533] No presente exemplo, a variante Cas9 Y155H foi introduzida na proteína Cas9 codificada em pRF97 (SEQ ID NO: 86).
[534] Um fragmento de DNA sintético que codifica uma porção da proteína de Cas9 de pRF97, mas que contém substituições que codifi- cam a variante Y155H (SEQ ID NO: 87) foi produzido. O fragmento sin- tético foi amplificado com o uso de condições de PCR padrão e os inici- adores listados na Tabela 16.
[535] Tabela 16. Par de iniciadores direto e reverso. Dianteiro CTCCAGTCGTCTGCTCTTCG SEQ ID NO: 88 Inverso CCAACGAGATGGCCAAGGTG SEQ ID NO: 89
[536] O plasmídeo pRF97 (SEQ ID NO: 86) foi amplificado para aceitar a inserção do fragmento sintético Y155H (SEQ ID NO: 87) com o uso de técnicas PCR padrão e os iniciadores listados abaixo na Tabela 17 para produzir o fragmento pRF97-Y155H (SEQ ID NO: 90).
[537] Tabela 17. Par de iniciadores direto e reverso. Dianteiro CACCTTGGCCATCTCGTTGG SEQ ID NO: 91 Inverso CGAAGAGCAGACGACTGGAG SEQ ID NO: 92
[538] O fragmento sintético Y155H (SEQ ID NO: 87) e o fragmento pRF97-Y155H (SEQ ID NO: 90) foram combinados para criar pRF861 (SEQ ID NO: 93) um plasmídeo de baixa cópia que contém um cassete de expressão de E. coli para a variante Cas9 Y155H.
[539] EXEMPLO 8
[540] Deleção do gene de controle de assimilação de nitrogênio de E. coli com o uso de um WT Cas9 e uma variante Cas9 Y155H.
[541] No presente exemplo, o gene nac que codifica o gene de controle de assimilação de nitrogênio de E. coli foi deletado com o uso da variante WT Cas9 ou da variante Cas9 Y155H.
[542] O gene E. coli nac (SEQ ID NO: 94) contém dois sítios-alvo; sítio-alvo 1 (SEQ ID NO: 95) e PAM (últimas três bases da SEQ ID NO: 96), e sítio-alvo 2 (SEQ ID NO: 97) e PAM (últimas três bases da SEQ ID NO: 98). Conforme descrito no exemplo 1 adicionando-se o DNA que codifica o domínio CER (SEQ ID NO: 33) à extremidade 3' do DNA que codifica o sítio-alvo de modo operacional que funde um promotor ativo em E. coli (por exemplo, o promotor de fago N25 (SEQ ID NO: 99)) à extremidade 5' do sítio-alvo e um terminador ativo em E. coli (por exem- plo, o terminador t0 de fago lâmbda (SEQ ID NO: 36) à extremidade 3' do domínio CER, um cassete de expressão de gRNA operável pode ser produzido para o sítio nac 1(SEQ ID NO: 100) e o sítio nac 2 (SEQ ID NO: 101). E. coli repara principalmente o DNA por meio de reparo dire- cionado por homologia e, para eficiência, a edição mediada por Cas9 necessita e edita o modelo.
[543] Os 491 bp a montante do códon de início nac e os primeiros três códons (SEQ ID NO: 102) foram ligados de modo operacional aos 491 bp a jusante do códon de parada nac e os últimos três códons do quadro de leitura aberto nac(SEQ ID NO: 103) para criar um modelo de edição que deleta todos, exceto os primeiros três e os últimos três có- dons do quadro de leitura aberto nac (SEQ ID NO: 104).
[544] O cassete de expressão de gRNA de sítio 1 (SEQ ID NO: 100) ou o cassete de expressão de gRNA de sítio 2 (SEQ ID NO: 102) foram ligados de modo operacional ao modelo de edição de deleção nac (SEQ ID NO: 104) e com 20 bp de identidade com pRF97 (SEQ ID NO: 86) e pRF861 (SEQ ID NO: 93) na extremidade 5' (SEQ ID NO: 105) e 21 bp de identidade (SEQ ID NO: 106) para pRF97 (SEQ ID NO: 86 ) e pRF861 (SEQ ID NO: 93) na extremidade 3' e ordenado como fragmen- tos sintéticos de DNA nacETsite1 (SEQ ID NO: 107) e nacETsite2 (SEQ ID NO: 108).
[545] pRF97 (SEQ ID NO: 86) ou pRF861 (SEQ ID NO: 93) foram amplificados com o uso de técnicas de biologia molecular padrão e os iniciadores listados na Tabela 18 abaixo para criar fragmentos lineares pRF97-cassete (SEQ ID NO: 109) ou pRF861-cassete (SEQ ID NO: 110).
[546] Tabela 18. Par de iniciadores direto e reverso. Dianteiro GGTTTATTGACTACCGGAAGC SEQ ID NO: 111 Inverso GCCGTCAATTGTCTGATTCG SEQ ID NO: 112
[547] O pRF97-cassete (SEQ ID NO: 109) ou o pRF861-cassete
(SEQ ID NO: 110) foi montado com o nacETsite1 (SEQ ID NO: 107) ou nacETsite1 (SEQ ID NO: 108) com o uso de técnicas de biologia mole- cular padrão para criar pRF97/nacETsite1 (SEQ ID NO:113), pRF97/na- cETsite2 (SEQ ID NO: 114), pRF861/nacETsite1 (SEQ ID NO: 115), e pRF861/nacETsite2 (SEQ ID NO: 116).
[548] As células de E. coli MG1655 foram tornadas eletrocompe- tentes conforme descrito anteriormente (Protocolos curtos em biologia molecular) e transformados com 1 µl de pRF97/nacETsite1 (SEQ ID NO:113), pRF97/nacETsite2 (SEQ ID NO: 114), pRF861/nacETsite1 (SEQ ID NO: 115), ou pRF861/nacETsite2 (SEQ ID NO: 116). As células foram transferidas para placa em caldo L solidificado com 1,5% em p∙v- 1 ágar que contém cloramfenicol 25 µg∙ml-1 e 0,1% em p∙v-1 de L-arabi- nose (para induzir à expressão de Cas9). As colônias da transformação foram contadas após 24 horas de crescimento a 30°C.
[549] Para determinar se uma colônia continha um alelo editado, até 8 colônias de cada transformação foram triados por PCR pela pre- sença da localização WT nac (SEQ ID NO: 117) ou a localização nac editada (SEQ ID NO: 118) por amplificação de PCR com o uso de téc- nicas padrão e dos iniciadores na Tabela 19 abaixo.
[550] Tabela 19. Par de iniciadores direto e reverso. Dianteiro GGTTTATTGACTACCGGAAGC SEQ ID NO: 119 Inverso GCCGTCAATTGTCTGATTCG SEQ ID NO: 120
[551] As colônias que geraram produtos de amplificação corres- pondentes à localização nac editada (SEQ ID NO: 118) que é menor do que a localização WT nac (SEQ ID NO: 117) foram contados como edi- tados para o cálculo de frequência de edição. A frequência de edição é a porcentagem de células triadas que demonstraram a presença da lo- calização nac editada (SEQ ID NO 118) de PCR. Os resultados na Ta- bela 20 mostram a frequência de edição e a eficiência de transformação (Transformantes/transformantes WT Cas9).
[552] Tabela 20. Eficiência de transformação e frequência de edi- ção de WT Cas9 e Y155H Cas9 em E. coli Cas9 Sítio alvo Transformantes Eficiência de Frequência de Eficiência de Transformação Edição Edição WT Sítio 1 4 1,0 75 1,00 Y155H Sítio 1 13 3,3 86 1,15 WT Sítio 2 11 1,0 63 1,00 Y155H Sítio 2 8 0,7 100 1,59
[553] A Tabela 20 demonstra claramente que a variante Cas9 Y155H é operável em E. coli e mostra um aumento em eficiência de edição de pelo menos 15% a 59% quando em comparação com a fre- quência de edição de WTCas9.
[554] EXEMPLO 9
[555] CONSTRUÇÃO DE VETORES CAS9-gRNA PARA EDITAR A DELEÇÃO DE GENE URA3 CROMOSSÔMICO DE SACCHA-
ROMYCES CEREVISIAE
[556] A fim de testar a transformação e eficiências de edição de variante Cas9 Y155H vs tipo selvagem Cas9 (wt) para editar a deleção de gene URA3 cromossômico de Saccharomyces cerevisiae, Cas9 Y155H-gRNA e Cas9 wt-gRNA que expressam plasmídeos com um gene de resistência G-418 (KanMX) como um marcador de seleção são produzidos conforme descrito abaixo.
[557] O fragmento A (Cas9 wt) que contém um polinucleotídeo sin- tético que codifica a proteína de tipo selvagem Cas9 de S. pyogenes (SEQ ID NO: 1), que compreende uma sequência de localização nuclear N-terminal (NLS; "APKKKRKV"; SEQ ID NO: 3), um NLS C-terminal ("KKKKLK"; SEQ ID NO: 4) e uma etiqueta deca-histidina ("HHHHHHH- HHH"; SEQ ID NO: 5), é amplificado a partir do plasmídeo pRF694 (SEQ ID NO: 25) com o uso de DNA polimerase Q5 (NEB) de acordo com as instruções do fabricante com o par iniciador direto/reverso apresentado abaixo na Tabela 21. O fragmento A' (Cas9 Y115H) que contém um po- linucleotídeo sintético que codifica a variante Cas9 Y115H (SEQ ID NO: 58), que compreende uma sequência de localização nuclear N-terminal,
um NLS C-terminal e uma etiqueta deca-histidina, é amplificado a partir do plasmídeo pRF827 (SEQ ID NO: 61) com o uso de DNA polimerase Q5 (NEB) de acordo com as instruções do fabricante com o par de ini- ciadores direto (SEQ ID NO: 138)/reverso (SEQ ID NO: 138) apresen- tado abaixo na Tabela 21.
[558] Tabela 21. Par de iniciadores direto e reverso. Dianteiro AAAAGAAATATATAGAGAGATACTCTTATCAATGATGGTGATGAT SEQ ID NO: 138
GATGGTGATG Inverso ACACGTATTTATTTGTCCAATTACCATGGCCCCAAAAAAGAAACG SEQ ID NO: 139
CAAGGTTATGGAT
[559] O fragmento B que contém o promotor RNR2p (SEQ ID NO: 140), origem 1 de replicação de 2 mícrons (SEQ ID NO: 141), cassete de expressão KanMX (SEQ ID NO: 142), e promotor SNR52p (SEQ ID NO: 143), é amplificado a partir do plasmídeo pSE087 (SEQ ID NO: 144) com o uso de DNA polimerase Q5 (NEB) de acordo com as instruções do fabricante com o par de iniciadores direto (SEQ ID NO: 145)/reverso (SEQ ID NO: 146) apresentado abaixo na Tabela 22.
[560] Tabela 22. Par de iniciadores direto e reverso. Dianteiro CTCCGCAGTGAAAGATAAATGATCGCCCAAAATTTGTTTACTAAAAAC SEQ ID NO: 145
ACATGTGGA Inverso GAATTGGGTACCGGGCCCTTAGAGTAAAAAATTGTACTTGGCGGATAA SEQ ID NO: 146
TGCCTTTAGC
[561] O plasmídeo pSE087 é um vetor shuttle 2µ com um cassete de expressão KanMX heterólogo. O plasmídeo contém o gene cas9 de S. pyogenes sob o controle do promotor RNR2, o promotor SNR52 a montante de fragmento de carga que contém o sgRNA de alvejamento + terminador T(6) (SEQ ID NO: 147). O sgRNA é flanqueado por sítios de ligação BsmBI que são orientados de modo que a linearização do plasmídeo por BsmBI libere a carga de sgRNA que deixa cadeias se- cundárias incompatíveis no plasmídeo digerido.
[562] O fragmento C que contém um polinucleotídeo sintético do braço de homologia a montante de 50 bp (SEQ ID NO: 148), URA3 que alveja sgRNA + terminador T(6) (SEQ ID NO: 149), e 50 bp a jusante
(SEQ ID NO: 150) é amplificado com o uso de DNA polimerase Q5 (NEB) de acordo com as instruções do fabricante com o par de iniciado- res direto (SEQ ID NO: 151)/reverso (SEQ ID NO: 152) apresentado abaixo na Tabela 23.
[563] Tabela 23. Par de iniciadores direto e reverso. Dianteiro CCGCCAAGTACAATTTTTTACTCTAAGGGCCCGGTACCCAATTCGCC SEQ ID NO: 151
CTATAGTGAG Inverso CATCATCACCATCATTGATAAGAGTATCTCTCTATATATTTCTTTTTACG SEQ ID NO: 152
CAGTCTC
[564] O fragmento D que contém a origem 2 de replicação de 2 mícrons (SEQ ID NO: 153), gene resistente à ampicilina (SEQ ID NO: 154) e terminador de RNR2 (SEQ ID NO: 155), é amplificado a partir do plasmídeo pSE087 com o uso de DNA polimerase Q5 (NEB) de acordo com as instruções do fabricante com o par de iniciadores direto (SEQ ID NO: 156)/reverso (SEQ ID NO: 157) apresentado abaixo na Tabela 24.
[565] Tabela 24. Par de iniciadores direto e reverso. Dianteiro CCTTGCGTTTCTTTTTTGGGGCCATGGTAATTGGACAAATAAATACG SEQ ID NO: 156
TGTATTAAG Inverso TGTTTTTAGTAAACAAATTTTGGGCGATCATTTATCTTTCACTGCGGAG SEQ ID NO: 157
AAGTTTC
[566] Os fragmentos de PCR são purificados com o uso do kit de purificação de pCR Qiagen (QIAGEN, Inc) de acordo com as instruções do fabricante. Subsequentemente, os fragmentos de PCR são monta- dos na cadeia principal de plasmídeo de 2 mícrons por reparo de lacuna em levedura de acordo com o protocolo abaixo.
[567] As células competentes S. cerevisiae ura3Δ são preparadas usando-se o kit Frozen-EZ Yeast Transformation IITM (Zymo Research, Inc) de acordo com as instruções do fabricante. Os 50 µl de células com- petentes S. cerevisiae ura3Δ são misturados com 0,1 a 0,2 µg de DNA de cada produto de PCR dos fragmentos A, B, C e D para criar pWS572 (Cas9 wt). Os 50 µl de células competentes S. cerevisiae ura3Δ são misturados com 0,1 a 0,2 µg de DNA de cada produto de PCR dos fra- gmentos A, B, C e D para criar pWS573 (Cas9 Y115H). Os 500 µl de solução EZ 3 que são fornecidos a partir do kit são adicionados e mis- turados completamente. Após incubar a mistura a 30°C por 45 minutos, 50 a 150 µl da mistura de transformação se espalha na placa de meio YPD suplementada com o antibiótico Geneticin 200ug/ml (G418). As placas foram incubadas a 30°C por 2 a 4 dias para permitir o cresci- mento de transformantes.
[568] Os plasmídeos resultantes de pWS572 (Cas9 wt) e pWS573 (Cas9 Y155H) são preparados a partir de 1ml dos transformantes culti- vados no meio YPD suplementado com o antibiótico Geneticin 200 ug/ml (G418) usando-se o kit ChargeSwitch® Plasmid Yeast Mini (Invi- trogen, Inc).
[569] EXEMPLO 10
[570] DELEÇÃO DE GENE URA3 CROMOSSÔMICO DE SAC- CHAROMYCES CEREVISIAE USANDO-SE PWS572 (CAS9 WT) E PWS573 (CAS9 Y155H)
[571] Nesse exemplo, a transformação e as eficiências de edição de pWS573 (Cas9 Y155H) vs pWS572 (Cas9 wt) para deleção de gene URA3 cromossômico de Saccharomyces cerevisiae são comparadas. As células competentes de tipo selvagem de S. cerevisiae são prepara- das usando-se o kit Frozen-EZ Yeast Transformation IITM (Zymo Rese- arch, Inc) de acordo com as instruções do fabricante, e transformadas com 100ng de DNA de plasmídeo de pWS573 (Cas9 Y155H) e pWS572 (Cas9 wt), separadamente. 50 a 150 µl da mistura de transformação se espalha na placa de meio YPD suplementada com o antibiótico Geneti- cin 200ug/ml (G418). As placas foram incubadas a 30°C por 2 a 4 dias para permitir o crescimento de transformantes. As colônias ura3Δ cor- retas são triadas para auxotrofo de uracila coletando-se transformantes nos meios completos sintéticos (1X de base de nitrogênio de levedura sem aminoácidos, mistura de aminoácido 1X que não tem uracila) su- plementados com glicose 2 g/l e incubando-se células a 30C por 2 a 4 dias para permitir o crescimento de transformantes.
A deleção do gene URA3 é confirmada por PCR e sequenciamento com iniciadores de flan- queamento da região-alvo URA3. A frequência de edição para cada plasmídeo é determinada dividindo-se o número de colônias ura3Δ pelo número total de colônias testadas.

Claims (34)

REIVINDICAÇÕES
1. Variante de endonuclease Cas9, ou um fragmento ativo da mesma, caracterizada pelo fato de que tem pelo menos 80% de iden- tidade de aminoácido com um polipeptídeo de Cas9 parente apresen- tado na SEQ ID NO: 1 e que tem pelo menos uma substituição de ami- noácido em uma posição selecionada a partir do grupo que consiste em posição 86, posição 98, posição 155 e uma combinação das mesmas, sendo que as posições de aminoácido da variante são numeradas em correspondência à sequência de aminoácidos do dito polipeptídeo de Cas9 parente, sendo que a dita variante de endonuclease Cas9 tem ati- vidade de endonuclease.
2. Variante de endonuclease Cas9, de acordo com a reivin- dicação 1, caracterizada pelo fato de que a pelo menos uma substituição de aminoácido é selecionada a partir do grupo que consiste em Y155H, Y155N, Y155E, Y155F (na posição 155), F86A (na posição 86) e F98A (na posição 98).
3. Variante de endonuclease Cas9, de acordo com a reivin- dicação 1, caracterizada pelo fato de que tem pelo menos uma proprie- dade melhorada selecionada a partir do grupo que consiste em eficiên- cia de transformação melhorada e eficiência de edição melhorada, quando comparada com a dita endonuclease Cas9 parente.
4. Variante de endonuclease Cas9, ou fragmento ativo da mesma, de acordo com qualquer uma das reivindicações anteriores, ca- racterizada pelo fato de que a dita variante compreende uma sequência de aminoácidos que tem 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência de aminoáci- dos com a sequência de aminoácidos da SEQ ID NO: 1.
5. Variante de endonuclease Cas9, de acordo com a reivin- dicação 3, caracterizada pelo fato de que a propriedade melhorada é eficiência de transformação melhorada e em que a dita variante, ou fra- gmento ativo da mesma, também tem uma eficiência de edição melho- rada.
6. Variante de endonuclease Cas9, ou fragmento ativo da mesma, de acordo com qualquer uma das reivindicações anteriores, ca- racterizada pelo fato de que compreende pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 substituições de aminoácido quando comparada com a endo- nuclease Cas9 parente.
7. Composição caracterizada pelo fato de que compreende a endonuclease Cas9, ou um fragmento funcional da mesma, como de- finido em qualquer uma das reivindicações anteriores.
8. Composição, de acordo com a reivindicação 7, caracteri- zada pelo fato de que é selecionada a partir do grupo que consiste em um complexo de polinucleotídeo-guia/endonuclease Cas9, um com- plexo de RNA-guia/endonuclease Cas9 e uma proteína de fusão que compreende a dita variante de endonuclease Cas9.
9. Polinucleotídeo caracterizado pelo fato de que compre- ende uma sequência de ácido nucleico que codifica a variante de endo- nuclease Cas9, como definida em qualquer uma das reivindicações an- teriores.
10. Complexo de polinucleotídeo-guia/endonuclease Cas (PGEN) caracterizado pelo fato de que compreende pelo menos um po- linucleotídeo-guia e pelo menos uma variante de endonuclease Cas9, como definida em qualquer uma das reivindicações 1 a 6, sendo que o dito polinucleotídeo-guia é um polinucleotídeo-guia de ocorrência não natural quimérico, sendo que o dito complexo de polinucleotídeo- guia/endonuclease Cas tem capacidade para reconhecer, se ligar e, op- cionalmente, cortar, desenrolar ou clivar toda ou parte de uma sequên- cia-alvo.
11. Construto de DNA recombinante caracterizado pelo fato de que compreende o polinucleotídeo, como definido na reivindicação
9.
12. Célula hospedeira caracterizada pelo fato de que com- preende a endonuclease Cas9, ou fragmento funcional da mesma, como definido em qualquer uma das reivindicações 1 a 6.
13. Célula hospedeira caracterizada pelo fato de que com- preende o polinucleotídeo como definido na reivindicação 9.
14. Célula hospedeira, de acordo com a reivindicação 13, ca- racterizada pelo fato de que a célula é uma célula procariótica ou célula eucariótica.
15. Célula hospedeira, de acordo com a reivindicação 14, ca- racterizada pelo fato de que a célula é selecionada a partir do grupo que consiste em uma célula humana, não humana, animal, bacteriana, fún- gica, de inseto, levedura, levedura não convencional e vegetal.
16. Método para modificar um sítio-alvo no genoma de uma célula, caracterizado pelo fato de que compreende introduzir em uma célula pelo menos um PGEN, como definida na reivindicação 10, e iden- tificar pelo menos uma célula que tem uma modificação no dito alvo, sendo que a modificação no dito sítio-alvo é selecionada a partir do grupo que consiste em (i) uma substituição de pelo menos um nucleotí- deo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
17. Método para editar uma sequência de nucleotídeos no genoma de uma célula, sendo que o método é caracterizado pelo fato de que compreende introduzir em pelo menos um PGEN, como definido na reivindicação 10, e um modelo de modificação de polinucleotídeo, sendo que o dito modelo de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeo da dita sequência de nu- cleotídeos.
18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que compreende adicionalmente selecionar pelo menos uma célula que compreende a sequência de nucleotídeos editada.
19. Método para modificar um sítio-alvo no genoma de uma célula, caracterizado pelo fato de que compreende introduzir em uma célula pelo menos um PGEN, de acordo com a reivindicação 10, e pelo menos um DNA doador, sendo que o dito DNA doador compreende um polinucleotídeo de interesse.
20. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que compreende adicionalmente identificar pelo menos uma célula a qual o dito polinucleotídeo de interesse se integrou ou próxima ao dito sítio-alvo.
21. Método, de acordo com qualquer uma das reivindicações 16 a 21, caracterizada pelo fato de que a célula é selecionada a partir do grupo que consiste em uma célula humana, não humana, animal, bacteriana, fúngica, de inseto, levedura, levedura não convencional e vegetal.
22. Método, de acordo com as reivindicações 16 a 21, carac- terizado pelo fato de que o PGEN é introduzido na célula como um com- plexo de polinucleotídeo e proteína pré-montado.
23. Método, de acordo com qualquer uma das reivindicações 16 a 21, caracterizado pelo fato de que o polinucleotídeo-guia/endonu- clease Cas é um RNA-guia/endonuclease Cas.
24. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que o complexo de RNA-guia/endonuclease Cas é montado in vitro antes de ser introduzido na célula como um complexo de ribonu- cleotídeo e proteína.
25. Método para melhorar pelo menos uma propriedade de uma variante de endonuclease Cas9, caracterizado pelo fato de que compreende introduzir pelo menos uma modificação de aminoácido em uma endonuclease Cas9 parente, sendo que a dita pelo menos uma modificação de aminoácido está localizada fora dos domínios RuVC e HNH da endonuclease Cas9 parente, desse modo, se cria a dita vari- ante de endonuclease Cas9, sendo que a dita variante de endonuclease Cas9 mostra um melhoramento em pelo menos uma propriedade quando comparada com a dita endonuclease Cas9 parente.
26. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que a dita pelo menos uma modificação de aminoácido é uma substituição de aminoácido em uma posição selecionada a partir do grupo que consiste em posição 86, posição 98, posição 155 e uma combinação das mesmas, sendo que as posições de aminoácido da va- riante são numeradas em correspondência à sequência de aminoácidos da dita endonuclease Cas9 parente.
27. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que pelo menos uma substituição de aminoácido é selecio- nada a partir do grupo que consiste em Y155H, Y155N, Y155E, Y155F (na posição 155), F86A (na posição 86) e F98A (na posição 98).
28. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que a variante de endonuclease Cas9 tem pelo menos uma propriedade melhorada selecionada a partir do grupo que consiste em eficiência de transformação melhorada e eficiência de edição melho- rada, quando comparada com a dita endonuclease Cas9 parente.
29. Variante de endonuclease Cas9, caracterizada pelo fato de que é produzida através do método, como definido em qualquer uma das reivindicações 24 a 27.
30. Método para modificar o genoma de uma célula hospe- deira Bacillus, sendo que o dito método é caracterizado pelo fato de que compreende fornecer a uma célula hospedeira Bacillus que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA-
guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9, como definida emqualquer uma das reivindicações 1 a 6, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capaci- dade para formar um complexo (PGEN), sendo que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desen- rolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e, identificar pelo menos uma célula hospedeira Bacillus, em que a pelo menos uma sequência-alvo de genoma foi modificada.
31. Método, de acordo com a reivindicação 30, caracterizado pelo fato de que a modificação no dito sítio-alvo é selecionada a partir do grupo que consiste em (i) uma substituição de pelo menos um nucle- otídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inser- ção de pelo menos um nucleotídeo e (iv) qualquer combinação de (i) a (iii).
32. Método, de acordo com a reivindicação 29, caracterizado pelo fato de que a célula hospedeira Bacillus é selecionada a partir do grupo de espécies Bacillus que consiste em Bacillus alkalophilus, Baci- llus altitudinis, Bacillus amyloliquefaciens, B. amyloliquefaciens subsp. plantarum, Bacillus brevis, Bacillus circulans, Bacillus clausii, Bacillus coagulans, Bacillus firmus, Bacillus lautus, Bacillus lentus, Bacillus liche- niformis, Bacillus megaterium, Bacillus methylotrophicus, Bacillus pumi- lus, Bacillus safensis, Bacillus stearothermophilus, Bacillus subtilis e Ba- cillus thuringiensis.
33. Método para modificar o genoma de uma célula hospe- deira E. coli, sendo que o dito método é caracterizado pelo fato de que compreende fornecer a uma célula hospedeira E. coli que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9, de acordo com qualquer uma das reivindicações 1 a 6,
sendo que o RNA-guia e a variante de endonuclease Cas9 têm capaci- dade para formar um complexo (PGEN), sendo que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desen- rolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e, identificar pelo menos uma célula hospedeira E. coli, em que a pelo menos uma sequência-alvo de genoma foi modificada.
34. Método para modificar o genoma de uma célula hospe- deira fúngica, caracterizado pelo fato de que compreende fornecer a uma célula hospedeira fúngica que compreende pelo menos uma sequência-alvo a ser modificada, pelo menos um RNA- guia de ocorrência não natural e pelo menos uma variante de endonu- clease Cas9, de acordo com qualquer uma das reivindicações 1 a 6, sendo que o RNA-guia e a variante de endonuclease Cas9 têm capaci- dade para formar um complexo (PGEN), sendo que o dito complexo tem capacidade para reconhecer, se ligar e, opcionalmente, cortar, desen- rolar ou clivar toda ou parte da dita pelo menos uma sequência-alvo; e, identificar pelo menos uma célula hospedeira fúngica, sendo que a pelo menos uma sequência-alvo de genoma foi modificada.
BR112020011011-6A 2017-12-15 2018-12-11 variantes de cas9 e métodos de uso BR112020011011A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762599176P 2017-12-15 2017-12-15
US62/599,176 2017-12-15
PCT/US2018/064955 WO2019118463A1 (en) 2017-12-15 2018-12-11 Cas9 variants and methods of use

Publications (1)

Publication Number Publication Date
BR112020011011A2 true BR112020011011A2 (pt) 2020-11-17

Family

ID=65003497

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020011011-6A BR112020011011A2 (pt) 2017-12-15 2018-12-11 variantes de cas9 e métodos de uso

Country Status (10)

Country Link
US (2) US11781125B2 (pt)
EP (1) EP3707253A1 (pt)
JP (2) JP7384801B2 (pt)
KR (1) KR20200098578A (pt)
CN (1) CN111465689A (pt)
AU (1) AU2018386002A1 (pt)
BR (1) BR112020011011A2 (pt)
CA (1) CA3084191A1 (pt)
MX (1) MX2020005726A (pt)
WO (1) WO2019118463A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210148269A (ko) * 2019-04-05 2021-12-07 다니스코 유에스 인크. 선형 재조합 dna 작제물 및 이의 조성물을 이용하여 공여 dna 서열을 바실러스 게놈 내에 통합시키기 위한 방법
CN110272858B (zh) * 2019-07-18 2020-09-04 江南大学 一种高产l-乳酸的凝结芽孢杆菌及其应用
JP2022544573A (ja) * 2019-08-14 2022-10-19 ダニスコ・ユーエス・インク バチルス・リケニフォルミス(bacillus licheniformis)における増加したタンパク質産生のための組成物及び方法
JP2023524334A (ja) 2020-01-15 2023-06-12 ダニスコ・ユーエス・インク バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法
CN116601293A (zh) * 2020-12-07 2023-08-15 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法
CN113308451B (zh) * 2020-12-07 2023-07-25 中国科学院动物研究所 工程化的Cas效应蛋白及其使用方法

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
TW261517B (pt) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
HUT70467A (en) 1992-07-27 1995-10-30 Pioneer Hi Bred Int An improved method of agrobactenium-mediated transformation of cultvred soyhean cells
IL108241A (en) 1992-12-30 2000-08-13 Biosource Genetics Corp Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
BR9711795A (pt) 1996-03-26 2000-06-06 Razvant T Radulescu Peptìdeos tendo propriedades antiproliferativas
WO1998001575A1 (en) 1996-07-08 1998-01-15 Pioneer Hi-Bred International, Inc. Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
AU2001279254A1 (en) 2000-08-11 2002-02-25 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
EP2073013B1 (en) 2002-04-12 2016-01-06 Omeros Corporation Method of identifying transmembrane protein-interacting compounds
US20110059496A1 (en) 2003-06-25 2011-03-10 E. I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast
US7459546B2 (en) 2003-06-25 2008-12-02 E.I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase regulatory sequences for gene expression in oleaginous yeast
US7202356B2 (en) 2003-11-14 2007-04-10 E. I. Du Pont De Nemours And Company Fructose-bisphosphate aldolase regulatory sequences for gene expression in oleaginous yeast
US7264949B2 (en) 2004-09-15 2007-09-04 E.I. Du Pont De Nemours And Company Glycerol-3-phosphate o-acyltransferase promoter for gene expression in oleaginous yeast
US20060094102A1 (en) 2004-11-04 2006-05-04 Zhixiong Xue Ammonium transporter promoter for gene expression in oleaginous yeast
ATE473637T1 (de) 2005-08-26 2010-07-15 Danisco Verwendung der crispr assoziierten gene (cas)
WO2008007989A1 (en) 2006-07-11 2008-01-17 Grabania, Bogdan Head for directing objects, especially for displaying screens
US8680366B2 (en) 2007-06-07 2014-03-25 Agriculture And Agri-Food Canada Nanocarrier based plant transfection and transduction
US10030245B2 (en) 2011-03-23 2018-07-24 E I Du Pont De Nemours And Company Methods for producing a complex transgenic trait locus
WO2012135773A1 (en) 2011-03-31 2012-10-04 E. I. Du Pont De Nemours And Company Yarrowia diacylglycerol acyltransferase promoter regions for gene expression in yeast
WO2012135777A1 (en) 2011-04-01 2012-10-04 E. I. Du Pont De Nemours And Company Yarrowia esterase/lipase promoter regions for gene expression in yeast
EP2694657A1 (en) 2011-04-05 2014-02-12 E. I. Du Pont de Nemours and Company Yarrowia n-alkane-hydroxylating cytochrome p450 promoter regions for gene expression in yeast
EP2702148A1 (en) 2011-04-07 2014-03-05 E.I. Du Pont De Nemours And Company Yarrowia peroxisomal 2,4-dienoyl-coa reductase promoter regions for gene expression in yeast
US10266850B2 (en) 2012-05-25 2019-04-23 The Regents Of The University Of California Methods and compositions for RNA-directed target DNA modification and for RNA-directed modulation of transcription
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
DK3252160T3 (da) 2012-12-12 2021-02-01 Broad Inst Inc Systemer, fremgangsmåder og sammensætninger med crispr-cas-bestanddele til sekvensmanipulation
EP3036327B1 (en) 2013-08-22 2019-05-08 Pioneer Hi-Bred International, Inc. Genome modification using guide polynucleotide/cas endonuclease systems and methods of use
US10513711B2 (en) * 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
CA2966731C (en) 2014-11-06 2023-01-31 E. I. Du Pont De Nemours And Company Peptide-mediated delivery of rna-guided endonuclease into cells
AU2016263026A1 (en) 2015-05-15 2017-11-09 Pioneer Hi-Bred International, Inc. Guide RNA/Cas endonuclease systems
US20180208945A1 (en) 2015-07-28 2018-07-26 Danisco Us Inc. Genome editing systems and methods of use
AU2016341044B2 (en) 2015-10-20 2023-03-09 Pioneer Hi-Bred International, Inc. Restoring function to a non-functional gene product via guided Cas systems and methods of use
EP3368655B1 (en) 2015-10-30 2020-06-10 Danisco US Inc. Enhanced protein expression and methods thereof
SG11201804373VA (en) * 2015-12-04 2018-06-28 Novartis Ag Compositions and methods for immunooncology
US9946070B2 (en) 2016-03-08 2018-04-17 Sharp Kabushiki Kaisha Automotive head up display
EP3426780A1 (en) * 2016-03-11 2019-01-16 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
WO2018183808A1 (en) 2017-03-31 2018-10-04 Agenovir Corporation Antiviral therapeutic

Also Published As

Publication number Publication date
CA3084191A1 (en) 2019-06-20
AU2018386002A1 (en) 2020-05-28
JP2023011727A (ja) 2023-01-24
EP3707253A1 (en) 2020-09-16
JP7384801B2 (ja) 2023-11-21
US20200308561A1 (en) 2020-10-01
US11781125B2 (en) 2023-10-10
KR20200098578A (ko) 2020-08-20
MX2020005726A (es) 2020-08-13
WO2019118463A1 (en) 2019-06-20
US20240018497A1 (en) 2024-01-18
CN111465689A (zh) 2020-07-28
JP2021506257A (ja) 2021-02-22

Similar Documents

Publication Publication Date Title
JP7160891B2 (ja) ポリメラーゼII(Pol-II)ベースのガイドRNA発現のための方法および組成物
EP3390631B1 (en) Methods and compositions for t-rna based guide rna expression
US20240018497A1 (en) Cas9 variants and methods of use
EP3387134B1 (en) Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects
EP3362560B1 (en) Protected dna templates for gene modification and increased homologous recombination in cells and methods of use
Li et al. TALEN-mediated homologous recombination produces site-directed DNA base change and herbicide-resistant rice
Zhang et al. TALEN‐mediated targeted mutagenesis produces a large variety of heritable mutations in rice
Liu et al. High-efficiency thermal asymmetric interlaced PCR for amplification of unknown flanking sequences
CN116391038A (zh) 用于改善基因组编辑的工程化Cas内切核酸酶变体
US20200332306A1 (en) Type i-e crispr-cas systems for eukaryotic genome editing
Flaishman et al. Advanced molecular tools for breeding in Mediterranean fruit trees: Genome editing approach of Ficus carica L.
Anil Kumar et al. Pearl millet blast resistance: Current status and recent advancements in genomic selection and genome editing approaches
Rai et al. 8 CRISPR/Cas9 for Enhancing
Hassan et al. CRISPR/Cas-Mediated Genome Editing for Abiotic Stress Tolerance
CN117701589A (zh) 水稻基因OsBi1及其应用
Rai et al. CRISPR/Cas9 for Enhancing Resilience of Crops to Abiotic Stresses
BR102015029526A2 (pt) Plague resistant to prague, plant resistant plant production method and nucleic acid for plant transformation

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]