BR112021007123A2 - edição de base de dna programável pelas proteínas de fusão nme2cas9-desaminase - Google Patents

edição de base de dna programável pelas proteínas de fusão nme2cas9-desaminase Download PDF

Info

Publication number
BR112021007123A2
BR112021007123A2 BR112021007123-7A BR112021007123A BR112021007123A2 BR 112021007123 A2 BR112021007123 A2 BR 112021007123A2 BR 112021007123 A BR112021007123 A BR 112021007123A BR 112021007123 A2 BR112021007123 A2 BR 112021007123A2
Authority
BR
Brazil
Prior art keywords
nme2cas9
fact
protein
editing
deaminase
Prior art date
Application number
BR112021007123-7A
Other languages
English (en)
Inventor
Erik J. Sontheimer
Xin Gao
Aamir Mir
Alireza Edraki
Scot A. Wolfe
Pengpeng Liu
Original Assignee
University Of Massachusetts
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University Of Massachusetts filed Critical University Of Massachusetts
Publication of BR112021007123A2 publication Critical patent/BR112021007123A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14142Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

EDIÇÃO DE BASE DE DNA PROGRAMÁVEL PELAS PROTEÍNAS DE FUSÃO NME2CAS9-DESAMINASE. A presente invenção refere-se ao campo de edição de gene. Em particular, a edição de gene é direcionada à edição de base de nucleotídeo único. Por exemplo, tal edição de base de nucleotídeo único resulta em uma conversão de um par de bases CG para um par de bases TA. A alta precisão e exatidão e precisão do editor de gene de base de nucleotídeo único revelado atualmente é realizado por uma nuclease NmeCas9 que é fundida a uma proteína de nucleotídeo desaminase. A natureza compacta do NmeCas9 acoplado com um número maior de motivos adjacentes ao protoespaçador compatíveis proveem os construtos de fusão Cas9 contemplados aqui para ter uma janela de edição de gene que pode editar locais que não são direcionáveis por outras plataformas editoras base SpyCas9 convencionais.

Description

“EDIÇÃO DE BASE DE DNA PROGRAMÁVEL PELAS PROTEÍNAS DE FUSÃO NME2CAS9-DESAMINASE”
REFERÊNCIA CRUZADA A PEDIDO RELACIONADO
[001] O pedido reivindica prioridade ao Pedido de Patente Provisório Norte-Americano Nº 62/745.666, depositado em 15 de outubro de 2018, incorporado aqui por referência em sua totalidade.
CAMPO DA INVENÇÃO
[002] A presente invenção refere-se ao campo de edição de gene. Em particular, a edição de gene é direcionada à edição de base de nucleotídeo único. Por exemplo, tal edição de base de nucleotídeo único resulta em uma conversão de um par de bases C•G a um par de bases T•A. O alto rigor e precisão do editor de gene de base de nucleotídeo único divulgado atualmente é realizado por uma nuclease NmeCas9 que é fundida a uma proteína de nucleotídeo desaminase. A natureza compacta do NmeCas9 acoplado a um número maior de motivos adjacentes ao protoespaçador compatíveis provê os construtos de fusão de Cas9 contemplados aqui com tendo uma janela de edição de gene que pode editar sítios que não são direcionáveis por outras plataformas convencionais do editor de base de SpyCas9.
HISTÓRICO
[003] Muitas doenças humanas surgem devido à mutação de uma base única. A capacidade de corrigir tais aberrações genéticas é crucial no tratamento destes distúrbios genéticos. Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas (CRISPR) juntamente com proteínas (Cas) associadas a CRISPR compreendem um sistema imune adaptativo guiado por RNA em arqueas e bactérias. Estes sintomas proveem imunidade pelo direcionamento e inativação de ácidos nucleicos que se originam de elementos genéticos estranhos.
[004] As plataformas de edição de base de SpyCas9 não podem ser usadas para direcionar todas as mutações de base única devido a suas janelas de edição limitadas. A janela de edição é limitada em parte pela exigência de um NGG PAM e pela exigência de que as base(s) editadas tenham uma distância muito precisa do PAM. SpyCas9 também é intrinsicamente associado aos efeitos altamente inespecíficos na edição do genoma.
[005] O que é necessário na técnica é uma plataforma de edição de base única de Cas9 altamente precisa tendo uma especificidade alvo programável devido ao reconhecimento de uma população diversa de sítios de PAM.
SUMÁRIO DA INVENÇÃO
[006] A presente invenção refere-se ao campo da edição de gene. Em particular, a edição de gene é direcionada à edição de base de nucleotídeo único. Por exemplo, tal edição de base de nucleotídeo único resulta em uma conversão de um par de bases C•G a um par de bases T•A. O alto rigor e precisão do editor de gene de base de nucleotídeo único divulgado atualmente é realizado por uma nuclease NmeCas9 que é fundida a uma proteína de nucleotídeo desaminase. A natureza compacta do NmeCas9 acoplado a um número maior de motivos adjacentes ao protoespaçador compatíveis proveem os construtos de fusão de Cas9 contemplados aqui como tendo uma janela de edição de gene que é superior a outras plataformas convencionais do editor de base de SpyCas9.
[007] Em uma modalidade, a presente invenção contempla uma proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para uma sequência de nucleotídeo N4CC. Em uma modalidade, a dita proteína é Nme2Cas9. Em uma modalidade, a dita proteína compreende ainda uma proteína sinal de localização nuclear. Em uma modalidade, o dito nucleotídeo desaminase é uma citidina desaminase. Em uma modalidade, o dito nucleotídeo desaminase é uma adenosina desaminase. Em uma modalidade, uma proteína compreende ainda um inibidor de uracil glicosilase. Em uma modalidade, a dita proteína sinal de localização nuclear inclui, mas não é limitada a, nucleoplasmina (NLS) e/ou SV40 NLS e/ou C-myc NLS. Em uma modalidade, a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador. Em uma modalidade, o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação. Em uma modalidade, a dita mutação é uma mutação D16A. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda CBE4. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda um ligante. Em uma modalidade, o dito ligante é um ligante 73aa. Em uma modalidade, o dito ligante é um 3xHA-tag.
[008] Em uma modalidade, a presente invenção contempla um constructo, em que o dito construto é um nNme2Cas9-ABEmax otimizado.
[009] Em uma modalidade, a presente invenção contempla um construto, em que o dito construto é um nNme2Cas9-CBE4.
[0010] Em uma modalidade, a presente invenção contempla um construto, em que o dito construto é um YE1-BE3-nNme2Cas9 (D16A)-UGI.
[0011] Em uma modalidade, a presente invenção contempla um vírus adeno-associado compreendendo uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para uma sequência de nucleotídeo N4CC. Em uma modalidade, o dito vírus é um vírus adeno-associado 8. Em uma modalidade, o dito vírus é um vírus adeno-associado 6. Em uma modalidade, a dita proteína é Nme2Cas9. Em uma modalidade, a dita proteína compreende ainda uma proteína sinal de localização nuclear. Em uma modalidade, o dito nucleotídeo desaminase é uma citidina desaminase. Em uma modalidade, o dito nucleotídeo desaminase é uma adenosina desaminase. Em uma modalidade, uma proteína compreende ainda um inibidor de uracil glicosilase. Em uma modalidade, uma proteína sinal de localização nuclear inclui, mas não é limitada a, nucleoplasmina (NLS) e/ou SV40 NLS e/ou C-myc NLS. Em uma modalidade, a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador. Em uma modalidade, o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação. Em uma modalidade,
a dita mutação é uma mutação D16A. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda CBE4. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda um ligante. Em uma modalidade, o dito ligante é um ligante 73aa. Em uma modalidade, o dito ligante é um 3xHA- tag.
[0012] Em uma modalidade, a presente invenção contempla um construto, em que o dito construto é um nNme2Cas9-ABEmax otimizado.
[0013] Em uma modalidade, a presente invenção contempla um construto, em que o dito construto é um nNme2Cas9-CBE4.
[0014] Em uma modalidade, a presente invenção contempla um construto, em que o dito construto é um YE1-BE3-nNme2Cas9 (D16A)-UGI.
[0015] Em uma modalidade, a presente invenção contempla um método, compreendendo: a) provisão; i) uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC; ii) uma proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) contato da dita sequência de nucleotídeo com a dita proteína NmeCas9 mutada sob condições tais que a dita região de ligação se fixa a dita sequência de nucleotídeo N4CC; e c) substituição da dita base única mutada com uma base do tipo selvagem com a dita proteína NmeCas9 mutada. Em uma modalidade, a dita proteína é Nme2Cas9. Em uma modalidade, a dita proteína compreende ainda uma proteína sinal de localização nuclear. Em uma modalidade, o dito nucleotídeo desaminase é um citidina desaminase. Em uma modalidade, o dito nucleotídeo desaminase é uma adenosina desaminase. Em uma modalidade, uma proteína compreende ainda um inibidor de uracil glicosilase. Em uma modalidade, uma proteína sinal de localização nuclear inclui, mas não é limitada a, nucleoplasmina (NLS) e/ou SV40 NLS e/ou C-myc NLS. Em uma modalidade, a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador. Em uma modalidade, o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação. Em uma modalidade, a dita mutação é uma mutação D16A. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda CBE4. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda um ligante. Em uma modalidade, o dito ligante é um ligante 73aa. Em uma modalidade, o dito ligante é um 3xHA-tag. Em uma modalidade, o dito gene codifica uma tirosinase. Em uma modalidade, o dito gene é Fah. Em uma modalidade, o dito gene é c-fos.
[0016] Em uma modalidade, a presente invenção contempla um método, compreendendo: a) provisão de: i) um paciente compreendendo uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC, em que o dito gene mutado causa uma condição médica com base genética; ii) um vírus adeno-associado compreendendo uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) tratamento do dito paciente com o dito vírus adeno- associado sob condições tais que a dita proteína NmeCas9 mutada substitui a dita base única mutada com uma base do tipo selvagem única, tal que a dita condição médica com base genética não se desenvolve. Em uma modalidade, o dito gene codifica uma proteína tirosinase. Em uma modalidade, a dita condição médica com base genética é tirosinemia. Em uma modalidade, o dito vírus é um vírus adeno-associado 8. Em uma modalidade, o dito vírus é um vírus adeno- associado 6. Em uma modalidade, a dita proteína é Nme2Cas9. Em uma modalidade, a dita proteína compreende ainda uma proteína sinal de localização nuclear. Em uma modalidade, o dito nucleotídeo desaminase é uma citidina desaminase. Em uma modalidade, o dito nucleotídeo desaminase é uma adenosina desaminase. Em uma modalidade, uma proteína compreende ainda um inibidor de uracil glicosilase. Em uma modalidade, uma proteína sinal de localização nuclear inclui, mas não é limitada a, nucleoplasmina (NLS) e/ou SV40 NLS e/ou C-myc NLS. Em uma modalidade, a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador. Em uma modalidade, o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação. Em uma modalidade, a dita mutação é uma mutação D16A. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda CBE4. Em uma modalidade, a dita proteína NmeCas9 mutada compreende ainda um ligante. Em uma modalidade, o dito ligante é um ligante 73aa. Em uma modalidade, o dito ligante é um 3xHA-tag. Em uma modalidade, o dito gene codifica um tirosinase. Em uma modalidade, o dito gene é Fah. Em uma modalidade, o dito gene é c-fos.
[0017] Em uma modalidade, a presente invenção contempla um método, compreendendo: a) provisão de: i) um paciente compreendendo uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC, em que o dito gene mutado causa uma condição médica com base genética; ii) um nNme2Cas9-ABEmax otimizado, compreendendo uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) tratamento do dito paciente com o dito nNme2Cas9- ABEmax otimizado sob condições tais que a dita proteína NmeCas9 mutada substitui a dita base única mutada com uma base do tipo selvagem única, tal que a dita condição médica com base genética não se desenvolve.
[0018] Em uma modalidade, a presente invenção contempla um método, compreendendo: a) provisão de: i) um paciente compreendendo uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC, em que o dito gene mutado causa uma condição médica com base genética; ii) um nNme2Cas9-CBE4, compreendendo uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) tratamento do dito paciente com o dito nNme2Cas9-CBE4 sob condições tais que a dita proteína NmeCas9 mutada substitui a dita base única mutada com uma base do tipo selvagem única, tal que a dita condição médica com base genética não se desenvolve.
[0019] Em uma modalidade, a presente invenção contempla um método, compreendendo: a) provisão de: i) um paciente compreendendo uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC, em que o dito gene mutado causa uma condição médica com base genética; ii) um YE1-BE3-nNme2Cas9 (D16A)-UGI, compreendendo uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) tratamento do dito paciente com o dito nNme2Cas9-CBE4 sob condições tais que a dita proteína NmeCas9 mutada substitui a dita base única mutada com uma base do tipo selvagem única, tal que a dita condição médica com base genética não se desenvolve.
DEFINIÇÕES
[0020] Para facilitar o entendimento desta invenção, vários termos são definidos abaixo. Os termos definidos aqui têm os significados como comumente compreendido por uma pessoa versada nas áreas relevantes à presente invenção. Os termos tais como “um”, “uma” e “o/a” não são destinados a se referir somente à entidade singular, mas incluem a classe geral da qual um exemplo específico pode ser usado para ilustração. A terminologia aqui é usada para descrever modalidades específicas da invenção, mas seu uso não delimita a invenção, exceto como destacado nas reivindicações.
[0021] Como usado aqui, o termo “editar” “edição” ou “editado” se refere a um método de alteração de uma sequência de ácido nucleico de um polinucleotídeo (por exemplo, por exemplo, uma sequência de ácido nucleico de ocorrência natural do tipo selvagem ou uma sequência de ocorrência natural mutada) por deleção seletiva de um alvo genômico específico (on-target). Tal alvo genômico específico inclui, mas não é limitado a, uma região cromossômica, um gene, um promotor, uma estrutura de leitura aberta ou qualquer sequência de ácido nucleico.
[0022] Como usado aqui, o termo “base única” se refere a um, e somente um, nucleotídeo dentro de uma sequência de ácido nucleico. Quando usada no contexto da edição de base única, entende-se que a base em uma posição específica dentro da sequência de ácido nucleico é substituída com uma base diferente. Esta substituição pode ocorrer por muitos mecanismos, incluindo, entre outros, substituição ou modificação.
[0023] Como usado aqui, o termo “alvo” ou “sítio alvo” se refere a uma sequência de ácido nucleico pré-identificada de qualquer composição e/ou comprimento. Tais sítios alvo incluem, mas não são limitados a, uma região cromossômica, um gene, um promotor, uma estrutura de leitura aberta ou qualquer sequência de ácido nucleico. Em algumas modalidades, a presente invenção interroga estas sequências alvo genômicas específicas com sequências complementares de gRNA.
[0024] O termo “sequência de ligação específica” como usado aqui, se refere a uma subsequência de um alvo genômico específico que pode ser completamente complementar a um domínio de ligação de DNA programável e/ou uma sequência de RNA guia única.
[0025] O termo “sequência de ligação inespecífica (off-target)” como usado aqui, se refere a uma subsequência de um alvo genômico específico que pode ser parcialmente complementar a um domínio de ligação de DNA programável e/ou uma sequência de RNA guia única.
[0026] O termo “quantidade eficaz” como usado aqui, se refere a uma quantidade particular de uma composição farmacêutica compreendendo um agente terapêutico que alcança um resultado clinicamente benéfico (isto é, por exemplo, uma redução de sintomas). A toxicidade e eficácia terapêutica de tais composições podem ser determinadas por procedimentos farmacêuticos padrão nas culturas celulares ou animais experimentais, por exemplo, para a determinação da LD50 (a dose letal para 50% da população) e a ED50 (a dose terapeuticamente eficaz em 50% da população). A razão da dose entre efeitos tóxicos e terapêuticos é o índice terapêutico, e ele pode ser expresso como a razão LD50/ED50. Os compostos que exibem grandes índices terapêuticos índices arsão preferidos. Os dados obtidos destes ensaios de cultura celular e estudos com animais adicionais podem ser usados na formulação de uma faixa de dosagem para o uso humano. A dosagem de tais compostos se encontra preferivelmente dentro de uma faixa de concentrações em circulação que incluem a ED50 com pouca ou nenhuma toxicidade. A dosagem varia dentro desta faixa dependendo da forma de dosagem empregada, sensibilidade do paciente, e a vida de administração.
[0027] O termo “sintoma”, como usado aqui, se refere a qualquer evidência subjetiva ou objetiva de doença ou distúrbio físico observado pelo paciente. Por exemplo, a evidência subjetiva é usualmente com base na autodeclaração do paciente e pode incluir, mas não é limitada à dor, dor de cabeça, distúrbios visuais, náusea e/ou vômito. Alternativamente, a evidência objetiva é usualmente um resultado de teste médico incluindo, entre outros, temperatura corporal, hemograma completo, painéis de lipídios, painéis da tireoide, pressão arterial, frequência cardíaca, eletrocardiograma, exames de imagem de tecido e/ou corpo.
[0028] O termo “doença” ou “condição médica”, como usado aqui, se refere a qualquer comprometimento do estado normal do corpo animal ou vegetal vivo ou uma de suas partes que interrompe ou modifica o desempenho das funções vitais. Tipicamente manifestada por sinais e sintomas distintos, ela é usualmente uma resposta a: i) fatores ambientais (como má nutrição, riscos industriais, ou clima); ii) agentes infecciosos específicos (como vermes, bactérias ou vírus); iii) defeitos inerentes do organismo (como anomalias genéticas); e/ou iv) combinações destes fatores.
[0029] Os termos "reduzir," "inibir," "diminuir," "suprimir," "baixar," “prevenir” e equivalentes gramaticais (incluindo “inferior,” “menor,” etc.) quando em referência à expressão de qualquer sintoma em um indivíduo não tratado em relação a um indivíduo tratado, significa que a quantidade e/ou magnitude dos sintomas no indivíduo tratado é menor do que o indivíduo não tratado em qualquer quantidade que seja reconhecida como clinicamente relevante por qualquer pessoa treinada clinicamente. Em uma modalidade, a quantidade e/ou magnitude dos sintomas no indivíduo tratado é pelo menos 10% menor do que, pelo menos 25% menor do que, pelo menos 50% menor do que, pelo menos 75% menor do que, e/ou pelo menos 90% menor do que a quantidade e/ou magnitude dos sintomas no indivíduo não tratado.
[0030] O termo "fixado" como usado aqui, se refere a qualquer interação entre um meio (ou veículo) e um fármaco. A fixação pode ser reversível ou irreversível. Tal fixação inclui, mas não é limitada à ligação covalente, ligação iônica, forças Van der Waals ou fricção, e os similares. Um fármaco é fixado a um meio (ou veículo) se ele for impregnado, incorporado, revestido, em suspensão com, em solução com, misturado com, etc.
[0031] O termo "fármaco" ou "composto" como usado aqui, se refere a qualquer substância farmacologicamente ativa capaz de ser administrada que alcance um efeito desejado. Fármacos ou compostos podem ser sintéticos ou de ocorrência natural, não peptídeo, proteínas ou peptídeos, oligonucleotídeos ou nucleotídeos, polissacarídeos ou açúcares.
[0032] O termo "administrado" ou "administração", como usado aqui, se refere a qualquer método de provisão de uma composição a um paciente tal que a composição tenha seu efeito pretendido sobre o paciente. Um método de administração exemplar é por um mecanismo direto tal como administração do tecido local (isto é, por exemplo, colocação extravascular), ingestão oral, emplastro transdérmico, tópica, inalação, supositório etc.
[0033] O termo "paciente" ou “indivíduo”, como usado aqui, é um ser humano ou animal e não precisa ser hospitalizado. Por exemplo, pacientes ambulatoriais, pessoas em lares de idosos são "pacientes". Um paciente pode compreender qualquer idade de um animal humano ou não humano e, portanto, inclui tanto adultos quanto jovens (isto é, crianças). Não se deseja que o termo "paciente" conote uma necessidade de tratamento médico, portanto, um paciente pode voluntariamente ou involuntariamente ser parte de experimentos seja clínicos ou em apoio a estudos básicos da ciência.
[0034] O termo “afinidade” como usado aqui, se refere a qualquer força atrativa entre substâncias ou partículas que as faça entrar em e permanecer na combinação química. Por exemplo, um composto inibidor que tenha uma alta afinidade com um receptor proverá maior eficácia na prevenção de que o receptor interaja com seus ligantes naturais, do que um inibidor com uma baixa afinidade.
[0035] O termo "farmaceuticamente" ou "farmacologicamente aceitáveis", como usado aqui, se referem a entidades e composições moleculares que não produzem reações adversas, alérgicas ou outras reações desagradáveis quando administradas a um animal ou um ser humano.
[0036] O termo, "veículo farmaceuticamente aceitável", como usado aqui, inclui qualquer e todos os solventes, ou um meio de dispersão incluindo, entre outros, água, etanol, poliol (por exemplo, glicerol, propilenoglicol, e polietileno glicol líquido, e os similares), misturas adequadas dos mesmos, e óleos vegetais, revestimentos, agentes isotônicos e de retardo de absorção, lipossoma, limpadores comercialmente disponíveis, e os similares. Ingredientes bioativos suplementares também podem ser incorporados em tais veículos.
[0037] O termo “vetor viral” abrange qualquer construto de ácido nucleico derivado de um genoma do vírus capaz de incorporar sequências de ácido nucleico heterólogas para expressão em um organismo hospedeiro. Por exemplo, tais vetores virais podem incluir, mas não são limitados a, vetores virais adeno-associados, vetores lentivirais, vetores virais SV40, vetores retrovirais, vetores adenovirais. Embora vetores virais sejam ocasionalmente criados de vírus patogênicos, eles podem ser modificados de tal maneira a minimizar seu risco geral à saúde. Isto usualmente envolve a deleção de uma parte do genoma viral envolvido com a replicação viral. Tal vírus pode infectar eficientemente as células, mas, uma vez que a infecção tenha ocorrido, o vírus pode exigir um vírus auxiliar para prover as proteínas perdidas para a produção de novos vírions. Preferivelmente, vetores virais devem ter um efeito mínimo sobre a fisiologia da célula que ele infecta e exibem propriedades geneticamente estáveis (por exemplo, não sofrem rearranjo espontâneo do genoma). A maioria dos vetores virais é projetada para infectar a maior variedade possível de tipos de células. Mesmo assim, um receptor viral pode ser modificado para direcionar o vírus para um tipo específico de célula. Diz-se que os vírus modificados desta maneira são pseudotipados. Vetores virais são, frequentemente, projetados para incorporar certos genes que ajudam a identificar quais células absorveram os genes virais. Estes genes são denominados genes marcadores. Por exemplo, um gene marcador comum confere resistência antibiótica a um certo antibiótico.
[0038] Como usado aqui, o “gene ROSA26” ou “gene Rosa26” se refere a um sítio humano ou de camundongo (respectivamente) que é amplamente usado para a obtenção da expressão generalizada no camundongo. O direcionamento para o sítio de ROSA26 pode ser alcançado pela introdução de um gene desejado no primeiro íntron do sítio, em um sítio Xbal único aproximadamente 248 pb a montante da linha de armadilha de gene original. Um construto pode ser construído usando um aceitante de splice de adenovírus seguido por um gene de interesse e um sítio de poliadenilação inserido no sítio Xbal único. Um cassete de resistência de neomicina também pode ser incluído no vetor de direcionamento.
[0039] Como usado aqui, o “gene PCSK9” ou “gene Pcsk9” se refere a um sítio humano ou de camundongo (respectivamente) que codifica uma proteína PCSK9. O gene PCSK9 reside no cromossoma 1 na banda 1p32.3 e inclui 13 éxons. Este gene pode produzir pelo menos duas isoformas através do splicing alternativo.
[0040] O termo “pró-proteína convertase subtilisina / kexina tipo 9” e “PCSK9” se refere a uma proteína codificada por um gene que modula níveis de lopoproteína de baixa densidade. A pró-proteína convertase subtilisina / kexina tipo 9, também conhecida como PCSK9, é uma enzima que em seres humanos é codificada pelo gene PCSK9. Seidah et al., "The secretory proprotein convertase neural apoptosis-regulated convertase 1 (NARC-1): liver regeneration and neuronal differentiation" Proc. Natl. Acad. Sci. U.S.A. 100 (3): 928–933 (2003). Os genes (ortólogos) similares são encontrados em muitas espécies. Muitas enzimas, incluindo PSCK9, são inativas quando elas são sintetizadas pela primeira vez, porque elas têm uma seção de cadeias de peptídeo que bloqueia sua atividade; a pró-proteína convertases removem aquela seção para ativar a enzima. Acredita-se que PSCK9 desempenha um papel regulador na homeostase do colesterol. Por exemplo, PCSK9 pode se ligar ao domínio de repetição A similar ao fator de crescimento epidérmico (EGF-A) do receptor de lipoproteína de baixa densidade (LDL-R) resultando em internalização e degradação de LDL-R. Claramente, seria esperado que níveis reduzidos de LDL-R resultassem em metabolismo diminuído de LDL-C, o que poderia levar à hipercolesterolemia.
[0041] O termo “hipercolesterolemia” como usado aqui, se refere a qualquer condição médica em que os níveis de colesterol no sangue são elevados acima dos níveis clinicamente recomendados. Por exemplo, se o colesterol for medido usando lipoproteínas de baixa densidade (LDLs), a hipercolesterolemia pode existir se os níveis de LDL medidos estiverem acima de, por exemplo, aproximadamente 70 mg/dl. Alternativamente, se o colesterol for medido usando colesterol plasmático livre, a hipercolesterolemia pode existir se os níveis de colesterol livre medidos estiverem acima de, por exemplo, aproximadamente 200-220 mg/dl.
[0042] Como usado aqui, o termo “CRISPRs” ou “Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas” se refere a um acrônimo para sítios de DNA que contêm repetições múltiplas, curtas, diretas de sequências de base. Cada repetição contém uma série de bases seguido por mais ou menos 30 pares de base conhecidos como "DNA espaçador". Os espaçadores são segmentos curtos de DNA de um vírus e podem servir como uma 'memória' de exposições passadas para facilitar uma defesa adaptativa contra invasões futuras.
[0043] Como usado aqui, o termo “Cas” ou “(cas) associado a CRISPR” se refere a genes frequentemente associados a matrizes de espaçadores de repetição CRISPR.
[0044] Como usado aqui, o termo “Cas9” se refere a uma nuclease de sistemas CRISPR do tipo II, uma enzima especializada para a geração de rompimentos de filamento duplo em DNA, com dois sítios de corte ativo (os domínios HNH e RuvC), um para cada filamento de hélice dupla. Jinek combinou tracrRNA e RNA espaçador em uma molécula de "RNA guia único" (sgRNA) que, misturada com Cas9, poderia encontrar e clivar alvos de DNA através do pareamento de Watson-Crick entre a sequência guia dentro do sgRNA e a sequência de DNA alvo.
[0045] O termo “motivo adjacente ao protoespaçador” (ou PAM) como usado aqui, se refere a uma sequência de DNA que pode ser exigida para um Cas9/sgRNA para formar um R-loop para interrogar uma sequência de DNA específica através do pareamento de Watson-Crick deste RNA guia com o genoma. A especificidade de PAM pode ser uma função da especificidade de ligação de DNA da proteína Cas9 (por exemplo, um “domínio de reconhecimento do motivo adjacente ao protoespaçador” no término C de Cas9).
[0046] Como usado aqui, o termo “sgRNA” se refere um RNA guia único usado em conjunto com sistemas associados a CRISPR (Cas). sgRNAs são uma fusão de crRNA e tracrRNA e contêm nucleotídeos de sequência complementar ao sítio alvo desejado. Jinek et al., “A programmable dual-RNA- guided DNA endonuclease in adaptive bacterial immunity” Science 337(6096):816-821 (2012). O pareamento de Watson-Crick do sgRNA com o sítio alvo permite a formação de R-loop, que em conjunto com um PAM funcional permite a clivagem do DNA ou no caso de Cas9 deficiente em nuclease permite ligações ao DNA naquele sítio.
[0047] Como usado aqui, o termo “proteína fluorescente” se refere a um domínio de proteína que compreende pelo menos uma porção de composto orgânico que emite luz fluorescente em resposta aos comprimentos de onda apropriados. Por exemplo, proteínas fluorescentes podem emitir luz vermelha, azul e/ou verde. Tais proteínas são prontamente e comercialmente disponíveis incluindo, entre outros: i) mCherry (Clonetech Laboratories): excitação: 556/20 nm (comprimento de onda/comprimento de banda); emissão: 630/91 nm; ii) sfGFP (Invitrogen): excitação: 470/28 nm; emissão: 512/23 nm; iii) TagBFP (Evrogen): excitação 387/11 nm; emissão 464/23 nm.
[0048] Como usado aqui, o termo “sgRNA” se refere a RNA guia único usado em conjunto com sistemas associados a CRISPR (Cas). sgRNAs contém nucleotídeos de sequência complementar ao sítio alvo desejado. O pareamento de Watson-crick do sgRNA com o sítio alvo recruta o Cas9 deficiente em nuclease para ligar o DNA naquele sítio.
[0049] Como usado aqui, o termo “ortogonal” se refere a alvos que são de não sobreposição, não correlacionados ou independentes. Por exemplo, se dois genes ortogonais Cas9 deficiente em nuclease fundidos a diferentes domínios efetores forem implementados, os sgRNAs codificados para cada um que não interagiriam ou se sobreporiam. Nem todos os genes Cas9 deficientes em nuclease operam da mesma forma, o que possibilita que o uso de gene ortogonal Cas9 deficiente em nuclease fundido a diferentes domínios efetores proveja os sgRNAs ortogonais apropriados.
[0050] Como usado aqui, o termo “mudança fenotípica” ou “fenótipo” se refere ao compósito de características ou traços observáveis em um organismo, tais como sua morfologia, desenvolvimento, propriedades bioquímicas ou fisiológicas, fenologia, comportamento e produtos de comportamento. Os fenótipos resultam da expressão de genes de um organismo assim como a influência de fatores ambientais e as interações entre os dois.
[0051] "Sequência de ácido nucleico" e "sequência de nucleotídeo" como usado aqui se referem a um oligonucleotídeo ou polinucleotídeo, e fragmentos ou porções dos mesmos, e ao DNA ou RNA de origem genômica ou sintética que podem ser de filamento único ou filamento duplo e representam o filamento sentido ou antissentido.
[0052] O termo "um ácido nucleico isolado”, como usado aqui, se refere a qualquer molécula de ácido nucleico que foi removida de seu estado natural (por exemplo, removida de uma célula e é, em uma modalidade preferida, livre de outro ácido nucleico genômico).
[0053] Os termos "sequência de aminoácidos" e "sequência de polipeptídeo" como usados aqui, são intercambiáveis e se referem a uma sequências de aminoácidos.
[0054] Como usado aqui o termo "porção" quando em referência a uma proteína (como em "uma porção de uma proteína dada") se refere a fragmentos daquela proteína. Os fragmentos podem variar em tamanho de quatro resíduos de aminoácido à sequências de aminoácidos inteira menos um aminoácido.
[0055] O termo "porção" quando usado em referência a uma sequência de nucleotídeo se refere a fragmentos daquela sequência de nucleotídeo. Os fragmentos podem variar em tamanho de 5 resíduos de nucleotídeo à sequência de nucleotídeo inteira menos um resíduo de ácido nucleico.
[0056] Como usado aqui, os termos "complementar" ou "complementaridade" são usados em referência a "polinucleotídeos" e "oligonucleotídeos" (que são termos intercambiáveis que se referem a uma sequência de nucleotídeos) relacionados pelas regras de pareamento de base. Por exemplo, a sequência "C-A-G-T," é complementar à sequência "G-T-C-A." a complementaridade pode ser "parcial" ou "total". A complementaridade "parcial" é onde uma ou mais bases de ácido nucleico não são combinadas de acordo com as regras de pareamento de base. A complementaridade "total" ou "completa" entre ácidos nucleicos é onde toda e qualquer base de ácido nucleico é combinada com outra base sob as regras de pareamento de base. O grau de complementaridade entre os filamentos de ácido nucleico tem efeitos significativos sobre a eficiência e resistência da hibridização entre filamentos de ácido nucleico. Isto é de particular importância em reações de amplificação, assim como métodos de detecção que dependem da ligação entre ácidos nucleicos.
[0057] Os termos "homologia" e "homóloga" como usado aqui em referência à sequência de nucleotídeos se referem a um grau de complementaridade com outras sequências de nucleotídeos. Pode haver homologia parcial ou homologia completa (isto é, identidade). Uma sequência de nucleotídeo que é parcialmente complementar, isto é, "substancialmente homóloga," a uma sequência de ácido nucleico é uma que pelo menos parcialmente inibe uma sequência completamente complementar de hibridizar em uma sequência de ácido nucleico alvo. A inibição de hibridização da sequência completamente complementar na sequência alvo pode ser examinada usando um ensaio de hibridização (Southern ou Northern blot, hibridização da solução e os similares) sob condições de baixa estringência. Uma sequência ou sonda substancialmente homóloga competirá por e inibirá a ligação (isto é, a hibridização) de uma sequência completamente homóloga a uma sequência alvo sob condições de baixa estringência. Isto não significa que condições de baixa estringência são tais que ligação não específica seja permitida; condições de baixa estringência exigem que a ligação de duas sequências uma a outra seja uma interação específica (isto é, seletiva). A ausência de ligação não específica pode ser testada pelo uso de uma segunda sequência alvo que carece de um grau mesmo que parcial de complementaridade (por exemplo, menos do que cerca de 30% de identidade); na ausência de ligação não específica, a sonda não hibridizirá no segundo alvo não complementar.
[0058] Os termos “homologia” e “homóloga” como usado aqui em referência às sequências de aminoácidos se referem ao grau de identidade da estrutura primária entre duas sequências de aminoácidos. Tal grau de identidade pode ser direcionado a uma porção de cada sequência de aminoácidos, ou ao comprimento total da sequência de aminoácidos. Duas ou mais sequências de aminoácidos que são “substancialmente homólogas” podem ter pelo menos 50% de identidade, preferivelmente pelo menos 75% de identidade, mais preferivelmente pelo menos 85% de identidade, mais preferivelmente pelo menos 95%, ou 100% de identidade.
[0059] Uma sequência de oligonucleotídeo que é um "homólogo" é definida aqui como uma sequência de oligonucleotídeo que exibe mais do que ou igual a 50% de identidade com uma sequência, quando sequências tendo um comprimento de 100 pb ou maior são comparadas.
[0060] Condições de baixa estringência compreendem condições equivalentes à ligação ou hibridização a 42°C em uma solução consistindo em 5 x SSPE (43,8 g/l NaCl, 6,9 g/l NaH2PO4·H2O e 1,85 g/l EDTA, pH ajustado a 7,4 com NaOH), 0,1% de SDS, 5x reagente Denhardt {50x Denhardt's contém por 500 ml: 5 g de Ficoll (Tipo 400, Pharmacia), 5 g de BSA (Fração V; Sigma)} e 100 μg/ml de DNA de esperma de salmão desnaturado seguido por lavagem em uma solução compreendendo 5x SSPE, 0,1% de SDS a 42°C quando uma sonda de cerca de 500 nucleotídeos em comprimento é empregada. Numerosas condições equivalentes também podem ser empregadas para compreender condições de baixa estringência; fatores tais como o comprimento e natureza (DNA, RNA, composição base) da sonda e natureza do alvo (DNA, RNA, composição base, presente em solução ou imobilizada, etc.) e a concentração dos sais e outros componentes (por exemplo, a presença ou ausência de formamida, sulfato de dextrano, polietileno glicol), assim como componentes da solução de hibridização podem ser variados para gerar condições de hibridização de baixa estringência diferentes de, mas equivalentes às condições listadas acima. Além disso, condições que promovem a hibridização sob condições de alta estringência (por exemplo, aumentando a temperatura da hibridização e/ou etapas de lavagem, o uso de formamida na solução de hibridização, etc.) também podem ser usadas.
[0061] Como usado aqui, o termo "hibridização" é usado em referência ao pareamento de ácidos nucleicos complementares usando qualquer processo pelo qual um filamento de ácido nucleico se una com um filamento complementar através de pareamento de base para formar um complexo de hibridização. A hibridização e a resistência de hibridização (isto é, a resistência da associação entre os ácidos nucleicos) são impactadas por tais fatores como o grau de complementaridade entre os ácidos nucleicos, estringência das condições envolvidas, a Tm do híbrido formado, e a razão G:C dentro dos ácidos nucleicos.
[0062] Como usado aqui, o termo "complexo de hibridização" se refere a um complexo formado entre duas sequências de ácidos nucleicos em virtude da formação de ligações de hidrogênio entre bases G e C complementares e entre bases A e T complementares; estas ligações de hidrogênio podem ser ainda estabilizadas por interações de empilhamento de bases. As duas sequências de ácidos nucleicos complementares ligação de hidrogênio em uma configuração antiparalelo. Um complexo de hibridização pode ser formado em solução (por exemplo, análise de C0 t ou R0 t) ou entre uma sequência de ácido nucleico presente em solução e outra sequência de ácido nucleico imobilizada em um suporte sólido (por exemplo, uma membrana de náilon ou um filtro de nitrocelulose como empregado em Southern e Northern blotting, dot blotting ou uma lâmina de vidro como empregado em hibridização in situ, incluindo FISH (hibridização fluorescente in situ)).
[0063] Diz-se que as moléculas de DNA têm "extremidades 5' " e "extremidades 3'" porque os mononucleotídeos são reagidos para fazer oligonucleotídeos de maneira tal que o 5' fosfato de um anel de mononucleotídeo pentose é fixado ao 3' oxigênio de seu vizinho em uma direção por meio de uma ligação de fosfodiéster. Portanto, uma extremidade de um oligonucleotídeo é referida como a "extremidade 5’" se seu 5' fosfato não está ligado ao 3' oxigênio de um anel de mononucleotídeo pentose. Uma extremidade de um oligonucleotídeo é referida como a "extremidade 3’" se seu 3' oxigênio não estiver ligado a um 5' fosfato de outro anel de mononucleotídeo pentose. Como usado aqui, também se pode dizer que uma sequência de ácido nucleico, mesmo se interna a um oligonucleotídeo maior, tenha extremidades 5’ e 3’. Em uma molécula de DNA linear ou circular, elementos discretos são referidos como sendo elementos "a montante" ou 5' do "a jusante" ou 3'. Esta terminologia reflete o fato de que a transcrição prossegue de uma maneira 5' a 3' ao longo do filamento de DNA. O promotor e elementos intensificadores que direcionam a transcrição de um gene ligado são geralmente localizados 5' ou a montante da região de codificação. No entanto, elementos intensificadores podem exercer seu efeito mesmo quando localizado 3' do elemento promotor e a região de codificação. Os sinais de término da transcrição e poliadenilação são localizados 3' ou a jusante da região de codificação.
[0064] O termo "transfecção" ou "transfectado" se refere à introdução de DNA estranho dentro de uma célula.
[0065] Como usado aqui, os termos "codificação da molécula de ácido nucleico", "codificação da sequência de DNA," e "codificação de DNA" se referem à ordem ou sequência de desoxirribonucleotídeos ao longo de um filamento de ácido desoxirribonucleico. A ordem destes desoxirribonucleotídeos determina a ordem de aminoácidos ao longo da cadeia de polipeptídeo (proteína). A sequência de DNA, assim, codifica a sequência de aminoácidos.
[0066] Como usado aqui, o termo "gene" significa as sequências de desoxirribonucleotídeo compreendendo a região de codificação de um gene estrutural e incluindo sequências localizadas adjacentes à região de codificação em ambas as extremidades 5’ e 3’ por uma distância de cerca de 1 kb em ambas as extremidades tal que o gene corresponde ao comprimento do mRNA de comprimento total. As sequências que são localizadas 5' da região de codificação e que estão presentes no mRNA são referidas como sequências não traduzidas 5'. As sequências que são localizadas 3' ou a jusante da região de codificação e que estão presentes no mRNA são referidas como sequências não traduzidas 3’. O termo "gene" abrange ambos cDNA e formas genômicas de um gene. Uma forma genômica ou clone de um gene contém a região de codificação interrompida com sequências de não codificação denominadas "íntrons" ou "regiões de intervenção" ou "sequências de intervenção". Íntrons são segmentos de um gene que são transcritos em RNA heterogêneo nuclear (hnRNA); íntrons podem conter elementos reguladores tais como intensificadores. Íntrons são removidos ou "spliced out" do transcrito nuclear ou primário; íntrons, portanto, estão ausentes no transcrito de RNA mensageiro (mRNA). O mRNA funciona durante a translação para especificar a sequência ou ordem de aminoácidos em um polipeptídeo nascente.
[0067] Além de conter íntrons, as formas genômicas de um gene também podem incluir sequências localizadas em ambas a extremidade 5' e 3’ das sequências que estão presentes no transcrito de RNA. Estas sequências são referidas como sequências ou regiões "de flanqueamento" (estas sequências de flanqueamento são localizadas 5' ou 3' em relação às sequências não traduzidas presentes no transcrito de mRNA). A região de flanqueamento 5' pode conter sequências reguladoras tais como promotores e intensificadores que controlam ou influenciam a transcrição do gene. A região de flanqueamento 3' pode conter sequências que direcionam o término da transcrição, clivagem pós-transcricional e poliadenilação.
[0068] O termo "marcador" ou "marcador detectável" são usados aqui para se referir a qualquer composição detectável por meios espectroscópicos, fotoquímicos, bioquímicos, imunoquímicos, elétricos, ópticos ou químicos. Tais marcadores incluem biotina para a coloração com conjugado de estreptavidina marcado, contas magnéticas (por exemplo, Dynabeads®), corantes fluorescentes (por exemplo, fluoresceína, vermelho texas, rodamina, proteína fluorescente verde e os similares), radiomarcadores (por exemplo, 3H, 125I, 35S, 14C, ou 32P), enzimas (por exemplo, peroxidase de rábano silvestre, fosfatase alcalina e outros comumente usados em um ELISA), e marcadores calorimétricos tais como contas de ouro coloidal ou vidro ou plástico colorido (por exemplo, poliestireno, polipropileno, látex, etc.). as patentes ensinando o uso de tais marcadores incluem, mas não são limitados à Patentes Norte-Americanas Nº 3.817.837; 3.850.752; 3.939.350; 3.996.345; 4.277.437; 4.275.149; e
4.366.241 (todas aqui incorporadas por referência em sua totalidade). Os marcadores contemplados na presente invenção podem ser detectados por muitos métodos. Por exemplo, radiomarcadores podem ser detectados usando filme fotográfico ou contadores de cintilação, marcadores fluorescentes podem ser detectados usando um fotodetector para detectar a luz emitida. Os marcadores enzimáticos são tipicamente detectados pela provisão da enzima com um substrato e detecção, o produto de reação produzido pela ação da enzima sobre o substrato, e os marcadores calorimétricos são detectados pela simples visualização do marcador colorido.
BREVE DESCRIÇÃO DOS DESENHOS
[0069] O arquivo de patente ou pedido contém pelo menos um desenho executado em cores. As cópias desta publicação de patente ou pedido de patente com desenho(s) colorido serão providas pelo Escritório mediante a solicitação e pagamento da taxa necessária.
[0070] A figura 1 ilustra modalidades esquemáticas exemplares de um editor de base única de proteína de fusão de NmeCas9 desaminase e plasmídeos construídos exemplares de editores de base.
[0071] A figura 1A mostra um construto exemplar YE1-BE3- nNme2Cas9 (D16A)-UGI.
[0072] A figura 1B mostra um construto exemplar ABE7.10 nNme2Cas9 (D16A).
[0073] A figura 1C mostra um construto exemplar ABE7.10- nNme2Cas9 (D16A) compreendendo duas sequências SV40 NLS.
[0074] A figura 1D mostra um construto exemplar nNme2Cas9- CBE4 (também chamado de um BE4-nNme2Cas9 (D16A)-UGI-UGI).
[0075] A figura 1E mostra um construto otimizado exemplar nNme2Cas9-ABEmax.
[0076] A figura 2 apresenta dados exemplares da eletroporação de células HEK293T com plasmídeos de DNA compreendendo uma proteína de fusão de YE1-BE3-nNme2Cas9 (D16A)-UGI que converte eficientemente C em T no sítio alvo endógeno 25 (TS25) em células HEK293T por meio de nucleofecção.
[0077] A figura 2A mostra sequências exemplares para um sítio alvo endógeno TS25 (dentro do retângulo preto). Pares de base GN23 sgRNA com o filamento de DNA alvo, deixando o filamento de DNA deslocado para citidina desaminase editar (por exemplo, novos nucleotídeos verdes).
[0078] A figura 2B mostra dados de sequenciamento exemplares mostrando um pico dupleto de nucleotídeo (7th posição da extremidade 5’; seta) demonstrando a edição de base única bem-sucedida de uma citidina em uma timidina (por exemplo, uma conversão do par de bases C•G em um par de bases T•A).
[0079] A figura 2C mostra uma quantificação exemplar dos dados mostrados na Figura 2B representando a conversão percentual da edição de base única C → T. O percentual de C convertido em T é cerca de 40% na amostra tratada com editor de base e sgRNA (valor p = 6,88 x 10-6). O controle “nenhum sgRNA” exibe o ruído de fundo devido ao sequenciamento Sanger. EditR (Kluesner et al., 2018) foi usado para realizar a análise.
[0080] A figura 3 apresenta sítios alvo UGI específicos exemplares que foram, respectivamente, integrados nas proteínas de fusão mutantes YE1- BE3-nNme2Cas9/D16A e co-expressos com proteína fluorescente verde intensificada (EGFP) em uma linhagem celular derivada de K562 estável. As bases convertidas são destacadas em cor laranja. Os sinais de fundo foram filtrados usando amostras de controle negativo (células K562 nucleofectadas YE1-BE3-nNme2Cas9 sem construtos de sgRNA). N4CC PAMs estão dentro de uma caixa. O percentual de leituras totais exibindo mutações em sítios direcionados ao editor de base é mostrado na coluna da direita.
[0081] A figura 3A mostra um sítio de EGFP 1 exemplar.
[0082] A figura 3B mostra um sítio de EGFP 2 exemplar.
[0083] A figura 3C mostra um sítio de EGFP 3 exemplar.
[0084] A figura 3D mostra um sítio de EGFP 4 exemplar.
[0085] A figura 3E mostra uma análise de sequenciamento profundo exemplar indicando onde YE1-BE3-nNme2Cas9 converte resíduos C a resíduos T na região promotora c-fos endógena. O percentual de leituras totais exibindo mutações em sítios direcionados ao editor de base é mostrado na coluna da direita. As bases convertidas são destacadas na cor laranja ou amarelo. Os sinais de fundo foram filtrados usando amostras de controle negativo. O maior percentual de edição é 32,50%.
[0086] A figura 3F mostra uma análise de sequenciamento profundo exemplar indicando onde ABE7.10-nNme2Cas9 ou ABEmax (Koblan et al., 2018)-nNme2Cas9 converte resíduos A em resíduos G na região promotora endógena c-fos. O percentual de leituras totais exibindo mutações em sítios direcionados ao editor de base é mostrado na coluna da direita. As bases convertidas são destacadas na cor laranja. Os sinais de ruído foram filtrados usando amostras de controle negativo. O percentual de edição é 0,53% por ABE7.10-nNme2Cas9 ou 2,33% por ABEmax-nNme2Cas9 (D16A).
[0087] A figura 4 apresenta um alinhamento exemplar do gene do tipo selvagem Fah com o gene mutante de tirosinemia Fah mostrando um sítio alvo de edição de gene de base único A-G (posição 9). O respectivo sítio PAM único SpyCas9 e sítios PAM duplos NmeCas9 são indicados para demonstrar a janela de direcionamento subótima em relação ao sítio PAM SpyCas9.
[0088] A figura 5 ilustra três ortólogos de Cas9 Neisseria meningitidis intimamente relacionados que têm PAMs distintos.
[0089] A figura 5A mostra um esquema exemplar mostrando resíduos mutados (esferas laranja) entre Nme2Cas9 (esquerda) e Nme3Cas9 (direita) mapeado sobre a estrutura predita de Nme1Cas9, revelando o grupamento de mutações no PID (preto).
[0090] A figura 5B mostra um fluxo de trabalho experimental exemplar do ensaio de descoberta de PAM in vitro com uma região de PAM randomizada de 10 pb. Após a digestão in vitro, adaptadores foram ligados a produtos clivados para a construção e sequenciamento da biblioteca.
[0091] A figura 5C mostra logos de sequência exemplares resultantes de descoberta de PAM in vitro revelando o enriquecimento de um PAM N4GATT para Nme1Cas9, consistente com sua especificidade estabelecida anteriormente.
[0092] A figura 5D mostra logos de sequência exemplares indicando que Nme1Cas9 com seu PID trocado por aquele de Nme2Cas9
(esquerda) ou Nme3Cas9 (direita) exige um C na posição 5 de PAM. Os nucleotídeos restantes não foram determinados com alta confiança devido à modesta eficiência de clivagem das quimeras de proteína trocadas por PID (vide a Figura 6C).
[0093] A figura 5E mostra uma sequência logo exemplar mostrando que o Nme2Cas9 de comprimento total reconhece um PAM N4CC, baseado na clivagem do substrato eficiente de um pool alvo com um C fixo na posição 5 de PAM, e com PAM nts 1-4 e 6-8 randomizados.
[0094] A figura 6 apresenta uma caracterização de ortólogos de Cas9 Neisseria meningitidis com PIDs de evolução rápida, como relacionado à Figura 5.
[0095] A figura 6A mostra uma árvore filogenética não enraizada exemplar de ortólogos de NmeCas9 que são >80% idênticos a Nme1Cas9. Três ramificações distintas surgiram, com a maioria das mutações agrupadas no PID. O grupos 1 (azul), 2 (laranja), e 3 (verde) têm PIDs com >98%, ~52%, e ~86% de identidade com Nme1Cas9, respectivamente. Três ortólogos de Cas9 representativos (um de cada grupo) (Nme1Cas9, Nme2Cas9 e Nme3Cas9) são indicados.
[0096] A figura 6B mostra um esquema exemplar mostrando os sítios de CRISPR-cas das cepas que codificam os três ortólogos de Cas9 (Nme1Cas9, Nme2Cas9, e Nme3Cas9) de (A). As identidades percentuais de cada componente CRISPR-Cas com N. meningitidis 8013 (codificando Nme1Cas9) são mostradas. As setas azuis e vermelhas denotam sítios de iniciação de transcrição pre-crRNA e tracrRNA, respectivamente.
[0097] A figura 6C mostra contagens de leitura normalizadas exemplares (% de leituras totais) de DNAs clivados dos ensaios in vitro para Nme1Cas9 (cinza) intacto, para quimeras com PID de Nme1Cas9 trocado com aqueles de Nme2Cas9 e Nme3Cas9 (cores mistas), e para Nme2Cas9 (laranja)
de comprimento total, são representados. As contagens de leitura normalizadas reduzidas indicam menores eficiências de clivagem nas quimeras.
[0098] A figura 6D mostra logos de sequência exemplares do ensaio de descoberta de PAM in vitro em um pool PAM NNNNCNNN por Nme1Cas9 com seu PID trocado com aqueles de Nme2Cas9 (esquerda) ou Nme3Cas9 (direita).
[0099] A figura 7 apresenta dados exemplares mostrando que Nme2Cas9 usa um espaçador de 22-24 nt para editar sítios adjacentes a um PAM N4CC. Todos os experimentos foram feitos em triplicata, e as barras de erro representam o erro padrão da média (s.e.m.).
[00100] A figura 7A mostra um digrama esquemático exemplar descrevendo transfecção transiente e edição de células HEK293T TLR2.0, com mCherry+ células detectadas por citometria de fluxo 72 horas após a transfecção.
[00101] A figura 7B mostra um edição de Nme2Cas9 exemplar do repórter TLR2.0. Os sítios com PAMs N4CC foram direcionados com eficiências variáveis, enquanto nenhum direcionamento de Nme2Cas9 foi observado em um PAM N4GATT ou na ausência de sgRNA. SpyCas9 (direcionado a um sítio validado anteriormente com um PAM NGG) e Nme1Cas9 (direcionado a N4GATT) foram usados como controles positivos.
[00102] A figura 7C mostra um efeito exemplar de comprimento do espaçador sobre a eficiência da edição de Nme2Cas9. Um direcionamento de sgRNA para um sítio único TLR2.0, com comprimentos do espaçador variando de 24 a 20 nts (incluindo o terminal G 5’ exigido pelo promotor U6), indicam que as maiores eficiências de edição são obtidas com espaçadores de 22-24 nt.
[00103] A figura 7D mostra que uma An Nme2Cas9 nickase dupla exemplar pode ser usada em tandem para gerar edições baseadas em NHEJ- e HDR em TLR2.0. Os plasmídeos, que expressam Nme2Cas9 e sgRNA, juntamente com um doador de dsDNA de 800 pb para o reparo homólogo, foram eletroporados em células HEK293T TLR2.0, e ambos os resultados de NHEJ (mCherry+) e HDR (GFP+) foram pontuados por citometria de fluxo. HNH nickase, Nme2Cas9D16A; RuvC nickase, Nme2Cas9H588A. Os sítios de clivagem de 32 pb e 64 pb separados foram direcionados usando ambas nickase. A HNH nickase (Nme2Cas9D16A) rendeu edição eficiente, particularmente com os sítios de clivagem que foram separados por 32 pb, enquanto a RuvC nickase (Nme2Cas9H588A) não foi eficaz. Nme2Cas9 do tipo selvagem foi usado como um controle.
[00104] A figura 8 apresenta dados exemplares mostrando exigências de PAM, espaçador, e semente para o direcionamento de Nme2Cas9 em células de mamíferos, quando relacionado à Figura 7. Todos os experimentos foram feitos em triplicata e barras de erro representam s.e.m.
[00105] A figura 8A mostra um Nme2Cas9 exemplar direcionado a sítios N4CD em TLR2.0, com edição estimada com base em mCherry+ células. Quatro sítios para cada nucleotídeo não C na posição testada (N4CA, N4CT e N4CG) foram examinados e um sítio N4CC foi usado como um controle positivo.
[00106] A figura 8B mostra um Nme2Cas9 exemplar direcionado aos sítios N4DC em TLR2.0 [similar a (A)].
[00107] A figura 8C mostra truncamentos guia exemplares em um sítio TLR2.0 (distinto daquele na Figura 2C) com um PAM N4CCA, revelando exigências de comprimento similares àquelas observadas no outro sítio.
[00108] A figura 8D mostra que a eficiência de direcionamento de Nme2Cas9 exemplar é diferencialmente sensível a incompatibilidades (mismatches) de nucleotídeo único na região da semente do sgRNA. Os dados mostraram os efeitos de incompatibilidades de sgRNA de nucleotídeo único ambulante ao longo do espaçador de 23-nt em um sítio alvo TLR2.0.
[00109] A figura 9 apresenta dados exemplares mostrando edição do genoma de Nme2Cas9 em sítios endógenos em células de mamíferos por meio de métodos de distribuição múltiplos. Todos os resultados representam 3 réplicas biológicas independentes, e barras de erro representam s.e.m.
[00110] A figura 9A mostra uma edição do genoma de Nme2Cas9 exemplar de sítios humanos endógenos em células HEK293T após a transfecção transiente de plasmídeos que expressam Nme2Cas9 e sgRNA. 40 sítios foram selecionados inicialmente (Tabela 1); os 14 sítios mostrados (selecionados para incluir representantes de eficiências de edição variáveis, como medido por TIDE) foram então reanalisados em triplicata. Um sítio alvo Nme1Cas9 (com um PAM N4GATT) foi usado como um controle negativo.
[00111] A figura 9B mostra gráficos de dados exemplares: Painel da esquerda: A transfecção transiente de um plasmídeo único que expressa ambos Nme2Cas9 e sgRNA (direcionados aos sítios Pcsk9 e Rosa26) permite a edição em células de camundongo Hepa1-6, como detectado por TIDE. Painel da direita: A eletroporação de plasmídeos sgRNA em células K562 expressando estavelmente Nme2Cas9 de um lentivetor resulta em formação de indel eficiente.
[00112] A figura 9C mostra que Nme2Cas9 exemplar pode ser eletroporado como um complexo de RNP para induzir a edição do genoma. 40 picomoles Cas9 juntamente com 50 picomoles de sgRNAs transcritos in vitro direcionados a três sítios diferentes foram eletroporados em células HEK293T. Os indels foram medidos após 72h usando TIDE.
[00113] A figura 10 apresenta dados exemplares mostrando dependência de dose e deleções segmentares por Nme2Cas9, como relacionado à Figura 9.
[00114] A figura 10A mostra que o aumento exemplar da dose de plasmídeo Nme2Cas9 eletroporado (500 ng, vs. 200 ng na Figura 3A) melhora a eficiência da edição em dois sítios (TS16 e TS6). Os dados providos em amarelo são reutilizados da Figura 9A.
[00115] A figura 10B mostra que Nme2Cas9 exemplar pode ser usado para criar deleções segmentares precisas. Dois alvos TLR2.0 com sítios de clivagem de 32 pb separados foram direcionados simultaneamente com Nme2Cas9. A maioria das lesões criadas foram deleções de exatamente 32 pb (azul).
[00116] A figura 11 apresenta dados exemplares mostrando que Nme2Cas9 é sujeito à inibição por um subconjunto de famílias anti-CRISPR do tipo II-C in vitro e em células. Todos os experimentos foram feitos em triplicata e barras de erro representam s.e.m.
[00117] A figura 11A mostra ensaio de clivagem In vitro exemplar de Nme1Cas9 e Nme2Cas9 na presença de cinco proteínas anti-CRISPR caracterizadas anteriormente (razão 10:1 de Acr:Cas9). Topo: Nme1Cas9 cliva eficientemente um fragmento contendo um protoespaçador com um PAM N4GATT na ausência de um Acr ou na presença de um controle negativo Acr (AcrE2). Todas as cinco famílias Acr do tipo II-C caracterizadas anteriormente inibiram Nme1Cas9, como esperado. Fundo: a inibição de Nme2Cas9 espelha aquela de Nme1Cas9, exceto pela carência de inibição por AcrIIC5Smu.
[00118] A figura 11B mostra edição do genoma exemplar na presença das cinco famílias anti-CRISPR descritas anteriormente. Os plasmídeos que expressam Nme2Cas9 (200 ng), sgRNA (100 ng) e cada respectivo Acr (200 ng) foram co-transfectados em células HEK293T, e a edição do genoma foi medida usando Rastreamento de Indels por Decomposição (TIDE) 72 h após a transfecção. Consistente com as presentes análises in vitro, todos os anti-CRISPRs do tipo II-C exceto AcrIIC5Smu inibiram a edição do genoma, embora com eficiências diferentes.
[00119] A figura 11C mostra inibição de Acr exemplar de Nme2Cas9 é dependente de dose com potências aparentes distintas. Nme2Cas9 é totalmente inibido por AcrIIC1Nme e AcrIIC4Hpa em razões de massa 2:1 e 1:1 de plasmídeos Acr e Nme2Cas9 cotransfectados, respectivamente.
[00120] A figura 12 apresenta dados exemplares mostrando que uma troca de Nme2Cas9 PID rende Nme1Cas9 insensível à inibição de
AcrIIC5Smu, como relacionado à figura 11. A clivagem in vitro pela quimera Nme1Cas9-Nme2Cas9PID na presença de proteínas Acr caracterizadas anteriormente (10 uM Cas9-sgRNA + 100 uM Acr).
[00121] A figura 13 apresenta dados exemplares mostrando ortogonalidade e precisão relativa de Nme2Cas9 e SpyCas9 em sítios alvo duais, como relacionado à Figura 12.
[00122] A figura 13A mostra que guias Nme2Cas9 e SpyCas9 exemplares são ortogonais. Os resultados de TIDE mostram as frequências de indels criadas por ambas nucleases direcionadas a DS2 com seus sgRNAs cognates ou com os sgRNAs do outro ortólogo.
[00123] A figura 13B mostra Nme2Cas9 e SpyCas9 exemplares exibindo eficiências de edição específicas comparáveis quando avaliado por GUIDE-seq. As barras indicam contagens de leitura específicas de GUIDE-Seq nos três sítios duais direcionados por cada ortólogo. As barras laranja representam Nme2Cas9 e as barras pretas representam SpyCas9.
[00124] A figura 13C mostra contagens de leitura específicas vs inespecíficas de SpyCas9 exemplares para cada sítio. Barras laranja representam as leituras específicas enquanto as barras pretas representam leituras inespecíficas.
[00125] A figura 13D mostra leituras específicas vs inespecíficas de Nme2Cas9 exemplares para cada sítio.
[00126] A figura 13E mostra gráficos de barra mostrando eficiências de indel exemplares (medidas por TIDE) em sítios inespecíficos potenciais preditos por CRISPRSeek. As sequências de sítio específico e não específico são mostradas na esquerda, com a região de PAM sublinhada e incompatibilidades de sgRNA e nucleotídeos de PAM não consenso dados em vermelho.
[00127] A figura 14 apresenta dados exemplares mostrando que Nme2Cas9 exibe pouca ou nenhuma inespecificidade detectável em células de mamíferos.
[00128] A figura 14A mostra um esquema exemplar descrevendo sítios duais (DSs) direcionáveis por ambos SpyCas9 e Nme2Cas9 em virtude de seus PAMs de não sobreposição. O Nme2Cas9 PAM (laranja) e SpyCas9 PAM (azul) são destacados. Uma sequência guia Nme2Cas9 de 24nt é indicada em amarelo; a sequência guia correspondente para SpyCas9 poderia ser 4nt mais curto na extremidade 5’.
[00129] A figura 14B mostra que Nme2Cas9 e SpyCas9 exemplares ambos induzem indels em DSs. Seis DSs em VEGFA (com sequências GN3GN19NGGNCC) foram selecionados para comparações diretas de edição pelos dois ortólogos. Os plasmídeos que expressam cada Cas9 (com o mesmo promotor, ligantes, marcadores e NLSs) e sua guia cognata foram transfectados em células HEK293T. As Ineficiências de indel foram determinadas por TIDE 72 h após a transfecção. A edição de Nme2Cas9 foi detectável em todos os seis sítios e foi marginalmente ou significativamente mais eficiente do que SpyCas9 em dois sítios (DS2 e DS6, respectivamente). SpyCas9 editou quatro dos seis sítios (DS1, DS2, DS4 e DS6), com dois sítios mostrando eficiências de edição significativamente maiores do que Nme2Cas9 (DS1 e DS4). DS2, DS4 e DS6 foram selecionados para análise de GUIDE-Seq visto que Nme2Cas9 foi igualmente eficiente, menos eficiente e mais eficiente do que SpyCas9, respectivamente, nestes sítios.
[00130] A figura 14C mostra edição do genoma de Nme2Cas9 exemplar que é altamente precisa em células humanas. Números de sítios inespecíficos detectados por GUIDE-Seq para cada nuclease em sítios alvo individuais são mostrados. Além dos sítios duais, foram anlisados TS6 (devido a sua alta eficiência de edição específica) e sítios Pcsk9 e Rosa26 em células de camundongo Hepa1-6 (para medir a precisão em outro tipo de célula).
[00131] A figura 14D mostra que um sequenciamento profundo direcionado exemplar para detectar indels em células editadas confirma a alta precisão de Nme2Cas9 indicada por GUIDE-seq.
[00132] A figura 14E mostra uma sequência exemplar para o sítio inespecífico validado do guia Rosa26, mostrando a região de PAM (sublinhada), o dinucleotídeo de PAM CC consenso (negrito), e três incompatibilidades na porção distal de PAM do espaçador (vermelho).
[00133] A figura 15 apresenta dados exemplares mostrando a edição do genoma de Nme2Cas9 in vivo por meio da distribuição de AAV completa.
[00134] A figura 15A mostra fluxo de trabalho exemplar para a distribuição de AAV8.sgRNA.Nme2Cas9 para diminuir os níveis de colesterol em camundongos pelo direcionamento de Pcsk9. Topo: esquema do vetor de AAV completo expressando Nme2Cas9 e o sgRNA (elementos do genoma individual não representados em escala). O sítio de poli(A) de BGH, hormônio de crescimento bovino; HA, marcador de epítopo; NLS, sequência de localização nuclear; h, otimizado para códon humano. Fundo: Linha do tempo para injeções na veia caudal de AAV8.sgRNA.Nme2Cas9 (4 x 1011 GCs), seguido por medições de colesterol no dia 14 e análises de indel, histologia e colesterol no dia 28 após a injeção.
[00135] A figura 15B mostra uma análise TIDE exemplar para medir indels em DNA extraído de fígados de camundongos injetados com AAV8.Nme2Cas9+sgRNA direcionado a sítios de Pcsk9 e Rosa26 (controle). A eficiência de indel no único sítio inespecífico identificado por GUIDE-seq para estes dois sgRNAs (Rosa26|OT1) também foi avaliada por TIDE.
[00136] A figura 15C mostra níveis de colesterol sérico reduzidos exemplares em camundongos injetados com o guia direcionado a Pcsk9 comparado aos controles direcionados a Rosa26. Os valores P são calculados por teste t de duas caudas não pareado.
[00137] A figura 16 apresenta dados exemplares mostrando inativação de PCSK9 e histologia do fígado após a distribuição e edição de Nme2Cas9 AAV, relacionado à Figura 15.
[00138] A figura 16A mostra que Western blotting exemplar usando anticorpo anti-PCSK9 revela níveis fortemente reduzidos de PCSK9 nos fígados de camundongos tratados com sgPcsk9, comparado a camundongos tratados com sgRosa26. 2 ng de PCSK9 recombinante foram usados como um padrão de mobilidade (faixa mais à esquerda), e uma banda de reação cruzada nas amostras do fígado é indicada por um asterisco. GAPDH foi usado como controle de carregamento (painel do fundo).
[00139] A figura 16B mostra coloração H&E exemplar de fígados de camundongos injetados com vetores AAV8.Nme2Cas9+sgRosa26 (esquerda) ou AAV8.Nme2Cas9+sgPcsk9 (direita). Barras de escala, 25 µm.
[00140] A figura 17 apresenta dados exemplares mostrando edição de Tyr ex vivo em zigotos de camundongo, relacionados à Figura 16.
[00141] A figura 17A mostra que dois sítios exemplares em Tyr, cada um com PAMs N4CC, foram testados quanto à edição em células Hepa1-6. O guia sgTyr2 exibiu maior eficiência da edição e foi selecionado para teste adicional.
[00142] A figura 17B mostra sete camundongos exemplares que sobreviveram ao desenvolvimento pós-natal, e cada um exibiu fenótipos da cor da pelagem assim como edição específica, como avaliado por TIDE.
[00143] A figura 17C mostra espectros de Indel exemplares de DNA da cauda de cada camundongo de (B), assim como um camundongo C57BL/6NJ não editado, como indicado por análise TIDE. As eficiências de inserções (positivas) e deleções (negativas) de vários tamanhos são indicadas.
[00144] A figura 18 apresenta dados exemplares mostrando edição do genoma de Nme2Cas9 ex vivo por meio de distribuição de AAV completa.
[00145] A figura 18A mostra um fluxo de trabalho exemplar para a edição única de AAV Nme2Cas9 ex vivo para gerar camundongos albinos C57BL/6NJ pelo direcionamento ao gene Tyr. Zigotos são cultivados em KSOM contendo AAV6.Nme2Cas9:sgTyr por 5-6 horas, enxaguados em M2, e cultivados por um dia antes de serem transferidos para o oviduto de receptores pseudogestantes.
[00146] A figura 18B mostra camundongos albinos (esquerda) e chinchila ou diversificados (meio) exemplares gerados por 3x109 GCs, e camundongos chinchila ou diversificados (direita) gerados por 3x108 GCs de zigotos com AAV6.Nme2Cas9:sgTyr.
[00147] A figura 18C mostra um sumário exemplar de experimentos de edição de Tyr ex vivo de AAV único Nme2Cas9.sgTyr em duas doses de AAV.
[00148] A figura 19 mostra um ensaio repórter mCherry exemplar para nSpCas9-ABEmax e atividades otimizadas de ABEmax-nNme2Cas9 (D16A).
[00149] A figura 19A mostra informações de sequência exemplares de informações de sequência de repórter ABE-mCherry. Há um códon de parada TAG na região de codificação mCherry. Na linhagem celular estável integrada repórter, não há qualquer sinal de mCherry. O sinal de mCherry mostrará se o nSpCas9-ABEmax ou ABEmax-nNme2Cas9 (D16A) otimizado pode converter TAG em CAG (que é Gln codificado).
[00150] A figura 19B mostra que sinais de mCherry exemplares acendem uma vez que SpCas9-ABE ou ABEmax-nNme2Cas9 (D16A) seja ativo na região específica do repórter mCherry. O painel superior é o controle negativo, o painel do meio mostra que os sinais de mCherry acendem em células repórter tratadas com nSpCas9-ABEmax, o painel do fundo mostra que os sinais de mCherry acendem em células repórter tratadas com ABEmax-nNme2Cas9 (D16A) otimizado.
[00151] A figura 19C mostra uma Quantificação FACs exemplar de eventos de edição de base em células repórter mCherry transfectadas com o SpCas9-ABE ou ABEmax-nNme2Cas9 (D16A). N = 6; barras de erro representam S.D. Os resultados são de réplicas biológicas realizadas em duplicatas técnicas.
[00152] A figura 20 mostra um ensaio repórter GFP exemplar para atividades de nSpCas9-CBE4 (Addgene #100802) e CBE4-nNme2Cas9 (D16A)-UGI-UGI (CBE4 foi clonado de Addgene #100802).
[00153] A figura 20A mostra informações de sequência exemplares de repórter CBE-GFP. Há uma mutação na região de núcleo de fluoroforo da linhagem repórter de GFP, que converte GYG em GHG. Portanto, não há qualquer sinal de GFP. O sinal de GFP mostrará se o nSpCas9-CBE4 ou CBE4- nNme2Cas9 (D16A)-UGI-UGI pode converter CAC em TAC/TAT (Histidina em Tirosina).
[00154] A figura 20B mostra um sinal de GFP exemplar (verde) uma vez que nSpCas9-CBE4 ou CBE4-nNme2Cas9 (D16A)-UGI-UGI é ativo na região específica do repórter de GFP. O painel superior é o controle negativo. O painel do meio mostra que os sinais de mCherry acendem nas células repórter tratadas com CBE4-nNme2Cas9 (D16A)-UGI-UGI. O painel do fundo mostra que os sinais de GFP acendem nas células repórter tratadas com CBE4- nNme2Cas9 (D16A)-UGI-UGI).
[00155] A figura 20C mostra uma Quantificação FACs exemplar de eventos de edição de base em células repórter de GFP transfectadas com nSpCas9-CBE4 ou CBE4-nNme2Cas9 (D16A)-UGI-UGI. N = 6; barras de erro representam S.D. Os resultados são de réplicas biológicas realizadas em duplicatas técnicas .
[00156] A figura 21 mostra edição de citosina exemplar por CBE4- nNme2Cas9 (D16A)-UGI-UGI. Painel superior mostra as informações de sequência de direcionamento a KANK3 (sequências de PAM são indicadas em vermelho) de Nme2Cas9 e edição de base nas amostras de controle negativo. O painel do fundo mostra a quantificação da taxa de substituição de cada tipo de base na janela de edição de CBE4-nNme2Cas9 (D16A)-UGI-UGI das sequências alvo KANK3. As tabelas de sequência mostram frequências de nucleotídeo em cada posição. As frequências de conversão C-em-T esperada são destacadas em vermelho.
[00157] A figura 22 mostra a edição de citosina e adenina exemplar por CBE4-nNme2Cas9 (D16A)-UGI-UGI e ABEmax-nNme2Cas9 (D16A) otimizado, respectivamente. O painel superior mostra as informações de sequência de direcionamento PLXNB2 (sequências de PAM são indicadas em vermelho) de Nme2Cas9 e edição de base nas amostras de controle negativo. O painel do meio mostra a quantificação da taxa de substituição de cada tipo de base nas janelas de edição otimizadas de ABEmax-nNme2Cas9 (D16A) das sequências alvo PLXNB2. As tabelas de sequência mostram frequências de nucleotídeo em cada posição. As frequências de conversão A-a-G esperada são destacadas em vermelho. O painel do fundo mostra a quantificação da taxa de substituição de cada tipo de base nas janelas de edição de CBE4-nNme2Cas9 (D16A)-UGI-UGI das sequências alvo PLXNB2. As tabelas de sequência mostram frequências de nucleotídeo em cada posição. As frequências de conversão C-a-T esperada são destacadas em vermelho.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[00158] A presente invenção é relacionada ao campo da edição de gene. Em particular, a edição de gene é direcionada à edição de base de nucleotídeo único. Por exemplo, tal edição de base de nucleotídeo único resulta em uma conversão de um par de bases C•G a um par de bases T•A. O alto rigor e precisão do editor de gene de base de nucleotídeo único divulgado atualmente são realizados por uma nuclease NmeCas9 que é fundida a uma proteína de nucleotídeo desaminase. A natureza compacta do NmeCas9 acoplado com um maior número de motivos adjacentes ao protoespaçador compatíveis provê os construtos de fusão de Cas9 contemplados aqui que podem editar sítios que não são direcionáveis por plataformas de editor de base de SpyCas9 convencionais. A. NMECAS9 EDIÇÃO DE BASE ÚNICA
[00159] Cas9 é uma nuclease programável que usa um RNA guia para criar um rompimento do filamento duplo em qualquer sítio genômico desejado. Esta capacidade de programação foi aproveitada para abordagens biomédicas e terapêuticas. No entanto, rompimentos induzidos por Cas9 frequentemente levam a reparo impreciso pelo mecanismo celular, escondendo sua aplicação terapêutica para correções de base única assim como inativações de genes uniformes e precisas. Além disso, é extremamente desafiador combinar rompimentos de filamento duplo de DNA induzido por Cas9 e um modelo de reparo para reparo direcionado por homologia (HDR) para corrigir mutações genéticas em células pós-mitóticas (por exemplo, células neuronais).
[00160] A edição de base de nucleotídeo único é uma abordagem de edição do genoma onde um nuclease Cas9 morta ou comprometida (por exemplo, Cas9 morta (dCas9) ou nickase Cas9 (nCas9)) é fundida com outra enzima capaz de nucleotídeos de edição de base sem causar rompimentos de filamento duplo de DNA. Até hoje, duas classes amplas de editores de base de Cas9 foram desenvolvidas: i) proteína de fusão de SpyCas9 de citidina desaminase (edita um par de bases C•G a um par de bases T•A); e ii) SpyCas9 de adenosina desaminase (edita um par de bases A•T a um par de bases G•C). Liu et al., “Nucleobase editors and uses thereof” US 2017/0121693; e Lui et al., “Fusions of cas9 domains and nucleic acid-editing domains” US 2015/0166980; (ambos aqui incorporados por referência).
[00161] No entanto, como mencionado acima, as plataformas de edição de base SpyCas9 não podem ser usadas para direcionar a todas as mutações de base única devido a suas janelas de edição limitadas. A janela de edição é limitada pela exigência por um PAM NGG. SpyCas9 também é intrinsecamente associado com efeitos de alta inespecificidade na edição do genoma.
[00162] Em uma modalidade, a presente invenção contempla uma proteína de fusão de desaminase com um Nme2Cas9 compacto e hiperpreciso (Neisseria meningitidis spp.). Este Nme2Cas9 tem 1.082 aminoácidos quando comparado a SpyCas9 que tem 1.368 aminoácidos. Este Nme2Cas9 ortólogo funciona eficientemente em células de mamíferos, reconhece um PAM N4CC, e é intrinsecamente hiperpreciso. Edraki et al., Mol Cell. (em preparação).
[00163] Embora não seja necessário entender o mecanismo de uma invenção, acredita-se que a compactação e hiperprecisão de um editor de base de NmeCas9 direciona mutações de base única que não poderiam ser alcançadas anteriormente por outras plataformas de Cas9 atualmente conhecidas na técnica. Acredita-se também que os editores de base de NmeCas9 contemplados aqui são direcionados a mutações patogênicas que não são viáveis por meio das plataformas atuais de editor de base e com uma precisão aumentada de edição de base.
[00164] Em uma modalidade, a presente invenção contempla uma proteína de fusão compreendendo um Nme2Cas9 e uma proteína desaminase, exemplos exemplares incluindo ABE7.10-nNme2Cas9 (D16A); nNme2Cas9- ABEmax otimizado; nNme2Cas9-CBE4 (igual a BE4-nNme2Cas9 (D16A)-UGI- UGI ) assim como ABEmax-nNme2Cas9 (D16A). Vide a Figura 1A, Figura 1B, Figura 1C, Figura 1D e Figura 1E.
[00165] A figura 1 ilustra modalidades esquemáticas exemplares de um editor de base única de proteína de fusão de NmeCas9 desaminase e plasmídeos de editores de base construídos exemplares. A Figura 1A mostra um construto de YE1-BE3-nNme2Cas9 (D16A)-UGI exemplar. A Figura 1B mostra um construto de ABE7.10 nNme2Cas9 (D16A) exemplar. A Figura 1C mostra um construto de ABE7.10-nNme2Cas9 (D16A) exemplar. A Figura 1C mostra um construto de ABE7.10-nNme2Cas9 (D16A) exemplar compreendendo duas sequências SV40 NLS. A Figura 1D mostra um nNme2Cas9-CBE4 exemplar (também denominado um construto de BE4-nNme2Cas9 (D16A)-UGI-UGI). A Figura 1E mostra um construto de nNme2Cas9-ABEmax otimizado exemplar.
[00166] Em uma modalidade, a proteína desaminase é Apobec1 (YE1-BE3). Não se pretende limitar Apobec1 a um organismo. Em uma modalidade, a Apobec1 é derivada de uma espécie de rato. Kim et al., “Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions”. Nature Biotechnology 35 (2017). Em uma modalidade, o Nme2Cas9 compreende um mutante de nNme2Cas9 D16A. Em uma modalidade, a proteína de fusão compreende ainda uma proteína do inibidor de uracil glicosilase (UGI). Em uma modalidade, a proteína de fusão compreende um construto de YE1-BE3-nNme2Cas9 (D16A)-UGI. Em uma modalidade, o construto de YE1-BE3-nNme2Cas9 (D16A)-UGI tem a sequência de:
[00167] MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLY
EINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSYSPC GECSRAITEFLSRYPHVTLFIYIARLYHHADPENRQGLRDLISSGVTIQIMTEQE SGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQP QLTFFTIALQSCHYQRLPPHILWATGLKSGSETPGTSESATPESMAAFKPNPIN YILGLAIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLA RSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAAL DRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVANNAHALQT GDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGN PHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAER FIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTA FFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSSELQDEIG TAFSLFKTDEDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGK RYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVR RYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVG EPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDAALPFSRTWDDSF NNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQR ILLQKFDEDGFKECNLNDTRYVNRFLCQFVADHILLTGKGKRRVFASNGQITNL LRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGK TIDKETGKVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTL LAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGAHKDTLRSAKRFVKHNEKISVK RVWLTEIKLADLENMVNYKNGREIELYEALKARLEAYGGNAKQAFDPKDNPFY KKGGQLVKAVRVEKTQESGVLLNKKNAYTIADNGDMVRVDVFCKVDKKGKN QYFIVPIYAWQVAENILPDIDCKGYRIDDSYTFCFSLHKYDLIAFQKDEKSKVEF AYYINCDSSNGRFYLAWHDKGSKEQQFRISTQNLVLIQKYQVNELGKEIRPCR LKKRPPVRSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVH TAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRKV*
[00168] YE1-BE3 (sublinhado); ligante (negrito), nNme2Cas9 (itálico), UGI (negrito/sublinhado), SV40 NLS (simples).
[00169] Em uma modalidade, o construto de YE1-BE3-nNme2Cas9 (D16A)-UGI tem a sequência de:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRH TSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSYSPCGECSRAITEFLSRY PHVTLFIYIARLYHHADPENRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSP SNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHY QRLPPHILWATGLKSGSETPGTSESATPESMAAFKPNPINYILGLAIGIASVGW AMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAH RLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAV LLHLIKHRGYLSQRKNEGETADKELGALLKGVANNAHALQTGDFRTPAELALN KFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIE TLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRIL EQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDN AEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDI TGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYG DHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIET AREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRL YEQQHGKCLYSGKEINLVRLNEKGYVEIDAALPFSRTWDDSFNNKVLVLGSEN QNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGF KECNLNDTRYVNRFLCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKV RAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLH QKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEA VHEYVTPLFVSRAPNRKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLAD LENMVNYKNGREIELYEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAV RVEKTQESGVLLNKKNAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQ VAENILPDIDCKGYRIDDSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNG RFYLAWHDKGSKEQQFRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVRSGG STNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENV MLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSPKKKRKV*
[00170] YE1-BE3 (sublinhado); ligante (negrito), nNme2Cas9 (itálico), UGI (negrito/sublinhado), SV40 NLS (simples).
[00171] Em uma modalidade, a presente invenção contempla uma proteína de fusão compreendendo uma proteína desaminase NmeCas9/ABE7.10. Em uma modalidade, a proteína desaminase é TadA. Em uma modalidade, a proteína desaminase é TadA 7.10. Em uma modalidade, o construto de ABE7.10-nNme2Cas9 (D16A) tem a seguinte sequência:
[00172] MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNN
RVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCA GAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAAL LSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGS SGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNR AIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRM PRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSMA AFKPNPINYILGLAIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSL AMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTP WQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVA NNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLF EKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAA KNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARK LLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLS SELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRI VPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQAR KVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFR EYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDHALPF SRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETS RFPRSKKQRILLQKFDEDGFKECNLNDTRYVNRFLCQFVADHILLTGKGKRRV FASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRY KEMNAFDGKTIDKETGKVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEE ADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGAHKDTLRSAKRF VKHNEKISVKRVWLTEIKLADLENMVNYKNGREIELYEALKARLEAYGGNAKQ AFDPKDNPFYKKGGQLVKAVRVEKTQESGVLLNKKNAYTIADNGDMVRVDVF CKVDKKGKNQYFIVPIYAWQVAENILPDIDCKGYRIDDSYTFCFSLHKYDLIAFQ KDEKSKVEFAYYINCDSSNGRFYLAWHDKGSKEQQFRISTQNLVLIQKYQVNE LGKEIRPCRLKKRPPVREDKRPAATKKAGQAKKKK*
[00173] TadA (sublinhado), TadA 7.10 (sublinhado/negrito), ligante (negrito), nNme2Cas9 (itálico), Nucleoplasmina NLS (simples).
[00174] Em uma modalidade, um construto de ABE7.10- nNme2Cas9 (D16A) tem a seguinte sequência de aminoácidos:
[00175] MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNN
RVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCA GAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAAL LSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGS SGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNR AIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIG RVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRM PRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSMA AFKPNPINYILGLAIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSL AMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTP WQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVA NNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLF EKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAA KNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARK LLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLS SELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRI VPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQAR KVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFR EYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDHALPF SRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETS RFPRSKKQRILLQKFDEDGFKECNLNDTRYVNRFLCQFVADHILLTGKGKRRV FASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRY KEMNAFDGKTIDKETGKVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEE ADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGAHKDTLRSAKRF VKHNEKISVKRVWLTEIKLADLENMVNYKNGREIELYEALKARLEAYGGNAKQ AFDPKDNPFYKKGGQLVKAVRVEKTQESGVLLNKKNAYTIADNGDMVRVDVF CKVDKKGKNQYFIVPIYAWQVAENILPDIDCKGYRIDDSYTFCFSLHKYDLIAFQ KDEKSKVEFAYYINCDSSNGRFYLAWHDKGSKEQQFRISTQNLVLIQKYQVNE LGKEIRPCRLKKRPPVREDKRPAATKKAGQAKKKK*
[00176] TadA (sublinhado), TadA 7.10 (sublinhado/negrito), ligante (negrito itálico), nNme2Cas9 (itálico), Nucleoplasmina NLS (simples).
[00177] Em uma modalidade, um construto de ABEmax- nNme2Cas9 (D16A) tem a seguinte sequência de aminoácidos:
[00178] MKRTADGSEFESPKKKRKVSEVEFSHEYWMRHALTLAK
RAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQ NYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHP GMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSS GSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVP VGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLY VTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEI TEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGT SESATPESSGGSSGGSMAAFKPNPINYILGLAIGIASVGWAMVEIDEEENPIRLI DLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGV LQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQR KNEGETADKELGALLKGVANNAHALQTGDFRTPAELALNKFEKESGHIRNQR GDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGD AVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTER ATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYH AISRALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRVQPEILE ALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYL PPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEI EKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGK EINLVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFN GKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKECNLNDTRYVNRF LCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAV VVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHFPQPWEFFA QEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRA PNRKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYKNGREI ELYEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAVRVEKTQESGVLLN KKNAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQVAENILPDIDCKGY RIDDSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHDKGSK EQQFRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVREDKRPAATKKAGQAK KKKFEPKKKRKV*
[00179] TadA (sublinhado), TadA* 7.10 (sublinhado/negrito), ligante (negrito itálico), nNme2Cas9 (itálico), Nucleoplasmina NLS (simples) e SV40 NLS (NEGRITO).
[00180] Em uma modalidade, um construto de CBE4-nNme2Cas9 (D16A)-UGI-UGI tem a seguinte sequência de aminoácidos:
[00181] PAAKRVKLDGGSGGGSGGGSGPAAKRVKLDGGSGGGS
GGGSGPLEPKKKRKVPWSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKET CLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLS WSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIM TEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILR RKQPQLTFFTIALQSCHYQRLPPHILWATGLKSGGSSGGSSGSETPGTSESAT PESSGGSSGGSIDKLAAFKPNPINYILGLAIGIASVGWAMVEIDEEENPIRLIDL GVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQ AADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKN EGETADKELGALLKGVANNAHALQTGDFRTPAELALNKFEKESGHIRNQRGD YSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAV QKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATL MDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAIS RALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALL KHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPI PADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEK RQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEIN LVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGK DNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKECNLNDTRYVNRFLC QFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVV ACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHFPQPWEFFAQE VMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPN RKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYKNGREIEL YEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAVRVEKTQESGVLLNKK NAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQVAENILPDIDCKGYRID DSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHDKGSKEQQ FRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVRVYPYDVPDYAGYPYDVPD YAGSYPYDVPDYAGSAAPAAKKKKLDFESGEFLQPGIDLSQLGGDSGGSG GSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDEST DENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEK ETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPE YKPWALVIQDSNGENKIKMLSGGSPKKKRKVSRGSAAPAAKRVKLDGGSGG GSGGGSGSGPAAKRVKLD
[00182] rApobec1 (sublinhado), UGI (sublinhado/negrito), ligante (negrito itálico), nNme2Cas9 (D16A) (itálico), Cmyc-NLS (simples) e SV40 NLS (NEGRITO).
[00183] Em uma modalidade, um construto de nNme2Cas9- ABEmax otimizado se refere a uma versão otimizada com promotor melhorado, sequências NLS, e sequências ligantes. Em algumas modalidades, um construto de nNme2Cas9-ABEmax otimizado compreende, 5' a 3', um C-myc NLS, ligante 12aa, ligante 15aa, SV40 NLS, TadA, TadA*7.10, ligante 48aa, nNme2Cas9, um ligante 73aa (3xHA-tag), ligante 15aa, e um C-myc NLS. Em algumas modalidades, um construto de nNme2Cas9-ABEmax otimizado compreende ainda pelo menos dois, cada um, C-myc NLS alternante e um ligante 12aa na extremidade 3’. Em algumas modalidades, um construto de nNme2Cas9- ABEmax otimizado compreende ainda pelo menos dois, cada um, ligante 15aa alternante e C-myc NLS na extremidade 5’. Vide a Figura 1E, por exemplo.
[00184] Em uma modalidade, um construto de nNme2Cas9- ABEmax otimizado tem a seguinte sequência de aminoácidos:
[00185] PAAKRVKLDGGSGGGSGGGSGPAAKRVKLDGGSGGGS
GGGSGPLEPKKKRKVSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVH NNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVM CAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECA ALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSG GSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGW NRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHS RIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFF RMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGS MAAFKPNPINYDIDKLAAFKPNPINYILGLAIGIASVGWAMVEIDEEENPIRLIDL GVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQ AADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKN EGETADKELGALLKGVANNAHALQTGDFRTPAELALNKFEKESGHIRNQRGD YSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAV QKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATL MDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAIS RALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALL KHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPI PADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEK RQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEIN LVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGK DNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKECNLNDTRYVNRFLC QFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVV ACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHFPQPWEFFAQE VMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPN RKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYKNGREIEL YEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAVRVEKTQESGVLLNKK NAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQVAENILPDIDCKGYRID DSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHDKGSKEQQ FRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVRVYPYDVPDYAGYPYDVPD YAGSYPYDVPDYAGSAAPAAKKKKLDFESGEFLQPGGSTSSRGSAAPAAK RVKLDGGSGGGSGGGSGSGPAAKRVKLD
[00186] hTadA7.10 (sublinhado), hTadA*7.10 (sublinhado/negrito), ligante (negrito itálico), nNme2Cas9 (itálico), Cmyc-NLS (simples), SV40-NLS (negrito).
[00187] Em algumas modalidades, um plasmídeo nSpCas9- ABEmax (Addgene ID:112095) foi usado para controles experimentais e para a clonagem molecular. Em algumas modalidades, um plasmídeo nSpCas9-CBE4 (Addgene ID: 100802) foi usado para controles experimentais e para a clonagem molecular.
[00188] A eletroporação de células HEK293T com plasmídeos de DNA compreendendo uma proteína de fusão de nucleotídeo desaminase YE1- BE3-Nme2Cas9 alcançou edição de base única robusta de um par de bases C•G a um par de bases T•A em um sítio alvo endógeno (TS25). Vide as Figuras 2A- C.
[00189] A Figura 2 apresenta dados exemplares da eletroporação de células HEK293T com plasmídeos de DNA compreendendo uma proteína de fusão YE1-BE3-nNme2Cas9 (D16A)-UGI convertendo eficientemente C a T em sítio alvo endógeno 25 (TS25) em células HEK293T por meio de nucleofecção. A Figura 2A mostra sequências exemplares para um sítio alvo endógeno TS25 (dentro do retângulo preto). Pares de base de sgRNA GN23 com o filamento de DNA alvo, deixando o filamento de DNA deslocado para citidina desaminase para editar (por exemplo, novos nucleotídeos verdes). A Figura 2B mostra dados de sequenciamento exemplares mostrando um pico de nucleotídeo dupleto (7a posição da extremidade 5’; seta) demonstrando a edição de base única bem- sucedida de uma citidina para uma timidina (por exemplo, uma conversão do par de bases C•G a um par de bases T•A). A Figura 2C mostra uma quantificação exemplar dos dados mostrados na Figura 2B representando a conversão percentual de edição de base única C → T. O percentual de C convertido em T é cerca de 40% na amostra de editor de base e tratada com sgRNA (valor p = 6,88 x 10-6). O controle “nenhum sgRNA” exibe o ruído de fundo devido ao sequenciamento Sanger. EditR (Kluesner et al., 2018) foi usado para realizar a análise.
[00190] Quatro outras proteínas de fusão mutantes YE1-BE3- nNme2Cas9/D16A foram co-expressas com proteína fluorescente verde intensificada (EGFP) em uma linhagem celular derivada de K562 estável expressando proteína fluorescente verde intensificada (EGFP). Cada proteína de fusão mutante YE1-BE3-nNme2Cas9/D16A teve um sítio alvo UGI específico. Vide as Figuras 3A-D.
[00191] A análise de sequenciamento profundo indica que YE1-BE3- nNme2Cas9 converte resíduos C em resíduos T em cada um dos quatro sítios alvo de EGFP. O percentual de edição variou de 0,24% a 2%. A janela de edição de base potencial é de nucleotídeos 2-8 no filamento de DNA deslocado, contando o nucleotídeo na extremidade 5’ (PAM-distal) como nucleotídeo #1. Vide as Figuras 3A-D.
[00192] A Figura 3 apresenta sítios alvo de UGI específicos exemplares que foram, respectivamente, integrados em proteínas de fusão mutantes YE1-BE3-nNme2Cas9/D16A e co-expressos com proteína fluorescente verde intensificada (EGFP) em uma linhagem celular derivada de K562 estável. As bases convertidas são destacadas em cor laranja. Os sinais de fundo foram filtrados usando amostras de controle negativo (células K562 nucleofectadas YE1-BE3-nNme2Cas9 sem construtos de sgRNA). PAMs N4CC estão dentro de uma caixa. O percentual de leituras totais exibindo mutações em sítios direcionados ao editor de base é mostrado na coluna da direita. A Figura 3A mostra um sítio de EGFP 1 exemplar. A Figura 3B mostra um sítio de EGFP 2 exemplar. A Figura 3C mostra um sítio de EGFP 3 exemplar. A Figura 3D mostra um sítio de EGFP 4 exemplar.
[00193] A eletroporação de células HEK293T com plasmídeos de DNA compreendendo um promotor c-fos YE1-BE3-nNme2Cas9 alcançou a edição de base única robusta de um par de bases CG a um par de bases TA em locais alvo endógenos no promotor c-fos (Figura 3E). A Figura 3E mostra uma análise de sequenciamento profundo exemplar indicando onde YE1-BE3- nNme2Cas9 converte resíduos C em resíduos T na região do promotor endógeno c-fos. O percentual de leituras totais exibindo mutações em sítios direcionados ao editor de base é mostrado na coluna da direita. As bases convertidas são destacadas na cor laranja ou amarelo. Sinais de fundo foram filtrados usando amostras de controle negativo. O maior percentual de edição é 32,50%. A Figura 3F mostra uma análise de sequenciamento profundo exemplar indicando onde ABE7.10-nNme2Cas9 ou ABEmax (Koblan et al., 2018)- nNme2Cas9 converte resíduos A em resíduos G na região do promotor endógeno c-fos. O percentual de leituras totais exibindo mutações em sítios direcionados ao editor de base é mostrado na coluna da direita. As bases convertidas são destacadas na cor laranja. Sinais de fundo foram filtrados usando amostras de controle negativo. O percentual de edição é 0,53% por ABE7.10-nNme2Cas9 ou 2,33% por ABEmax-nNme2Cas9 (D16A).
[00194] Em uma modalidade, a presente invenção contempla a expressão de uma proteína de fusão ABE7.10-nNme2Cas9 (D16A) para a edição de base. Embora não seja necessário entender o mecanismo de uma invenção, acredita-se que a edição de base de Nme2Cas9 pode ser um tratamento eficaz para tirosinemia ao inverter uma mutação pontual de G-a-A no gene Fah com uma proteína de fusão ABE7.10-nNme2Cas9 (D16A).
[00195] A mutação G-a-A (vermelho) no último nucleotídeo de éxon 8 no gene Fah, causando a omissão do éxon. A deficiência em FAH leva ao acúmulo de toxina e dano grave ao fígado. A posição de um PAM SpyCas9 (caixa retangular preta) a jusante da mutação não é ótima para a projeção do sgRNA uma vez que a mutação A está fora da janela de edição de base eficiente de ABE7.10, que é 4-7th nt na extremidade 5’ (PAM-distal) (sublinhado) (Gaudelli et al., 2017).
[00196] No entanto, existem dois PAMs Nme2Cas9 (caixa retangular vermelha) nas sequências a jusante que podem corrigir potencialmente a mutação e reverter a sequência de DNA para do tipo selvagem por meio de ABE7.10-nNme2Cas9 (D16A). Vide a Figura 4.
[00197] A Figura 4 apresenta um alinhamento exemplar do gene do tipo selvagem Fah com o gene mutante Fah de tirosinemia mostrando um sítio alvo de edição de gene de base único A-G (posição 9). O respectivo sítio PAM único SpyCas9 e sítios PAM duplos NmeCas9 são indicados para demonstrar a janela de direcionamento subótima em relação ao sítio PAM SpyCas9. Esta figura serve como um exemplo potencial de um sítio onde Nme2Cas9 poderia superar as limitações de editores de base existentes. Ainda se acredita que o editor de base NmeCas9 descrito aqui pode realizar edição de base precisa que não pode ser alcançada com editores de base derivados de SpyCas9 convencionais devido a uma janela de edição de base subótima em relação a PAMs disponíveis nas proximidades.
[00198] Além disso, é contemplado o prolongamento da edição de base até um modelo de camundongo de tirosinemia para a reversão da mutação pontual G-a-A por métodos de distribuição viral usando ABEmax-nNme2Cas9 (D16A), onde a edição desejada não pode ser alcançada com editores de base derivados de SpyCas9 devido a uma janela de edição de base subótima em relação a PAMs disponíveis nas proximidades (por exemplo Figura 4). B. CONSTRUTOS DE NMECAS9: COMPACTOS & HIPERPRECISOS
[00199] Repetições palindrômicas agrupadas, regularmente interespaçadas, curtas (CRISPR) juntamente com proteínas (Cas) associadas a CRISPR constituem caminhos imunes adaptativos bacterianos e arqueais contra fagos e outros elementos genéticos móveis (MGEs) (Barrangou et al., 2007; Brouns et al., 2008; Marraffini e Sontheimer, 2008). Em sistemas CRISPR do tipo II, RNA CRISPR (crRNA) é ligado a um crRNA de transativação (tracrRNA) e carregado sobre uma proteína efetora Cas9 que cliva ácidos nucleicos MGE complementares ao crRNA (Garneau et al., 2010; Deltcheva et al., 2011; Sapranauskas et al., 2011; Gasiunas et al., 2012; Jinek et al., 2012). O híbrido crRNA:tracrRNA pode ser fundido em um RNA guia único (sgRNA) (Jinek et al., 2012). A capacidade de programação do RNA de endonucleases Cas9 tornou-o uma plataforma poderosa de edição do genoma em biotecnologia e medicina (Cho et al., 2013; Cong et al., 2013; Hwang et al., 2013; Jiang et al., 2013; Jinek et al., 2013; Mali et al., 2013b).
[00200] Além do sgRNA, o reconhecimento alvo de Cas9 é usualmente associado com uma assinatura de nucleotídeo 1-5 a jusante da sequência de DNA complementar, denominada um motivo adjacente ao protoespaçador (PAM) (Deveau et al., 2008; Mojica et al., 2009). Ortólogos de Cas9 exibem diversidade considerável em comprimento e sequência de PAM. Dentre os ortólogos de Cas9 que foram caracterizados, Streptococcus pyogenes Cas9 (SpyCas9) é o mais amplamente usado, em parte porque ele reconhece um PAM NGG curto (Jinek et al., 2012) (N reapresenta qualquer nucleotídeo) que rende uma alta densidade de sítios direcionáveis. Entretanto, o tamanho relativamente grande de Spy (isto é, 1.368 aminoácidos) torna este Cas9 difícil de empacotar (juntamente com sgRNA e promotores) em um vírus adeno- associado recombinante único (rAAV). Isto foi mostrado como sendo uma desvantagem para aplicações terapêuticas dada a promessa mostrada pelos vetores de AAV para a distribuição de gene in vivo (Keeler et al., 2017). Além disso, SpyCas9 e seus guias de RNA exigiram caracterização e engenharia extensiva para minimizar a tendência a editar sítios inespecíficos quase- cognatos. (Bolukbasi et al., 2015b; Tsai e Joung, 2016; Tycko et al., 2016; Chen et al., 2017; Casini et al., 2018; Yin et al., 2018). Até hoje, esforços de engenharia subsequentes não superaram estas limitações de tamanho.
[00201] Vários ortólogos de Cas9 de menos do que 1.100 aminoácidos em comprimento obtidos de espécies diversas foram validados para a edição do genoma de mamíferos, incluindo cepas de N. meningitidis (NmeCas9, 1,082 aa) (Esvelt et al., 2013; Hou et al., 2013), Staphylococcus aureus (SauCas9, 1,053 aa) (Ran et al., 2015), Campylobacter jejuni (CjeCas9, 984 aa) (Kim et al., 2017), e Geobacillus stearothermophilus (GeoCas9, 1,089 aa) (Harrington et al., 2017b). NmeCas9, CjeCas9, e GeoCas9 são representantes de Cas9s do tipo II-C (Mir et al., 2018), cuja maioria é <1.100 aa.
Com a exceção de GeoCas9, cada um destes ortólogos de sequência mais curtos foi implantado com sucesso para a edição in vivo por meio de distribuição de AAV completa (na qual um vetor único expressa tanto o guia quanto o efetor) (Ran et al., 2015; Kim et al., 2017; Ibraheim et al., 2018, submitted). Além disso, NmeCas9 e CjeCas9 foram mostrados como sendo naturalmente resistentes à edição inespecífica (Lee et al., 2016; Kim et al., 2017; Amrani et al., 2018, submitted). No entanto, os PAMs que são reconhecidos por Cas9s compactos são usualmente mais longos do que aqueles de SpyCas9, reduzindo substancialmente o número de sítios direcionáveis em ou próximo a um dado local; por exemplo, i) N4GAYW/N4GYTT/N4GTCT para NmeCas9 (Esvelt et al., 2013; Hou et al., 2013; Lee et al., 2016; Amrani et al., 2018); ii) N2GRRT para SauCas9 (Ran et al., 2015); iii) N4RYAC para CjeCas9 (Kim et al., 2017); e iv) N4CRAA/N4GMAA para GeoCas9s (Harrington et al., 2017b) (Y = C, T; R = A, G; M = A, C; W = A, T). Um subconjunto menor de sítios alvo é vantajoso para tarefas de edição de gene altamente correta e precisa incluindo, entre outros: i) edição de pequenos alvos (por exemplo, miRNAs); ii) correção de mutações por edição de base que altera uma janela muito estreita de bases em relação ao PAM (Komor et al., 2016; Gaudelli et al., 2017); ou iii) edição precisa por meio de reparo direcionado por homologia (HDR) que é mais eficiente quando as bases reescritas são próximas ao sítio de clivagem (Gallagher e Haber, 2018). Devido às restrições de PAM, muitos sítios de edição não podem ser direcionados usando vetor de AAV completos para a distribuição in vivo mesmo com estes Cas9s de proteína mais curtos. Por exemplo, um mutante SauCas9 (SauCas9KKH) foi desenvolvido que reduziu as limitações de PAM (N3RRT), embora este aumento na faixa de direcionamento frequentemente venha ao custo da eficácia reduzida da edição específica, e edições inespecíficas ainda são observadas. (Kleinstiver et al., 2015).
[00202] A edição de gene terapêutico baseada em CRISPR segura e eficaz será muito intensificada por ortólogos de Cas9 e variantes que são altamente ativas em células humanas, resistentes à inespecificidade, suficientemente compactas para a distribuição de AAV completa e capazes de acessar uma alta densidade de sítios genômicos. Em uma modalidade, a presente invenção contempla um Cas9 compacto, hiperpreciso (Nme2Cas9) de uma cepa distinta de N. meningitidis. Em uma modalidade, a presente invenção contempla um método para a distribuição de AAV único de Nme2Cas9 e seu sgRNA para realizar a edição eficiente do genoma in vivo e/ou ex vivo. Embora não seja necessário entender o mecanismo de uma invenção, acredita-se que este ortólogo funciona eficientemente em células de mamíferos e reconhece um PAM N4CC que rende uma densidade de sítio alvo idêntica àquela de SpyCas9 do tipo selvagem (por exemplo, cada 8 pb em média, quando ambos filamentos de DNA são considerados).
1. DOMÍNIOS DE INTERAÇÃO DE PAM E PROTEÍNAS ANTI-CRISPR
[00203] O reconhecimento de PAM por ortólogos de Cas9 ocorre predominantemente através de interações de DNA da proteína entre o Domínio de Interação de PAM (PID) e os nucleotídeos adjacentes ao protoespaçador (Jiang e Doudna, 2017). As mutações de PAM frequentemente permitem que o fago escape da imunidade CRISPR do tipo II (Paez-Espino et al., 2015), colocando estes sistemas sob pressão seletiva não somente para adquirir novos espaçadores CRISPR, mas também para desenvolver novas especificidades de PAM por meio de mutações de PID. Além disso, alhuns fagos e MGEs expressam proteínas anti-CRISPR (Acr) que inibem Cas9 (Pawluk et al., 2016; Hynes et al., 2017; Rauch et al., 2017). A ligação de PID é um mecanismo inibidor eficaz adotado por alguns Acrs (Dong et al., 2017; Shin et al., 2017; Yang e Patel, 2017), sugerindo que a variação de PID também pode ser acionada por pressão seletiva para escapar da inibição de Acr. PIDs de Cas9 podem se desenvolver tal que ortólogos intimamente relacionados reconhecem PAMs distintos, como ilustrado recentemente em duas espécies de Geobacillus. O Cas9 codificado por G. stearothermophilus reconhece um PAM N4CRAA, mas quando seu PID foi trocado com aquele da cepa de Cas9 de LC300, sua exigência de PAM mudou para N4GMAA (Harrington et al., 2017b).
[00204] Em uma modalidade, a presente invenção contempla uma pluralidade de ortólogos de Cas9 N. meninigitidis com PIDs divergentes que reconhecem PAMs diferentes. Em uma modalidade, a presente invenção contempla uma proteína Cas9 com uma alta identidade de sequência (>80% ao longo de seus comprimentos totais) em relação àquela cepa de NmeCas9 8013 (Nme1Cas9) (Zhang et al., 2013). Nme1Cas9 também tem um tamanho pequeno e precisão naturalmente alta como discutido acima. (Lee et al., 2016; Amrani et al., 2018). Alinhamentos revelaram três clados de ortólogos de Cas9 meningocócicos, cada um com >98% de identidade no terminal N ~820 resíduos de aminoácido (aa), que incluem todas as regiões da proteína que não o PID. Vide a Figura 5A e Figura 6A.
[00205] Todos estes ortólogos de Cas9 são 1.078-1.082 aa em comprimento. O primeiro clado (grupo 1) inclui ortólogos nos quais a identidade de sequência >98% aa com Nme1Cas9 se estende através do PID. Pelo contrário, os outros dois grupos tinham PIDs que foram significativamente divergentes daqueles de Nme1Cas9, com ortólogos de grupo 2 e grupo 3 medindo ~52% e ~86% de identidade de sequência de PID com Nme1Cas9, respectivamente. Uma cepa meningocócica foi selecionada de cada grupo: i) De11444 do grupo 2; e ii) 98002 do grupo 3 para análise detalhada, que são referidos aqui como Nme2Cas9 (1.082 aa) e Nme3Cas9 (1.081 aa), respectivamente. Os sítios de CRISPR-cas destas duas cepas têm sequências de repetição e comprimentos do espaçador que são idênticos aqueles da cepa
8013. Vide a Figura 6B. isto sugeriu fortemente que seus crRNAs maduros também têm 24nt de sequências guia e 24 nt de sequências de repetição (Zhang et al., 2013). Similarmente, as sequências de tracrRNA de De11444 e 98002 foram 100% idênticas ao tracrRNA 8013. Vide a Figura 6B. Estas observações implicam que a mesma estrutura da sequência de sgRNA pode guiar a clivagem de DNA por todos os três Cas9s.
[00206] Para determinar se estes ortólogos de Cas9 têm PAMs distintos, o PID de Nme1Cas9 foi substituído com aquele de Nme2Cas9 ou Nme3Cas9. Para identificar as exigências de PAM correspondentes, estas quimeras de proteína foram expressas em Escherichia coli, purificadas e usadas para a identificação de PAM in vitro (Karvelis et al., 2015; Ran et al., 2015; Kim et al., 2017). Em resumo, um pool de fragmentos de DNA contendo um protoespaçador seguido por uma sequência randomizada de 10-nt foi clivado in vitro usando Cas9 recombinante e um cognato, sgRNA transcrito in vitro. Vide a Figura 5B. Somente se esperou que aqueles DNAs contendo uma sequência de PAM Cas9 fossem clivados. Os produtos de clivagem foram então sequenciados para identificar os PAMs. Vide as Figuras 5C-D.
[00207] O consenso PAM N4GATT esperado foi validado no Nme1Cas9 de comprimento total recuperado. Vide a Figura 5C. derivados trocados por PID quiméricos exibiram uma forte preferência por um resíduo C na 5a posição no lugar do G reconhecido por Nme1Cas9. Vide a Figura 5D.
[00208] Em uma modalidade, ABE7.10-nNme2Cas9 (D16A) é usado para a edição de base única de um par de bases AT a um par de bases GC.
Em uma modalidade, BEmax-nNme2Cas9 (D16A) é usado para a edição de base única de par de bases AT a um par de bases GC. (Vide a Figura 3F).
[00209] A Figura 5 ilustra três ortólogos de Cas9 intimamente relacionados de Neisseria meningitidis exemplares que têm PAMs distintos. A Figura 5A mostra um esquema exemplar mostrando resíduos mutados (esferas laranja) entre Nme2Cas9 (esquerda) e Nme3Cas9 (direita) mapeados sobre a estrutura prevista de Nme1Cas9, revelando o grupamento de mutações no PID (preto). A Figura 5B mostra um fluxo de trabalho experimental exemplar do ensaio de descoberta de PAM in vitro com uma região de PAM randomizada de 10 pb. Após a digestão in vitro, adaptadores foram ligados a produtos clivados para a construção e sequenciamento de biblioteca. A Figura 5C mostra logos de sequência exemplares resultantes de descoberta de PAM in vitro que revelam o enriquecimento de um N4GATT PAM para Nme1Cas9, consistente com sua especificidade anteriormente estabelecida. A Figura 5D mostra logos de sequência exemplares indicando que Nme1Cas9 com seu PID trocado com aquele de Nme2Cas9 (esquerda) ou Nme3Cas9 (direita) exige um C na posição 5 de PAM. Os nucleotídeos restantes não foram determinados com alta confiança devido à eficiência de clivagem modesta das quimeras de proteína trocadas por PID (vide a Figura 6C). A Figura 5E mostra uma sequência logo exemplar mostrando que Nme2Cas9 de comprimento total reconhece um N4CC PAM, baseado em clivagem do substrato eficiente de um pool alvo com um C fixo na posição 5 de PAM, e com PAM de nts 1-4 e 6-8 randomizado.
[00210] Quaisquer nucleotídeos de PAM restantes não poderiam ser atribuídos com confiança devido às baixas eficiências de clivagem das proteínas quiméricas sob as condições usadas. Vide a Figura 6C. Para determinar adicionalmente os PAMs, ensaios in vitro foram realizados em uma biblioteca com uma sequência randomizada de 7-nt possuindo um C invariável na 5a posição do PAM (por exemplo, 5’-NNNNCNNN-3’ no filamento não complementar de sgRNA). Esta estratégia rendeu uma eficiência de clivagem muito maior e os resultados indicaram que os PIDs Nme2Cas9 e Nme3Cas9 reconhecem NNNNCC(A) e NNNNCAAA PAMs, respectivamente. Vide as
Figuras 6C-D. O consenso de Nme3Cas9 é similar àquele de GeoCas9 (Harrington et al., 2017b).
[00211] Estes testes foram repetidos usando um Nme2Cas9 de comprimento total (em vez de uma quimera trocada por PID) com o pool de DNA NNNNCNNN e novamente um consenso de NNNNCC(A) foi recuperado. Vide a Figura 5E. Observou-se que este teste teve clivagem mais eficiente. Vide a Figura 6C. Estes dados sugerem que uma ou mais das 15 mudanças de aminoácido em Nme2Cas9 (em relação a Nme1Cas9) fora do PID suportam eficientemente a atividade de clivagem de DNA. Vide a Figura 6C. Visto que o PAM único de 2-3 nt de Nme2Cas9 rende uma maior densidade de sítios alvo potenciais do que os ortólogos de Cas9 compactos anteriormente descritos, ele foi selecionado para análises adicionais.
[00212] A Figura 6 apresenta uma caracterização de ortólogos de Cas9 de Neisseria meningitidis com PIDs de evolução rápida, como relacionado à Figura 5. A Figura 6A mostra uma árvore filogenética não enraizada exemplar de ortólogos de NmeCas9 que são >80% idênticos a Nme1Cas9. Três ramificações distintas surgiram, com a maioria das mutações agrupadas no PID. Grupos 1 (azul), 2 (laranja), e 3 (verde) têm PIDs com >98%, aproximadamente 52%, e aproximadamente 86% de identidade com Nme1Cas9, respectivamente. Três ortólogos de Cas9 representativos (um de cada grupo) (Nme1Cas9, Nme2Cas9 e Nme3Cas9) são indicados. A Figura 6B mostra um esquema exemplar mostrando os sítios de CRISPR-cas das cepas que codificam os três ortólogos de Cas9 (Nme1Cas9, Nme2Cas9, e Nme3Cas9) de (A). As identidades percentuais de cada componente de CRISPR-Cas com N. meningitidis 8013 (codificando Nme1Cas9) são mostradas. As setas azul e vermelha denotam sítios de início de transcrição pre-crRNA e tracrRNA, respectivamente. A Figura 6C mostra que contagens de leitura normalizadas exemplares (% de leituras totais) de DNAs clivados dos ensaios in vitro para Nme1Cas9 intacto (cinza), para quimeras com PID trocado de Nme1Cas9 com aqueles de Nme2Cas9 e
Nme3Cas9 (cores mistas), e para Nme2Cas9 (laranja) de comprimento total, são representados. As contagens de leitura normalizadas reduzidas indicam menores eficiências de clivagem nas quimeras. A Figura 6D mostra logos de sequência exemplares do ensaio de descoberta de PAM in vitro em um pool de NNNNCNNN PAM por Nme1Cas9 com seu PID trocado com aqueles de Nme2Cas9 (esquerda) ou Nme3Cas9 (direita).
2. EDIÇÃO DE GENE DIRECIONADA A N4CC PAM
[00213] Para testar a eficácia de Nme2Cas9 em edição do genoma humano, um construto de Nme2Cas9 de comprimento total (por exemplo, não trocado por PID) otimizado para códon humano foi clonado em um plasmídeo de expressão de mamífero com sinais de localização nucleares em anexo (NLSs) e ligantes validados anteriormente para Nme1Cas9 (Amrani et al., 2018). Para testes iniciais, um Traffic Light Reporter (TLR2.0) modificado baseado em fluorescência foi usado (Certo et al., 2011). Em resumo, um GFP rompido é seguido por um peptídeo fora do quadro T2A e cassete mCherry. Quando rompimentos de filamento duplo de DNA (DSBs) são introduzidos n cassete de GFP rompidos, um subconjunto de eventos de reparo de união de extremidade não homóloga (NHEJ) deixa +1-indels com deslocamento do quadro de leitura, colocando mCherry no quadro e rendendo fluorescência vermelha que pode ser facilmente quantificada por citometria de fluxo. Vide a Figura 7A. os resultados do reparo direcionado à homologia (HDR) também podem ser pontuados simultaneamente ao incluir um doador de DNA que restaura a sequência de GFP funcional, rendendo uma fluorescência verde (Certo et al., 2011). Visto que alguns indels não introduzem um +1 deslocamento do quadro de leitura, a leitura da fluorescência geralmente provê uma subestimativa da eficiência da edição verdadeira. Não obstante, a velocidade, simplicidade e baixo custo do ensaio o torna útil como uma medida inicial, semiquantitativa de edição do genoma em células HEK293T carregando um sítio de TLR2.0 único incorporado por meio do lentivetor.
[00214] Para testes iniciais, o plasmídeo Nme2Cas9 foi co- transfectado transientemente com um de quinze plasmídeos de sgRNA carregando espaçadores que são direcionados a sítios TLR2.0 com N4CC PAMs. Nenhum doador de HDR foi incluído, assim somente a edição baseada em NHEJ (mCherry) foi pontuada. A maioria dos sgRNAs estava em um formato G23 (isto é, um 5’-terminal G para facilitar a transcrição, seguido por uma sequência guia de 23nt), como usado rotineiramente para Nme1Cas9 (Lee et al., 2016; Pawluk et al., 2016; Amrani et al., 2018; Ibraheim et al., 2018). Nenhum sgRNA e um sgRNA direcionado a um N4GATT PAM foram usados como controles negativos, e co-transfecções de SpyCas9+sgRNA e Nme1Cas9+sgRNA (protoespaçadores NGG e N4GATT de direcionamento, respectivamente) foram incluídos como controles positivos. A edição por SpyCas9 e Nme1Cas9 foi prontamente detectável (~28% e 10% de mCherry, respectivamente). Vide a Figura 7B.
[00215] Para Nme2Cas9, todos os 15 alvos com N4CC PAMs foram funcionais, embora em várias medidas variando de 4% a 20% de mCherry. Estes quinze sítios incluem exemplos com cada um dos quatro nucleotídeos possíveis na 7a posição de PAM (por exemplo, após o dinucleotídeo CC), indicando que uma leve preferência por um resíduo A foi observada in vitro (Figura 5E) não reflete uma exigência de PAM para aplicações de edição em células humanas. O controle N4GATT PAM rendeu sinal de mCherry similar ao controle de nenhum sgRNA. Vide a Figura 7B.
[00216] Para determinar se ambos os resíduos C no N4CC PAM estão envolvidos na edição, uma série de sítios PAM N4DC (D = A, T, G) e N4CD foi testada em células repórter TLR2.0. Vide as figuras 8A e 8B. Nenhuma edição detectável foi encontrada em qualquer destes sítios, provendo uma indicação inicial de que ambos os resíduos C do consenso de N4CC PAM são exigidos para a atividade eficiente de Nme2Cas9.
[00217] O comprimento do espaçador no crRNA difere dentre ortólogos de Cas9 e pode afetar a atividade específica vs inespecífica (Cho et al., 2014; Fu et al., 2014). O comprimento ótimo do espaçador de SpyCas9 é 20 nts, com truncamentos para 17 nts tolerados (Fu et al., 2014). Em contraste, Nme1Cas9 usualmente tem espaçadores com 24 nt (Hou et al., 2013; Zhang et al., 2013), e tolera truncamentos de até 18-20 nts (Lee et al., 2016; Amrani et al., 2018). Para testar as exigências de comprimento do espaçador para Nme2Cas9, plasmídeos de RNA guia foram criados para cada sítio TLR2.0 único direcionado, mas com comprimentos do espaçador variáveis. Vide a Figura 7C e Figura 8C. Atividades comparáveis foram observadas com guias G23, G22 e G21, mas a atividade diminuiu significativamente mediante o truncamento adicional até comprimentos de G20 e G19. Vide a Figura 7C. Estes resultados validam Nme2Cas9 como uma plataforma de edição do genoma, com sequências guia de 22-24 nt, em sítios PAM N4CC em células humanas cultivadas.
[00218] A Figura 7 apresenta dados exemplares mostrando que Nme2Cas9 usa um espaçador de 22-24 nt para editar sítios adjacentes a um N4CC PAM. Todos os experimentos foram feitos em triplicata, e barras de erro representam o erro padrão da média (s.e.m.). A Figura 7A mostra um digrama esquemático exemplar descrevendo a transfecção transiente e edição de células HEK293T TLR2.0, com mCherry+ células detectadas por citometria de fluxo 72 horas após a transfecção. A Figura 7B mostra uma edição exemplar de Nme2Cas9 do repórter TLR2.0. Sítios com N4CC PAMs foram direcionados com eficiências variáveis, enquanto nenhum direcionamento de Nme2Cas9 foi observado em um N4GATT PAM ou na ausência de sgRNA. SpyCas9 (direcionado a um sítio validado anteriormente com um PAM NGG) e Nme1Cas9 (direcionado a N4GATT) foram usados como controles positivos. A Figura 7C mostra um efeito exemplar do comprimento do espaçador sobre a eficiência da edição de Nme2Cas9. Um sgRNA direcionado a um sítio único TLR2.0, com comprimentos do espaçador variando de 24 a 20 nts (incluindo o 5’-terminal G exigido pelo promotor U6), indicam que as maiores eficiências de edição são obtidas com espaçadores de 22-24 nt. A Figura 7D mostra que uma nickase duplo An Nme2Cas9 exemplar pode ser usada em tandem para gerar edições baseadas em NHEJ e HDR em TLR2.0. Os plasmídeos que expressam Nme2Cas9 e sgRNA, juntamente com um doador de dsDNA de 800 pb para reparo homólogo, foram eletroporados em células HEK293T TLR2.0, e ambos resultados de NHEJ (mCherry+) e HDR (GFP+) foram pontuados por citometria de fluxo. HNH nickase, Nme2Cas9D16A; RuvC nickase, Nme2Cas9H588A. Sítios de clivagem de 32 pb e 64 pb separados foram direcionados usando ambas nickases. A HNH nickase (Nme2Cas9D16A) rendeu edição eficiente, particularmente com os sítios de clivagem que foram separados por 32 pb, enquanto a RuvC nickase (Nme2Cas9H588A) não foi eficaz. Nme2Cas9 do tipo selvagem foi usado como um controle.
3. EDIÇÃO PRECISA POR HDR E HNH NICKASE
[00219] As enzimas Cas9 usam seus domínios HNH e RuvC para clivar o filamento guia-complementar e não complementar do DNA alvo, respectivamente. SpyCas9 nickases (nCas9s), nas quais o domínio HNH ou RuvC é mutacionalmente inativado, foi usado para induzir o reparo direcionado por homologia (HDR) e para melhorar a especificidade da edição do genoma por meio de indução de DSB por nickases duais (Mali et al., 2013a; Ran et al., 2013).
[00220] Para testar a eficácia de Nme2Cas9 como uma nickase, um Nme2Cas9D16A (HNH nickase) e Nme2Cas9H588A (RuvC nickase) foram criados, os quais possuem mutações de alanina em resíduos catalíticos dos domínios RuvC e HNH, respectivamente (Esvelt et al., 2013; Hou et al., 2013; Zhang et al., 2013). As células TLR2.0, juntamente com um dsDNA doador de GFP, foram usadas para determinar se nickases induzidas por Nme2Cas9podem induzir edições precisas por meio de HDR. Os sítios alvo dentro de TLR2.0 foram usados para testar a funcionalidade de cada nickase usando guias direcionados a sítios de clivagem espaçados 32 pb e 64 pb. Vide a Figura 7D. Nme2Cas9 do tipo selvagem direcionado a um sítio único mostrou edição eficiente, com ambos NHEJ e HDR como resultados de reparo. Para nickases, sítios de clivagem 32 pb e 64 pb separados mostraram edição usando o Nme2Cas9D16A (HNH nickase), mas nenhum par alvo trabalhou com Nme2Cas9H588A. Estes resultados sugerem que Nme2Cas9 HNH nickase pode ser usado para edição do genoma eficiente, desde que os sítios estejam bem próximos.
[00221] Estudos em Cas9s caracterizados anteriormente identificaram uma região específica próxima ao PAM onde a atividade de Cas9 é altamente sensível a incompatibilidades da sequência. Esta região de 8 a 12 nt é conhecida como a sequência de semente e foi observada dentre todos os Cas9s caracterizados até hoje (Gorski et al., 2017). Para determinar se Nme2Cas9 também possui uma sequência de semente, uma série de transfecções transientes foi realizada, cada uma direcionada ao mesmo sítio em TLR2.0, mas com uma incompatibilidade de nucleotídeo única em diferentes posições do guia. Vide a Figura 8D. Uma diminuição significativa no número de células positivas mCherry foi observada para incompatibilidades nos primeiros 10-12 nts próximo ao PAM, sugerindo que Nme2Cas9 possui uma sequência de semente nesta região.
[00222] A Figura 8 apresenta dados exemplares mostrando exigências de PAM, espaçador, e semente para Nme2Cas9 direcionado em células de mamíferos, como relacionado à Figura 7. Todos os experimentos foram feitos em triplicata e barras de erro representam s.e.m. A Figura 8A mostra um Nme2Cas9 exemplar direcionado em sítios N4CD em TLR2.0, com edição estimada com base em mCherry+ células. Quatro sítios para cada nucleotídeo não C na posição testada (N4CA, N4CT e N4CG) foram examinados, e um sítio N4CC foi usado como um controle positivo. A Figura 8B mostra um Nme2Cas9 exemplar direcionado em sítios N4DC em TLR2.0 [similar a (A)]. A Figura 8C mostra truncamentos guia exemplares em um sítio TLR2.0 (distinto daquele na Figura 2C) com um N4CCA PAM, revelando exigências de comprimento similares aquelas observadas no outro sítio. A Figura 8D mostra que a eficiência de direcionamento de Nme2Cas9 exemplar é diferencialmente sensível a incompatibilidades de nucleotídeo único na região de semente do sgRNA. Os dados mostram os efeitos de incompatibilidades de sgRNA de nucleotídeo único ambulante ao longo do espaçador de 23 nt em um sítio alvo TLR2.0.
4. MÉTODOS DE DISTRIBUIÇÃO PARA TIPOS CELULARES DE
MAMÍFEROS
[00223] A capacidade de Nme2Cas9 de funcionar em diferentes linhagens celulares de mamíferos foi testada usando vários métodos de distribuição. Como um teste inicial, quarenta (40) sítios diferentes (29 com um N4CC PAM, e 11 sítios foram testados com um N4CD PAM). Vários sítios foram selecionados (AAVS1, VEGFA, etc.), e sítios alvo com N4CC PAMs foram escolhidos randomicamente para a edição com Nme2Cas9. A edição (%) foi determinadas ao transfectar transientemente 150 ng de Nme2Cas9 juntamente com 150 ng de plasmídeos de sgRNA seguido por análise TIDE 72 horas após a transfecção. Um subconjunto de sítios exibindo uma faixa de eficiências de edição nesta seleção inicial foi selecionado para análises de repetição em triplicata. Vide a Figura 9A; e Tabela 1.
[00224] A Figura 9 apresenta dados exemplares mostrando edição do genoma de Nme2Cas9 em sítios endógenos em células de mamíferos por meio de métodos de distribuição múltiplos. Todos os resultados representam 3 réplicas biológicas independentes, e barras de erro representam s.e.m. A Figura 9A mostra uma edição do genoma de Nme2Cas9 exemplar de sítios humanos endógenos em células HEK293T após a transfecção transiente de plasmídeos que expressam Nme2Cas9 e sgRNA. 40 sítios foram selecionados inicialmente (Tabela 1); os 14 sítios mostrados (selecionados para incluir representantes de eficiências de edição variáveis, como medido por TIDE) foram então reanalisados em triplicata. Um sítio alvo Nme1Cas9 (com um N4GATT PAM) foi usado como um controle negativo. A Figura 9B mostra gráficos de dados exemplares: Painel da esquerda: Transfecção transiente de um plasmídeo único que expressa ambos Nme2Cas9 e sgRNA (direcionados aos sítios de Pcsk9 e
Rosa26) permite a edição em células de camundongo Hepa1-6, como detectado por TIDE.
Painel da direita: Eletroporação de plasmídeos de sgRNA em células K562 que expressam estavelmente Nme2Cas9 de um lentivetor resulta em formação de indel eficiente.
A Figura 9C mostra que Nme2Cas9 exemplar pode ser eletroporado como um complexo de RNP para induzir a edição do genoma. 40 picomoles de Cas9 juntamente com 50 picomoles de sgRNAs transcritos in vitro direcionados a três sítios diferentes foram eletroporados em células HEK293T.
Indels foram medidos após 72 h usando TIDE.
Tabela 1. Sítios de edição do genoma humano endógeno exemplares direcionados por Nme2Cas9. No.
Nome Sequência espaçadora PAM Lócus Edição do (%) sítio
1 TS1 GGTTCTGGGTACTTTTATCTGTCC CCTCCACC AAVS1 ND
2 TS4 GTCTGCCTAACAGGAGGTGGGGGT TAGACGAA AAVS1 11
3 TS5 GAATATCAGGAGACTAGGAAGGAG GAGGCCTA AAVS1 15
4 TS6 GCCTCCCTGCAGGGCTGCTCCC CAGCCCAA LINC01588 20
5 TS10 GAGCTAGTCTTCTTCCTCCAACCC GGGCCCTA AAVS1 3.5
6 TS11 GATCTGTCCCCTCCACCCCACAGT GGGGCCAC AAVS1 9
7 TS12 GGCCCAAATGAAAGGAGTGAGAGG TGACCCGA AAVS1 10
8 TS13 GCATCCTCTTGCTTTCTTTGCCTG GACACCCCA AVS1 2
9 TS16 GGAGTCGCCAGAGGCCGGTGGTGG ATTTCCTC LINC01588 28
10 TS17 GCCCAGCGGCCGGATATCAGCTGC CACGCCCG LINC01588 ND
11 TS18 GGAAGGGAACATATTACTATTGC TTTCCCTC CYBB 1
12 TS19 GTGGAGTGGCCTGCTATCAGCTAC CTATCCAA CYBB 6
13 TS20 GAGGAAGGGAACATATTACTATTG CTTTCCCT CYBB 11.2
14 TS21 GTGAATTCTCATCAGCTAAAATGC CAAGCCTT CYBB 1
15 TS25 GCTCACTCACCCACACAGACACAC ACGTCCTC VEGFA 15.6
16 TS26 GGAAGAATTTCATTCTGTTCTCAG TTTTCCTG CFTR 2
17 TS27 GCTCAGTTTTCCTGGATTATGCCT GGCACCAT CFTR 4
18 TS31 GCGTTGGAGCGGGGAGAAGGCCAG GGGTCACT VEGFA 9
19 TS34 GGGCCGCGGAGATAGCTGCAGGGC GGGGCCCC LINC01588 ND
20 TS35 GCCCACCCGGCGGCGCCTCCCTGC AGGGCTGC LINC01588 ND
21 TS36 GCGTGGCAGCTGATATCCGGCCGC TGGGCGTC LINC01588 ND
22 TS37 GCCGCGGCGCGACGTGGAGCCAGC CCCGCAAA LINC01588 ND
23 TS38 GTGCTCCCCAGCCCAAACCGCCGC GGCGCGAC LINC01588 2
24 TS41 GTCAGATTGGCTTGCTCGGAATTG CCAGCCAA AGA 3
25 TS44 GCTGGGTGAATGGAGCGAGCAGCG TCTTCGAG VEGFA 3
26 TS45 GTCCTGGAGTGACCCCTGGCCTTC TCCCCGCT VEGFA 7.4
27 TS46 GATCCTGGAGTGACCCCTGGCCTT CTCCCCGC VEGFA 6
28 TS47 GTGTGTCCCTCTCCCCACCCGTCC CTGTCCGG VEGFA 23.1
29 TS48 GTTGGAGCGGGGAGAAGGCCAGGG GTCACTCC VEGFA 2
30 TS49 GCGTTGGAGCGGGGAGAAGGCCAG GGGTCACT VEGFA 4
31 TS50 GTACCCTCCAATAATTTGGCTGGC AATTCCGA AGA 6
32 TS51 GATAATTTGGCTGGCAATTCCGAG CAAGCCAA AGA 4.5
33 TS58 GCAGGGGCCAGGTGTCCTTCTCTG GGGGCCTC VEGFA 5 (DS1)
34 TS59 GAATGGCAGGCGGAGGTTGTACTG GGGGCCAG VEGFA 11.5 (DS2)
35 TS60 GAGTGAGAGAGTGAGAGAGAGACA CGGGCCAG VEGFA 3 (DS3)
36 TS61 GTGAGCAGGCACCTGTGCCAACAT GGGCCCGC VEGFA 3.5 (DS4)
37 TS62 GCGTGGGGGCTCCGTGCCCCACGC GGGTCCAT VEGFA 3.4 (DS5)
38 TS63 GCATGGGCAGGGGCTGGGGTGCAC AGGCCCAG VEGFA 16 (DS6)
39 TS64 GAAAATTGTGATTTCCAGATCCAC AAGCCCAA FANCJ 7
40 TS65 GAGCAGAAAAAATTGTGATTTCC AGATCCAC FANCJ ND
No. Nome Nome do iniciador Iniciador TIDE FW Iniciador TIDE RV do TIDE sítio 1 TS1 AAVS1_TIDE1 TGGCTTAGCACCTCTCC AGAACTCAGGACCAACTTATT
AT CTG 2 TS4 AAVS1_TIDE1 TGGCTTAGCACCTCTCC AGAACTCAGGACCAACTTATT
AT CTG 3 TS5 AAVS1_TIDE1 TGGCTTAGCACCTCTCC AGAACTCAGGACCAACTTATT
AT CTG 4 TS6 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 5 TS10 AAVS1_TIDE1 TGGCTTAGCACCTCTCC AGAACTCAGGACCAACTTATT
AT CTG 6 TS11 AAVS1_TIDE1 TGGCTTAGCACCTCTCC AGAACTCAGGACCAACTTATT
AT CTG 7 TS12 AAVS1_TIDE2 TCCGTCTTCCTCCACTCC TAGGAAGGAGGAGGCCTAAG 8 TS13 AAVS1_TIDE2 TCCGTCTTCCTCCACTCC TAGGAAGGAGGAGGCCTAAG 9 TS16 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 10 TS17 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 11 TS18 NTS55_TIDE TAGAGAACTGGGTAGTG CCAATATTGCATGGGATGG
TG 12 TS19 NTS55_TIDE TAGAGAACTGGGTAGTG CCAATATTGCATGGGATGG
TG 13 TS20 NTS55_TIDE TAGAGAACTGGGTAGTG CCAATATTGCATGGGATGG
TG 14 TS21 NTS55_TIDE TAGAGAACTGGGTAGTG CCAATATTGCATGGGATGG
TG 15 TS25 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 16 TS26 hCFTR_TIDE1 TGGTGATTATGGGAGAA ACCATTGAGGACGTTTGTCTC
CTGGAGC AC 17 TS27 hCFTR_TIDE1 TGGTGATTATGGGAGAA ACCATTGAGGACGTTTGTCTC
CTGGAGC AC 18 TS31 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C
19 TS34 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 20 TS35 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 21 TS36 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 22 TS37 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 23 TS38 LINC01588_TIDE AGAGGAGCCTTCTGACT ATGACAGACACAACCAGAGG
GCTGCAGA GCA 24 TS41 AGA_TIDE1 GGCATAAGGAAATCGAA CATGTCCTCAAGTCAAGAACA
GGTC AG 25 TS44 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 26 TS45 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 27 TS46 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 28 TS47 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 29 TS48 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 30 TS49 VEGF_TIDE3 GTACATGAAGCAACTCC ATCAAATTCCAGCACCGAGCG
AGTCCCA C 31 TS50 AGA_TIDE1 GGCATAAGGAAATCGAA CATGTCCTCAAGTCAAGAACA
GGTC AG 32 TS51 AGA_TIDE1 GGCATAAGGAAATCGAA CATGTCCTCAAGTCAAGAACA
GGTC AG 33 TS58 VEGF_TIDE4 ACACGGGCAGCATGGGA GCTAGGGGAGAGTCCCACTG (DS1) ATAGTC TCCA 34 TS59 VEGF_TIDE5 CCTGTGTGGCTTTGCTTT GGTAGGGTGTGATGGGAGGC (DS2) GGTC TAAGC 35 TS60 VEGF_TIDE5 CCTGTGTGGCTTTGCTTT GGTAGGGTGTGATGGGAGGC (DS3) GGTC TAAGC 36 TS61 VEGF_TIDE5 CCTGTGTGGCTTTGCTTT GGTAGGGTGTGATGGGAGGC (DS4) GGTC TAAGC
37 TS62 VEGF_TIDE6 GGAGGAAGAGTAGCTCG AGACCGAGTGGCAGTGACAG (DS5) CCGAGG CAAG 38 TS63 VEGF_TIDE7 AGGGAGAGGGAAGTGTG GTCTTCCTGCTCTGTGCGCAC (DS6) GGGAAGG GAC 39 TS64 FancJ_TIDE5 GTTGGGGGCTCTAAGTT CTTCATCTGTATCTTCAGGAT
ATGTAT CA 40 TS65 FancJ_TIDE5 GTTGGGGGCTCTAAGTT CTTCATCTGTATCTTCAGGAT
ATGTAT CA
[00225] As células HEK293T foram usadas para suportar as transfecções transientes e em 72 horas após a transfecção, as células foram coletadas, seguido por extração de DNA genômico e amplificação seletiva do sítio direcionado. A análise TIDE foi usada para medir a eficiência de indel em cada sítio (Brincam et al., 2014). A edição de Nme2Cas9 foi detectável na maioria destes sítios, mesmo que as eficiências variem dependendo da sequência alvo. Tabela 1. De modo interessante, Nme2Cas9 induziu indels em vários sítios genômicos com N4CD PAMs, embora menos consistentemente e em níveis menores. Tabela 1. Quatorze (14) sítios com N4CC PAMs foram analisados em triplicata, e edição consistente foi observada. Vide a Figura 9A. Além disso, a eficiência da edição poderia ser melhorada significativamente pelo aumento da quantidade do plasmídeo Nme2Cas9 distribuído, e esta alta eficiência poderia ser estendida para precisar a deleção segmentar com dois guias. Vide as figuras 10A e 10B.
[00226] A capacidade de Nme2Cas9 de funcionar foi testada em células de camundongo Hepa1-6 (derivadas de hepatoma). Para células Hepa1- 6, um plasmídeo único que codifica ambos Nme2Cas9 e um sgRNA (direcionados a Rosa26 ou Pcsk9) foi transientemente transfectado e indels foram medidos após 72 h. a edição foi prontamente observada em ambos os sítios. Vide a Figura 9B, esquerda. A funcionalidade de Nme2Cas9 também foi testada quando estavelmente expressa em células K562 de leucemia humana.
Com este fim, um construto lentiviral foi criado expressando Nme2Cas9 e células transduzidas para expressar estavelmente Nme2Cas9 sob o controle do promotor de SFFV. Esta linhagem celular estável não mostrou quaisquer diferenças visíveis com relação ao crescimento e morfologia em comparação a células não transduzidas, sugerindo que Nme2Cas9 não é tóxico quando estavelmente expresso. Estas células foram transientemente eletroporadas com plasmídeos que expressam sgRNAs e analisadas por TIDE após 72 horas para medir ineficiências de indel. A edição eficiente (>50%) foi observada em todos os três sítios testados, validando a capacidade de Nme2Cas9 de funcionar mediante a distribuição lentiviral em células K562. Vide a Figura 9B.
[00227] A distribuição de ribonucleoproteína (RNP) de Cas9 e seu sgRNA também é útil para algumas aplicações de edição do genoma, e a maior transitoriedade da presença de Cas9 pode minimizar a edição inespecífica (Kim et al., 2014; Zuris et al., 2015). Além disso, alguns tipos de células (por exemplo, certas células imunes) são recalcitrantes para a edição baseada na transfecção de DNA (Schumann et al., 2015). Para testar se Nme2Cas9 é funcional por Distribuição de RNP, um 6xHis-tagged Nme2Cas9 (fundido a três NLSs) foi clonado em um construto de expressão bacteriana e a proteína recombinante foi purificada. A proteína recombinante foi então carregada com sgRNAs transcritos por T7 RNA polimerase direcionada a três sítios validados anteriormente. A eletroporação do complexo de Nme2Cas9:sgRNA induziu a edição bem- sucedida em cada um dos três sítios alvo em células HEK293T, como detectado por TIDE. Vide a Figura 9C. Coletivamente estes resultados indicam que Nme2Cas9 pode ser distribuído eficazmente por meio de plasmídeo ou lentivírus, ou como um complexo de RNP, em múltiplos tipos de células.
5. REGULAÇÃO ANTI-CRISPR
[00228] Até hoje, cinco famílias de Acrs de espécies bacterianas diversas foram mostradas como inibindo Nme1Cas9 in vitro e em células humanas (Pawluk et al., 2016; Lee et al., 2018, submitted). Considerando a alta identidade de sequência entre Nme1Cas9 e Nme2Cas9, pelo menos algumas destas famílias de Acr devem inibir Nme2Cas9. Para testar isto, todas as cinco famílias de Acrs recombinantes foram expressas, purificadas e testadas quanto a capacidade de Nme2Cas9 de clivar um alvo in vitro na presença de um membro de cada família (razão molar 10:1 Acr:Cas9). Um inibidor foi usado para o sistema CRISPR do tipo I-E em E. coli (AcrE2) como um controle negativo, enquanto Nme1Cas9 foi usado como um controle positivo. (Pawluk et al., 2014); (Pawluk et al., 2016). Como esperado, todas as 5 famílias inibiram Nme1Cas9, enquanto AcrE2 falhou em fazê-lo. Vide a Figura 11A, topo. AcrIIC1Nme, AcrIIC2Nme, AcrIIC3Nme, e AcrIIC4Hpa inibiram completamente Nme2Cas9. Notavelmente, no entanto, AcrIIC5Smu que foi reportado anteriormente como o mais potente dos inibidores de Nme1Cas9 (Lee et al., 2018), não inibiu Nme2Cas9 in vitro mesmo em um excesso molar de 10 vezes. Isto sugere que ele provavelmente inibe Nme1Cas9 pela interação com seu PID.
[00229] A Figura 10 apresenta dados exemplares mostrando dependência de dose e seleções segmentares por Nme2Cas9, como relacionado à Figura 9. A Figura 10A mostra que o aumento exemplar da dose de plasmídeo eletroporado Nme2Cas9 (500 ng, vs. 200 ng na Figura 3A) melhora a eficiência da edição em dois sítios (TS16 e TS6). Os dados providos em amarelo são reutilizados da Figura 9A. A Figura 10B mostra que Nme2Cas9 exemplar pode ser usado para criar deleções segmentares precisas. Dois alvos TLR2.0 com sítios de clivagem de 32 pb separados foram direcionados simultaneamente com Nme2Cas9. A maioria das lesões criadas foram deleçõ4es de exatamente 32 pb (azul).
[00230] A Figura 11 apresenta dados exemplares mostrando que Nme2Cas9 é sujeito à inibição por um subconjunto de famílias anti-CRISPR do tipo II-C in vitro e em células. Todos os experimentos foram feitos em triplicata e barras de erro representam s.e.m. A Figura 11A mostra ensaio de clivagem exemplar in vitro de Nme1Cas9 e Nme2Cas9 na presença de cinco proteínas anti-CRISPR caracterizadas anteriormente (razão 10:1 de Acr:Cas9). Topo: Nme1Cas9 cliva eficientemente um fragmento contendo um protoespaçador com um N4GATT PAM na ausência de um Acr ou na presença de um controle negativo de Acr (AcrE2). Todas as cinco famílias Acr do tipo II-C caracterizadas anteriormente inibiram Nme1Cas9, como esperado. Fundo: a inibição de Nme2Cas9 espelha aquela de Nme1Cas9, exceto pela carência de inibição por AcrIIC5Smu. A Figura 11B mostra edição do genoma exemplar na presença de das cinco famílias anti-CRISPR anteriormente descritas. Os plasmídeos que expressam Nme2Cas9 (200 ng), sgRNA (100 ng) e cada respectivo Acr (200 ng) foram co-transfectado em células HEK293T, e a edição do genoma foi medida usando Rastreamento de Indels por Decomposição (TIDE) 72 h após a transfecção. Consistente com as presentes análises in vitro, todos os anti- CRISPRs do tipo II-C exceto AcrIIC5Smu inibiram a edição do genoma, embora com eficiências diferentes. A Figura 11C mostra que a inibição de Acr exemplar de Nme2Cas9 é dependente da dose com potências aparentes distintas. Nme2Cas9 é totalmente inibido por AcrIIC1Nme e AcrIIC4Hpa em razões de massa 2:1 e 1:1 de Acr cotransfectado e plasmídeos Nme2Cas9, respectivamente.
[00231] Para testar ainda isto, uma quimera de Nme1Cas9/Nme2Cas9 com o PID de Nme2Cas9 foi testada. Vide a Figura 5D e Figura 6D. Devido à atividade reduzida deste híbrido, uma concentração ~30x maior de Cas9 foi usada para alcançar uma eficiência de clivagem similar enquanto mantém a razão molar 10:1 Cas9:Acr. Nenhuma inibição foi observada por AcrIIC5Smu nesta quimera de proteína. Vide a Figura 12. Estes dados proveem evidência adicional de que AcrIIC5Smu provavelmente interage com o PID de Nme1Cas9. Independente da base mecanística para a inibição diferencial por AcrIIC5Smu, estes resultados indicam que Nme2Cas9 é sujeito à inibição pelas outras quatro famílias Acr do tipo II-C.
[00232] A Figura 12 apresenta dados exemplares mostrando que uma troca de PID Nme2Cas9 rende Nme1Cas9 insensível à inibição de
AcrIIC5Smu, como relacionado à Figura 11. A clivagem in vitro pela quimera de Nme1Cas9-Nme2Cas9PID na presença de proteínas Acr caracterizadas anteriormente (10 uM Cas9-sgRNA + 100 uM Acr).
[00233] Com base nos dados in vitro acima, foi hipotetizado que AcrIIC1Nme, AcrIIC2Nme, AcrIIC3Nme, e AcrIIC4Hpa poderiam ser usados como interruptores de desligar para a edição do genoma de Nme2Cas9. Para testar isso, as transfecções de plasmídeo Nme2Cas9/sgRNA (150 ng de cada plasmídeo) direcionadas a TS16 foram realizadas em células HEK293T na presença ou ausência de plasmídeos de expressão de Acr, como foi reportado que a maioria de Acrs inibiu Nme1Cas9 naquelas razões de plasmídeo (Pawluk et al., 2016). Como esperado, AcrIIC1Nme, AcrIIC2Nme, AcrIIC3Nme e AcrIIC4Hpa inibiram a edição do genoma de Nme2Cas9, enquanto AcrIIC5Smu não teve qualquer efeito. Vide a Figura 11B. A inibição completa foi observada por AcrIIC3Nme e AcrIIC4Hpa, sugerindo que eles têm alta potência contra Nme2Cas9 quando comparado a AcrIIC1Nme e AcrIIC2Nme. Para comparar ainda a potência de AcrIIC1Nme e AcrIIC4Hpa, foram repetidos os experimentos em várias razões de plasmídeo Acr a plasmídeo Cas9. Vide a Figura 11C. Os dados mostram que o plasmídeo AcrIIC4Hpa é especialmente potente contra Nme2Cas9. Em conjunto, estes dados sugerem que várias proteínas Acr podem ser usadas como interruptores de desligar para aplicações baseadas em Nme2Cas9.
6. HIPERPRECISÃO
[00234] Nme1Cas9 demonstra fidelidade de edição notável em células e modelos de camundongo (Lee et al., 2016; Amrani et al., 2018; Ibraheim et al., 2018). Além disso, a similaridade de Nme2Cas9 com Nme1Cas9 sobre a maioria do seu comprimento sugere que ele pode ser provavelmente hiperpreciso. No entanto, o maior número de sítios amostrados no genoma como um resultado do dinucleotídeo PAM poderia criar mais oportunidades para a inespecificidade de Nme2Cas9 em comparação com Nme1Cas9 e seu menos frequentemente encontrado 4-nucleotídeo PAM. Para avaliar o perfil inespecífico de Nme2Cas9, GUIDE-seq (identificação imparcial em todo o genoma de rompimentos do filamento duplo permitida pelo sequenciamento) foi usado para identificar sítios inespecíficos potenciais empiricamente e de maneira imparcial (Tsai et al., 2014). Mesmo os melhores algoritmos de previsão inespecíficos são passíveis de falso negativos necessitando de métodos empíricos de perfilamento de sítio alvo (Bolukbasi et al., 2015b; Tsai e Joung, 2016; Tycko et al., 2016). GUIDE-seq depende da incorporação de oligodesoxinucleotídeos de filamento duplo (dsODNs) em sítios de rompimento do filamento duplo do DNA em todo o genoma. Estes sítios de inserção são então detectados por amplificação e sequenciamento de alto rendimento.
[00235] Visto que SpyCas9 é um Cas9 ortólogo bem-caracterizado, ele é útil para aplicações multiplexadas com outros Cas9s, e como uma referência para suas propriedades de edição (Jiang e Doudna, 2017; Komor et al., 2017). SpyCas9 e Nme2Cas9 foram clonados em estruturas principais de plasmídeo idênticas, com os mesmos UTRs, ligantes, NLSs, e promotores, para transfecções transientes paralelas (juntamente com plasmídeos que expressam sgRNA similarmente combinados) em células HEK293T. Primeiramente, foi confirmado que os guias de RNA para SpyCas9 e Nme2Cas9 são ortogonais, isto é, que Nme2Cas9 sgRNAs não direciona a edição por SpyCas9, e vice- versa. Vide a Figura 13A. Isto estava em contraste com os resultados recentemente reportados com Nme1Cas9 (Esvelt et al., 2013; Fonfara et al., 2014).
[00236] Em seguida, para identificar um uso de SpyCas9 como uma referência para GUIDE-seq, porque SpyCas9 e Nme2Cas9 têm PAMs de não sobreposição, ele pode, portanto, editar potencialmente qualquer sítio duplo (DS) flanqueado por uma sequência 5’-NGGNCC-3’, que cumpre simultaneamente as exigências de PAM de ambos Cas9’s.isto permite comparações lado a lado de inespecificidade com guias de RNA que facilitam uma edição do exato mesmo sítio específico. Vide a Figura 14A. Seis (6) DSs em VEGFA foram direcionados,
cada um dos quais também tem um G nas posições apropriadas 5’ do PAM tal que ambos os guias SpyCas9 e Nme2Cas9 (acionados pelo promotor U6) foram 100% complementares ao sítio alvo. Setenta e duas (72) horas após a transfecção, uma análise TIDE foi realizada nestes sítios direcionados por cada nuclease. Nme2Cas9 induziu indels em todos os seis sítios, embora em baixas eficiências em dois deles, enquanto SpyCas9 induziu indels em quatro dos seis sítios. Vide a Figura 14B. Em dois dos quatro sítios (DS1 e DS4), nos quais SpyCas9 foi eficaz, ele induziu ~7 vezes mais indels do que Nme2Cas9, enquanto Nme2Cas9 induziu uma frequência de indels ~3 vezes maior do que SpyCas9 em DS6. Ambos os ortólogos de Cas9 editaram DS2 com eficiência aproximadamente igual.
[00237] Para GUIDE-seq, DS2, DS4 e DS6 foram selecionados para amostrar clivagem inespecífica com guias Nme2Cas9 que direcionam a edição específica tão eficientemente, menos eficientemente, ou mais eficientemente do que os guias SpyCas9 correspondentes, respectivamente. Além dos três sítios duais, TS6 foi adicionado visto que se observou que ele é um sítio alvo Nme2Cas9 eficientemente editado, tendo uma eficiência de indel aproximada de 30-50% dependendo do tipo de célula. Vide as figuras 9A e 10A. dados similares são vistos com os sítios de camundongo Pcsk9 e Rosa26 Nme2Cas9. Vide a Figura 9B.
[00238] As transfecções de plasmídeo foram realizadas para cada Cas9 juntamente com seus sgRNAs cognatos e os dsODNs. Subsequentemente, as bibliotecas de GUIDE-seq foram preparadas como descrito anteriormente (Amrani et al., 2018). Uma análise de GUIDE-seq revelou edição específica eficiente para ambos os ortólogos de Cas9, com eficiências relativas (como refletido por contagens de leitura GUIDE-seq) que são similares àquelas observadas por TIDE. A Figura 13B e Tabela 2. (Tsai et al., 2014; Zhu et al., 2017).
[00239] A Figura 13 apresenta dados exemplares mostrando ortogonalidade e precisão relativa de Nme2Cas9 e SpyCas9 em sítios alvo duais, como relacionado à Figura 12. A Figura 13A mostra que guias Nme2Cas9 e SpyCas9 exemplares são ortogonais.
Os resultados de TIDE mostram as frequências de indels criadas por ambas nucleases direcionadas a DS2 com seus sgRNAs cognatos ou com os sgRNAs do outro ortólogo.
A Figura 13B mostra Nme2Cas9 e SpyCas9 exemplares exibindo eficiências de edição específicas comparáveis quando avaliado por GUIDE-seq.
As barras indicam contagens de leitura específicas de GUIDE-Seq nos três sítios duais direcionados por cada ortólogo.
As barras laranja representam Nme2Cas9 e as barras pretas representam SpyCas9. A Figura 13C mostra SpyCas9’s contagens de leitura específicas vs inespecíficas exemplares para cada sítio.
As barras laranja representam as leituras específicas enquanto as barras pretas representam leituras inespecíficas.
A Figura 13D mostra leituras específicas vs inespecíficas de Nme2Cas9 exemplares para cada sítio.
Os gráficos de barra da Figura 13E mostram ineficiências de indel exemplares (medidas por TIDE) em sítios inespecíficos potenciais previstos por CRISPRSeek.
As sequências de sítio específico e não específico são mostradas à esquerda, com a região de PAM sublinhada e incompatibilidades de sgRNA e nucleotídeos de PAM não consenso dados em vermelho.
TABELA 2: DADOS DE GUIDE-SEQ SpyDS2 (gRNA.nome SpyDS2) Inespecífico (OffTarget) Pico da Pontuação de clivagem pontuação prevista chr6:-:43748587:43748609 652 100 chr1:+:82004618:82004640 304 4.1 chr1:-:31140567:31140589 275 19.6 chr16:+:30357052:30357074 226 0.6 chr5:-:33453895:33453917 217 4 chr11:+:116600352:116600374 206 0.4 chr17:-:46938649:46938671 191 0.6 chr9:-:130859778:130859800 146 5.4 chr15:+:59837681:59837703 143 2.6 chr22:-:19135541:19135563 124 0.3 chrX:+:49057600:49057622 122 0.6 chr7:-:72751388:72751410 117 2.6 chr3:-:51652045:51652067 115 0.3 chr1:-:9544334:9544356 109 0.7 chr3:-:47868006:47868028 99 2.6 chr9:+:140670069:140670091 91 0.4 chr2:-:149516035:149516057 90 0.3 chr22:-:18245713:18245735 89 0.2 chr3:+:154744438:154744460 89 2.6 chr17:-:73320669:73320691 88 0.7 chr1:-:38479457:38479479 85 2.6 chr7:+:33058792:33058814 78 0.3 chr9:+:108299833:108299855 76 1 chr1:-:23627429:23627451 74 0.5 chr2:-:63393272:63393294 74 0.5 chr16:+:71467786:71467808 70 0.6 chr1:-:111638773:111638795 67 0.3 chr1:-:213393740:213393762 67 0.5 chr7:+:38284425:38284447 67 0.3 chr7:-:134511606:134511628 66 0.2 chr7:+:152293366:152293388 66 0.7 chr17:+:60243345:60243367 63 0.5 chrX:-:48007735:48007757 60 0.6 chr1:+:52768707:52768729 58 5.4 chr19:-:38805324:38805346 58 0.3 chrX:-:41283776:41283798 58 2.6 chr11:-:14539718:14539740 57 2.6 chr6:+:32895093:32895115 57 0.7 chr7:-:138957343:138957365 56 98.6 chr3:-:63900682:63900704 52 0.4 chr5:-:79624954:79624976 52 2.6 chr7:+:76012229:76012251 52 0.7 chrX:+:39889198:39889220 52 2.6 chr4:-:99897525:99897547 51 5.4 chr1:-:25822709:25822731 50 0.7 chr5:+:17293204:17293226 50 0.7 chr13:-:66697991:66698013 49 0.1 chr5:-:80796103:80796125 49 2.6 chr16:+:49239128:49239150 45 1.9 chr3:+:69489884:69489906 43 0.5 chr8:+:113712655:113712677 42 0.3 chr2:-:24502672:24502694 39 2.6 chr7:-:65642349:65642371 39 2.6 chrX:-:135700076:135700098 37 2.6 chr1:-:99795756:99795778 36 6.2 chr19:+:1821377:1821399 36 0.2 chr4:-:75501534:75501556 36 0.3 chr18:+:74828740:74828762 34 0.3 chrX:+:133975784:133975806 34 6.2 chr14:+:55717904:55717926 33 98.6 chr13:+:49522615:49522637 32 0.3 chr3:-:77788415:77788437 32 0.7 chr11:-:48230825:48230847 31 6.2 chr1:-:1280441:1280463 30 0.3 chr7:+:44602379:44602401 30 5.4 chr12:-:108166294:108166316 29 5.4 chr7:-:111929850:111929872 29 4 chr12:-:122404237:122404259 27 0.2 chr12:-:79123453:79123475 27 0.7 chr22:-:46412541:46412563 27 6.2 chr5:+:93889070:93889092 26 0.3 chr10:-:97776548:97776570 25 0.6 chr2:-:56533335:56533357 24 98.6 chr3:+:149843401:149843423 24 0.1 chr1:-:232769157:232769179 23 2.6 chr15:-:75100050:75100072 21 2.6 chr18:+:37252965:37252987 21 0.6 chr2:-:44506208:44506230 21 2.6 chr4:+:182389352:182389374 21 0.6 chr11:+:9360929:9360951 20 98.6 chr12:+:23638452:23638474 19 0.4 chr7:-:66498753:66498775 19 1.4 chr13:+:32055862:32055884 16 6.2 chr15:-:59331986:59332008 16 6.2 chr2:+:126196868:126196890 16 0.7 chrX:-:77359566:77359588 16 0 chrX:+:24652788:24652810 16 6.2 chr17:-:17667857:17667879 15 0.4 chr21:+:34751155:34751177 15 2.6 chr2:-:48734975:48734997 14 5.4 chr1:-:69755048:69755070 13 2.6 chr16:+:90013282:90013304 13 1.1 chr18:-:630757:630779 13 5.4 chr3:-:163905630:163905652 12 0.6 gRNAPlusPAM Sequência inespecífica
GGCAGGCGGAGGTTGTACTGNGG GGCAGGCGGAGGTTGTACTGGGG GGCAGGCGGAGGTTGTACTGNGG GGAAGGCGGAAGTTGTACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGCAGGCGGAGGTTGTAGTGGGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGTGGAGGTTGTACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGCAGGGGGAAGCTGTACTGTGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG GGCAAGAGGAGGTTGGACTGGGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAAGCGGAGGTTGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG TCCAGGTGGAGGCTGTACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGCACTGGGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGATGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG CACAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGAACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGCAAGGGGAAGTTGTACTGTGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GAGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG CAGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGCAGGTAGAGGTTGGACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG TGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGTGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGAAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGCTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGAAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGAAGGTGAAGGCTGTACTGCGG GGCAGGCGGAGGTTGTACTGNGG AGAAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG AGTAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GCCAGGCGGGTGCTGTACTGGGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTACTGGGC GGCAGGCGGAGGTTGTACTGNGG TGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGTGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGTGGAGGTTGTAATGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGTAGGCAAAGGTTGTACCAGGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG GGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGTGGAGGTTGCACTGAGG GGCAGGCGGAGGTTGTACTGNGG CAGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGT GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGAAGGCGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG CGTCTGCGAGGGTACTAGTGAGA GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GGGAGACGGAGGTTGTAGTGAGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG AGAAGGCAGAGGTTGTACTGAGC GGCAGGCGGAGGTTGTACTGNGG GCCAGGCTGAGGATGTACTGTGG GGCAGGCGGAGGTTGTACTGNGG AGGAGGCGGAGGTTGTACTGAGC
GGCAGGCGGAGGTTGTACTGNGG GGGAGGCAGAGGTTGTAGTGAGG Guia de alinhamento 2 inespecífico incompatibilidade. Fita inespecífica distância2PAM .................... - - ..A.......A......... + 18,10 .................G.. - 3 A.G............C.... + 20,18,5 ..G...T............. - 18,14 ......G...A.C....... + 14,10,8 A.G............C.... - 20,18,5 A.G................. - 20,18 ..G..............A.. + 18,3 ....A.A........G.... - 16,14,5 A.G............C.... + 20,18,5 ..G..............G.. - 18,3 A.G.A............A.. - 20,18,16,3 A.G..............A.. - 20,18,3 ..G..............G.. - 18,3 TC....T.....C....... + 20,19,14,8 A.G....A.......C.... - 20,18,13,5 ..G.........A....A.. - 18,8,3 CA.....A............ + 20,19,13 A.G..............G.. - 20,18,3
..G..............G.. - 18,3
A.G....A.......A.... + 20,18,13,5
....A.G...A......... + 16,14,10
..G....A.......C.... - 18,13,5
.AG............C.... - 19,18,5
A.G............C.... + 20,18,5
A.G....A.......C.... - 20,18,13,5
..G....A.......C.... - 18,13,5
CAG..............G.. + 20,19,18,3
A.....TA.......G.... - 20,14,13,5
A.G..............G.. + 20,18,3
..G....A.......C.... + 18,13,5
A.G............C.... - 20,18,5
T.G................. + 20,18
A.G....A.......C.... - 20,18,13,5
..G..............G.. - 18,3
A.G....A............ - 20,18,13
A.G..............G.. + 20,18,3
..G................. - 18
..G...T........C.... - 18,14,5
..G..............G.. - 18,3
A.G..............G.. + 20,18,3
..G..............G.. + 18,3
A.G................. - 20,18
A.A..............G.. - 20,18,3
A.G..............G.. + 20,18,3
A.G.........C..C.... - 20,18,8,5
..G..............G.. - 18,3
..G............C.... + 18,5
..G....A.......C.... + 18,13,5
A.G....A.........A.. + 20,18,13,3
..G..............G.. - 18,3
..A..............G.. - 18,3
A.G....A............ - 20,18,13
..G....A............ - 18,13
..A...T.A...C....... + 18,14,12,8
A.A....A.......C.... - 20,18,13,5
A.T....A.......C.... + 20,18,13,5
..G....A............ + 18,13
..G................. + 18
A.G....A.........A.. + 20,18,13,3
A.G..............G.. - 20,18,3
..G....A............ - 18,13
.C.......GT.C....... - 19,11,10,8
A.G................. + 20,18
T.G................. - 20,18
..G...T............. - 18,14
A.G...T..........A.. - 20,18,14,3
A.G..............G.. - 20,18,3
..G....A............ - 18,13
A.G....A.......C.... + 20,18,13,5
..G....A.........G.. - 18,13,3
..G................. - 18
..T....AA.........CA + 18,13,12,2,1
..G..............G.. - 18,3
A.G....A............ - 20,18,13
..G....A.........G.. + 18,13,3
..G..............G.. - 18,3
..G....A.........G.. + 18,13,3
..G................. + 18
..G...T........C.... + 18,14,5
CAG....A............ - 20,19,18,13
..G....A............ + 18,13
..G....A............ - 18,13
A.A..............G.. + 20,18,3
C.TCT...AG...AC..G.. 20,18,17,16,12,11, - 7,6,3
..G....A............ + 18,13
..G..A...........G.. - 18,15,3
A.G....A............ + 20,18,13
A.G................. - 20,18
A.A....A............ - 20,18,13
.C.....T....A....... + 19,13,8
A.G................. - 20,18
..G....A.........G.. - 18,13,3 n.PAM.incompatibilidade n.guia.incompatibilidade Sequência.PAM
0 0 GGG
0 2 AGG
0 1 GGG
0 3 AGG
0 2 AGG
0 3 TGG
0 3 AGG
1 2 AGC
0 2 AGG
0 3 GGG
0 3 AGG
0 2 AGG
0 4 AGG
0 3 AGG
0 2 AGG
0 4 AGG
0 4 GGG
0 3 AGG
1 3 AGC
0 3 AGG
0 2 AGG
0 4 AGG
0 3 TGG
0 3 AGG
0 3 AGG
0 3 AGG
0 4 AGG
0 3 AGG
0 4 AGG
0 4 AGG
0 3 AGG
0 3 AGG
0 3 AGG
1 2 AGC
0 4 AGG
0 2 AGG
1 3 AGC
0 3 AGG
1 1 AGC
0 3 AGG
0 2 AGG
0 3 AGG
0 2 AGG
1 2 AGC
0 3 AGG
0 3 AGG
0 4 AGG
0 2 AGG
0 2 AGG
0 3 AGG
0 4 AGG
0 2 AGG
0 2 AGG
1 3 AGC
1 2 AGC
0 4 CGG
0 4 AGG
0 4 AGG
1 2 AGC
1 1 AGC
0 4 AGG
0 3 AGG
1 2 AGC
0 4 GGG
1 2 GGC
1 2 AGC
1 2 AGC
0 4 AGG
0 3 AGG
1 2 AGC
0 4 AGG
0 3 AGG
1 1 AGC
0 5 GGG
0 2 AGG
1 3 AGC
0 3 AGG
0 2 AGG
0 3 AGG
1 1 AGC
0 3 AGG
1 4 AGC
1 2 AGT
1 2 AGC
0 3 AGG
1 9 AGA
1 2 AGC
0 3 AGG
1 3 AGC
1 2 AGC
1 3 AGC
0 3 TGG
1 2 AGC
0 3 AGG
Início inespecífico Término inespecífico cromossomo
43748587 43748609 chr6
82004618 82004640 chr1
31140567 31140589 chr1
30357052 30357074 chr16
33453895 33453917 chr5
116600352 116600374 chr11
46938649 46938671 chr17
130859778 130859800 chr9
59837681 59837703 chr15
19135541 19135563 chr22
49057600 49057622 chrX
72751388 72751410 chr7
51652045 51652067 chr3
9544334 9544356 chr1
47868006 47868028 chr3
140670069 140670091 chr9
149516035 149516057 chr2
18245713 18245735 chr22
154744438 154744460 chr3
73320669 73320691 chr17
38479457 38479479 chr1
33058792 33058814 chr7
108299833 108299855 chr9
23627429 23627451 chr1
63393272 63393294 chr2
71467786 71467808 chr16
111638773 111638795 chr1
213393740 213393762 chr1
38284425 38284447 chr7
134511606 134511628 chr7
152293366 152293388 chr7
60243345 60243367 chr17
48007735 48007757 chrX
52768707 52768729 chr1
38805324 38805346 chr19
41283776 41283798 chrX
14539718 14539740 chr11
32895093 32895115 chr6
138957343 138957365 chr7
63900682 63900704 chr3
79624954 79624976 chr5
76012229 76012251 chr7
39889198 39889220 chrX
99897525 99897547 chr4
25822709 25822731 chr1
17293204 17293226 chr5
66697991 66698013 chr13
80796103 80796125 chr5
49239128 49239150 chr16
69489884 69489906 chr3
113712655 113712677 chr8
24502672 24502694 chr2
65642349 65642371 chr7
135700076 135700098 chrX
99795756 99795778 chr1
1821377 1821399 chr19
75501534 75501556 chr4
74828740 74828762 chr18
133975784 133975806 chrX
55717904 55717926 chr14
49522615 49522637 chr13
77788415 77788437 chr3
48230825 48230847 chr11
1280441 1280463 chr1
44602379 44602401 chr7
108166294 108166316 chr12
111929850 111929872 chr7
122404237 122404259 chr12
79123453 79123475 chr12
46412541 46412563 chr22
93889070 93889092 chr5
97776548 97776570 chr10
56533335 56533357 chr2
149843401 149843423 chr3
232769157 232769179 chr1
75100050 75100072 chr15
37252965 37252987 chr18
44506208 44506230 chr2
182389352 182389374 chr4
9360929 9360951 chr11
23638452 23638474 chr12
66498753 66498775 chr7
32055862 32055884 chr13
59331986 59332008 chr15
126196868 126196890 chr2
77359566 77359588 chrX
24652788 24652810 chrX
17667857 17667879 chr17
34751155 34751177 chr21
48734975 48734997 chr2
69755048 69755070 chr1
90013282 90013304 chr16
630757 630779 chr18
163905630 163905652 chr3 inExon entrez_id símbolo
TRUE 7422 VEGFA
- 23266 ADGRL2
- - -
- - -
- 6897 TARS
- - -
- 10241 CALCOCO2
- 114789 SLC25A25
- - -
- - -
- - -
- 8468 FKBP6
- 23132 RAD54L2
- - -
- 22907 DHX30
- 79813 EHMT1
- 26122 EPC2
- 637 BID
- 4311 MME
- 2885 GRB2
- 51118 UTP11
- 51251 NT5C3A
- 83856 FSD1L
- - -
- 51057 WDPCP
- - -
- - -
- 26750 RPS6KC1
- 445347 TARP
- 800 CALD1
- - -
- - -
- - -
- 9372 ZFYVE9
- 90522 YIF1B
- - -
- 5682 PSMA1
- - -
- 254048 UBN2
- 6314 ATXN7
- - -
- - -
- - -
- - -
- 55219 MACO1
- - -
- - -
- 23635 SSBP2
- - -
- 23150 FRMD4B
- 114788 CSMD3
- 50618 ITSN2
- - -
- - -
- - -
- 57455 REXO1
- - -
- 4155 MBP
- 159091 FAM122C
- - -
- - -
- - -
- - -
- 1855 DVL1
- - -
- - -
- 11179 ZNF277
- 144406 WDR66
- - -
- - -
- 285600 KIAA0825
- 728558 ENTPD1-AS1
- 114800 CCDC85A
- - -
- - -
- - -
- 647946 MIR924HG
- 6519 SLC3A1
- - -
- - -
- - -
- 55253 TYW1
- - -
- 54778 RNF111
- - -
- - -
- 9468 PCYT1B
- 10743 RAI1
- - -
- 129285 PPP1R21
- - -
- - -
- 27098 CLUL1
- - -
SpyDS4 (gRNA.nome SpyDS4) Pontuação de clivagem prevista gRNAPlusPAM
100 GCAGGCACCTGTGCCAACATNGG
0.1 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG 0 GCAGGCACCTGTGCCAACATNGG Sequência inespecífica Guia de Alinhamento 2 inespecífico GCAGGCACCTGTGCCAACATGGG ....................
ACAGGCACTGATGCCAACTTTGG A.......TGA.......T. TAATGCCCTGGAGCCTCCCTGGC TA.T..C.TG.A...TC.C. GCAGGGCGCGCCGAGAGCAGCGG .....GCG.GCC.AG.G..G CCAGCCACCCAGCCCCTCCTCCC C...C....CAGC..CT.C. GTAAGCATATGATAGTCCATTTT .T.A...TA..ATAGTC... CCGCGTCCCTGCGCAAACCCAGG C.GC.TC....C..A...CC GTGCACCCCTGCTCCTACCCCCC .TGCA.C....CT..T..CC CCAGGGAGCAATGGCAGCGCGCC C....G.G.AA..G..G.GC GGCGGAAGTTGTACTGAGGTGAG .GC..A.GT...A.TG.GG.
GCAGGAACTGGAGTGCACAGGTG .....A..TG.A.TGC...G Fita inespecífica incompatibilidade.distância2PAM n.guia.incompatibilidade
- - 0
+ 20,12,11,10,2 5
+ 20,19,17,14,12,11,9,5,4,2 10
+ 15,14,13,11,10,9,7,6,4,1 10
- 20,16,11,10,9,8,5,4,2 9
+ 19,17,13,12,9,8,7,6,5,4 10
- 20,18,17,15,14,9,6,2,1 9
+ 19,18,17,16,14,9,8,5,2,1 10
+ 20,15,13,11,10,7,4,2,1 9
+ 19,18,15,13,12,8,6,5,3,2 10
- 15,12,11,9,7,6,5,1 8
Sequência.PAM Início inespecífico Término inespecífico
GGG 43748848 43748870
TGG 41551021 41551043
GGC 43748564 43748586
CGG 77359654 77359676
CCC 43741999 43742021
TTT 68132445 68132467
AGG 77359345 77359367
CCC 22774978 22775000
GCC 77359596 77359618
GAG 82004622 82004644
GTG 80003891 80003913 cromossomo inExon entrez_id símbolo chr6 NA 7422 VEGFA chr22 TRUE 2033 EP300 chr6 TRUE 7422 VEGFA chrX TRUE 5230 PGK1 chr6 - 7422 VEGFA chr15 - - -
chrX - - -
chr6 - - -
chrX - - -
chr1 - 23266 ADGRL2 chr12 - 5074 PAWR
SpyDS6 (gRNA.nome SpyDS6)
Inespecífico Pico da Pontuação de clivagem prevista pontuação chr6:+:80816457:80816479 699 0.2 chr6:-:22774975:22774997 553 1.4 chr6:-:43742023:43742045 458 100 chr7:-:124498153:124498175 449 0.2 chr1:-:79194307:79194329 386 0.2 chr17:+:77835740:77835762 383 5.2 chr19:+:15313634:15313656 382 0.7 chr12:+:96650610:96650632 374 3.7 chr10:-:79681895:79681917 352 1.5 chr6:+:20250488:20250510 338 0.2 chr13:-:49117083:49117105 334 0.1 chr12:-:80003893:80003915 330 0.1 chr17:-:77543039:77543061 302 1.6 chr8:-:65972642:65972664 299 0.1 chr20:-:35488683:35488705 277 2.4 chr11:+:100275645:100275667 271 1.6 chr22:+:38338356:38338378 268 0.4 chr13:+:45356854:45356876 255 0.2 chr20:-:31061319:31061341 231 1.9 chr11:-:66051111:66051133 229 0.7 chr17:-:72637693:72637715 225 2.4 chr11:+:128772408:128772430 198 0.5 chr1:-:99257317:99257339 172 0.1 chr15:-:39243269:39243291 171 0.3 chr14:-:22258408:22258430 170 0.2 chr21:-:42506703:42506725 166 2.1 chr7:-:150036050:150036072 163 0.2 chr7:-:1140569:1140591 162 1.5 chr4:+:40239842:40239864 154 0.4 chr22:-:50743552:50743574 151 0.9 chr2:-:241904500:241904522 149 3.1 chr9:-:136776149:136776171 146 1 chr8:+:22487688:22487710 145 0.3 chr1:-:110032844:110032866 144 4.6 chr1:-:182626625:182626647 133 0.9 chr5:-:134908150:134908172 127 0.1 chr20:-:61928182:61928204 123 2.1 chr10:-:88042752:88042774 120 0.4 chr17:-:6131626:6131648 118 0.2 chr4:-:1002743:1002765 117 0.2 chr22:+:19106203:19106225 115 0.2 chr1:+:44003969:44003991 114 1.5 chr1:-:114792469:114792491 110 0.4 chr19:+:38997988:38998010 110 1.6 chr2:-:46897354:46897376 109 0.1 chr12:+:121011672:121011694 108 0.1 chr17:-:75891020:75891042 105 0.6 chr9:+:139220931:139220953 98 5.7 chr14:+:24168625:24168647 97 0.1 chr15:-:74949775:74949797 92 0.1 chr19:+:44199443:44199465 86 0.4 chr12:+:75214528:75214550 85 0.3 chr17:-:46058760:46058782 82 0.2 chr16:-:90077745:90077767 80 1.3 chr20:+:62023611:62023633 79 2.1 chr12:+:121013758:121013780 77 0.1 chrX:+:106755923:106755945 75 1 chr10:+:44417540:44417562 73 0.3 chr11:-:118193407:118193429 73 1.4 chr16:-:13411476:13411498 73 0.2 chr4:-:8206405:8206427 73 0.6 chr16:+:1517259:1517281 71 0.1 chr1:-:150849202:150849224 69 0 chr19:-:2057711:2057733 69 1.1 chr9:-:136075308:136075330 69 0.1 chr12:+:29935821:29935843 67 0.1 chr11:-:70812278:70812300 66 0.2 chr13:-:89703965:89703987 62 2.3 chr1:+:110166721:110166743 60 0.6 chr11:-:114079332:114079354 58 0.2 chr10:-:71813737:71813759 57 0.4 chr19:-:17414518:17414540 56 0.3 chr3:-:184289395:184289417 56 0.3 chr14:-:94566714:94566736 55 0.2 chr5:+:178665449:178665471 55 0.1 chr5:+:149568491:149568513 54 0.3 chr11:-:70242709:70242731 52 0.1 chr21:-:45132035:45132057 52 0.1 chr17:-:827977:827999 47 0.2 chr18:-:35056448:35056470 44 0 chr6:+:12990616:12990638 44 0.2 chr8:-:17955569:17955591 44 0.1 chr1:-:148932239:148932261 43 0.3 chr19:-:32734619:32734641 42 0.2 chr1:+:228330887:228330909 41 0.1 chr3:+:140221489:140221511 41 3.3 chr5:-:139938346:139938368 40 0.2 chr22:+:23744878:23744900 39 1.6 chr10:-:16388635:16388657 38 0.1 chr17:+:34824953:34824975 35 0.1 chr3:-:129656921:129656943 35 0.4 chr14:-:93351573:93351595 34 0 chr1:+:33169255:33169277 33 0.1 chr18:+:29253123:29253145 33 0 chr6:+:20984444:20984466 33 0 chr10:-:77256682:77256704 32 2.5 chr15:+:89196634:89196656 32 1.7 chr18:-:73391522:73391544 32 0 chr10:-:72512814:72512836 31 0 chr8:+:80980935:80980957 31 0.1 chr11:+:37704008:37704030 30 0.1 chr12:+:52539310:52539332 29 1.7 chr14:-:56431001:56431023 27 0.3 chr15:-:66949803:66949825 26 1.6 chr7:+:100879116:100879138 26 98.6 chr11:-:94784149:94784171 25 0.2 chr12:+:111548733:111548755 25 0.8 chr19:+:2212199:2212221 25 0.2 chr13:-:22824517:22824539 22 0.1 chr13:-:84196623:84196645 19 0.2 chr15:+:96534271:96534293 19 0.1 chr21:-:21304105:21304127 17 0.2 chr17:-:39705337:39705359 16 0.2 chr20:-:56582544:56582566 15 0.9 chr20:+:49479068:49479090 15 0.1 chr1:+:89258185:89258207 14 0.1 chr15:-:51386687:51386709 13 0.1 chr19:+:38724286:38724308 13 0.3 chr16:-:2286384:2286406 11 0.2 gRNAPlusPAM Sequência inespecífica
GGGCAGGGGCTGGGGTGCACNGG CGGCAGGGGCTGAGGGGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGTAGGAGCAGGGGTGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGGCTGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG CAGCAGGGGCTGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGAAGGGCCTGGGGTACACGGG GGGCAGGGGCTGGGGTGCACNGG GGGCCGGGGCAGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGACAGGGGCCGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCACCGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGAGTGCACGGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGAAGGGACTGGGGTGCACTGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGTGGGGGCTGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGGGTGCACGGG GGGCAGGGGCTGGGGTGCACNGG TGGCAGGGGCAGGGGTGAACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCACGGG GGGCAGGGGCTGGGGTGCACNGG GGCCAGGGGCTGGGGAGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGCTGGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG TGGGTGGGGCTGGGGTGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGAGGGGGCTGGGGAGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTACACGGG GGGCAGGGGCTGGGGTGCACNGG GAGAAGGAGCTGGGGAGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCACCAG GGGCAGGGGCTGGGGTGCACNGG GGGCAAGGGCAGGGGTGCACCAG GGGCAGGGGCTGGGGTGCACNGG AAGAAGGGGCAAGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGCCAGGAGCAGGGGTGCACGGG GGGCAGGGGCTGGGGTGCACNGG TGGCAGCGGCTGGGGAGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCGTGGGCAGGGGTGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGTGGCTGGGGTGCATTGG GGGCAGGGGCTGGGGTGCACNGG GGCCAGGAGCTGGGGTGCTCAGG GGGCAGGGGCTGGGGTGCACNGG CCTCAGGGGCTGGGGTGAACAGG GGGCAGGGGCTGGGGTGCACNGG TGGCAGGGTCTGGGGTGCACAGA GGGCAGGGGCTGGGGTGCACNGG GAGCAGGGTCTGGGGTGCATGGG GGGCAGGGGCTGGGGTGCACNGG GAGCAGGGACTGAGGGGCACAGG GGGCAGGGGCTGGGGTGCACNGG GAGCAGGGGCTGGGGGGCACTGG GGGCAGGGGCTGGGGTGCACNGG TGGCAGGGGTAAGGGTGCACTGG GGGCAGGGGCTGGGGTGCACNGG AGACAGAGGCTGGAGTGCACTGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGGGCTGGAGTTCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGAAGGGACCAGGGTGCACCAG GGGCAGGGGCTGGGGTGCACNGG GGCCAGGAGCAGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCCGGGGCTGGGGTGCCAGGG GGGCAGGGGCTGGGGTGCACNGG GGGCGGGGGCTGGGGAGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAGCCAGGGTGCAGAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGAGGCTGGAGTGCCCAGG GGGCAGGGGCTGGGGTGCACNGG GGACAGGGGCAGGGGTGCCCGGG GGGCAGGGGCTGGGGTGCACNGG AGGGAGGGGCTGGGGTGCACGGA GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCATAGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGAGTGCACAAG GGGCAGGGGCTGGGGTGCACNGG GGGCAGAGGCTAGGGTGCAGTGG GGGCAGGGGCTGGGGTGCACNGG AGGTAGGGGTTGGGGGGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGAAGCAGGGGTGCTCAGG GGGCAGGGGCTGGGGTGCACNGG GGGGAGGGGTGGGGGTGCACCGG GGGCAGGGGCTGGGGTGCACNGG GAGCAGGGGCTGGGGGGCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGAGGCTGGAGTGCCCAGG GGGCAGGGGCTGGGGTGCACNGG GGGTGGGGGCTGGGGTGCCCAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAAGGGCAGGGGTGCCCTGG GGGCAGGGGCTGGGGTGCACNGG GAGAGGGAGCTGGGGTGCACGGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGGACTGAGGTGCATAGG GGGCAGGGGCTGGGGTGCACNGG GGGCCAGGGCTGAGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG TGGGAGGGGCTAGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG CCGCAGGGGCTGGGATGCTGGGG GGGCAGGGGCTGGGGTGCACNGG GAGGAGGGGCTGGGGTGCCCTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAAAGGCCGGGGTGCCCAGG GGGCAGGGGCTGGGGTGCACNGG AGGCGGGGGCTGGGGGGCTCGGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGGGCCAGGGTCCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGTTGGGGTTGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGGGCCGGGGTGCGCAGG GGGCAGGGGCTGGGGTGCACNGG GGGCACAGACTGGGGTGCATTGG GGGCAGGGGCTGGGGTGCACNGG GGGCTGGGGCTGAGGTGCGCCGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGGGCTGGGGGGCAAGGG GGGCAGGGGCTGGGGTGCACNGG GAGCGGGAGCTGGGGGGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGACTGGGGTGCTTAGG GGGCAGGGGCTGGGGTGCACNGG GGGAAGGGGCTGGAGGGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGGAAGGGGTGGACTGG GGGCAGGGGCTGGGGTGCACNGG AGACAGGGGCTGGAGTGCAGTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGAGGCTGGAGTGCAATGG GGGCAGGGGCTGGGGTGCACNGG GGGCTGGGGCTGGGGAGCAGGGG GGGCAGGGGCTGGGGTGCACNGG AGGAAAGGGCTGGAGTGCAGGGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTGGAGTGCACCAG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGAGTGCACAAG GGGCAGGGGCTGGGGTGCACNGG AGGCAGAGCCTGGGGTGCAGGGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGCCAGGGGAGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGCCAGGGGCTGGGGGGAACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGGATGGGGTGCAGTGG GGGCAGGGGCTGGGGTGCACNGG AGGCAAGGCCTGGGGTGCCCAGG GGGCAGGGGCTGGGGTGCACNGG GGGCTGGGGCTGGGGAGCACGGG GGGCAGGGGCTGGGGTGCACNGG GAGAAGGGGCTGGGAAGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTGGAGTGCACAAG GGGCAGGGGCTGGGGTGCACNGG GGGGAGGGGCTGGGGTGCCAGGG GGGCAGGGGCTGGGGTGCACNGG AGGAAGGGGCTGGGGAAAACAGG GGGCAGGGGCTGGGGTGCACNGG CCCCAGGGGCTGGGGTGCCTGGG GGGCAGGGGCTGGGGTGCACNGG AAGCAGAGGCTGAAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGAACTAGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGGGTGGGGTCCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGGAGGGGCTGGGGAGCACGGA GGGCAGGGGCTGGGGTGCACNGG AGGCAGAGGCTGGAGTGGACCGG GGGCAGGGGCTGGGGTGCACNGG GGGTAGGGGCTGGGGGATACCGG GGGCAGGGGCTGGGGTGCACNGG GGGAAGGGTCTGGAGTCCACTGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGAACTAGAGTGCACGGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGACTGGGGTGCTCTGG GGGCAGGGGCTGGGGTGCACNGG GAGTAGGGGCAGGGGTGCTCTGG GGGCAGGGGCTGGGGTGCACNGG AGGAAGGGCCTGGGGTGCACAGA GGGCAGGGGCTGGGGTGCACNGG GGCCAGGGGCTGGGGTGCACGGT GGGCAGGGGCTGGGGTGCACNGG AGGCAGGGGCCAGGGTGCATGGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGAGGATGGGGTGCAGGGG GGGCAGGGGCTGGGGTGCACNGG CGGCAGGGGCTGGAGTGCAGTGG GGGCAGGGGCTGGGGTGCACNGG AGGCAGGATCTGGAGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG AGACAGGAGCTGGAGTGCACAAG GGGCAGGGGCTGGGGTGCACNGG TGGCAGGGGCAGGGATGCTCTGG GGGCAGGGGCTGGGGTGCACNGG CCTCAGGGGTTGGGATGCACTGG GGGCAGGGGCTGGGGTGCACNGG GAGCAGGGTCAGGGGTGCAGAGG GGGCAGGGGCTGGGGTGCACNGG CAGGAGTGGCTGGGGTGCACAGG GGGCAGGGGCTGGGGTGCACNGG GGGCCTGGGCTGAGATGCACGGG GGGCAGGGGCTGGGGTGCACNGG ACGCAGGGGCTAGGGAGCACAAG GGGCAGGGGCTGGGGTGCACNGG GGGCTGGGGCTGGGGAGGACGGG GGGCAGGGGCTGGGGTGCACNGG GGGCAGGGATTGGGGGGCACAGG
GGGCAGGGGCTGGGGTGCACNGG AGGGAGGGGCCGGGCTGCACTGG Guia de Alinhamento 2 Fita inespecífica incompatibilidade.distância2PAM inespecífico C...........A..G.... + 20,8,5 ...T...A..A......... - 17,13,10 .................... - - .......AA....A...... - 13,12,7
.......AA....A...... - 13,12,7
CA.................. + 20,19
...A....C.......A... + 17,12,4
....C.....A......... + 16,10
A.A.......C......... - 20,18,10
.......AA....A...... + 13,12,7
A......AA....A...... - 20,13,12,7
A......AA....A...... - 20,13,12,7
A..A....A........... - 20,17,12
A......AA....A...... - 20,13,12,7
A..TG............... - 20,17,16
A......AA........... + 20,13,12
T.........A......A.. + 20,10,3
.......AA....A...... + 13,12,7
..C............A.... - 18,5
........CTG......... - 12,11,10
T..GT............... - 20,17,16
...AG..........A.... + 17,16,5
.......AA....A..A... - 13,12,7,4
.A.A...A.......A.... - 19,17,13,5
.......AA....A...... - 13,12,7
.....A....A......... - 15,10
AA.A......AA........ - 20,19,17,10,9
..C....A..A......... - 18,13,10
T.....C........A.... + 20,14,5
....GT....A......... - 16,15,10
......T............T - 14,1
..C....A..........T. - 18,13,2
CCT..............A.. + 20,19,18,3
T.......T........... - 20,12
.A......T..........T - 19,12,1
.A......A...A..G.... - 19,12,8,5
.A.............G.... - 19,5
T........TAA........ - 20,11,10,9
A.A...A......A...... - 20,18,14,7
A............A..T... - 20,7,4
A..A....A.CA........ + 20,17,12,10,9
..C....A..A......... + 18,13,10
....C.............CA - 16,2,1
....G..........A.... + 16,5
A......A..CA.......G - 20,13,10,9,1
......A......A....C. + 14,7,2
..A.......A.......C. - 18,10,2
A..G................ + 20,17
.......AA....A.....T + 13,12,7,1
A......AA....A...... - 20,13,12,7
......A....A.......G + 14,9,1
A..T.....T.....G.... + 20,17,11,5
......AA..A.......T. - 14,13,10,2
...G.....TG......... - 17,11,10
.A.............G.... + 19,5
......A......A....C. + 14,7,2
...TG.............C. + 17,16,2
.....A....A.......C. + 15,10,2
.A.AG..A............ - 19,17,16,13
A.......A...A......T - 20,12,8,1
....CA......A....... - 16,15,8
T..G.......A.A...... + 20,17,9,7
CC............A...TG - 20,19,6,2,1
.A.G..............C. - 19,17,2
.....AA...C.......C. - 15,14,10,2
A...G..........G..T. + 20,16,5,2
A.........CA....C... - 20,10,9,4
...TT....T.......... - 17,16,11
A.........C.......G. + 20,10,2
.....CA.A..........T - 15,14,12,1
....T.......A.....G. - 16,8,2
A..............G...A - 20,5,1
.A..G..A.......G.... - 19,16,13,5
........A.........TT - 12,2,1
...A.........A.G.... + 17,7,5
.........AA......G.. + 11,10,3
A.A..........A.....G - 20,18,7,1
......A......A.....A - 14,7,1
....T..........A...G - 16,5,1
A..A.A.......A.....G - 20,17,15,7,1
.......AA....A...... + 13,12,7
A......AA....A...... - 20,13,12,7
A.....A.C..........G - 20,14,12,1
........C.A....A.... - 12,10,5
A.C............G.A.. + 20,18,5,3
.........A.........G + 11,1
A....A..C.........C. - 20,15,12,2
....T..........A.... + 16,5
.A.A..........AA.... - 19,17,6,5
A......AA....A...... + 20,13,12,7
...G..............CA - 17,2,1
A..A...........AAA.. - 20,17,5,4,3
CCC...............CT + 20,19,18,2,1
AA....A.....AA...... + 20,19,14,8,7
A......AA..A.A...... + 20,13,12,9,7
.........G......C... - 11,4
...G...........A.... + 17,5
A.....A......A...G.. - 20,14,7,3
...T...........GAT.. - 17,5,4,3
...A....T....A..C... + 17,12,7,4
.......AA..A.A...... + 13,12,9,7
........A.........T. + 12,2
.A.T......A.......T. - 19,17,10,2
A..A....C........... - 20,17,12
..C................. + 18
A.........CA.......T - 20,10,9,1
......A..A.........G + 14,11,1
C............A.....G + 20,7,1
A......AT....A...... - 20,13,12,7
A.A....A.....A...... - 20,18,13,7
T.........A...A...T. + 20,10,6,2
CCT......T....A..... - 20,19,18,11,6
.A......T.A........G - 19,12,10,1
CA.G..T............. - 20,19,17,14
....CT......A.A..... + 16,15,8,6
AC.........A...A.... + 20,19,9,5
....T..........A.G.. - 16,5,3
........AT.....G.... + 12,11,5
A..G......C...C..... - 20,17,10,6 n.PAM.incompatibilidade n.guia.incompatibilidade Sequência.PAM
0 3 TGG
0 3 TGG
0 0 AGG
0 3 AGG
0 3 AGG
0 2 AGG
0 3 GGG
0 2 AGG
0 3 AGG
0 3 CGG
0 4 GGG
0 4 AGG
0 3 TGG
0 4 AGG
0 3 AGG
0 3 GGG
0 3 TGG
0 3 GGG
0 2 AGG
0 3 AGG
0 3 TGG
0 3 AGG
0 4 GGG
0 4 TGG
1 3 CAG
1 2 CAG
0 5 AGG
0 3 GGG
0 3 TGG
0 3 TGG
0 2 TGG
0 3 AGG
0 4 AGG
1 2 AGA
0 3 GGG
0 4 AGG
0 2 TGG
0 4 TGG
0 4 TGG
0 3 AGG
1 5 CAG
0 3 AGG
0 3 GGG
0 2 AGG
0 5 AGG
0 3 AGG
0 3 GGG
1 2 GGA
0 4 AGG
1 4 AAG
0 3 TGG
0 4 AGG
0 4 AGG
0 3 CGG
0 2 TGG
0 3 AGG
0 3 AGG
0 3 TGG
0 4 GGG
0 4 AGG
0 3 AGG
0 4 AGG
0 5 GGG
0 3 TGG
0 4 AGG
0 4 GGG
0 4 AGG
0 3 AGG
0 3 AGG
0 4 TGG
0 3 CGG
0 3 GGG
0 4 AGG
0 3 AGG
0 3 AGG
0 3 TGG
0 4 TGG
0 3 TGG
0 3 GGG
0 5 GGG
1 3 CAG
1 4 AAG
0 4 GGG
0 3 AGG
0 4 AGG
0 2 TGG
0 4 AGG
0 2 GGG
0 4 AGG
1 4 AAG
0 3 GGG
0 5 AGG
0 5 GGG
0 5 AGG
0 5 AGG
0 2 AGG
1 2 GGA
0 4 CGG
0 4 CGG
0 4 TGG
0 4 GGG
0 2 TGG
0 4 TGG
1 3 AGA
1 1 GGT
0 4 GGG
0 3 GGG
0 3 TGG
0 4 AGG
1 4 AAG
0 4 TGG
0 5 TGG
0 4 AGG
0 4 AGG
0 4 GGG
1 4 AAG
0 3 GGG
0 3 AGG
0 4 TGG
Início inespecífico Término inespecífico cromossomo
80816457 80816479 chr6
22774975 22774997 chr6
43742023 43742045 chr6
124498153 124498175 chr7
79194307 79194329 chr1
77835740 77835762 chr17
15313634 15313656 chr19
96650610 96650632 chr12
79681895 79681917 chr10
20250488 20250510 chr6
49117083 49117105 chr13
80003893 80003915 chr12
77543039 77543061 chr17
65972642 65972664 chr8
35488683 35488705 chr20
100275645 100275667 chr11
38338356 38338378 chr22
45356854 45356876 chr13
31061319 31061341 chr20
66051111 66051133 chr11
72637693 72637715 chr17
128772408 128772430 chr11
99257317 99257339 chr1
39243269 39243291 chr15
22258408 22258430 chr14
42506703 42506725 chr21
150036050 150036072 chr7
1140569 1140591 chr7
40239842 40239864 chr4
50743552 50743574 chr22
241904500 241904522 chr2
136776149 136776171 chr9
22487688 22487710 chr8
110032844 110032866 chr1
182626625 182626647 chr1
134908150 134908172 chr5
61928182 61928204 chr20
88042752 88042774 chr10
6131626 6131648 chr17
1002743 1002765 chr4
19106203 19106225 chr22
44003969 44003991 chr1
114792469 114792491 chr1
38997988 38998010 chr19
46897354 46897376 chr2
121011672 121011694 chr12
75891020 75891042 chr17
139220931 139220953 chr9
24168625 24168647 chr14
74949775 74949797 chr15
44199443 44199465 chr19
75214528 75214550 chr12
46058760 46058782 chr17
90077745 90077767 chr16
62023611 62023633 chr20
121013758 121013780 chr12
106755923 106755945 chrX
44417540 44417562 chr10
118193407 118193429 chr11
13411476 13411498 chr16
8206405 8206427 chr4
1517259 1517281 chr16
150849202 150849224 chr1
2057711 2057733 chr19
136075308 136075330 chr9
29935821 29935843 chr12
70812278 70812300 chr11
89703965 89703987 chr13
110166721 110166743 chr1
114079332 114079354 chr11
71813737 71813759 chr10
17414518 17414540 chr19
184289395 184289417 chr3
94566714 94566736 chr14
178665449 178665471 chr5
149568491 149568513 chr5
70242709 70242731 chr11
45132035 45132057 chr21
827977 827999 chr17
35056448 35056470 chr18
12990616 12990638 chr6
17955569 17955591 chr8
148932239 148932261 chr1
32734619 32734641 chr19
228330887 228330909 chr1
140221489 140221511 chr3
139938346 139938368 chr5
23744878 23744900 chr22
16388635 16388657 chr10
34824953 34824975 chr17
129656921 129656943 chr3
93351573 93351595 chr14
33169255 33169277 chr1
29253123 29253145 chr18
20984444 20984466 chr6
77256682 77256704 chr10
89196634 89196656 chr15
73391522 73391544 chr18
72512814 72512836 chr10
80980935 80980957 chr8
37704008 37704030 chr11
52539310 52539332 chr12
56431001 56431023 chr14
66949803 66949825 chr15
100879116 100879138 chr7
94784149 94784171 chr11
111548733 111548755 chr12
2212199 2212221 chr19
22824517 22824539 chr13
84196623 84196645 chr13
96534271 96534293 chr15
21304105 21304127 chr21
39705337 39705359 chr17
56582544 56582566 chr20
49479068 49479090 chr20
89258185 89258207 chr1
51386687 51386709 chr15
38724286 38724308 chr19
2286384 2286406 chr16
TRUE 594 BCKDHB
- - -
- 7422 VEGFA
- 25913 POT1
- - -
- - -
- - -
- 2004 ELK3
- 9231 DLG5
- - -
- - -
- 5074 PAWR
- - -
- - -
- 140710 SOGA1
- - -
TRUE 85377 MICALL1
- - -
- 140688 NOL4L
TRUE 254263 CNIH2
- - -
TRUE 3762 KCNJ5
- - -
- - -
- - -
- - -
- 5919 RARRES2
- 84310 C7orf50
- 399 RHOH
- 23654 PLXNB2
- 200772 LOC200772
- 7410 VAV2
- 55909 BIN3
- 127002 ATXN7L2
- 85397 RGS8
- 9547 CXCL14
- 57642 COL20A1
- 2894 GRID1
- - -
- - -
- 9993 DGCR2
- 5792 PTPRF
- - -
- 6261 RYR1
- - -
- 9921 RNF10
- - -
TRUE 26102 DKFZP434A062
- - -
- 80153 EDC3
- - -
- - -
- 80279 CDK5RAP3
- 79007 DBNDD1
- - -
- 9921 RNF10
- - -
- 283033 LINC00841
- - -
- - -
- 54436 SH3TC1
- 1186 CLCN7
TRUE 405 ARNT
- - -
- - -
TRUE 83857 TMTC1
- 22941 SHANK2
- - -
- 271 AMPD2
- 7704 ZBTB16
- 55506 H2AFY2
- - -
- 2049 EPHB3
- 122509 IFI27L1
- 9509 ADAMTS2
- - -
- - -
- - -
- 64359 NXN
- 56853 CELF4
- 221692 PHACTR1
- - -
- 645166 LOC645166
- - -
- 2987 GUK1
- 64084 CLSTN2
TRUE 10307 APBB3
- - -
- - -
- - -
- - -
- - -
- - -
- 9331 B4GALT6
- 54901 CDKAL1
- - -
- 3669 ISG20
- - -
- 140766 ADAMTS14
- 7163 TPD52
- - -
- - -
- - -
- - -
- 24146 CLDN15
- - -
- 23316 CUX2
TRUE 84444 DOT1L
- - -
- - - - - - - - - - 3728 JUP - - - - 55653 BCAS4 - 5586 PKN2 - 388121 TNFAIP8L3 - - - - - - Nme2DS2 inespecífico Pico de pontuação Pontuação de clivagem prevista chr6:-:43748582:43748613 547 100 chrX:+:77359550:77359581 44 0 gRNA.nome gRNAPlusPAM Sequência inespecífica Nme2DS2 GAATGGCAGGCGGAGGTTGTA GAATGGCAGGCGGAGGTTGTACT
CTGNNNNCCNN GGGGGCCAG Nme2DS2 GAATGGCAGGCGGAGGTTGTA GAATGGCAGGCGGAGGTTGTACT
CTGNNNNCCNN GGGGGCCAG Guia de Alinhamento 2 Fita inespecífica incompatibilidade.distância2PA inespecífico M ........................ - - A..C..A..C..C.C..CTC...A + 24, 21, 18, 15, 12, 10, 7, 6, 5, 1 n.PAM.incompatibilidade n.guia.incompatibilidade Sequência.PAM
0 0 GGGGCCAG 0 10 GTACCCTC Início inespecífico Término inespecífico cromossomo 43748582 43748613 chr6 77359550 77359581 chrX inExon entrez_id Símbolo TRUE 7422 VEGFA - - - Nme2DS4 inespecífico Pico da pontuação gRNA.nome chr6:-:43748843:43748874 66 c_DeCas9_human_TS14 gRNAPlusPAM
GTGAGCAGGCACCTGTGCCAACATNNNNCCNN Sequência inespecífica Guia de Alinhamento 2 inespecífico GTGAGCAGGCACCTGTGCCAACATGGGCCCGC ........................
Fita inespecífica Pontuação de clivagem prevista Incompatibilidade.distância2PA
M - 100 - n.PAM.incompatibilidade n.guia.incompatibilidade Sequência.PAM 0 0 GGGCCCGC
Início inespecífico Término inespecífico cromossomo 43748843 43748874 chr6 inExon entrez_id símbolo - 7422 VEGFA Nme2DS6 inespecífico Pico da pontuação Pontuação de clivagem prevista chr6:-:43742018:43742049 483 100 chrX:-:77359465:77359496 12 0 gRNA.nome gRNAPlusPAM d_DeCas9_human_TS16 GCATGGGCAGGGGCTGGGGTGCACNNNNCCNN d_DeCas9_human_TS16 GCATGGGCAGGGGCTGGGGTGCACNNNNCCNN Sequência inespecífica Guia de Alinhamento 2 Fita inespecífica inespecífico GCATGGGCAGGGGCTGGGGTG ........................ -
CACAGGCCCAG GCAGGAAGCGTCGCCGGGGGG ...G.AAGC.TC..C....G..C. 21,19,18,17,16,14,13,10,5,2
CCCACAAGGGT n.PAM.incompatibilidade Sequência.PAM Sequência.PAM 0 AGGCCCAG AATCCCTT
10 ACAAGGGT ACTCCCTC Início inespecífico Término inespecífico cromossomo 43742018 43742049 chr6 77359465 77359496 chrX inExon entrez_id símbolo - 7422 VEGFA - - VEGFA Rosa26 inespecífico Pico da pontuação Pontuação de clivagem prevista chr6:-:113076072:113076103 1175 100 chr11:-:73171296:73171327 24 1.4 gRNA.nome gRNAPlusPAM Nme2Rosa TGAGGACCGCCCTGGGCCTGGGAGNNNNCCNN Nme2Rosa TGAGGACCGCCCTGGGCCTGGGAGNNNNCCNN Sequência inespecífica Guia de Alinhamento 2 Fita inespecífica inespecífico TGAGGACCGCCCTGGGCCTGGG ........................ -
AGAATCCCTT GAAGGACCACCCTAGGCCTGGG GA......A....A.......... -
AGACTCCCT incompatibilidade.distância2PA n.PAM.incompatibilidade n.guia.incompatibilidade
M
- 0 0 24, 23, 16, 11 0 4 Sequência.PAM Início inespecífico Término inespecífico AATCCCTT 113076072 113076103 ACTCCCTC 73171296 73171327 cromossomo inExon entrez_id chr6 - 14910 chr11 - 94045 PCSK9 inespecífico Pico de pontuação gRNA.nome chr4:-:106463720:106463751 266 Nme2PCSK9 gRNAPlusPAM Sequência inespecífica
GGCCTGGCTGATGAGGCCGCACAT GGCCTGGCTGATGAGGCCGCACATGTGGCCAC
NNNNCCNN Guia de Alinhamento 2 Fita inespecífica Pontuação de clivagem prevista inespecífico ........................ - 100 incompatibilidade.distância2PA n.PAM.incompatibilidade n.guia.incompatibilidade
M
- 0 0 Sequência.PAM Início inespecífico Término inespecífico GTGGCCAC 106463720 106463751 cromossomo inExon entrez_id chr4 TRUE 100102
[00240] Para a identificação inespecífica, a análise revelou que os SpyCas9 sgRNAs DS2, DS4, e DS6 pareceram direcionar a edição em 93, 10, e 118 sítios inespecíficos candidatos, respectivamente, na faixa normal de sítios inespecíficos quando a edição de SpyCas9 baseada em plasmídeo é analisada por GUIDE-seq (Fu et al., 2014; Tsai et al., 2014). Em contraste impressionante, os Nme2Cas9 sgRNAs DS2, DS4, e DS6 pareceram direcionar a edição em 1, 0, e 1 sítios inespecíficos, respectivamente. Figura 14C e Tabela 2. Quando comparada às contagens de leitura GUIDE-seq para os sítios inespecíficos de SpyCas9, aquelas de Nme2Cas9 foram muito baixas, anda sugerindo que Nme2Cas9 é altamente específico. Figura 13C cf. Figura 13D. Análises de Nme2Cas9 GUIDE-seq com o TS6, Pcsk9, e Rosa26 renderam resultados similares (0, 0, e 1 sítios inespecíficos, respectivamente, com uma contagem de leitura modesta para o sítio inespecífico Rosa26-OT1). Figura 13C, Figura 14D, e Tabela 2.
[00241] A Figura 14 apresenta dados exemplares mostrando que Nme2Cas9 exibe pouca ou nenhuma inespecificidade detectável em células de mamíferos.
A Figura 14A mostra um esquema exemplar descrevendo sítios duais (DSs) direcionáveis por ambos SpyCas9 e Nme2Cas9 em virtude de seus PAMs de não sobreposição.
O Nme2Cas9 PAM (laranja) e SpyCas9 PAM (azul) são destacados.
Uma sequência guia de Nme2Cas9 de 24nt é indicada em amarelo; a sequência guia correspondente para SpyCas9 seria 4nt mais curta na extremidade 5’. A Figura 14B mostra um Nme2Cas9 e SpyCas9 exemplares que ambos induzem indels em DSs.
Seis DSs em VEGFA (com sequências GN3GN19NGGNCC) foram selecionadas para comparações diretas de edição pelos dois ortólogos.
Os plasmídeos que expressam cada Cas9 (com o mesmo promotor, ligantes, marcadores e NLSs) e seu guia cognato foram transfectados em células HEK293T.
As ineficiências de indel foram determinadas por TIDE 72 h após a transfecção.
A edição de Nme2Cas9 foi detectável em todos os seis sítios e foi marginalmente ou significativamente mais eficiente do que SpyCas9 em dois sítios (DS2 e DS6, respectivamente). SpyCas9 editou quatro dos seis sítios (DS1, DS2, DS4 e DS6), com dois sítios mostrando eficiências de edição significativamente maiores do que Nme2Cas9 (DS1 e DS4). DS2, DS4 e DS6 foram selecionados para a análise GUIDE-Seq visto que Nme2Cas9 foi igualmente eficiente, menos eficiente e mais eficiente do que SpyCas9, respectivamente, nestes sítios.
A Figura 14C mostra a edição do genoma de Nme2Cas9 exemplar que altamente precisa em células humanas.
Números de sítios inespecíficos detectados por GUIDE-Seq para cada nuclease em sítios alvo individuais são mostrados.
Além dos sítios duais, foi analisado TS6 (devido a sua alta eficiência da edição específica) e sítios Pcsk9 e Rosa26 em células de camundongo Hepa1-6 (para medir a precisão em outro tipo de célula). A Figura 14D mostra que um sequenciamento profundo direcionado exemplar para detectar indels em células editadas confirma a alta precisão de Nme2Cas9 indicada por GUIDE-seq.
A Figura 14E mostra uma sequência exemplar para o sítio inespecífico validado do guia Rosa26, mostrando a região de PAM
(sublinhada), o dinucleotídeo de PAM CC consenso (negrito), e três incompatibilidades na porção distal de PAM do espaçador (vermelho).
[00242] Para validar os sítios inespecíficos detectados por GUIDE- seq, um sequenciamento profundo direcionado foi realizado para medir a formação de indel nos sítios inespecíficos de topo após a edição independente de GUIDE-seq (isto é, sem co-transfecção do dsODN). Embora SpyCas9 mostrasse edição considerável na maioria dos sítios inespecíficos testados e, em alguns casos, fosse mais eficiente do que no sítio específico correspondente, Nme2Cas9 não exibiu quaisquer indels detectáveis nos sítios inespecíficos candidatos DS2 e DS6 sozinhos. Vide a Figura 14D. Com o Rosa26 sgRNA, Nme2Cas9 induziu ~1% de edição no sítio Rosa26-OT1 em células Hepa1-6, comparado a ~30% de edição específica. Vide a Figura 14D. Vale ressaltar que este sítio inespecífico tem um consenso de Nme2Cas9 PAM (ACTCCCT) com somente 3 incompatibilidades na extremidade distal de PAM da região guia complementar (isto é, fora da semente). Vide a Figura 14E. estes dados suportam e reforçam os presentes resultados de GUIDE-seq indicando um alto grau de precisão para edição do genoma de Nme2Cas9 em células de mamíferos.
[00243] Para corroborar ainda os resultados de GUIDE-Seq acima, CRISPRseek foi usado para prever computacionalmente sítios inespecíficos potenciais para dois Nme2Cas9 sgRNAs ativos que são direcionados a TS25 e TS47, ambos os quais também estão em VEGFA. Vide a Figura 9A; (Zhu et al., 2014). Três (TS25) ou quatro (TS47) dos sítios previstos mais intimamente combinados, cinco com N4CC PAMs e dois com N4CA PAMs; cada um tinha 2-5 incompatibilidades, principalmente em suas regiões não semente distais de PAM. Vide a Figura 13E. A edição específica vs inespecífica foi comparada após transfecções de plasmídeo Nme2Cas9+sgRNA em células HEK293T por amplificação direcionada de cada sítio, seguido por análise TIDE. Consistentemente, nenhum indel poderia ser detectado naqueles sítios inespecíficos para sgRNA por TIDE, enquanto a edição específica eficiente foi prontamente detectada em DNA das mesmas populações de células. Tomados juntos, os presentes dados indicam que Nme2Cas9 é uma plataforma de edição do genoma naturalmente hiperprecisa em células de mamíferos.
7. DISTRIBUIÇÃO DE ADENOVÍRUS ASSOCIADO
[00244] O tamanho compacto, pequeno PAM, e alta fidelidade de Nme2Cas9 oferecem grandes vantagens para a edição do genoma in vivo usando distribuição de Adenovírus Associado (AAV). Para testar se a edição do genoma eficaz de Nme2Cas9 pode ser alcançada por meio de distribuição de AAV único, Nme2Cas9 foi clonado com seu sgRNA e seus promotores (U1a e U6, respectivamente) em uma estrutura principal do vetor AAV. Vide a Figura 15A. Um AAV completo foi preparado com um sgRN-.Nme2Cas9 empacotado em um capsídeo de AAV8 hepatotrópico para ser direcionado a dois genes no fígado do camundongo: i) Rosa26 (um sítio de porto seguro comumente usado para a inserção de transgene) (Friedrich e Soriano, 1991) como um controle negativo; e ii) Pcsk9, um grande regulador de homeostase do colesterol circulante (Rashid et al., 2005), como um alvo fenotíoico.
[00245] Os indels induzidos por SauCas9 ou Nme1Cas9 em Pcsk9 no fígado do camundongo resulta em níveis de colesterol reduzidos provendo uma referência in vivo útil e fácil de pontuar para as novas plataformas de edição (Ran et al., 2015; Ibraheim et al., 2018). Os guias de RNA Nme2Cas9 foram os mesmos que aqueles usados acima. Vide a Figura 9B, Figura 13D, e Figura 14. Como Rosa26-OT1 foi o único sítio inespecífico Nme2Cas9 que foi validado em células de mamíferos cultivadas, o guia Rosa26 também forneceu ao presente uma oportunidade de avaliar edição específica vs inespecífica in vivo. Vide as figuras 14D-E). As veias caudais de dois grupos de camundongos (n = 5) foram injetadas com 4 x 1011 cópias de genoma (GCs) AAV8.sgRNA.Nme2Cas9 direcionadas a Pcsk9 ou Rosa26. O soro foi coletado em 0, 14 e 28 dias após a injeção para a medição do nível de colesterol. Os camundongos foram sacrificados em 28 dias após a injeção e os tecidos hepáticos foram coletados. Vide a Figura 15A. O sequenciamento profundo direcionado de cada sítio revelou ~38% e ~46% de indução de indel nos sítios de edição de Pcsk9 e Rosa26, respectivamente, no fígado. Vide a Figura 15B. visto que hepatócitos constituem somente 65-70% do conteúdo celular total no fígado adulto, as eficiências de edição do hepatócito induzidas por Nme2Cas9 AAV com sgPcsk9 e sgRosa foram de aproximadamente 54-58% e 66-71%, respectivamente (Racanelli e Rehermann, 2006).
[00246] Somente 2,25% de indels do fígado total (~3-3,5% em hepatócitos) foram detectados no sítio inespecífico de Rosa26-OT1, comparável ao 1% de edição que foi observado neste sítio em células transfectadas Hepa1-
6. Figura 15B cf Figura 14D. Em ambos 14 e 28 dias após a injeção, a edição de Pcsk9 foi realizada por uma redução de ~44% em níveis de colesterol sérico, enquanto os camundongos tratados com o nível de colesterol normal mantido por AAV que expressa sgRosa26 em todo o estudo. Vide a Figura 15C. A redução de ~44% em colesterol sérico nos camundongos tratados com AAV Nme2Cas9/sgPcsk9 compara bem com a redução de ~40% reportada com AAV completo SauCas9 quando direcionado ao mesmo gene (Ran et al., 2015).
[00247] A Figura 15 apresenta dados exemplares mostrando a edição do genoma de Nme2Cas9 in vivo por meio de distribuição de AAV completa. A Figura 15A mostra fluxo de trabalho exemplar para a distribuição de AAV8.sgRNA.Nme2Cas9 para diminuir os níveis de colesterol em camundongos pelo direcionamento a Pcsk9. Topo: esquema do vetor de AAV completo expressando Nme2Cas9 e the sgRNA (elementos do genoma individual não apresentados em escala). BGH, hormônio de crescimento bovino sítio poli(A); HA, marcador de epítopo; NLS, sequência de localização nuclear; h, otimizado para códon humano. Fundo: Linha do tempo para injeções na veia caudal de AAV8.sgRNA.Nme2Cas9 (4 x 1011 GCs), seguido por medições do colesterol no dia 14 e análises de indel, histologia e colesterol no dia 28 após a injeção. A
Figura 15B mostra uma análise TIDE exemplar para medir indels em DNA extraído de fígados de camundongos injetados com AAV8.Nme2Cas9+sgRNA direcionado aos sítios de Pcsk9 e Rosa26 (controle). A eficiência de indel no sítio inespecífico sozinho identificada por GUIDE-seq para estes dois sgRNAs (Rosa26|OT1) também foi avaliada por TIDE. A Figura 15C mostra níveis de colesterol sérico reduzidos exemplares em camundongos injetados com o guia de direcionamento de Pcsk9 comparado aos controles de direcionamento de Rosa26. Os valores P são calculados pelo teste t de duas caudas não pareado. A Figura 16 apresenta dados exemplares mostrando inativação de PCSK9 e histologia do fígado após distribuição e edição de AAV de Nme2Cas9, relacionados à Figura 15. A Figura 16A mostra que Western blotting exemplar usando anticorpo anti-PCSK9 revela níveis fortemente reduzidos de PCSK9 nos fígados de camundongos tratados com sgPcsk9, comparado aos camundongos tratados com sgRosa26. 2ng de PCSK9 recombinante foram usados como um padrão de mobilidade (faixa mais à esquerda), e uma banda de reação cruzada nas amostras de fígado é indicada por um asterisco. GAPDH foi usado como controle de carregamento (painel do fundo). A Figura 16B mostra coloração H&E exemplar de fígados de camundongos injetados com vetores de AAV8.Nme2Cas9+sgRosa26 (esquerda) ou AAV8.Nme2Cas9+sgPcsk9 (direita). Barras de escala, 25 µm.
[00248] Western blotting foi realizado usando um anticorpo anti- PCSK9 para estimarto os níveis de proteína PCSK9 nos fígados de camundongos tratados com sgPcsk9 e sgRosa26. O PCSK9 do fígado foi abaixo o limite de detecção em camundongos tratados com sgPcsk9, enquanto os camundongos tratados com sgRosa26 exibiram níveis normais de PCSK9. Vide a Figura 16A. A coloração e histologia de hematoxilina e eosina (H&E) não revelaram quaisquer sinais de toxicidade ou dano ao tecido no grupo após a expressão de Nme2Cas9. Vide a Figura 16B. Estes dados validam Nme2Cas9 como um sistema de edição do genoma in vivo altamente eficaz, incluindo quando distribuído por vetores únicos de AAV.
[00249] Os vetores de AAV foram usados recentemente para a geração de camundongos com edição do genoma, sem a necessidade de microinjeção ou eletroporação, simplesmente por embeber os zigotos em meio de cultura contendo vetor(s) de AAV, seguido por reimplantação em fêmeas pseudogestantes (Yoon et al., 2018). A edição foi obtida anteriormente com um sistema de AAV duplo no qual SpyCas9 e seu sgRNA foram distribuídos em vetores separados (Yoon et al., 2018). Para testar se Nme2Cas9 poderia realizar a edição precisa e eficiente em zigotos de camundongo com um sistema de distribuição de AAV completa, foi direcionado a Tirosinase (Tyr). Uma inativação bialélica de Tyr rompe a produção de melanina resultando em um fenótipo albino (Yokoyama et al., 1990).
[00250] Um Tyr sgRNA eficiente foi validado que cliva o sítio de Tyr somente dezessete (17) pb do sítio da mutação clássica albino em células Hepa1-6 por transfecções transientes. Vide a Figura 17A. Em seguida, os zigotos C57BL/6NJ foram incubados por 5-6 horas em meio de cultura contendo 3x109 ou 3x108 GCs de um vetor completo de AAV6 expressando Nme2Cas9 juntamente com o Tyr sgRNA. Após a cultura durante a noite em meios frescos, aqueles zigotos que avançaram para o estágio de duas células foram transferidos para o oviduto de recipientes pseudogestados e deixados se desenvolver até o fim. Vide a Figura 18A. A análise da cor da pelagem de crias revelou que os camundongos eram albinos, chinchila (indicando um alelo hipomórfico de Tirosinase), ou que tinham cor da pelagem diversificada composta de pontos albinos e de chinchila, mas carecendo de pigmentação preta. Vide as figuras 18B-C. Estes resultados sugerem uma alta frequência de mutações bialélicas visto que a presença de um alelo do tipo selvagem Tirosinase deve render pigmentação preta. Um total de cinco crias (10%) nasceram do experimento com 3x109 GCs. Todos eles carregaram indels;
fenotipicamente, dois eram albinos, um era chinchila, e dois tinham pigmentação diversificada, indicando mosaicismo.
[00251] Do experimento com 3x108 GCs, quatro (4) crias (14%) foram obtidas, duas das quais morreram ao nascer, impedindo uma análise da cor da pelagem ou genoma. A análise da cor da pelagem das duas crias restantes revelou uma chinchila e uma cria de mosaico. Estes resultados indicam que a distribuição de AAV único de Nme2Cas9 e seu guia podem ser usados para gerar mutações em zigotos de camundongo sem microinjeção ou eletroporação.
[00252] Para medir a formação de indel específica no gene Tyr, o DNA foi isolado das caudas de cada camundongo, o sítio foi amplificado e mediante o qual foi realizada uma análise TIDE. Todos os camundongos tinham altos níveis de edição específica por Nme2Cas9, variando de 84% a 100%. Vide as figuras 17B-C. A maioria das lesões em camundongo albino 9-1 foi uma deleção de 1 ou 4 pb, sugerindo mosaicismo ou trans-heterozigosidade, mas camundongo albino 9-2 exibiu uma deleção uniforme de 2 pb. Vide a Figura 17C. A Figura 17 apresenta dados exemplares mostrando a edição de Tyr ex vivo em zigotos de camundongo, relacionados à Figura 16. A Figura 17A mostra que dois sítios exemplares em Tyr, cada um com N4CC PAMs, foram testados quanto à edição em células Hepa1-6. O guia sgTyr2 exibiu maior eficiência da edição e foi selecionado para teste adicional. A Figura 17B mostra sete camundongos exemplares que sobreviveram ao desenvolvimento pós-natal, e cada um exibiu fenótipos da cor da pelagem assim como edição específica, como avaliado por TIDE. A Figura 17C mostra espectros de indel exemplares do DNA da cauda de cada camundongo de (B), assim como um camundongo C57BL/6NJ não editado, como indicado pela análise TIDE. Eficiências de inserções (positivas) e deleções (negativas) de vários tamanhos são indicadas.
[00253] A Figura 18 apresenta dados exemplares mostrando edição do genoma de Nme2Cas9 ex vivo por meio de distribuição de AAV completa. A
Figura 18A mostra um fluxo de trabalho exemplar para a edição ex vivo de Nme2Cas9 com AAV único para gerar camundongos albinos C57BL/6NJ pelo direcionamento ao gene Tyr. Os zigotos são cultivados em KSOM contendo AAV6.Nme2Cas9:sgTyr por 5-6 horas, enxaguados em M2, e cultivados por um dia antes de serem transferidos para o oviduto de receptores pseudogestantes. A Figura 18B mostra camundongos exemplares albinos (esquerda) e chinchila ou diversificados (meio) gerados por 3x109 GCs, e camundongos chinchila ou diversificados (direita) gerados por 3x108 GCs de zigotos com AAV6.Nme2Cas9:sgTyr. A Figura 18C mostra um sumário exemplar de experimentos de edição ex vivo de Nme2Cas9.sgTyr AAV único em duas doses de AAV.
[00254] Os dados são inconclusivos quanto a se existe qualquer mosaicismo em camundongo 9-2, ou que alelos adicionais estavam ausentes do camundongo 9-1, porque somente amostra da cauda foram sequenciadas e outros tecidos poderiam ter lesões distintas. A análise de DNA da cauda de camundongos chinchila revelou a presença de mutações em quadro que são potencialmente a causa da cor da pelagem da chinchila. A complexidade mutacional limitada sugere que a edição ocorreu cedo durante o desenvolvimento embriônico nestes camundongos. Estes resultados proveem uma rota simplificada para a mutagênese em mamíferos através da aplicação de um vetor único de AAV, neste caso distribuindo ambos Nme2Cas9 e seu sgRNA.
[00255] A Figura 19 mostra um ensaio repórter mCherry exemplar para as atividades otimizadas de nSpCas9-ABEmax e nNme2Cas9-ABEmax. A Figura 19A mostra informações de sequência de repórter ABE-mCherry exemplares. Existe um códon de parada TAG na região de codificação mCherry. Na linhagem celular estável integrada repórter, não existe qualquer sinal mCherry devido a este códon de parada. O sinal mCherry será ativado se o nSpCas9-ABEmax ou nNme2Cas9-ABEmax otimizado puder converter TAG em CAG, que codifica um resíduo de glutamina. A Figura 19B mostra que um sinal mCherry exemplar é ativado devido à atividade de SpCas9-ABE ou Nme2Cas9- ABE. Painel superior: controle negativo (nenhuma edição); painel do meio: ativação de mCherry por nSpCas9-ABEmax; painel do fundo: ativação de mCherry por nNme2Cas9-ABEmax otimizado. A Figura 19C mostra uma quantificação FACS exemplar de eventos de edição de base em células repórter mCherry transfectadas com o SpCas9-ABE ou Nme2Cas9-ABE. N = 6; barras de erro representam S.D. Os resultados são de três réplicas biológicas realizadas em duplicatas técnicas.
[00256] A Figura 20 mostra um ensaio repórter de GFP exemplar para as atividades de nSpCas9-CBE4 (Addgene #100802) e nNme2Cas9-CBE4 (mesma estrutura principal de plasmídeo que Addgene #100802). A Figura 20A mostra informações exemplares de sequência do CBE-repórter de GFP. Existe uma mutação que converte GYG em GHG na região de núcleo de fluoroforo da linhagem repórter de GFP. Não existe qualquer sinal de GFP devido a esta mutação. O sinal de GFP será ativado se o nSpCas9-CBE4 ou nNme2Cas9- CBE4 puder converter CAC (codificando histidina) em TAC/TAT (codificando tirosina). A Figura 20B mostra que um sinal de GFP exemplar é ativado devido à atividade de nSpCas9-CBE4 ou nNme2Cas9-CBE4. Painel superior: controle negativo (nenhuma edição); painel do meio: ativação de GFP por nSpCas9- CBE4; painel do fundo: ativação de GFP por nNme2Cas9-CBE4). A Figura 20C mostra uma quantificação de FACS exemplar de eventos de edição de base em células repórter de GFP transfectadas com nSpCas9-CBE4 ou nNme2Cas9- CBE4. N = 6; barras de erro representam S.D. Os resultados são de réplicas biológicas realizadas em duplicatas técnicas.
[00257] A Figura 21 mostra edição de citosina exemplar por nNme2Cas9-CBE4. O painel superior mostra as informações de sequência de direcionamento a KANK3 (sequências de PAM são indicadas em vermelho) de Nme2Cas9 e a edição de base nas amostras de controle negativo. O painel do fundo mostra a quantificação da eficiência da substituição de cada tipo de base na janela de edição de nNmeCas9-CBE4 das sequências alvo KANK3. As tabelas de sequência mostram frequências de nucleotídeo em cada posição. As frequências de conversão esperada C-a-T são indicadas em vermelho.
[00258] A Figura 22 mostra edição de citosina e adenina exemplar por nNme2Cas9-CBE4 e nNme2Cas9-ABEmax, respectivamente. O painel superior mostra as informações de sequência de direcionamento PLXNB2 (sequências de PAM são indicadas em vermelho) de Nme2Cas9 e edição de base nas amostras de controle negativo. O painel do meio mostra a quantificação da taxa de substituição de cada tipo de base nas janelas de edição nNmeCas9- ABEmax da sequência alvo PLXNB2. As tabelas de sequência mostram frequências de nucleotídeo em cada posição. As frequências de conversão esperada A-a-G são destacadas em vermelho. O painel do fundo mostra a eficiência da quantificação da substituição de cada tipo de base nas janelas de edição nNmeCas9-CBE4 da sequência alvo PLXNB2. As tabelas de sequência mostram frequências de nucleotídeo em cada posição. As frequências de conversão esperada C-a-T são destacadas em vermelho.
8. SEQUÊNCIAS
[00259] Alinhamento de Nme1Cas9 e Nme2Cas9
[00260] As diferenças aa de não PID (azul petróleo - sublinhado); as diferenças aa de PID (amarelo - sublinhado negrito); resíduos de sítio ativo (vermelho - negrito).
[00261] Nme1Cas9 (1-60)
MAAFKPNSINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTG DSLAM
[00262] Nme2Cas9 (1-60)
MAAFKPNPINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTG DSLAM
[00263] Nme1Cas9 (61-120)
ARRLARSVRRLTRRRAHRLLRTRRLLKREGVLQAANFDENGLIKSLPNTPWQL RAAALDR
[00264] Nme2Cas9 (61-120)
ARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQL RAAALDR
[00265] Nme1Cas9 (121-180)
KLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVAGNAHALQTGD FRTPAEL
[00266] Nme2Cas9 (121-180)
KLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVANNAHALQTGD FRTPAEL
[00267] Nme1Cas9 (181-240)
ALNKFEKESGHIRNQRSDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKE GIETLLM
[00268] Nme2Cas9 (181-240)
ALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKE GIETLLM
[00269] Nme1Cas9 (241-300)
TQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGS ERPLTDT
[00270] Nme2Cas9 (241-300)
TQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGS ERPLTDT
[00271] Nme1Cas9 (301-360)
ERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKA YHAISRAL
[00272] Nme2Cas9 (301-360)
ERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKA YHAISRAL
[00273] Nme1Cas9 (361-420)
EKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHIS FDKF
[00274] Nme2Cas9 (361-420)
EKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALLKHI SFDKF
[00275] Nme1Cas9 (421-480)
VQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNP VVLRA
[00276] Nme2Cas9 (421-480)
VQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNP VVLRA
[00277] Nme1Cas9 (481-540)
LSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKA AAKFREY
[00278] Nme2Cas9 (481-540)
LSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKA AAKFREY
[00279] Nme1Cas9 (541-600)
FPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSR TWDDSF
[00280] Nme2Cas9 (541-600)
FPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDHALPFSR TWDDSF
[00281] Nme1Cas9 (601-660)
NNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQR ILLQKFDED
[00282] Nme2Cas9 (601-660)
NNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQR ILLQKFDED
[00283] Nme1Cas9 (661-720)
GFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGL RKVRAEND
[00284] Nme2Cas9 (661-720)
GFKECNLNDTRYVNRFLCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLR KVRAEND
[00285] Nme1Cas9 (721-780)
RHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHF PQPWEFFA
[00286] Nme2Cas9 (721-780)
RHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHF PQPWEFFA
[00287] Nme1Cas9 (781-840)
QEVMIRVFGKPDGKPEFEEADTLEKLRTLLAEKLSSRPEAVHEYVTPLFVSRA PNRKMSG
[00288] Nme2Cas9 (781-840)
QEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRA PNRKMSG
[00289] Nme1Cas9 (841-895)
[00290] QGHMETVKSAK--- RLDEGVSVLRVPLTQLKLKDLEKMVNR--EREPKLYEALKARLEAH
[00291] Nme2Cas9 (841-899)
[00292] AHK-
DTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYKNGREIELYEALKARL EAY
[00293] Nme1Cas9 (896-950)
[00294] KDDPAKAFAE--- PFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNH--NGIADNATMVRV
[00295] Nme2Cas9 (900 –954)
[00296] GGNAKQAFDPKDNPFYKK---G--
GQLVKAVRVEKTQESGVLLNKKNAYTIADNGDMVRV
[00297] Nme1Cas9 (951-1005)
[00298] DVFEKG-----
DKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPND
[00299] Nme2Cas9 (955-1007)
[00300] DVFCKVDKKGKNQYFIVPIYAWQVAENILPDIDCKG-------
YRIDDSYTFCFSLHKYD
[00301] Nme1Cas9 (1006-1063)
[00302] LVEVIT--
KKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQI
[00303] Nme2Cas9 (1008-1063)
[00304] LIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHDKGSKEQ ----QFRISTQNLVLIQKYQV
[00305] Nme1Cas9 (1064-1082)
[00306] DELGKEIRPCRLKKRPPVR
[00307] Nme2Cas9 (1064-1082)
[00308] NELGKEIRPCRLKKRPPVR
[00309] Alinhamento de Nme1Cas9 e Nme3Cas9
[00310] As diferenças aa não PID (azul petróleo - sublinhado); diferenças aa PID (amarelo - sublinhado negrito); resíduos de sítio ativo (vermelho - negrito).
[00311] Nme1Cas9 1 MAAFKPNSINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAE 50
[00312] Nme3Cas9 1 MAAFKPNPINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAE 50
[00313] Nme1Cas9 51
VPKTGDSLAMARRLARSVRRLTRRRAHRLLRTRRLLKREGVLQAANFDEN 100
[00314] Nme3Cas9 51
VPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDEN 100
[00315] Nme1Cas9 101 GLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGET 150
[00316] Nme3Cas9 101 GLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGET 150
[00317] Nme1Cas9 151 ADKELGALLKGVAGNAHALQTGDFRTPAELALNKFEKESGHIRNQRSDYS 200
[00318] Nme3Cas9 151
ADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKECGHIRNQRGDYS 200
[00319] Nme1Cas9 201 HTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDA 250
[00320] Nme3Cas9 201 HTFSRKDLQAELNLLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDA 250
[00321] Nme1Cas9 251 VQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDT 300
[00322] Nme3Cas9 251 VQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDT 300
[00323] Nme1Cas9 301
ERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEM 350
[00324] Nme3Cas9 301 ERATLMDEPYRKSKLTYAQARKLLSLEDTAFFKGLRYGKDNAEASTLMEM 350
[00325] Nme1Cas9 351 KAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLK 400
[00326] Nme3Cas9 351 KAYHTISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLK 400
[00327] Nme1Cas9 401 DRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYG 450
[00328] Nme3Cas9 401 DRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYG 450
[00329] Nme1Cas9 451 DHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPAR 500
[00330] Nme3Cas9 451 DHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPAR 500
[00331] Nme1Cas9 501 IHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKS 550
[00332] Nme3Cas9 501 IHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKS 550
[00333] Nme1Cas9 551 KDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSF 600
[00334] Nme3Cas9 551 KDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSF 600
[00335] Nme1Cas9 601
NNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQ 650
[00336] Nme3Cas9 601
NNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQ 650
[00337] Nme1Cas9 651
RILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNG 700
[00338] Nme3Cas9 651
RILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNG 700
[00339] Nme1Cas9 701
QITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEM 750
[00340] Nme3Cas9 701
QITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEM 750
[00341] Nme1Cas9 751 NAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEA 800
[00342] Nme3Cas9 751 NAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEA 800
[00343] Nme1Cas9 801 DTLEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSA 850
[00344] Nme3Cas9 801
DTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSA 850
[00345] Nme1Cas9 851 KRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPA 900
[00346] Nme3Cas9 851 KRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPA 900
[00347] Nme1Cas9
[00348] 901
KAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRV 950
[00349] Nme3Cas9
[00350] 901
KAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRV 950
[00351] Nme1Cas9 951
DVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFS 1000
[00352] Nme3Cas9 951
DVFEKGDKYYLVPIYSWQVAKGILPDRAVVAYADEEDWTVIDESFRFKFV 1000
[00353] Nme1Cas9 1001 LHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGI 1050
[00354] Nme3Cas9 1001 LYSNDLIKVQLKKDSFLGYFSGLDRATGAISLREHDLEKSKGKDG-MHRI 1049
[00355] Nme1Cas9 1051 GVKTALSFQKYQIDELGKEIRPCRLKKRPPVR 1082
[00356] Nme3Cas9 1050 GVKTALSFQKYQIDEMGKEIRPCRLKKRPPVR 1081
[00357] Nme2Cas9 Expresso por Plasmídeo
[00358] SV40 NLS (amarelo - negrito); 3X-HA-Tag (verde- (sublinhado/negrito); NLS do tipo cMyc (azul petróleo - simples); Ligante (magenta - negrito itálico) e Nme2Cas9 (itálico).
[00359] MAAFKPNPINYILGLDIGIASVGWAMVEIDEEENPIRLIDLG
VRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQA ADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNE GETADKELGALLKGVANNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDY SHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQ KMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATL MDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAIS RALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALL KHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPI PADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEK RQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEIN LVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGK DNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKECNLNDTRYVNRFLC QFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVV ACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHFPQPWEFFAQE VMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPN RKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYKNGREIEL YEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAVRVEKTQESGVLLNKK NAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQVAENILPDIDCKGYRID DSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHDKGSKEQQ FRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVRGTGGPKKKRKVYPYDVPD YAGYPYDVPDYAGSYPYDVPDYAGSAAPAAKKKKLDFESG*
[00360] Nme2Cas9 Expresso por AAV
[00361] SV40 NLS (amarelo - negrito); 3X-HA-Tag (verde- (sublinhado/negrito); NLS do tipo nucleoplasmina (vermelho - sublinhado); c- myc NLS (azul petróleo - simples); Ligante (magenta - negrito itálico) e Nme2Cas9 (itálico).
[00362] MVPKKKRKVEDKRPAATKKAGQAKKKKMAAFKPNPINYI
LGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLAR SVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALD RKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVANNAHALQTG DFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNP HVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFI WLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAF FKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSSELQDEIGT AFSLFKTDEDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGK RYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVR RYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVG EPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDHALPFSRTWDDSF NNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQR ILLQKFDEDGFKECNLNDTRYVNRFLCQFVADHILLTGKGKRRVFASNGQITNL LRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGK TIDKETGKVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTL LAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGAHKDTLRSAKRFVKHNEKISVK RVWLTEIKLADLENMVNYKNGREIELYEALKARLEAYGGNAKQAFDPKDNPFY KKGGQLVKAVRVEKTQESGVLLNKKNAYTIADNGDMVRVDVFCKVDKKGKN QYFIVPIYAWQVAENILPDIDCKGYRIDDSYTFCFSLHKYDLIAFQKDEKSKVEF AYYINCDSSNGRFYLAWHDKGSKEQQFRISTQNLVLIQKYQVNELGKEIRPCR LKKRPPVREDKRPAATKKAGQAKKKKYPYDVPDYAGYPYDVPDYAGSYPYD VPDYAAAPAAKKKKLD*
[00363] Nme2Cas9 Recombinante
[00364] SV40 NLS (amarelo - negrito); NLS do tipo nucleoplasmina (vermelho-sublinhado); Ligante (magenta - negrito itálico) e Nme2Cas9 (itálico).
[00365] PKKKRKVNAMAAFKPNPINYILGLDIGIASVGWAMVEIDE
EENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARR LLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHR GYLSQRKNEGETADKELGALLKGVANNAHALQTGDFRTPAELALNKFEKESG HIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQR PALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERP LTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLME MKAYHAISRALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRV QPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNT EEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSF KDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKC LYSGKEINLVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTP YEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKECNLNDTR YVNRFLCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHH ALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHFPQP WEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPL FVSRAPNRKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYK NGREIELYEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAVRVEKTQES GVLLNKKNAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQVAENILPDID CKGYRIDDSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHD KGSKEQQFRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVRGGGGSGGGGS GGGGSPAAKKKKLDGGGSKRPAATKKAGQAKKKK*
[00366] Nme2Cas9 Recombinante para o uso em Distribuição de RNP de células de mamífero:
[00367] SV40 NLS (amarelo - negrito); NLS do tipo nucleoplasmina (vermelho - sublinhado); Ligante (magenta - negrito itálico) e Nme2Cas9 (itálico).
[00368] PKKKRKVNAMAAFKPNPINYILGLDIGIASVGWAMVEIDE
EENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARR LLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHR GYLSQRKNEGETADKELGALLKGVANNAHALQTGDFRTPAELALNKFEKESG HIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQR PALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERP LTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLME MKAYHAISRALEKEGLKDKKSPLNLSSELQDEIGTAFSLFKTDEDITGRLKDRV QPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNT EEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSF KDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKC LYSGKEINLVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTP YEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKECNLNDTR YVNRFLCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHH ALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGKVLHQKTHFPQP WEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPL FVSRAPNRKMSGAHKDTLRSAKRFVKHNEKISVKRVWLTEIKLADLENMVNYK NGREIELYEALKARLEAYGGNAKQAFDPKDNPFYKKGGQLVKAVRVEKTQES GVLLNKKNAYTIADNGDMVRVDVFCKVDKKGKNQYFIVPIYAWQVAENILPDID CKGYRIDDSYTFCFSLHKYDLIAFQKDEKSKVEFAYYINCDSSNGRFYLAWHD KGSKEQQFRISTQNLVLIQKYQVNELGKEIRPCRLKKRPPVRGGGGSGGGGS GGGGSPAAKKKKLDGGGSKRPAATKKAGQAKKKK*
9. APLICAÇÕES TERAPÊUTICAS
[00369] Embora ortólogos de Cas9 compactos tenham sido validados anteriormente para a edição do genoma, incluindo por meio de distribuição de AAV único, seus PAMs maiores têm desenvolvimento terapêutico restrito devido às frequências do sítio alvo que são menores do que aquela do SpyCas9 adotado mais amplamente. Além disso, SauCas9 e sua variante KKH com exigências relaxadas de PAM (Kleinstiver et al., 2015) são passíveis de edição inespecífica com alguns sgRNAs (Friedland et al., 2015; Kleinstiver et al., 2015). Estas limitações são exacerbadas com sítios alvo que exigem edição dentro de uma janela de sequência estreita ou que exigem deleção segmentar precisa. Foi identificado Nme2Cas9 como um Cas9 compacto e altamento preciso com um PAM de dinucleotídeo menos restritivo para a edição do genoma por distribuição de AAV in vivo. O desenvolvimento de Nme2Cas9 expande muito o escopo genômico da edição in vivo, especialmente por meio da distribuição de vetor viral. A distribuição de Nme2Cas9 da plataforma completa de AAV estabelecida neste estudo pode em princípio ser usada para direcionar uma variedade tão ampla de sítios quanto SpyCas9 (devido às densidades idênticas de N4CC ótimo e PAM NGGs), mas sem a necessidade de distribuir dois vetores separados para as mesmas células alvo. A disponibilidade de uma versão cataliticamente morta de Nme2Cas9 (dNme2Cas9) também promete expandir o escopo das aplicações tais como CRISPRi, CRISPRa, edição de base, e abordagens relacionadas (Dominguez et al., 2016; Komor et al., 2017). Além disso, a hiperprecisão de Nme2Cas9 permite a edição precisa de genes alvo, melhorando potencialmente problemas de segurança resultantes de atividades inespecíficas. Talvez contraintuitivamente, a maior densidade do sítio alvo de Nme2Cas9 (comparada naquela de Nme1Cas9) não leva a um aumento relativo na edição inespecífica para o primeiro. Resultados similares foram reportados recentemente com variantes de SpyCas9 evoluídas para terem PAMs mais curtos (Hu et al., 2018). Ortólogos de Cas9 do tipo II C são geralmente nucleases in vitro mais lentas do que SpyCas9 (Ma et al., 2015; Mir et al., 2018); interessantemente, os princípios enzimológicos indicam que um kcat aparente reduzido (dentro dos limites) pode melhorar a especificidade específica vs inespecífica para nucleases guiadas por RNA (Bisaria et al., 2017).
[00370] A descoberta de Nme2Cas9 e Nme3Cas9 articulado em Cas9s não explorados que são altamente relacionados (fora do PID) a um ortólogo que foi validado anteriormente para a edição do genoma humano (Esvelt et al., 2013; Hou et al., 2013; Lee et al., 2016; Amrani et al., 2018). O parentesco de Nme2Cas9 e Nme3Cas9 com Nme1Cas9 trouxe um benefício a mais, a saber que eles usam a mesma estrutura exata de sgRNA, contornando a necessidade de identificar e validar sequências de tracrRNA funcionais para cada uma. N contexto de imunidade natural de CRISPR, a evolução acelerada de novas especificidades de PAM poderia refletir pressão seletiva para restaurar o direcionamento de fagos e MGEs que escaparam da interferência através de mutações de PAM (Deveau et al., 2008; Paez-Espino et al., 2015). A presente observação de que AcrIIC5Smu inibe Nme1Cas9, mas não Nme2Cas9 sugere uma segunda base não mutuamente exclusiva para a variação acelerada de PID, a saber a evasão de inibição anti-CRISPR. Também foi especulado que a variabilidade acelerada não pode ser restrita a PIDs, talvez resultante de pressões seletivas para evitar anti-CRISPRs que ligam outros domínios de Cas9. Os inibidores de Cas9 tais como AcrIIC1 que liga regiões mais conservadas de Cas9 provavelmente apresentam menos rotas para o escape mutacional e, portanto, exibem um espectro inibidor mais amplo (Harrington et al., 2017a). Quaisquer que sejam as fontes de pressão seletiva que impulsionam a coevolução Acr e Cas9, a disponibilidade de inibidores validados de Nme2Cas9 (por exemplo AcrIIC1-4) provê oportunidades para níveis adicionais de controle sobre suas atividades.
[00371] A abordagem usada neste estudo (isto é, a busca por domínios de evolução rápida dentro de Cas9) pode ser implementada em qualquer lugar, especialmente com espécies bacterianas que são bem- amostradas no nível da sequência do genoma. Esta abordagem também poderia ser aplicada a outras proteínas efetoras CRISPR-Cas tais como Cas12 e Cas13 que também foram desenvolvidas para a projeção do genoma ou transcriptoma e outras aplicações. Esta estratégia poderia ser especialmente atraente com proteínas Cas que são intimamente relacionadas a ortólogos com eficácia comprovada em contextos heterólogos (por exemplo, em células eucarióticas), como foi o caso para Nme1Cas9. A aplicação desta abordagem a ortólogos de Cas9 meningocócicos rendeu uma nova plataforma de edição do genoma, Nme2Cas9, com uma combinação única de características (tamanho compacto, dinucleotídeo PAM, hiperprecisão, capacidade de distribuição de AAV único, e suscetibilidade de Acr) que promete acelerar o desenvolvimento de ferramentas de edição do genoma para aplicações gerais e terapêuticas. TABELA 3. A TABELA A SEGUIR APRESENTA SEQUÊNCIAS EXEMPLARES PARA PLASMÍDEOS E OLIGOS COMO REVELADO AQUI. Plasmídeos exemplares
Estrutu ra Nº do Descrição princip Sequência de plasmídeo Nome da inserção al Propósito inserção Expressão Nme3Cas9 bacteriana de PID em pMCSG Nme1Cas9 com 1 pAE70 Nme1Cas9 7 Nme3Cas9 PID Vide exemplos aqui.
Expressão Nme2Cas9 bacteriana de PID em pMCSG Nme1Cas9 com 2 pAE71 Nme1Cas9 7 Nme2Cas9 PID Vide exemplos aqui.
Direcionamento de
GTCACCTGCCTCG TLR2.0 com
TGGAATACGG 3 pAE113 Nme2TLR1 pLKO Nme2Cas9 Direcionamento de
GCACCTGCCTCGT TLR2.0 com
GGAATACGGT 4 pAE114 Nme2TLR2 pLKO Nme2Cas9 Direcionamento de
GTTCAGCGTGTCC TLR2.0 com
GGCTTTGGC 5 pAE115 Nme2TLR5 pLKO Nme2Cas9 Direcionamento de TLR2.0 com GTGGTGAGCAAGG 6 pAE116 Nme2TLR11 pLKO Nme2Cas9 GCGAGGAGCTG Direcionamento de TLR2.0 com GGGCGAGGAGCTG 7 pAE117 Nme2TLR12 pLKO Nme2Cas9 TTCACCGGGGT
Direcionamento de TLR2.0 com GTGAACTTGTGGC 8 pAE118 Nme2TLR13 pLKO Nme2Cas9 CGTTTACGTCG
Direcionamento de TLR2.0 com GCGTCCAGCTCGA 9 pAE119 Nme2TLR14 pLKO Nme2Cas9 CCAGGATGGGC
Direcionamento de TLR2.0 com GCGGTGAACAGCT 10 pAE120 Nme2TLR15 pLKO Nme2Cas9 CCTCGCCCTTG
Direcionamento de TLR2.0 com GGGCACCACCCCG 11 pAE121 Nme2TLR16 pLKO Nme2Cas9 GTGAACAGCTC
Direcionamento de TLR2.0 com GGCACCACCCCGG 12 pAE122 Nme2TLR17 pLKO Nme2Cas9 TGAACAGCTCC
Direcionamento de TLR2.0 com GGGATGGGCACCA 13 pAE123 Nme2TLR18 pLKO Nme2Cas9 CCCCGGTGAAC
Direcionamento de TLR2.0 com GCGTGTCCGGCTT 14 pAE124 Nme2TLR19 pLKO Nme2Cas9 TGGCGAGACAA
Direcionamento de TLR2.0 com GTCCGGCTTTGGC 15 pAE125 Nme2TLR20 pLKO Nme2Cas9 GAGACAAATCA
Direcionamento de TLR2.0 com GATCACCTGCCTC 16 pAE126 Nme2TLR21 pLKO Nme2Cas9 GTGGAATACGG
Direcionamento de TLR2.0 com GACGCTGAACTTG 17 pAE149 Nme2TLR22 pLKO Nme2Cas9 TGGCCGTTTAC
Direcionamento de TLR2.0 com GCCAAAGCCGGAC 18 pAE150 Nme2TLR23 pLKO Nme2Cas9 ACGCTGAACTT
Espaçador Direcionamento de Nme2TLR13 TLR2.0 com GGAACTTGTGGCC 19 pAE193 com 23nt pLKO Nme2Cas9 GTTTACGTCG
Espaçador Direcionamento de Nme2TLR13 TLR2.0 com GAACTTGTGGCCG 20 pAE194 com 22nt pLKO Nme2Cas9 TTTACGTCG
Espaçador Direcionamento de Nme2TLR13 TLR2.0 com GACTTGTGGCCGT 21 pAE195 com 21nt pLKO Nme2Cas9 TTACGTCG
Espaçador Direcionamento de Nme2TLR13 TLR2.0 com GCTTGTGGCCGTT 22 pAE196 com 20nt pLKO Nme2Cas9 TACGTCG
Espaçador Direcionamento de Nme2TLR13 TLR2.0 com GTTGTGGCCGTTT 23 pAE197 com 19nt pLKO Nme2Cas9 ACGTCG
Espaçador Direcionamento de Nme2TLR21 TLR2.0 com GTCACCTGCCTCG 24 pAE213 com G22 pLKO Nme2Cas9 TGGAATACGG
Espaçador Direcionamento de Nme2TLR21 TLR2.0 com GCACCTGCCTCGT 25 pAE214 com G21 pLKO Nme2Cas9 GGAATACGG
Espaçador Direcionamento de Nme2TLR21 TLR2.0 com GACCTGCCTCGTG 26 pAE215 com G20 pLKO Nme2Cas9 GAATACGG Espaçador Direcionamento de Nme2TLR21 TLR2.0 com GCCTGCCTCGTGG 27 pAE216 com G19 pLKO Nme2Cas9 AATACGG Direcionamento de
GGTTCTGGGTACT AAVS1 com
TTTATCTGTCC 28 pAE90 Nme2TS1 pLKO Nme2Cas9 Direcionamento de
GTCTGCCTAACAG AAVS1 com
GAGGTGGGGGT 29 pAE93 Nme2TS4 pLKO Nme2Cas9 Direcionamento de
GAATATCAGGAGA AAVS1 com
CTAGGAAGGAG 30 pAE94 Nme2TS5 pLKO Nme2Cas9 Direcionamento de
GCCTCCCTGCAGG LINC01588 com
GCTGCTCCC 31 pAE129 Nme2TS6 pLKO Nme2Cas9 Direcionamento de
GAGCTAGTCTTCTT AAVS1 com
CCTCCAACCC 32 pAE130 Nme2TS10 pLKO Nme2Cas9 Direcionamento de
GATCTGTCCCCTC AAVS1 com
CACCCCACAGT 33 pAE131 Nme2TS11 pLKO Nme2Cas9 Direcionamento de
GGCCCAAATGAAA AAVS1 com
GGAGTGAGAGG 34 pAE132 Nme2TS12 pLKO Nme2Cas9
Direcionamento de
GCATCCTCTTGCTT AAVS1 com
TCTTTGCCTG 35 pAE133 Nme2TS13 pLKO Nme2Cas9 Direcionamento de
GGAGTCGCCAGAG LINC01588 com
GCCGGTGGTGG 36 pAE136 Nme2TS16 pLKO Nme2Cas9 Direcionamento de
GCCCAGCGGCCG LINC01588 com
GATATCAGCTGC 37 pAE137 Nme2TS17 pLKO Nme2Cas9 Direcionamento de
GGAAGGGAACATA CYBB com
TTACTATTGC 38 pAE138 Nme2TS18 pLKO Nme2Cas9 Direcionamento de
GTGGAGTGGCCTG CYBB com
CTATCAGCTAC 39 pAE139 Nme2TS19 pLKO Nme2Cas9 Direcionamento de
GAGGAAGGGAACA CYBB com
TATTACTATTG 40 pAE140 Nme2TS20 pLKO Nme2Cas9 Direcionamento de
GTGAATTCTCATCA CYBB com
GCTAAAATGC 41 pAE141 Nme2TS21 pLKO Nme2Cas9 Direcionamento de
GCTCACTCACCCA VEGFA com
CACAGACACAC 42 pAE144 Nme2TS25 pLKO Nme2Cas9 Direcionamento de
GGAAGAATTTCATT CFTR com
CTGTTCTCAG 43 pAE145 Nme2TS26 pLKO Nme2Cas9
Direcionamento de
GCTCAGTTTTCCTG CFTR com
GATTATGCCT 44 pAE146 Nme2TS27 pLKO Nme2Cas9 Direcionamento de
GCGTTGGAGCGGG VEGFA com
GAGAAGGCCAG 45 pAE152 Nme2TS31 pLKO Nme2Cas9 Direcionamento de
GGGCCGCGGAGAT LINC01588 com
AGCTGCAGGGC 46 pAE153 Nme2TS34 pLKO Nme2Cas9 Direcionamento de
GCCCACCCGGCGG LINC01588 com
CGCCTCCCTGC 47 pAE154 Nme2TS35 pLKO Nme2Cas9 Direcionamento de
GCGTGGCAGCTGA LINC01588 com
TATCCGGCCGC 48 pAE155 Nme2TS36 pLKO Nme2Cas9 Direcionamento de
GCCGCGGCGCGA LINC01588 com
CGTGGAGCCAGC 49 pAE156 Nme2TS37 pLKO Nme2Cas9 Direcionamento de
GTGCTCCCCAGCC LINC01588 com
CAAACCGCCGC 50 pAE157 Nme2TS38 pLKO Nme2Cas9 Direcionamento de
GTCAGATTGGCTT AGA com
GCTCGGAATTG 51 pAE159 Nme2TS41 pLKO Nme2Cas9 Direcionamento de
GCTGGGTGAATGG VEGFA com
AGCGAGCAGCG 52 pAE185 Nme2TS44 pLKO Nme2Cas9
Direcionamento de
GTCCTGGAGTGAC VEGFA com
CCCTGGCCTTC 53 pAE186 Nme2TS45 pLKO Nme2Cas9 Direcionamento de
GATCCTGGAGTGA VEGFA com
CCCCTGGCCTT 54 pAE187 Nme2TS46 pLKO Nme2Cas9 Direcionamento de
GTGTGTCCCTCTC VEGFA com
CCCACCCGTCC 55 pAE188 Nme2TS47 pLKO Nme2Cas9 Direcionamento de
GTTGGAGCGGGGA VEGFA com
GAAGGCCAGGG 56 pAE189 Nme2TS48 pLKO Nme2Cas9 Direcionamento de
GCGTTGGAGCGGG VEGFA com
GAGAAGGCCAG 57 pAE190 Nme2TS49 pLKO Nme2Cas9 Direcionamento de
GTACCCTCCAATAA AGA com
TTTGGCTGGC 58 pAE191 Nme2TS50 pLKO Nme2Cas9 Direcionamento de
GATAATTTGGCTG AGA com
GCAATTCCGAG 59 pAE192 Nme2TS51 pLKO Nme2Cas9 Direcionamento de
GAAAATTGTGATTT TS64_FancJ FANCJ com
CCAGATCCAC 60 pAE232 1 pLKO Nme2Cas9 Direcionamento de
GAGCAGAAAAAATT TS65_FancJ FANCJ com
GTGATTTCC 61 pAE233 2 pLKO Nme2Cas9
Direcionamento de
GCAGGGGCCAGGT Nme2TS58 DS em VEGFA
GTCCTTCTCTG 62 pAE200 (Nme2DS1) pLKO com Nme2Cas9 Direcionamento de
GAATGGCAGGCGG Nme2TS59 DS em VEGFA
AGGTTGTACTG 63 pAE201 (Nme2DS2) pLKO com Nme2Cas9 Direcionamento de
GAGTGAGAGAGTG Nme2TS60 DS em VEGFA
AGAGAGAGACA 64 pAE202 (Nme2DS3) pLKO com Nme2Cas9 Direcionamento de
GTGAGCAGGCACC Nme2TS61 DS em VEGFA
TGTGCCAACAT 65 pAE203 (Nme2DS4) pLKO com Nme2Cas9 Direcionamento de
GCGTGGGGGCTCC Nme2TS62 DS em VEGFA
GTGCCCCACGC 66 pAE204 (Nme2DS5) pLKO com Nme2Cas9 Direcionamento de
GCATGGGCAGGGG Nme2TS63 DS em VEGFA
CTGGGGTGCAC 67 pAE205 (Nme2DS6) pLKO com Nme2Cas9 Direcionamento de
GGGCCAGGTGTCC DS em VEGFA
TTCTCTG 68 pAE207 SpyDS1 pLKO com SpyCas9 Direcionamento de
GGCAGGCGGAGGT DS em VEGFA
TGTACTG 69 pAE208 SpyDS2 pLKO com SpyCas9 Direcionamento de
GAGAGAGTGAGAG DS em VEGFA
AGAGACA 70 pAE209 SpyDS3 pLKO com SpyCas9
Direcionamento de
GCAGGCACCTGTG DS em VEGFA
CCAACAT 71 pAE210 SpyDS4 pLKO com SpyCas9 Direcionamento de
GGGGGCTCCGTGC DS em VEGFA
CCCACGC 72 pAE211 SpyDS5 pLKO com SpyCas9 Direcionamento de
GGGCAGGGGCTG DS em VEGFA
GGGTGCAC 73 pAE212 SpyDS6 pLKO com SpyCas9 Estrutura Expressão de AAV principal de completo de hDeCas9 Wt Nme2Cas9 com 74 pAE169 em AAV AAV cassete de sgRNA Vide exemplos aqui.
Estrutura Nme2Cas9 do tipo principal de selvagem para a hDeCas9 wt pMCSG expressão 75 pAE217 em pMSCG7 7 bacteriana Vide exemplos aqui.
Plasmídeo de 2xNLS expressão Nme2Cas9 acionado 76 pAE107 com HA pCdest Nme2Cas9 CMV Vide exemplos aqui.
hDemonCas Direcionamento de 9 3X NLS pMSCG sítios endógenos 77 pAE127 em pMSCG7 7 com Nme2Cas9 Vide exemplos aqui.
Lentivetor contendo hNme2Cas9 Nme2Cas9 e Puro pAM17 4X NLS com acionados por 78 2 3XHA pCVL UCOE, SFFV Vide exemplos aqui.
nickase hNme2Cas9 Lentivetor contendo D16A 4X Nme2Cas9 e Puro pAM17 NLS com acionados por 79 4 3XHA pCVL UCOE, SFFV Vide exemplos aqui.
nickase hNme2Cas9 Lentivetor contendo H588A 4X Nme2Cas9 e Puro pAM17 NLS com acionados por 80 5 3XHA pCVL UCOE, SFFV Vide exemplos aqui.
hNme2Cas9 Lentivetor contendo morto 4X Nme2Cas9 e Puro pAM17 NLS com acionados por 81 7 3XHA pCVL UCOE, SFFV Vide exemplos aqui.
Oligonucleotídeos exemplares Número Nome Sequência Propósito 1 AAVS1_TIDE1_FW TGGCTTAGCACCTCTCCAT análise TIDE LINC01588_TIDE_ AGAGGAGCCTTCTGACTGCTG 2 FW CAGA análise TIDE 3 AAVS1_TIDE2_FW TCCGTCTTCCTCCACTCC análise TIDE 4 NTS55_TIDE_FW TAGAGAACTGGGTAGTGTG análise TIDE
GTACATGAAGCAACTCCAGTCC VEGF_TIDE3_FW 5 CA análise TIDE
TGGTGATTATGGGAGAACTGGA hCFTR_TIDE1_FW 6 GC análise TIDE
7 AGA_TIDE1_FW GGCATAAGGAAATCGAAGGTC análise TIDE
ACACGGGCAGCATGGGAATAG VEGF_TIDE4_FW 8 TC análise TIDE
CCTGTGTGGCTTTGCTTTGGTC VEGF_TIDE5_FW 9 G análise TIDE
GGAGGAAGAGTAGCTCGCCGA VEGF_TIDE6_FW 10 GG análise TIDE
AGGGAGAGGGAAGTGTGGGGA VEGF_TIDE7_FW 11 AGG análise TIDE
AGAACTCAGGACCAACTTATTC AAVS1_TIDE1_RV 12 TG análise TIDE LINC01588_TIDE_ ATGACAGACACAACCAGAGGG 13 RV CA análise TIDE 14 AAVS1_TIDE2_RV TAGGAAGGAGGAGGCCTAAG análise TIDE 15 NTS55_TIDE_RV CCAATATTGCATGGGATGG análise TIDE 16 VEGF_TIDE3_RV ATCAAATTCCAGCACCGAGCGC análise TIDE
ACCATTGAGGACGTTTGTCTCA hCFTR_TIDE1_RV 17 C análise TIDE
CATGTCCTCAAGTCAAGAACAA AGA_TIDE1_RV 18 G análise TIDE
GCTAGGGGAGAGTCCCACTGT VEGF_TIDE4_RV 19 CCA análise TIDE
GTAGGGTGTGATGGGAGGCTA VEGF_TIDE5_RV 20 AGC análise TIDE
AGACCGAGTGGCAGTGACAGC VEGF_TIDE6_RV 21 AAG análise TIDE
GTCTTCCTGCTCTGTGCGCACG VEGF_TIDE7_RV 22 AC análise TIDE
TAGCGGCCGCTCATGCGCGGC GCATTACCTTTACNNNNNNNNN Protoespaçador NGGAT com 23 RandomPAM_FW CCTCTAGAGTCG PAM randomizado
ACAGGAAACAGCTATGACCATG AAAGCTTGCATGCCTGCAGGTC Protoespaçador GACTCTA com 24 RandomPAM_RV GAGGATC PAM randomizado Sequenciamento ctacacgacgctcttccgatctCCTGGAG profundo 25 DS2_ON_FW1 CGTGTACGTTGG direcionado Sequenciamento ctacacgacgctcttccgatctCCTGTGG profundo 26 SpyDS2_OT1_FW1 TCCCAGCTACTTG direcionado Sequenciamento ctacacgacgctcttccgatctATCTGCG profundo 27 SpyDS2_OT2_FW1 ATGTCCTCGAGG direcionado Sequenciamento ctacacgacgctcttccgatctTGGTGTG profundo 28 SpyDS2_OT3_FW1 CGCCTCTAACG direcionado Sequenciamento ctacacgacgctcttccgatctGGAGTCT profundo 29 SpyDS2_OT4_FW1 TGCTTTGTCACTCAGA direcionado Sequenciamento ctacacgacgctcttccgatctAGCCTAG profundo 30 SpyDS2_OT5_FW1 ACCCAGTCCCAT direcionado
Sequenciamento ctacacgacgctcttccgatctGCTGGGC profundo 31 SpyDS2_OT6_FW1 ATAGTAGTGGACT direcionado
Sequenciamento ctacacgacgctcttccgatctTGGGGAG profundo 32 SpyDS2_OT7_FW1 GCTGAGACACGA direcionado
Sequenciamento ctacacgacgctcttccgatctCTTGGGA profundo 33 SpyDS2_OT8_FW1 GGCTGAGGCAAG direcionado
Sequenciamento agacgtgtgctcttccgatctCAGGAGGA profundo 34 DS2_ON_RV1 TGAGAGCCAGG direcionado
Sequenciamento agacgtgtgctcttccgatctCAGGGTCT profundo 35 SpyDS2_OT1_RV1 CACTCTATCACCCA direcionado
Sequenciamento agacgtgtgctcttccgatctACTGAATG profundo 36 SpyDS2_OT2_RV1 GGTTGAACTTGGC direcionado
Sequenciamento agacgtgtgctcttccgatctGAGACAGA profundo 37 SpyDS2_OT3_RV1 ATCTTGCTCTGTCTCC direcionado
Sequenciamento agacgtgtgctcttccgatctTCCCAGCT profundo 38 SpyDS2_OT4_RV1 ACTTGGGAGGC direcionado
Sequenciamento agacgtgtgctcttccgatctCCTGCCCA profundo 39 SpyDS2_OT5_RV1 AATAGGGAAGCAG direcionado
Sequenciamento agacgtgtgctcttccgatctTGGCGCCT profundo 40 SpyDS2_OT6_RV1 TAGTCTCTGCTAC direcionado
Sequenciamento agacgtgtgctcttccgatctGCATGAGA profundo 41 SpyDS2_OT7_RV1 CACAGTTTCACTCTG direcionado
Sequenciamento agacgtgtgctcttccgatctGAGAGAGT profundo 42 SpyDS2_OT8_RV1 CTCACTGCGTTGC direcionado
Sequenciamento ctacacgacgctcttccgatctTCTCTCAC profundo 43 DS4_ON_FW3 CCACTGGGCAC direcionado
Sequenciamento agacgtgtgctcttccgatctGCTTCCAG profundo 44 DS4_ON_RV3 ACGAGTGCAGA direcionado
Sequenciamento ctacacgacgctcttccgatctAAGTTTTC profundo 45 SpyDS4_OT1_FW1 AAACCAGAAGAACTACGAC direcionado
Sequenciamento ctacacgacgctcttccgatctCCGGTAT profundo 46 SpyDS4_OT2_FW1 AAGTCCTGGAGCG direcionado
Sequenciamento ctacacgacgctcttccgatctGCCAGGG profundo 47 SpyDS4_OT3_FW1 AGCAATGGCAG direcionado
Sequenciamento ctacacgacgctcttccgatctCCTCGAA profundo 48 SpyDS4_OT6_FW1 TTCCACGGGGTT direcionado
Sequenciamento ctacacgacgctcttccgatctGTTGGTG profundo 49 DS16_ON_FW1 GGAGGGAAGTGAG direcionado
Sequenciamento ctacacgacgctcttccgatctGATGGCG profundo 50 SpyDS6_OT1_FW1 GTTGTAGCGGC direcionado
Sequenciamento ctacacgacgctcttccgatctCACATAAA profundo 51 SpyDS6_OT2_FW1 CCTATGTTTCAGCAGA direcionado
Sequenciamento ctacacgacgctcttccgatctGCTAGTT profundo 52 SpyDS6_OT3_FW1 GGATTGAAGCAGGGT direcionado
Sequenciamento ctacacgacgctcttccgatctTTGAGTG profundo 53 SpyDS6_OT4_FW1 CGGCAGCTTCC direcionado
Sequenciamento ctacacgacgctcttccgatctATAACCCT profundo 54 SpyDS6_OT6_FW1 CCCAGGCAAAGTC direcionado
Sequenciamento ctacacgacgctcttccgatctAGCCTGC profundo 55 SpyDS6_OT7_FW1 ACATCTGAGCTC direcionado
Sequenciamento ctacacgacgctcttccgatctGGAGCAT profundo 56 SpyDS6_OT8_FW1 TGAAGTGCCTGG direcionado
Sequenciamento agacgtgtgctcttccgatctCAGCCTGG profundo 57 DeDS6_ON_RV1 GACCACTGA direcionado
Sequenciamento agacgtgtgctcttccgatctCATCCTCG profundo 58 SpyDS6_OT1_RV1 ACAGTCGCGG direcionado
Sequenciamento agacgtgtgctcttccgatctGACTGATC profundo 59 SpyDS6_OT2_RV1 AAGTAGAATACTCATGGG direcionado
Sequenciamento agacgtgtgctcttccgatctCCCTGCCA profundo 60 SpyDS6_OT3_RV1 GCACTGAAGC direcionado
Sequenciamento agacgtgtgctcttccgatctGGTTCCTA profundo 61 SpyDS6_OT4_Rv1 TCTTTCTAGACCAGGAGT direcionado
Sequenciamento agacgtgtgctcttccgatctAGTGTGGA profundo 62 SpyDS6_OT6_RV1 GGGCTCAGGG direcionado
Sequenciamento agacgtgtgctcttccgatctGATGGGCA profundo 63 SpyDS6_OT7_RV1 GAGGAAGGCAA direcionado
Sequenciamento agacgtgtgctcttccgatctTCACTCTCA profundo 64 SpyDS6_OT8_RV1 TGAGCGTCCCA direcionado
Sequenciamento Nme2DS2_OT1_F ctacacgacgctcttccgatctAAGGTTC profundo 65 W1 CTTGCGGTTCGC direcionado
Sequenciamento Nme2DS2_OT1_R agacgtgtgctcttccgatctCGCTGCCA profundo 66 V1 TTGCTCCCT direcionado
Sequenciamento Nme2DS6_OT1_F ctacacgacgctcttccgatctTCTCGCA profundo 67 W1 CATTCTTCACGTCC direcionado Sequenciamento Nme2DS6_OT1_R agacgtgtgctcttccgatctAGGAACCT profundo 68 V1 TCCCGACTTAGGG direcionado Sequenciamento ctacacgacgctcttccgatctCCCGCCC profundo 69 Rosa26_ON_FW1 ATCTTCTAGAAAGAC direcionado Sequenciamento ctacacgacgctcttccgatctTGCCAGG profundo 70 Rosa26_OT1_FW1 TGAGGGACTGG direcionado Sequenciamento agacgtgtgctcttccgatctTCTGGGAG profundo 71 Rosa26_ON_RV1 TTCTCTGCTGCC direcionado Sequenciamento agacgtgtgctcttccgatctTGCCCAAC profundo 72 Rosa26_OT1_RV1 CTTAGCAAGGAG direcionado Sequenciamento ctacacgacgctcttccgatcttaccttggagc profundo 73 pCSK9_ON_FW2 aacggcg direcionado Sequenciamento agacgtgtgctcttccgatctcccaggacgag profundo 74 PCSK9_ON_RV2 gatggag direcionado 75 Tyr_500_FW3 GATAGTCACTCCAGGGGTTG análise TIDE 76 Tyr_500_RV3 GTGGTGAACCAATCAGTCCT análise TIDE
[00372] Distribuição de RNP para a edição do genoma de mamíferos
[00373] Para experimentos de RNP, o sistema de eletroporação Neon foi usado exatamente como descrito (Amrani et al., 2018). Em resumo, 40 picomoles de 3xNLS-Nme2Cas9 juntamente com 50 picomoles de SgRNA transcrito por T7 foram montados em tampão R e eletroporados usando 10 µL de pontas de neon. Após a eletroporação, as células foram transferidas para placas em placas de 24 cavidades preaquecidas contendo os meios de cultura apropriados sem antibióticos. Os parâmetros de eletroporação (tensão, largura, número de pulsos) foram 1150 V, 20 ms, 2 pulsos para células HEK293T; 1000 V, 50 ms, 1 pulso para células K562.
[00374] Distribuição de AAV8.Nme2Cas9+sgRNA In vivo e processamento do tecido hepático
[00375] Para as injeções de vetor AAV8, camundongos C57BL/6NJ fêmeas de 8 semanas de idade foram injetados com 4 x1011 cópias de genoma por camundongo por meio da veia caudal, com o sgRNA direcionando um sítio validado em Pcsk9 ou Rosa26. Os camundongos foram sacrificados 28 dias após a administração do vetor e os tecidos hepáticos foram coletados para análise. Os tecidos hepáticos foram fixados em 4% de formalina durante a noite, embebidos em parafina, seccionados e manchados com hematoxilina e eosina (H&E). O sangue foi retirado da veia facial em 0, 14 e 28 dias após a injeção, e soro foi isolado usando um separador de soro (BD, Cat. No. 365967) e armazenado a -80°C até o ensaio. O nível de colesterol sérico foi medido usando o ensaio de endpoint colorimétrico Infinity™ (Thermo-Scientific) seguindo o protocolo do fabricante e como descrito anteriormente (Ibraheim et al., 2018). Para o Western blot anti-PCSK9, 40 μg de proteína do tecido ou 2 ng de Proteína PCSK9 de Camundongo Recombinante (R&D Systems, 9258-SE-020) foram carregados sobre um MiniPROTEAN® TGX™ Precast Gel (Bio-Rad). As bandas separadas foram transferidas para uma membrana de PVDF e bloqueadas com 5% de solução Bloqueadora de Grau de Bloqueio (Bio-Rad) por 2 horas à temperatura ambiente. Em seguida, a membrana foi incubada com anticorpos anti-GAPDH de coelho (Abcam ab9485, 1:2.000) ou anti-PCSK9 de cabra (R&D Systems AF3985, 1:400) durante a noite. As membranas foram lavadas em TBST e incubadas com anticoelho de cabra conjugado com peroxidase de rábano silvestre (HRP) (Bio-Rad 1706515, 1:4.000), e anticorpos secundários de anticabra de macaco (R&D Systems HAF109, 1:2,000) por 2 horas à temperatura ambiente. As membranas foram lavadas novamente em TBST e visualizadas usando substrato ECL western Clarity™ (Bio-Rad) usando um processador M35A XOMAT (Kodak).
[00376] Distribuição ex vivo de AAV6.Nme2Cas9 em zigotos de camundongo
[00377] Os zigotos foram incubados em 15 µl de gotas de KSOM (Meio Simplex Otimizado Suplementado com Potássio, Millipore, Cat. No. MR- 106-D) contendo 3x109 ou 3x108 GCs de vetor AAV6.Nme2Cas9.sgTyr por 5-6 h (4 zigotos em cada gota). Após a incubação, zigotos foram enxaguados em M2 e transferidos para KSOM fresco para cultura durante a noite. No dia seguinte, os embriões que avançaram para o estágio de 2 células foram transferidos para o oviduto de recipientes pseudogestados e deixados se desenvolver até o fim.
EXPERIMENTAL
[00378] Exemplo I
[00379] Descoberta de ortólogos de Cas9 com PIDs diferencialmente divergentes
[00380] A sequência de peptídeo de Nme1Cas9 foi usada como uma consulta em pesquisas BLAST para encontrar todos os ortólogos de Cas9 em espécies de Neisseria meningitidis. Ortólogos com >80% de identidade com Nme1Cas9 foram selecionados para o restante deste estudo. Os PIDs foram a seguir alinhados com aquele de Nme1Cas9 (resíduos 820-1082) usando ClustalW2 e aqueles com grupamentos de mutações no PID foram selecionados para análise adicional. Uma árvore filogenética não enraizada de ortólogos de
NmeCas9 foi construída usando FigTree (http://tree.bio.ed.ac.uk/software/figtree/).
[00381] Exemplo II
[00382] Clonagem, expressão e purificação de ortólogos de Cas9 e Acr
[00383] Exemplos de plasmídeos e oligonucleotídeos usados neste estudo são listados na Tabela 3. Os PIDs de Nme2Cas9 e Nme3Cas9 foram ordenados como gBlocks (IDT) para substituir o PID de Nme1Cas9 usando Gibson Assembly (NEB) no plasmídeo de expressão bacteriana pMSCG7 (Zhang et al., 2015), que codifica Nme1Cas9 com uma 6xHis tag. O construto foi transformado em E. coli, expresso e purificado como descrito anteriormente (Pawluk et al., 2016). Em resumo, as células Rosetta (DE3) contendo os plasmídeos Cas9 respectivos foram desenvolvidos a 37°C até uma OD600 de 0,6 e a expressão da proteína foi induzida por IPTG 1mM por 16 h a 18°C. As células foram coletadas e lisadas por sonicação em tampão de lise [Tris-HCl50 mM (pH 7,5), NaCl 500 mM, imidazol 5 mM, DTT 1 mM] suplementado com 1 mg/mL de coquetel inibidor de lisozima e protease (Sigma). O lisado foi a seguir foi passado rapidamente através de uma coluna de agarose Ni2+-NTA (Qiagen), e uma proteína aglutinada foi eluída com imidazol 300 mM e dialisada em tampão de armazenamento [HEPES-NaOH 20 mM (pH 7,5), NaCl 250 mM, DTT1 mM]. Para proteínas Acr, proteínas 6xHis-tagged foram expressas em cepa de E. coli BL21 Rosetta (DE3). As células foram desenvolvidas a 37 C até uma densidade óptica (OD600) de 0,6 em uma incubadora de agitação. As culturas bacterianas foram resfriadas até 18°C, e a expressão da proteína foi induzida por adição de IPTG 1 mM para expressão durante a noite. No dia seguinte, as células foram coletadas e ressuspensas em tampão de lise suplementado com 1 mg/mL de coquetel inibidor de lisozima e protease (Sigma) e uma proteína foi purificada usando o mesmo protocolo que para Cas9. A 6xHis tag foi removida por incubação da proteína ligada à resina com protease do Vírus Etch do Tabaco (TEV) durante a noite a 4°C para isolar Acrs não marcados.
[00384] Exemplo III
[00385] Ensaio de descoberta de PAM in vitro
[00386] Uma biblioteca alvo de dsDNA com sequências de PAM randomizadas foi gerada pela sobreposição PCR de sobreposição, com o iniciador senso contendo a região de PAM randomizada 10-nt. A biblioteca foi purificada com gel e submetida à reação de clivagem in vitro por Cas9 purificado juntamente com SgRNAs transcritos por T7. O complexo de Cas9:sgRNA 300 nM foi usado para clivar 300 nM do fragmento alvo em 1X NEBuffer 3.1 (NEB) a 37˚C por 1 h. A reação foi a seguir tratada com proteinase K a 50˚C por 10 minutos e executada em um gel de 4% de agarose/1xTAE. O produto de clivagem foi excisado, eluído e clonado usando um protocolo descrito anteriormente (Zhang et al., 2012), com modificações. Em resumo, extremidades do DNA foram reparadas, caudas de 2’-deoxiadenosina não padronizadas foram adicionadas, e adaptadores em forma de Y foram ligados. Após a PCR, o produto foi quantificado com Kit de Quantificação de Biblioteca KAPA e sequenciado usando um NextSeq 500 (Illumina) para obter leituras de extremidades pareadas de 75 nt. As sequências foram analisadas com scripts personalizados e R.
[00387] Exemplo IV
[00388] Transfecções e edição do genoma de mamíferos
[00389] O Nme2Cas9 otimizado com códon humano foi clonado por Gibson Assembly na estrutura principal de plasmídeo pCDest2 usada anteriormente para a expressão Nme1Cas9 e SpyCas9 (Pawluk et al., 2016; Amrani et al., 2018). A transfecção de células HEK293T e HEK293T-TLR2.0 foi realizada como descrito anteriormente (Amrani et al., 2018). Para transfecções de Hepa1-6, Lipofectamina LTX foi usada para transfectar 500 ng de plasmídeo AAV.sgRNA.Nme2Cas9 completo em placas de 24 cavidades (~105 células/cavidade), usando células que foram cultivadas 24 horas antes da transfecção. Para células K562 que expressam estavelmente Nme2Cas9 distribuído por meio do lentivetor (vide abaixo), 50.000 – 150.000 células foram eletroporadas com 500 ng de plasmídeo sgRNA usando 10 µL de pontas de neon. Para medir indels em todas as células 72 h após as transfecções, as células foram coletadas e o DNA genômico foi extraído usando o Kit DNaesy Blood and Tissue (Qiagen). O sítio alvo foi amplificado por PCR, sequenciado por Sanger (Genewiz), e analisado por TIDE (Brinkman et al., 2014) usando a interface baseada no sítio da Desktop Genetics (http://tide.deskgen.com).
[00390] Exemplo V
[00391] Transdução lentiviral de células K562 para expressar estavelmente Nme2Cas9
[00392] As células K562 que expressam estavelmente Nme2Cas9 foram geradas como descrito anteriormente para Nme1Cas9 (Amrani et al., 2018). Para a produção de lentivírus, o vetor lentiviral foi co-transfectado em células HEK293T juntamente com os plasmídeos de empacotamento (Addgene 12260 & 12259) em placas de 6 cavidades usando reagente de transfecção TransIT-LT1 (Mirus Bio). Após 24 horas, os meios de cultura foram aspirados das células transfectadas e substituídos com 1 mL de DMEM fresco. No dia seguinte, o sobrenadante contendo o vírus foi coletado e filtrado através de um filtro de 0,45 µm. 10 uL do sobrenadante não diluído juntamente com 2,5 ug de polibreno foram usados para transduzir ~106 células K562 em placas de 6 cavidades. As células transduzidas foram selecionadas usando meios suplementados com 2,5 µg/mL de puromicina.
[00393] Exemplo VI
[00394] Distribuição de RNP para a edição do genoma de mamíferos
[00395] Para experimentos de RNP, o sistema de eletroporação Neon foi usado exatamente como descrito (Amrani et al., 2018). Em resumo, 40 picomoles de 3xNLS-Nme2Cas9 juntamente com 50 picomoles de SgRNA transcrito por T7 foram montados em tampão R e eletroporados usando 10 µL de pontas de neon. Após a eletroporação, as células foram transferidas para placas em placas de 24 cavidades preaquecidas contendo os meios de cultura apropriados sem antibióticos. Os parâmetros de eletroporação (tensão, largura, número de pulsos) foram 1150 V, 20 ms, 2 pulsos para células HEK293T; 1000 V, 50 ms, 1 pulso para células K562.
[00396] Exemplo VII
[00397] GUIDE-seq
[00398] Experimentos de GUIDE-seq foram realizados como descrito anteriormente (Tsai et al., 2014), com modificações menores (Bolukbasi et al., 2015a). Em resumo, células HEK293T foram transfectados com 200 ng de plasmídeo Cas9, 200 ng de plasmídeo sgRNA, e 7,5 pmol de oligonucleotídeos anelados GUIDE-seq usando Polifect (Qiagen). Alternativamente, as células Hepa1-6 foram transfectadas como descrito acima. O DNA genômico foi extraído com um kit DNeasy Blood and Tissue (Qiagen) 72 h após a transfecção de acordo com o protocolo do fabricante. A preparação e sequenciamento da biblioteca foram realizados exatamente como descrito anteriormente (Bolukbasi et al., 2015a). Para a análise, todas as sequências com até dez incompatibilidades com o sítio alvo, assim como um C na quinta posição PAM (N4CN), foram consideradas sítios inespecíficos potenciais. Os dados foram analisados usando o pacote Bioconductor GUIDEseq versão 1.1.17 (Zhu et al., 2017).
[00399] Exemplo VIII
[00400] Sequenciamento profundo direcionado e análise
[00401] Foi usado o sequenciamento profundo direcionado para confirmar os resultados de GUIDE-seq e para medir as taxas de indel com precisão máxima. Foi usada amplificação de PCR de duas etapas para produzir fragmentos de DNA para cada sítio específico e inespecífico. Para a edição de SpyCas9 em DS2 e DS6, foram selecionados os sítios inespecíficos principais com base em contagens de leitura GUIDE-seq. Para a edição de SpyCas9 em
DS4, menos sítios inespecíficos candidatos foram identificados por GUIDE-seq, e somente aqueles com PAMs NGG (DS4|OT1, DS4|OT3, DS4|OT6) ou NGC (DS4|OT2) foram examinados por sequenciamento. Na primeira etapa, foram usados iniciadores específicos do sítio suportando saliências universais com extremidades complementares aos adaptadores. Na primeira etapa, 2x de mistura mestre de PCR (NEB) foram usadas para gerar fragmentos suportando as saliências. Na segunda etapa, os produtos de PCR purificados foram amplificados com um iniciador senso universal e iniciadores reversos indexados. Produtos em tamanho real (~250 pb) foram purificados em gel e sequenciado em um Illumina MiSeq em modo de extremidade pareada. A análise dos dados de MiSeq foi realizada como descrito anteriormente (Pinello et al., 2016; Ibraheim et al., 2018).
[00402] Exemplo IX
[00403] Análise inespecífica usando CRISPRseek
[00404] As predições inespecíficas globais para TS25 e TS47 foram realizadas usando o pacote Bioconductor CRISPRseek. Mudanças menores foram feitas para acomodar as características de Nme2Cas9 não compartilhadas com SpyCas9. Especificamente, foram usadas as mudanças a seguir para: gRNA.size = 24, PAM = "NNNNCC", PAM.size = 6, RNA.PAM.pattern = "NNNNCN", e sítios inespecíficos candidatos com menos do que 6 incompatibilidades foram coletados. Os sítios inespecíficos potenciais principais com base nos números e posições de incompatibilidades foram selecionados. O DNA genômico de células direcionadas por cada respectivo sgRNA foi usado para amplificar cada sítio inespecífico candidato e a seguir analisado por TIDE.
[00405] Exemplo X
[00406] Cepas de camundongo e coleta de embriões
[00407] Todos os experimentos com animais foram conduzidos sob a orientação do Comitê Institucional de Cuidado e Uso de Animais (IACUC) da Escola de Medicina da Universidade de Massachusetts. C57BL/6NJ (Stock No.
005304). Os camundongos foram obtidos do The Jackson Laboratory. Todos os animais foram mantidos em um ciclo claro de 12 h. O meio do ciclo claro do dia, quando um plugue de acasalamento foi observado, foi considerado o dia embrionário 0,5 (E0,5) de gestação. Os zigotos foram coletados em E0,5 rasgando a ampola com fórceps e incubação em meio M2 contendo hialuronidase para remover células do cumulus.
[00408] Exemplo XI
[00409] Distribuição de AAV8.Nme2Cas9+sgRNA in vivo e processamento do tecido hepático
[00410] Para as injeções de vetor AAV8, camundongos C57BL/6NJ fêmeas de 8 semanas de idade foram injetados com 4 x1011 cópias de genoma por camundongo por meio da veia caudal, com o sgRNA direcionando um sítio validado em Pcsk9 ou Rosa26. Os camundongos foram sacrificados 28 dias após a administração do vetor e os tecidos hepáticos foram coletados para análise. Os tecidos hepáticos foram fixados em 4% de formalina durante a noite, embebidos em parafina, seccionados e manchados com hematoxilina e eosina (H&E). O sangue foi retirado da veia facial em 0, 14 e 28 dias após a injeção, e soro foi isolado usando um separador de soro (BD, Cat. No. 365967) e armazenado a -80°C até o ensaio. O nível de colesterol sérico foi medido usando o ensaio de endpoint colorimétrico Infinity™ (Thermo-Scientific) seguindo o protocolo do fabricante e como descrito anteriormente (Ibraheim et al., 2018). Para o Western blot anti-PCSK9, 40 μg de proteína do tecido ou 2 ng de Proteína PCSK9 de Camundongo Recombinante (R&D Systems, 9258-SE-020) foram carregados sobre um MiniPROTEAN® TGX™ Precast Gel (Bio-Rad). As bandas separadas foram transferidas para uma membrana de PVDF e bloqueadas com 5% de solução Bloqueadora de Grau de Bloqueio (Bio-Rad) por 2 horas à temperatura ambiente. Em seguida, a membrana foi incubada com anticorpos anti-GAPDH de coelho (Abcam ab9485, 1:2,000) ou anti-PCSK9 de cabra (R&D Systems AF3985, 1:400) durante a noite. As membranas foram lavadas em
TBST e incubadas com anticorpos secundários anticoelho de cabra conjugado com peroxidase de rábano silvestre (HRP) (Bio-Rad 1706515, 1:4.000), e anticabra de macaco (R&D Systems HAF109, 1:2.000) por 2 horas à temperatura ambiente. As membranas foram lavadas novamente em TBST e visualizadas usando substrato de ECL western Clarity™ (Bio-Rad) usando um processador M35A XOMAT (Kodak).
[00411] Exemplo XII
[00412] Distribuição de AAV6.Nme2Cas9 ex vivo em zigotos de camundongo
[00413] Os zigotos foram incubados em 15 µl gotas de KSOM (Meio Simplex Otimizado Suplementado com Potássio, Millipore, Cat. No. MR-106-D) contendo 3x109 ou 3x108 GCs de vetor AAV6.Nme2Cas9.sgTyr por 5-6 h (4 zigotos em cada gota). Após a incubação, zigotos foram enxaguados em M2 e transferidos para KSOM fresco para a cultura durante a noite. No dia seguinte, os embriões que avançaram para o estágio de 2 células foram transferidos para o oviduto de recipientes pseudogestados e deixados se desenvolver até o fim.
[00414] REFERÊNCIAS, cada uma das quais é aqui incorporada por referência em sua totalidade: Amrani, N., Gao, X.D., Liu, P., Edraki, A., Mir, A., Ibraheim, R., Gupta, A., Sasaki, K.E., Wu, T., Donohoue, P.D., et al. (2018). NmeCas9 is an intrinsically high-fidelity genome editing platform. BioRxiv, https://doi.org/10.1101/172650. Barrangou, R., Fremaux, C., Deveau, H., Richards, M., Boyaval, P., Moineau, S., Romero, D.A., and Horvath, P. (2007). CRISPR provides acquired resistance against viruses in prokaryotes. Science 315, 1709-1712. Bisaria, N., Jarmoskaite, I., and Herschlag, D. (2017). Lessons from Enzyme Kinetics Reveal Specificity Principles for RNA-Guided Nucleases in RNA Interference and CRISPR-Based Genome Editing. Cell Syst. 4, 21-29.
Bolukbasi, M.F., Gupta, A., Oikemus, S., Derr, A.G., Garber, M., Brodsky, M.H., Zhu, L.J., and Wolfe, S.A. (2015a). DNA-binding-domain fusions enhance the targeting range and precision of Cas9. Nat.
Methods 12, 1150-1156. Bolukbasi, M.F., Gupta, A., and Wolfe, S.A. (2015b). Creating and evaluating accurate CRISPR-Cas9 scalpels for genomic surgery.
Nat.
Methods 13, 41-50. Brinkman, E.K., Chen, T., Amendola, M., and van Steensel, B. (2014). Easy quantitative assessment of genome editing by sequence trace decomposition.
Nucleic Acids Res. 42, e168. Brouns, S.J., Jore, M.M., Lundgren, M., Westra, E.R., Slijkhuis, R.J., Snijders, A.P., Dickman, M.J., Makarova, K.S., Koonin, E.V., and van der Oost, J. (2008). Small CRISPR RNAs guide antiviral defense in prokaryotes.
Science 321, 960-964. Casini, A., Olivieri, M., Petris, G., Montagna, C., Reginato, G., Maule, G., Lorenzin, F., Prandi, D., Romanel, A., Demichelis, F., et al. (2018). A highly specific SpCas9 variant is identified by in vivo screening in yeast.
Nat.
Biotechnol. 36, 265-271. Certo, M.T., Ryu, B.Y., Annis, J.E., Garibov, M., Jarjour, J., Rawlings, D.J., and Scharenberg, A.M. (2011). Tracking genome engineering outcome at individual DNA breakpoints.
Nat.
Methods 8, 671-676. Chen, J.S., Dagdas, Y.S., Kleinstiver, B.P., Welch, M.M., Sousa, A.A., Harrington, L.B., Sternberg, S.H., Joung, J.K., Yildiz, A., and Doudna, J.A. (2017). Enhanced proofreading governs CRISPR-Cas9 targeting accuracy.
Nature 550, 407-410. Cho, S.W., Kim, S., Kim, J.M., and Kim, J.S. (2013). Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease.
Nat.
Biotechnol. 31, 230-232.
Cho, S.W., Kim, S., Kim, Y., Kweon, J., Kim, H.S., Bae, S., and Kim, J.S. (2014). Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickases.
Genome Res. 24, 132-141. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., et al. (2013). Multiplex genome engineering using CRISPR/Cas systems.
Science 339, 819-823. Deltcheva, E., Chylinski, K., Sharma, C.M., Gonzales, K., Chao, Y., Pirzada, Z.A., Eckert, M.R., Vogel, J., and Charpentier, E. (2011). CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III.
Nature 471, 602-607. Deveau, H., Barrangou, R., Garneau, J.E., Labonte, J., Fremaux, C., Boyaval, P., Romero, D.A., Horvath, P., and Moineau, S. (2008). Phage response to CRISPR-encoded resistance in Streptococcus thermophilus.
J.
Bacteriol. 190, 1390-1400. Dominguez, A.A., Lim, W.A., and Qi, L.S. (2016). Beyond editing: repurposing CRISPR-Cas9 for precision genome regulation and interrogation.
Nat.
Rev.
Mol.
Cell Biol. 17, 5-15. Dong, Guo, M., Wang, S., Zhu, Y., Wang, S., Xiong, Z., Yang, J., Xu, Z., and Huang, Z. (2017). Structural basis of CRISPR-SpyCas9 inhibition by an anti- CRISPR protein.
Nature 546, 436-439. Esvelt, K.M., Mali, P., Braff, J.L., Moosburner, M., Yaung, S.J., and Church, G.M. (2013). Orthogonal Cas9 proteins for RNA-guided gene regulation and editing.
Nat.
Methods 10, 1116-1121. Fonfara, I., Le Rhun, A., Chylinski, K., Makarova, K.S., Lecrivain, A.L., Bzdrenga, J., Koonin, E.V., and Charpentier, E. (2014). Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems.
Nucleic Acids Res. 42, 2577-2590. Friedland, A.E., Baral, R., Singhal, P., Loveluck, K., Shen, S., Sanchez, M., Marco, E., Gotta, G.M., Maeder, M.L., Kennedy, E.M., et al. (2015).
Characterization of Staphylococcus aureus Cas9: a smaller Cas9 for all-in-one adeno-associated virus delivery and paired nickase applications. Genome Biol. 16, 257. Friedrich, G., and Soriano, P. (1991). Promoter traps in embryonic stem cells: a genetic screen to identify and mutate developmental genes in mice. Genes Dev. 5, 1513-1523. Fu, Y., Sander, J.D., Reyon, D., Cascio, V.M., and Joung, J.K. (2014). Improving CRISPR-Cas nuclease specificity using truncated guide RNAs. Nat. Biotechnol. 32, 279-284. Gallagher, D.N., and Haber, J.E. (2018). Repair of a Site-Specific DNA Cleavage: Old-School Lessons for Cas9-Mediated Gene Editing. ACS Chem. Biol. 13, 397-405. Garneau, J.E., Dupuis, M.E., Villion, M., Romero, D.A., Barrangou, R., Boyaval, P., Fremaux, C., Horvath, P., Magadan, A.H., and Moineau, S. (2010). The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA. Nature 468, 67-71. Gasiunas, G., Barrangou, R., Horvath, P., and Siksnys, V. (2012). Cas9- crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proc. Natl. Acad. Sci. USA 109, E2579-2586. Gaudelli, N.M., Komor, A.C., Rees, H.A., Packer, M.S., Badran, A.H., Bryson, D.I., and Liu, D.R. (2017). Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551, 464-471. Ghanta, K., Dokshin, G., Mir, A., Krishnamurthy, P., Gneid, H., Edraki, A., Watts, J., Sontheimer, E., and Mello, C. (2018). 5′ Modifications Improve Potency and Efficacy of DNA Donors for Precision Genome Editing. Biorxiv
354480. Gorski, S.A., Vogel, J., and Doudna, J.A. (2017). RNA-based recognition and targeting: sowing the seeds of specificity. Nat. Rev. Mol. Cell Biol. 18, 215-
228.
Harrington, L.B., Doxzen, K.W., Ma, E., Liu, J.J., Knott, G.J., Edraki, A., Garcia, B., Amrani, N., Chen, J.S., Cofsky, J.C., et al. (2017a). A Broad-Spectrum Inhibitor of CRISPR-Cas9. Cell 170, 1224-1233. Harrington, L.B., Paez-Espino, D., Staahl, B.T., Chen, J.S., Ma, E., Kyrpides, N.C., and Doudna, J.A. (2017b). A thermostable Cas9 with increased lifetime in human plasma.
Nat.
Commun. 8, 1424. Hou, Z., Zhang, Y., Propson, N.E., Howden, S.E., Chu, L.F., Sontheimer, E.J., and Thomson, J.A. (2013). Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis.
Proc.
Natl.
Acad.
Sci.
USA 110, 15644-15649. Hu, J.H., Miller, S.M., Geurts, M.H., Tang, W., Chen, L., Sun, N., Zeina, C.M., Gao, X., Rees, H.A., Lin, Z., et al. (2018). Evolved Cas9 variants with broad PAM compatibility and high DNA specificity.
Nature 556, 57-63. Hwang, W.Y., Fu, Y., Reyon, D., Maeder, M.L., Tsai, S.Q., Sander, J.D., Peterson, R.T., Yeh, J.R., and Joung, J.K. (2013). Efficient genome editing in zebrafish using a CRISPR-Cas system.
Nat.
Biotechnol. 31, 227-229. Hynes, A.P., Rousseau, G.M., Lemay, M.-L., Horvath, P., Romero, D.A., Fremaux, C., and Moineau, S. (2017). An anti-CRISPR from a virulent streptococcal phage inhibits Streptococcus pyogenes Cas9. Nat.
Microbiol. 2, 1374-1380. Ibraheim, R., Song, C.-Q., Mir, A., Amrani, N., Xue, W., and Sontheimer, E.J. (2018). All-in-One Adeno-associated Virus Delivery and Genome Editing by Neisseria meningitidis Cas9 in vivo.
BioRxiv, https://doi.org/10.1101/295055. Jiang, F., and Doudna, J.A. (2017). CRISPR–Cas9 Structures and Mechanisms.
Annu.
Rev.
Biophys. 46, 505-529. Jiang, W., Bikard, D., Cox, D., Zhang, F., and Marraffini, L.A. (2013). RNA-guided editing of bacterial genomes using CRISPR-Cas systems.
Nat.
Biotechnol. 31, 233-239.
Jinek, M., Chylinski, K., Fonfara, I., Hauer, M., Doudna, J.A., and Charpentier, E. (2012). A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.
Science 337, 816-821. Jinek, M., East, A., Cheng, A., Lin, S., Ma, E., and Doudna, J. (2013). RNA-programmed genome editing in human cells. eLife 2, e00471. Karvelis, T., Gasiunas, G., Young, J., Bigelyte, G., Silanskas, A., Cigan, M., and Siksnys, V. (2015). Rapid characterization of CRISPR-Cas9 protospacer adjacent motif sequence elements.
Genome Biol. 16, 253. Keeler, A.M., ElMallah, M.K., and Flotte, T.R. (2017). Gene Therapy 2017: Progress and Future Directions.
Clin.
Transl.
Sci. 10, 242-248. Kim, E., Koo, T., Park, S.W., Kim, D., Kim, K.-E., Kim, K., Cho, H.-Y., Song, D.W., Lee, K.J., Jung, M.H., et al. (2017). In vivo genome editing with a small Cas9 ortholog derived from Campylobacter jejuni.
Nat.
Commun. 8, 14500. Kim, S., Kim, D., Cho, S.W., Kim, J., and Kim, J.S. (2014). Highly efficient RNA-guided genome editing in human cells via delivery of purified Cas9 ribonucleoproteins.
Genome Res. 24, 1012-1019. Kim, B., Komor, A., Levy, J., Packer, M., Zhao, K., and Liu, D. (2017). Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions.
Nature Biotechnology 35. Kleinstiver, B.P., Prew, M.S., Tsai, S.Q., Nguyen, N.T., Topkar, V.V., Zheng, Z., and Joung, J.K. (2015). Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition.
Nat.
Biotechnol. 33, 1293-1298. Kluesner, M., Nedveck, D., Lahr, W., Garbe, J., Abrahante, J., Webber, B., and Moriarity, B. (2018). EditR: A Method to Quantify Base Editing from Sanger Sequencing.
The CRISPR Journal 1, 239–250. Koblan, L., Doman, J., Wilson, C., Levy, J., Tay, T., Newby, G., Maianti, J., Raguram, A., and Liu, D. (2018). Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction.
Nat Biotechnol 36, 843.
Komor, A.C., Badran, A.H., and Liu, D.R. (2017). CRISPR-Based Technologies for the Manipulation of Eukaryotic Genomes. Cell 168, 20-36. Komor, A.C., Kim, Y.B., Packer, M.S., Zuris, J.A., and Liu, D.R. (2016). Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage. Nature 533, 420-424. Lee, C.M., Cradick, T.J., and Bao, G. (2016). The Neisseria meningitidis CRISPR-Cas9 system enables specific genome editing in mammalian cells. Mol. Ther. 24, 645-654. Lee, J., Mir, A., Edraki, A., Garcia, B., Amrani, N., Lou, H.E., Gainetdinov, I., Pawluk, A., Ibraheim, R., Gao, X.D., et al. (2018). Potent Cas9 inhibition in bacterial and human cells by new anti-CRISPR protein families. BioRxiv, https://www.biorxiv.org/content/early/2018/2006/2020/350504. Ma, E., Harrington, L.B., O'Connell, M.R., Zhou, K., and Doudna, J.A. (2015). Single-Stranded DNA Cleavage by Divergent CRISPR-Cas9 Enzymes. Mol. Cell 60, 398-407. Mali, P., Aach, J., Stranges, P.B., Esvelt, K.M., Moosburner, M., Kosuri, S., Yang, L., and Church, G.M. (2013a). CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat. Biotechnol. 31, 833-838. Mali, P., Yang, L., Esvelt, K.M., Aach, J., Guell, M., DiCarlo, J.E., Norville, J.E., and Church, G.M. (2013b). RNA-guided human genome engineering via Cas9. Science 339, 823-826. Marraffini, L.A., and Sontheimer, E.J. (2008). CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA. Science 322, 1843-
1845. Mir, A., Edraki, A., Lee, J., and Sontheimer, E.J. (2018). Type II-C CRISPR-Cas9 biology, mechanism and application. ACS Chem. Biol. 13, 357-
365.
Mojica, F.J., Diez-Villasenor, C., Garcia-Martinez, J., and Almendros, C. (2009). Short motif sequences determine the targets of the prokaryotic CRISPR defence system.
Microbiology 155, 733-740. Paez-Espino, D., Sharon, I., Morovic, W., Stahl, B., Thomas, B.C., Barrangou, R., and Banfield, J.F. (2015). CRISPR immunity drives rapid phage genome evolution in Streptococcus thermophilus. mBio 6. Pawluk, A., Amrani, N., Zhang, Y., Garcia, B., Hidalgo-Reyes, Y., Lee, J., Edraki, A., Shah, M., Sontheimer, E.J., Maxwell, K.L., et al. (2016). Naturally occurring off-switches for CRISPR-Cas9. Cell 167, 1829-1838 e1829. Pawluk, A., Bondy-Denomy, J., Cheung, V.H., Maxwell, K.L., and Davidson, A.R. (2014). A new group of phage anti-CRISPR genes inhibits the type I-E CRISPR-Cas system of Pseudomonas aeruginosa. mBio 5, e00896. Pinello, L., Canver, M.C., Hoban, M.D., Orkin, S.H., Kohn, D.B., Bauer, D.E., and Yuan, G.C. (2016). Analyzing CRISPR genome-editing experiments with CRISPResso.
Nat.
Biotechnol. 34, 695-697. Racanelli, V., and Rehermann, B. (2006). The liver as an immunological organ.
Hepatology 43, S54-62. Ran, F.A., Cong, L., Yan, W.X., Scott, D.A., Gootenberg, J.S., Kriz, A.J., Zetsche, B., Shalem, O., Wu, X., Makarova, K.S., et al. (2015). In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191. Ran, F.A., Hsu, P.D., Lin, C.Y., Gootenberg, J.S., Konermann, S., Trevino, A.E., Scott, D.A., Inoue, A., Matoba, S., Zhang, Y., et al. (2013). Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity.
Cell 154, 1380-1389. Rashid, S., Curtis, D.E., Garuti, R., Anderson, N.N., Bashmakov, Y., Ho, Y.K., Hammer, R.E., Moon, Y.A., and Horton, J.D. (2005). Decreased plasma cholesterol and hypersensitivity to statins in mice lacking Pcsk9. Proc.
Natl.
Acad.
Sci.
USA 102, 5374-5379.
Rauch, B.J., Silvis, M.R., Hultquist, J.F., Waters, C.S., McGregor, M.J., Krogan, N.J., and Bondy-Denomy, J. (2017). Inhibition of CRISPR-Cas9 with Bacteriophage Proteins. Cell 168, 150-158 e110. Sapranauskas, R., Gasiunas, G., Fremaux, C., Barrangou, R., Horvath, P., and Siksnys, V. (2011). The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic Acids Res. 39, 9275-9282. Schumann, K., Lin, S., Boyer, E., Simeonov, D.R., Subramaniam, M., Gate, R.E., Haliburton, G.E., Ye, C.J., Bluestone, J.A., Doudna, J.A., et al. (2015). Generation of knock-in primary human T cells using Cas9 ribonucleoproteins. Proc. Natl. Acad. Sci. USA 112, 10437-10442. Shin, J., Jiang, F., Liu, J.J., Bray, N.L., Rauch, B.J., Baik, S.H., Nogales, E., Bondy-Denomy, J., Corn, J.E., and Doudna, J.A. (2017). Disabling Cas9 by an anti-CRISPR DNA mimic. Sci. Adv. 3, e1701620. Tsai, S.Q., and Joung, J.K. (2016). Defining and improving the genome- wide specificities of CRISPR-Cas9 nucleases. Nat. Rev. Genet. 17, 300-312. Tsai, S.Q., Zheng, Z., Nguyen, N.T., Liebers, M., Topkar, V.V., Thapar, V., Wyvekens, N., Khayter, C., Iafrate, A.J., Le, L.P., et al. (2014). GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat. Biotechnol. 33, 187-197. Tycko, J., Myer, V.E., and Hsu, P.D. (2016). Methods for optimizing CRISPR-Cas9 genome editing specificity. Mol. Cell 63, 355-370. Yang, H., and Patel, D.J. (2017). Inhibition Mechanism of an Anti- CRISPR Suppressor AcrIIA4 Targeting SpyCas9. Mol Cell 67, 117-127 e115. Yin, H., Song, C.Q., Suresh, S., Kwan, S.Y., Wu, Q., Walsh, S., Ding, J., Bogorad, R.L., Zhu, L.J., Wolfe, S.A., et al. (2018). Partial DNA-guided Cas9 enables genome editing with reduced off-target activity. Nat. Chem. Biol. 14, 311-
316. Yokoyama, T., Silversides, D.W., Waymire, K.G., Kwon, B.S., Takeuchi, T., and Overbeek, P.A. (1990). Conserved cysteine to serine mutation in tyrosinase is responsible for the classical albino mutation in laboratory mice. Nucleic Acids Res. 18, 7293-7298. Yoon, Y., Wang, D., Tai, P.W.L., Riley, J., Gao, G., and Rivera-Perez, J.A. (2018). Streamlined ex vivo and in vivo genome editing in mouse embryos using recombinant adeno-associated viruses. Nat. Commun. 9, 412. Zhang, Y., Heidrich, N., Ampattu, B.J., Gunderson, C.W., Seifert, H.S., Schoen, C., Vogel, J., and Sontheimer, E.J. (2013). Processing-independent CRISPR RNAs limit natural transformation in Neisseria meningitidis. Mol. Cell 50, 488-503. Zhang, Y., Rajan, R., Seifert, H.S., Mondragón, A., and Sontheimer, E.J. (2015). DNase H activity of Neisseria meningitidis Cas9. Mol. Cell 60, 242-255. Zhang, Z., Theurkauf, W.E., Weng, Z., and Zamore, P.D. (2012). Strand- specific libraries for high throughput RNA sequencing (RNA-Seq) prepared without poly(A) selection. Silence 3, 9. Zhu, L.J., Holmes, B.R., Aronin, N., and Brodsky, M.H. (2014). CRISPRseek: a bioconductor package to identify target-specific guide RNAs for CRISPR-Cas9 genome-editing systems. PLoS One 9, e108424. Zhu, L.J., Lawrence, M., Gupta, A., Pagés, H., Kucukural, A., Garber, M., and Wolfe, S.A. (2017). GUIDEseq: a bioconductor package to analyze GUIDE- Seq datasets for CRISPR-Cas nucleases. BMC Genomics 18, 379. Zuris, J.A., Thompson, D.B., Shu, Y., Guilinger, J.P., Bessen, J.L., Hu, J.H., Maeder, M.L., Joung, J.K., Chen, Z.-Y., and Liu, D.R. (2015). Cationic lipid- mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo. Nat. Biotechnol. 33, 73-80.
[00415] Todas as publicações e patentes mencionadas no relatório descritivo acima são incorporadas aqui por referência. Várias modificações e variações dos métodos descritos e sistema da invenção serão aparentes àqueles versados na técnica sem se afastar do escopo e espírito da invenção. Embora a invenção tenha sido descrita em conexão com modalidades preferidas específicas, deve ser compreendido que a invenção como reivindicada não deve ser limitada indevidamente a tais modalidades específicas.
De fato, várias modificações dos modos descritos para a realização da invenção que são óbvias àqueles versados no controle biológico, bioquímica, biologia molecular, entomologia, plâncton, sistemas de pesca, e ecologia da água doce, ou campos relacionados são destinados a estar dentro do escopo das reivindicações a seguir.

Claims (46)

REIVINDICAÇÕES
1. Proteína, CARACTERIZADA pelo fato de que compreende uma nucleotídeo desaminase fundida e uma região de ligação para uma sequência de nucleotídeo N4CC.
2. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que a dita proteína é Nme2Cas9.
3. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que compreende ainda uma proteína sinal de localização nuclear.
4. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que o dito nucleotídeo desaminase é uma citidina desaminase.
5. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que o dito nucleotídeo desaminase é uma adenosina desaminase.
6. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que compreende ainda um inibidor de uracil glicosilase.
7. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que a dita proteína sinal de localização nuclear é selecionada de uma nucleoplasmina e um SV40 .
8. Proteína, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador.
9. Proteína, de acordo com a reivindicação 8, CARACTERIZADA pelo fato de que o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação.
10.Proteína, de acordo com a reivindicação 9, CARACTERIZADA pelo fato de que a dita mutação é uma mutação de D16A.
11.Vírus adeno-associado, CARACTERIZADO pelo fato de que compreende uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para uma sequência de nucleotídeo N4CC.
12.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que o dito vírus é um vírus adeno-associado 8.
13.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que o dito vírus é um vírus adeno-associado 6.
14.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a dita proteína é Nme2Cas9.
15.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a dita proteína compreende ainda uma proteína sinal de localização nuclear.
16.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que o dito nucleotídeo desaminase é uma citidina desaminase.
17.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que o dito nucleotídeo desaminase é uma adenosina desaminase.
18.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a dita proteína compreende ainda um inibidor de uracil glicosilase.
19.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a dita proteína sinal de localização nuclear é selecionada de uma nucleoplasmina e SV40.
20.Vírus, de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador.
21.Vírus, de acordo com a reivindicação 20, CARACTERIZADO pelo fato de que o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação.
22.Vírus, de acordo com a reivindicação 21, CARACTERIZADO pelo fato de que a dita mutação é uma mutação D16A.
23.Método, CARACTERIZADO pelo fato de que compreende: a) provisão de: i) uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC; ii) uma proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) contato da dita sequência de nucleotídeo com a dita proteína NmeCas9 mutada sob condições tais que a dita região de ligação se fixa à dita sequência de nucleotídeo N4CC; e c) substituição da dita base única mutada com uma base do tipo selvagem com a dita proteína NmeCas9 mutada.
24.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que a dita proteína é Nme2Cas9.
25.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que a dita proteína compreende ainda uma proteína sinal de localização nuclear.
26.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que o dito nucleotídeo desaminase é uma citidina desaminase.
27.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que o dito nucleotídeo desaminase é uma adenosina desaminase.
28.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que a dita proteína compreende ainda um inibidor de uracil glicosilase.
29.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que a dita proteína sinal de localização nuclear é selecionada do grupo consistindo em nucleoplasmina e SV40.
30.Método, de acordo com a reivindicação 23, CARACTERIZADO pelo fato de que a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador.
31.Método, de acordo com a reivindicação 30, CARACTERIZADO pelo fato de que o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação da proteína Cas9.
32.Método, de acordo com a reivindicação 31, CARACTERIZADO pelo fato de que a dita mutação da proteína Cas9 é uma mutação D16A.
33.Método, CARACTERIZADO pelo fato de que compreende: a) provisão de: i) um paciente compreendendo uma sequência de nucleotídeo compreendendo um gene com uma base única mutada, em que o dito gene é flanqueado por uma sequência de nucleotídeo N4CC, em que o dito gene mutado causa uma condição médica com base genética; ii) um vírus adeno-associado compreendendo uma proteína NmeCas9 mutada, a dita proteína NmeCas9 mutada compreendendo uma nucleotídeo desaminase fundida e uma região de ligação para a dita sequência de nucleotídeo N4CC; b) tratamento do dito paciente com o dito vírus adeno-associado sob condições tais que a dita proteína NmeCas9 mutada substitui a dita base única mutada com uma base do tipo selvagem única, tal que a dita condição médica com base genética não se desenvolve.
34.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que o dito gene codifica uma proteína tirosinase.
35.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a dita condição médica com base genética é tirosinemia.
36.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que o dito vírus é um vírus adeno-associado 8.
37.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que o dito vírus é um vírus adeno-associado 6.
38.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a dita proteína é Nme2Cas9.
39.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a dita proteína compreende ainda uma proteína sinal de localização nuclear.
40.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que o dito nucleotídeo desaminase é uma citidina desaminase.
41.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que o dito nucleotídeo desaminase é uma adenosina desaminase.
42.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a dita proteína compreende ainda um inibidor de uracil glicosilase.
43.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a dita proteína sinal de localização nuclear é selecionada do grupo consistindo em nucleoplasmina e SV40.
44.Método, de acordo com a reivindicação 33, CARACTERIZADO pelo fato de que a dita região de ligação é um domínio de interação de motivo acessório ao protoespaçador.
45.Método, de acordo com a reivindicação 44, CARACTERIZADO pelo fato de que o dito domínio de interação de motivo acessório ao protoespaçador compreende a dita mutação.
46.Método, de acordo com a reivindicação 45, CARACTERIZADO pelo fato de que a dita mutação é uma mutação D16A.
BR112021007123-7A 2018-10-15 2019-10-15 edição de base de dna programável pelas proteínas de fusão nme2cas9-desaminase BR112021007123A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862745666P 2018-10-15 2018-10-15
US62/745,666 2018-10-15
PCT/US2019/056341 WO2020081568A1 (en) 2018-10-15 2019-10-15 Programmable dna base editing by nme2cas9-deaminase fusion proteins

Publications (1)

Publication Number Publication Date
BR112021007123A2 true BR112021007123A2 (pt) 2021-08-10

Family

ID=68621349

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021007123-7A BR112021007123A2 (pt) 2018-10-15 2019-10-15 edição de base de dna programável pelas proteínas de fusão nme2cas9-desaminase

Country Status (14)

Country Link
US (1) US20220290113A1 (pt)
EP (1) EP3867367A1 (pt)
JP (1) JP2022508716A (pt)
KR (1) KR20210077732A (pt)
CN (1) CN113166743A (pt)
AU (1) AU2019362874A1 (pt)
BR (1) BR112021007123A2 (pt)
CA (1) CA3116555A1 (pt)
CO (1) CO2021006336A2 (pt)
EA (1) EA202191033A1 (pt)
IL (1) IL282267A (pt)
MX (1) MX2021004301A (pt)
SG (1) SG11202103722TA (pt)
WO (1) WO2020081568A1 (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL297761A (en) 2020-05-08 2022-12-01 Broad Inst Inc Methods and compositions for simultaneously editing two helices of a designated double-helix nucleotide sequence
GB202010348D0 (en) 2020-07-06 2020-08-19 Univ Wageningen Base editing tools
WO2022125968A1 (en) 2020-12-11 2022-06-16 Intellia Therapeutics, Inc. Polynucleotides, compositions, and methods for genome editing involving deamination
CR20230303A (es) 2020-12-11 2023-09-01 Intellia Therapeutics Inc Composiciones y métodos para reducir el mhc de clase ii en una célula
CR20230321A (es) 2020-12-23 2023-09-12 Intellia Therapeutics Inc Composiciones y métodos para modificar genéticamente ciita en una célula
CR20230320A (es) 2020-12-23 2023-10-23 Intellia Therapeutics Inc Composiciones y métodos para reducir los hla-a en una célula
WO2023081070A1 (en) * 2021-11-02 2023-05-11 University Of Massachusetts Nme2Cas9 INLAID DOMAIN FUSION PROTEINS
WO2023081689A2 (en) 2021-11-03 2023-05-11 Intellia Therapeutics, Inc. Polynucleotides, compositions, and methods for genome editing
WO2023196802A1 (en) * 2022-04-04 2023-10-12 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
WO2023227669A2 (en) * 2022-05-26 2023-11-30 UCB Biopharma SRL Novel nucleic acid-editing proteins
WO2023245109A2 (en) 2022-06-16 2023-12-21 Intellia Therapeutics, Inc. Compositions and methods for genomic editing
WO2023245108A2 (en) 2022-06-16 2023-12-21 Intellia Therapeutics, Inc. Compositions and methods for reducing mhc class i in a cell
WO2023245113A1 (en) 2022-06-16 2023-12-21 Intellia Therapeutics, Inc. Methods and compositions for genetically modifying a cell
CN115206456B (zh) * 2022-07-13 2023-04-25 黑龙江大学 基于属性编辑流的分子生成方法
CN115851775B (zh) * 2022-10-18 2023-08-04 哈尔滨工业大学 一种Cas9蛋白抑制剂及其应用
CN115716880A (zh) * 2022-12-07 2023-02-28 云舟生物科技(广州)股份有限公司 一种核定位荧光蛋白及其应用

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL154598B (nl) 1970-11-10 1977-09-15 Organon Nv Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking.
US3817837A (en) 1971-05-14 1974-06-18 Syva Corp Enzyme amplification assay
US3939350A (en) 1974-04-29 1976-02-17 Board Of Trustees Of The Leland Stanford Junior University Fluorescent immunoassay employing total reflection for activation
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4275149A (en) 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4277437A (en) 1978-04-05 1981-07-07 Syva Company Kit for carrying out chemically induced fluorescence immunoassay
US4366241A (en) 1980-08-07 1982-12-28 Syva Company Concentrating zone method in heterogeneous immunoassays
AU2014235794A1 (en) * 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
JP7109784B2 (ja) * 2015-10-23 2022-08-01 プレジデント アンド フェローズ オブ ハーバード カレッジ 遺伝子編集のための進化したCas9蛋白質
WO2018027078A1 (en) * 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
WO2018152197A1 (en) * 2017-02-15 2018-08-23 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
WO2018149915A1 (en) * 2017-02-15 2018-08-23 Keygene N.V. Methods of targeted genetic alteration in plant cells
CA3057192A1 (en) * 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins

Also Published As

Publication number Publication date
IL282267A (en) 2021-05-31
AU2019362874A1 (en) 2021-05-27
CA3116555A1 (en) 2020-04-23
SG11202103722TA (en) 2021-05-28
JP2022508716A (ja) 2022-01-19
WO2020081568A1 (en) 2020-04-23
CO2021006336A2 (es) 2021-10-29
MX2021004301A (es) 2021-08-05
EA202191033A1 (ru) 2021-12-21
KR20210077732A (ko) 2021-06-25
EP3867367A1 (en) 2021-08-25
CN113166743A (zh) 2021-07-23
US20220290113A1 (en) 2022-09-15

Similar Documents

Publication Publication Date Title
BR112021007123A2 (pt) edição de base de dna programável pelas proteínas de fusão nme2cas9-desaminase
Edraki et al. A compact, high-accuracy Cas9 with a dinucleotide PAM for in vivo genome editing
US20210139872A1 (en) Crispr having or associated with destabilization domains
US20240093193A1 (en) Dead guides for crispr transcription factors
US11624078B2 (en) Protected guide RNAS (pgRNAS)
US10954514B2 (en) Escorted and functionalized guides for CRISPR-Cas systems
BR112021006844A2 (pt) métodos para editar um rna alvo e para tratar ou prevenir uma doença ou condição, rna editado ou uma célula hospedeira tendo um rna editado, rna que recruta desaminase, construção, biblioteca, composição, célula hospedeira, e, kit para editar um rna alvo .
AU2018364993B2 (en) Targeted CRISPR delivery platforms
CN110382697A (zh) 用于治疗α-1抗胰蛋白酶缺乏症的组合物及方法
US20210317429A1 (en) Methods and compositions for optochemical control of crispr-cas9
WO2023081070A1 (en) Nme2Cas9 INLAID DOMAIN FUSION PROTEINS
Ibraheim et al. Precision Cas9 genome editing in vivo with all-in-one, self-targeting AAV vectors
US5863794A (en) SV40 viral vectors for targeted integration into cells
Ibraheim et al. Let us know how access to this document benefits you.
WO2023212677A2 (en) Identification of tissue-specific extragenic safe harbors for gene therapy approaches