BR112020026246A2 - composições, sistemas e métodos de amplificação com base em nickase dupla crispr - Google Patents

composições, sistemas e métodos de amplificação com base em nickase dupla crispr Download PDF

Info

Publication number
BR112020026246A2
BR112020026246A2 BR112020026246-3A BR112020026246A BR112020026246A2 BR 112020026246 A2 BR112020026246 A2 BR 112020026246A2 BR 112020026246 A BR112020026246 A BR 112020026246A BR 112020026246 A2 BR112020026246 A2 BR 112020026246A2
Authority
BR
Brazil
Prior art keywords
nucleic acid
crispr
cas
nickase
target
Prior art date
Application number
BR112020026246-3A
Other languages
English (en)
Inventor
Feng Zhang
Max Kellner
Jonathan Gootenberg
Omar Abudayyeh
Original Assignee
The Broad Institute Inc.
Massachusetts Institute Of Technology
President And Fellows Of Harvard College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The Broad Institute Inc., Massachusetts Institute Of Technology, President And Fellows Of Harvard College filed Critical The Broad Institute Inc.
Publication of BR112020026246A2 publication Critical patent/BR112020026246A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/125Specific component of sample, medium or buffer
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

composições, sistemas e métodos de amplificação com base em nickase dupla crispr. as modalidades aqui divulgadas utilizaram efetores de alvo de rna para fornecer métodos e sistemas robustos de amplificação de ácido nucleico à base de crispr. modalidades aqui divulgadas podem amplificar ambos os alvos de ácido nucleico de fita dupla e de fita simples. além disso, as modalidades aqui divulgadas podem ser combinadas com várias plataformas de detecção, por exemplo, crispr-sherlock, para alcançar a detecção e o diagnóstico com sensibilidade attomolar. tais modalidades são úteis em múltiplos cenários em saúde humana incluindo, por exemplo, detecção viral, tipagem de cepa bacteriana, genotipagem sensível e detecção de dna livre de célula associada à doença.

Description

Relatório Descritivo da Patente de Invenção para: COMPOSIÇÕES, SISTEMAS E MÉTODOS DE AMPLIFICAÇÃO COM BASE EM
NICKASE DUPLA CRISPR REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] Este pedido reivindica o benefício do Pedido Provisório U.S. 62/767.059 depositado em 14 de novembro de 2018 e do Pedido Provisório U.S. 62/690.278 depositado em 26 de junho de 2018. Todo o conteúdo de cada um dos pedidos acima é incorporado por referência neste documento.
DECLARAÇÃO SOBRE PESQUISA PATROCINADA PELO GOVERNO FEDERAL
[0002] Esta invenção foi feita com o apoio do governo sob os números de concessão MH100706, MH110049 e HL141201 concedidos pelo National Institutes of Health. O governo tem determinados direitos sobre a invenção.
CAMPO DA TÉCNICA
[0003] O assunto divulgado neste documento é geralmente direcionado a métodos, sistemas e diagnósticos rápidos de amplificação de ácido nucleico relacionados ao uso de sistemas efetores CRISPR.
FUNDAMENTOS
[0004] Os ácidos nucleicos são uma assinatura universal de informações biológicas. A capacidade de detectar rapidamente ácidos nucleicos com alta sensibilidade e especificidade de base única em uma plataforma portátil tem o potencial de revolucionar o diagnóstico e o monitoramento de muitas doenças, fornecer informações epidemiológicas valiosas e servir como uma ferramenta científica generalizável. Embora muitos métodos tenham sido desenvolvidos para a detecção de ácidos nucleicos (Du et al., 2017; Green et al., 2014; Kumar et al., 2014; Pardee et al., 2014; Pardee et al., 2016; Urdea et al., 2006), eles inevitavelmente sofrem trocas entre sensibilidade, especificidade, simplicidade e velocidade. Por exemplo, as abordagens de qPCR são sensíveis, mas são caras e dependem de instrumentação complexa, limitando a usabilidade a operadores altamente treinados em ambientes de laboratório.
À medida que o diagnóstico de ácidos nucléicos se torna cada vez mais relevante para uma variedade de aplicações na área da saúde, as tecnologias de detecção que fornecem alta especificidade e sensibilidade a baixo custo seriam de grande utilidade em ambientes de pesquisa clínica e básica.
[0005] Muitas abordagens de amplificação de ácido nucleico estão disponíveis com várias plataformas de detecção. Entre eles, métodos de amplificação isotérmica de ácido nucleico foram desenvolvidos para amplificação sem ciclagem drástica de temperatura e instrumentações complexas. Esses métodos incluem amplificação baseada em sequência de ácido nucleico (NASBA), amplificação de polimerase de recombinase (RPA), amplificação isotérmica mediada por laço (LAMP), amplificação de deslocamento de cadeia (SDA), amplificação dependente de helicase (HDA) ou reação de amplificação enzimática de corte (NEAR). Essas abordagens de amplificação isotérmica, no entanto, ainda podem exigir uma etapa de desnaturação inicial e múltiplos conjuntos de iniciadores. Além disso, novas abordagens combinando a amplificação isotérmica de ácido nucleico com plataformas portáteis (Du et al., 2017; Pardee et al., 2016), oferecem alta especificidade de detecção em um ambiente de ponto de atendimento (POC), mas apresentam algumas aplicações limitadas devido à baixa sensibilidade.
SUMÁRIO
[0006] A presente divulgação está geralmente relacionada a métodos de amplificação e detecção de ácido nucleico à base de nickase.
[0007] Em certas modalidades de exemplo, a invenção fornece um método de amplificação e / ou detecção de um ácido nucleico de fita dupla alvo, compreendendo: (a) combinar uma amostra compreendendo o ácido nucleico de fita dupla alvo com uma mistura de reação de amplificação, a mistura de reação de amplificação compreendendo: (i) um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e um segundo complexo CRISPR / Cas, o primeiro complexo CRISPR / Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR / Cas para um primeiro local no ácido nucleico alvo e o segundo complexo CRISPR / Cas compreendendo uma segunda nickase à base de Cas e uma segunda molécula guia que orienta o segundo complexo CRISPR / Cas para um segundo local do ácido nucleico alvo; e (ii) uma polimerase; (b) amplificar o ácido nucleico alvo; (c) adicionar um par de iniciadores compreendendo um primeiro e um segundo iniciador à mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar ao primeiro local do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia, e o segundo iniciador compreendendo uma porção que é complementar ao segundo local do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e (d) amplificação adicional do ácido nucleico alvo por extensão repetida e corte sob condições isotérmicas.
[0008] Em modalidades, o primeiro e o segundo locais estão na mesma fita de um ácido nucleico alvo. Em outras modalidades, o primeira e o segundo locais estão em uma primeira fita e uma segunda fita de um ácido nucleico alvo de fita dupla. Em aplicações em que o primeiro local e o segundo locais estão em uma primeira e segunda fitas de um ácido nucleico alvo, a amplificação pode compreender cortar a primeira e a segunda fitas do ácido nucleico alvo usando o primeiro e o segundo complexos CRISPR / Cas e deslocar e estender as fitas cortadas usando a polimerase, gerando assim duplexes compreendendo uma sequência de ácido nucleico alvo entre o primeiro e o segundo sítios de corte.
[0009] Em certas modalidades, a niqckase à base de Cas pode ser selecionada do grupo que consiste em Cas9 nickase, Cpf1 nickase e C2c1 nickase.
[0010] Em uma modalidade, a nickase à base de Cas é uma proteína Cas9 nickase que compreende uma mutação no domínio HNH. Em outra modalidade, a nickase à base de Cas é uma proteína Cas9 nickase que compreende uma mutação correspondente a N863A em SpCas9 ou N580A em SaCas9. A nickase à base de Cas é uma proteína Cas9 derivada de uma espécie bacteriana selecionada do grupo que consiste em Streptococcus pyogenes, Staphylococcus aureus, Streptococcus thermophilus, S. mutans, S. agalactiae, S. equisimilis, S.
sanguinis, S. pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N. gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C. difficile, C. tetani, C. sordellii, Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium
ND2006, Porphyromonas crevioricanis 3, Prevotella disiens e Porphyromonas macacae.
[0011] Em uma modalidade, a nickase à base de Cas é uma proteína Cpf1 nickase que compreende uma mutação no domínio Nuc. Em outra modalidade, a nickase à base de Cas é uma proteína Cpf1 nickase que compreende uma mutação correspondente a R1226A em AsCpf1. a nickase à base de Cas é uma proteína Cpf1 derivada de uma espécie bacteriana selecionada do grupo que consiste em Francisella tularensis, Prevotella albensis, Lachnospiraceae bacterium, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium, Parcubacteria bacterium, Smithella sp., Acidaminococcus sp., Lachnospiraceae bacterium, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi, Leptospira inadai, Porphyromonas crevioricanis, Prevotella disiens and Porphyromonas macacae, Succinivibrio dextrinosolvens, Prevotella disiens, Flavobacterium branchiophilum, Helcococcus kunzii, Eubacterium sp., Microgenomates (Roizmanbacteria) bacterium, Flavobacterium sp., Prevotella brevis, Moraxella caprae, Bacteroidetes oral, Porphyromonas cansulci, Synergistes jonesii, Prevotella bryantii, Anaerovibrio sp., Butyrivibrio fibrisolvens, Candidatus Methanomethylophilus, Butyrivibrio sp., Oribacterium sp., Pseudobutyrivibrio ruminis e Proteocatella sphenisci.
[0012] Em uma modalidade, a nickase à base de Cas é uma proteína C2c1 nickase que compreende uma mutação no domínio Nuc. Em outra modalidade, a nickase baseada em Cas é uma proteína C2c1 nickase que compreende uma mutação correspondente a D570A, E848A ou D977A em AacC2c1. A nickase à base de Cas pode ser uma proteína C2c1 derivada de uma espécie bacteriana selecionada do grupo que consiste em Alicyclobacillus acidoterrestris, Alicyclobacillus contaminans, Alicyclobacillus macrosporangiidus, Bacillus hisashii, Candidatus Lindowbacteria, Desulfovibrio inopinatus, Desulfonatronum thiodismutans, Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus, Bacillus thermoamylovorans, Brevibacillus sp.
CF112, Bacillus sp. NSP2.1, Desulfatirhabdium butyrativorans, Alicyclobacillus herbarius, Citrobacter freundii, Brevibacillus agri (por exemplo, BAB-2500) e Methylobacterium nodulans.
[0013] Em uma modalidade, a primeira nickase à base de Cas e a segunda nickase à base de Cas são as mesmas. Em outra modalidade, a primeira nickase à base de Cas e a segunda nickase à base de Cas são diferentes.
[0014] A DNA polimerase pode ser selecionada de um grupo de polimerases sem atividade de exonuclease 5' a 3' e que, adicionalmente, pode opcionalmente carecer de atividade de exonuclease 3'-5'. Exemplos de DNA polimerases adequadas incluem um fragmento de Klenow deficiente em exonuclease de E. coli DNA polimerase I (New England Biolabs, Inc.
(Beverly, Mass.)), uma DNA T7 polimerase deficiente em exonuclease (Sequenase; USB, (Cleveland, Ohio)), fragmento de Klenow de DNA polimerase I de E. coli (New England Biolabs, Inc. (Beverly, Mass.)), Fragmento grande de Bst DNA polimerase (New England Biolabs, Inc. (Beverly, Mass.)), DNA polimerase KlenTaq (AB Peptides, (St Louis, Mo.)), T5 DNA polimerase (Pat. U.S. 5.716.819), e Pol III DNA polimerase (Pat. U.S. 6.555.349). As DNA polimerases possuindo atividade de deslocamento de fita, tais como o fragmento Klenow deficiente em exonuclease de DNA polimerase I de E.
coli , Fragmento grande de DNA Bst polimerase e Sequenase, são preferidas para a amplificação dependente de helicase.
A T7 polimerase é uma polimerase de alta fidelidade com uma taxa de erro de 3.5×105 que é significativamente menor do que a Taq polimerase (Keohavong and Thilly, Proc. Natl. Acad.
Sci. USA 86, 9253–9257 (1989)). A T7 polimerase não é termoestável e, portanto, não é ideal para uso em sistemas de amplificação que requerem termociclagem. Em HDA, que pode ser conduzida isotermicamente, a T7 Sequenase é uma das polimerases preferidas para amplificação de DNA.
[0015] Em modalidades específicas, a polimerase pode ser selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento tota, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase, phi29 DNA polimerase, T7 DNA polimerase e Sequenase DNA polimerase.
[0016] Em certas modalidades, a polimerase é selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento total, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase de fragmento grande, phi29 DNA polimerase, T7 DNA polimerase, Gst polimerase, Taq polimerase, fragmento Klenow de E. coli DNA polimerase I, KlenTaq, Pol III DNA polimerase, T5 DNA polimerase e Sequenase DNA polimerase. A amplificação do ácido nucleico alvo pode ser realizada a cerca de 50ºC-59ºC, a cerca de 60ºC-72ºC ou a cerca de 37ºC. Em certas modalidades, a amplificação do ácido nucleico alvo pode ser realizada a uma temperatura constante. Em certas modalidades, a amplificação do ácido nucleico alvo é realizada dentro de uma faixa de temperaturas.
[0017] Em certas modalidades, a sequência de ácido nucleico alvo pode ter cerca de 20-30, cerca de 30-40, cerca de 40-50 ou cerca de 50-100 nucleotídeos de comprimento. Em certas modalidades, a sequência de ácido nucleico alvo pode ter cerca de 100-200, cerca de 100-500 ou cerca de 100-1000 nucleotídeos de comprimento. Em outras modalidades, a sequência de ácido nucleico alvo pode ter cerca de 1000- 2000, cerca de 2000-3000, cerca de 3000-4000 ou cerca de 4000-5000 nucleotídeos de comprimento.
[0018] Em modalidades adicionais, o primeiro ou segundo iniciador compreende ainda um promotor de RNA polimerase.
[0019] Em certas modalidades, o método pode compreender ainda detectar o ácido nucleico amplificado por um método selecionado do grupo que consiste em eletroforese em gel, detecção de corante intercalante, PCR, PCR em tempo real, fluorescência, Transferência de Energia de Ressonância de Fluorescência (FRET), espectrometria de massa, ensaios de fluxo lateral, ensaios colorimétricos (HRP, ALP, ensaios baseados em nanopartículas de ouro) e CRISPR-SHERLOCK. O método CRISPR-SHIRLOCK pode ser um método CRISPR-SHERLOCK baseado em Cas13. O ácido nucleico alvo pode ser detectado na sensibilidade atomolar ou na sensibilidade femtomolar.
[0020] Em certas modalidades, o ácido nucleico alvo pode ser um DNA ou RNA. O DNA pode ser selecionado do grupo que consiste em DNA genômico, DNA mitocondrial, DNA viral, DNA de plasmídeo, DNA livre de células circulantes, DNA ambiental e DNA de fita dupla sintético. Em certas modalidades, o ácido nucleico alvo pode ser um ácido nucleico de fita dupla ou um ácido nucleico de fita simples. Nos casos em que o ácido nucleico alvo é de fita simples, mas não estão necessariamente limitados a DNA viral de fita simples, RNA viral, RNA mensageiro, RNA ribossômico, RNA de transferência, microRNA, RNA de interferência curto, RNA nuclear pequeno, RNA sintético ou DNA de fita simples sintético.
[0021] Em uma modalidade, a amostra é uma amostra biológica ou uma amostra ambiental. A amostra biológica é um sangue, plasma, soro, urina, fezes, escarro, muco, fluido linfático, fluido sinovial, bile, ascite, efusão pleural, seroma, saliva, fluido cerebrospinal, humor aquoso ou vítreo, ou qualquer secreção corporal, um transudato, um exsudato ou fluido obtido de uma articulação ou um swab de pele ou superfície de membrana mucosa. Em certas modalidades específicas, a amostra é sangue, plasma ou soro obtido de um paciente humano. Em outra modalidade, a amostra é uma amostra de planta. Em outras modalidades, a amostra pode ser uma amostra em bruto ou purificada.
[0022] Em outro aspecto, a presente divulgação fornece um método para amplificar e / ou detectar um ácido nucleico de fita simples alvo, compreendendo: (a) converter o ácido nucleico de fita simples em uma amostra em um ácido nucleico de fita dupla alvo; e (b) realizar as etapas do método descrito anteriormente. O ácido nucleico de fita simples alvo pode ser uma molécula de RNA. A molécula de RNA pode ser convertida no ácido nucleico de fita dupla por uma etapa de transcrição reversa e amplificação. O ácido nucleico de fita simples alvo pode ser selecionado do grupo que consiste em DNA viral de fita simples, RNA viral, RNA mensageiro, RNA ribossômico, RNA de transferência, microRNA, RNA de interferência curto, RNA nuclear pequeno, RNA sintético, NRA não codificante longo, pré-micro RNA, dsRNA e DNA de fita simples sintético.
[0023] Em outro aspecto, a presente divulgação fornece um sistema para amplificar e / ou detectar um ácido nucleico de fita dupla alvo em uma amostra, o sistema compreendendo: (a) um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e um segundo complexo CRISPR/Cas, o primeiro complexo CRISPR/Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR/Cas para uma primeira fita do ácido nucleico alvo e o segundo complexo CRISPR/Cas compreendendo um segundo Cas à base de nickase e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para uma segunda fita do ácido nucleico alvo; (b) uma polimerase; (c) um par de iniciadores compreendendo um primeiro e um segundo iniciadores para a mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar à primeira fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia, e o segundo iniciador compreendendo uma porção que é complementar à segunda fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e opcionalmente (d) um sistema de detecção para detectar a amplificação do ácido nucleico alvo. A nickase baseada em Cas pode ser selecionada do grupo que consiste em Cas9 nickase, Cpf1 nickase, C2c1 nickase, Cas13a nickase, Cas13b nickase, Cas13c nickase, e Cas13d nickase. A polimerase pode ser selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento total, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase de fragmento grande, phi29 DNA polimerase, T7 DNA polimerase, Gst polimerase, Taq polimerase, fragmento Klenow de E. coli DNA polimerase I, KlenTaq, Pol III DNA polimerase, T5 DNA polimerase e Sequenase DNA polimerase. Em certas modalidades, a nickase à base de Cas e a polimerase atuam sob a mesma temperatura. Em certas modalidades, a nickase à base de Cas e a polimerase atuam sob diferentes temperaturas.
[0024] As DNA polimerases possuindo atividade de deslocamento de fita, tais como o fragmento Klenow deficiente em exonuclease de DNA polimerase I de E. coli , Fragmento grande de DNA Bst polimerase e Sequenase, são preferidas para a amplificação dependente de helicase. A polimerase T7 é uma polimerase de alta fidelidade com uma taxa de erro de 3,5×105 que é significativamente menor do que a polimerase Taq e pode ser usada quando conduzida isotermicamente.
(Keohavong and Thilly, Proc. Natl. Acad. Sci. USA 86, 9253– 9257 (1989)).
[0025] Em ainda outro aspecto, a presente divulgação fornece um sistema para amplificar e / ou detectar um ácido nucleico de fita simples alvo em uma amostra, o sistema compreendendo: (a) reagentes para converter o ácido nucleico de fita simples alvo em uma fita dupla ácido nucleico; e (b) componentes do sistema descrito acima para amplificar e / ou detectar um ácido nucleico de fita dupla alvo.
[0026] Em outro aspecto, a presente divulgação fornece um kit para amplificar e / ou detectar um ácido nucleico de fita dupla alvo em uma amostra, compreendendo componentes do sistema descrito acima para amplificar e / ou detectar um ácido nucleico de fita dupla alvo e um conjunto de instruções de uso. O kit pode ainda compreender reagentes para purificar o ácido nucleico de fita dupla na amostra.
[0027] Em outro aspecto, a presente divulgação fornece um kit para amplificar e / ou detectar um ácido nucleico de fita simples alvo em uma amostra, compreendendo componentes do sistema descrito acima para amplificar e / ou detectar um ácido nucleico de fita simples alvo e um conjunto de instruções de uso. O kit pode ainda compreender reagentes para purificar o ácido nucleico de fita simples na amostra.
[0028] Estes e outros aspectos, objetos, recursos e vantagens das modalidades exemplares tornar-se-ão evidentes àqueles versados na técnica mediante consideração da seguinte descrição detalhada de modalidades exemplificativas ilustradas.
BREVE DESCRIÇÃO DOS DESENHOS
[0029] Uma compreensão das características e vantagens da presente invenção será obtida por referência à seguinte descrição detalhada que estabelece modalidades ilustrativas, nas quais os princípios da invenção podem ser utilizados, e os desenhos anexos dos quais:
[0030] FIG. 1 - é um esquema de uma amplificação à base de nickase programável de acordo com certas modalidades de exemplo.
[0031] FIG. 2 - é uma imagem de eletroforese em gel que demonstra a otimização da reação de amplificação da enzima nickase. A seta vermelha indica a banda de amplificação alvo.
[0032] FIG. 3A - é um gráfico que mostra a amplificação linear à base de nickase usando a enzima de restrição Nt.A1w1 com alvo de 20 nM. FIG. 3B - é um gráfico que mostra a amplificação linear baseada em nickase usando Cpf1 incompatível com T7 com alvo de 20 nM. FIG. 3C - é um gráfico que mostra a amplificação linear baseada em nickase usando Cpf1 combinado com alvo de 20 nM. FIG. 3D - é um gráfico que mostra a amplificação linear à base de nickase usando a enzima de restrição Nt.A1w1 com alvo de 20 fM. FIG.
3E - é um gráfico que mostra a amplificação linear baseada em nickase usando Cpf1 incompatível com T7 com alvo de 20 fM. FIG. 3F - é um gráfico que mostra a amplificação linear baseada em nickase usando Cpf1 combinado com alvo de 20 fM.
[0033] FIG. 4A - é um gráfico que mostra a amplificação e detecção de Nt.A1w1 com corante intercalante SYTO. FIG. 4B - é um gráfico que mostra amplificação Cpf1 incompatível com T7 e detecção com corante intercalante SYTO.
FIG. 4C - é um gráfico que mostra a amplificação e detecção de Cpf1 combinada com corante intercalante SYTO. FIG. 4D - é um gráfico que mostra a amplificação e detecção de Nt.A1w1 com leitura baseada em gel. FIG. 4E - é um gráfico que mostra a amplificação e detecção de Cpf1 incompatível com T7 com leitura baseada em gel. FIG. 4F - é um gráfico que mostra a amplificação e detecção de Cpf1 combinada com leitura baseada em gel. FIG. 4G - é um gráfico que mostra a amplificação e detecção de Nt.A1w1 com CRISPR-SHERLOCK. FIG. 4H - é um gráfico que mostra a amplificação e detecção T7 de Cpf1 incompatível com CRISPR-SHERLOCK. FIG. 4I - é um gráfico que mostra a amplificação e detecção de Cpf1 combinada com CRISPR-SHERLOCK.
[0034] FIG. 5 - é um gráfico que mostra os resultados de amplificações à base de nickase combinadas com a detecção de SYTO ou CRISPR-SHERLOCK representados como razões de alvo/sem alvo.
[0035] FIG. 6A - é um gráfico que mostra os resultados da amplificação NEAR sozinha com concentrações alvo variáveis. FIG. 6B - é um gráfico que mostra os resultados da amplificação NEAR combinada com a detecção CRISPR-SHERLOCK com concentrações alvo variáveis.
[0036] FIG. 7A - é uma imagem de eletroforese em gel que mostra os resultados da amplificação NEAR realizada a 60˚C usando polimerase Bst 2.0 warmstart. FIG. 7B - é um gráfico que mostra a quantificação da FIG. 119A. FIG. 7C - é um gráfico que mostra os resultados de NEAR combinado com CRISPR-SHERLOCK realizado a 60˚C usando polimerase de partida a quente Bst 2.0.
[0037] FIG. 8A - é um gráfico que mostra a amplificação NEAR realizada a 37˚C com Sequenase 2.0 no ponto de tempo de 16 min. FIG. 8B - é um gráfico que mostra a amplificação NEAR realizada a 37˚C com Sequenase 2.0 no ponto final
[0038] FIG. 9 - é um esquema de CRISPR-NEAR combinado com detecção SHERLOCK.
[0039] As figuras aqui são apenas para fins ilustrativos e não são necessariamente desenhadas em escala.
DESCRIÇÃO DETALHADA DAS MODALIDADES EXEMPLIFICATIVAS Definições Gerais
[0040] Salvo definição em contrário, os termos técnicos e científicos usados neste documento têm o mesmo significado tal como comumente compreendendo por um indivíduo moderadamente versado na técnica a que pertence a presente divulgação. Definições de termos e técnicas comuns em biologia molecular podem ser encontradas em Molecular Cloning: A Laboratory Manual,2nd edition (1989) (Sambrook, Fritsch, and Maniatis); Molecular Cloning: A Laboratory Manual,4th edition (2012) (Green and Sambrook); Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al.
eds.); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboratory Manual, 2nd edition 2013 (E.A. Greenfield ed.); Animal Cell Culture (1987) (R.I. Freshney, ed.); Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223); Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829); Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710); Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994), March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992); e Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2nd edition (2011) .
[0041] Conforme usado neste documento, as formas singulares "um", "uma" e "o/a" incluem as formas do plural referentes, a menos que o contexto indique claramente o contrário.
[0042] O termo "opcional" ou "opcionalmente" significa que o evento ou circunstância descrito posteriormente pode ou pode não ocorrer, e que a descrição inclui instâncias em que ocorre o referido acontecimento ou circunstância e instâncias onde isso não acontece.
[0043] A recitação de intervalos numéricos por pontos finais inclui todos os números e frações incluídos nos respectivos intervalos, assim como os pontos finais recitados.
[0044] Os termos "cerca de" ou "aproximadamente", conforme utilizados neste documento, quando se referem a um valor mensurável, como um parâmetro, uma quantidade, uma duração temporal e similares, destinam-se a abranger variações de e a partir do valor especificado, como variações de +/-10% ou menos, +/-5% ou menos, +/-1% ou menos e +/-0.1% ou menos do e do valor especificado, na medida em que tais variações sejam apropriadas para executar na invenção divulgada. Deve ser entendido que o valor ao qual o modificador "aproximadamente" ou "aproximadamente" se refere também é específico e preferencialmente divulgado.
[0045] Como utilizado neste documento, uma "amostra biológica" pode conter células inteiras e / ou células vivas e / ou detritos celulares. A amostra biológica pode conter (ou ser derivada de) um “fluido corporal”. A presente invenção abrange modalidades em que o fluido corporal é selecionado de fluido amniótico, humor aquoso, humor vítreo, bile, soro sanguíneo, leite materno, líquido cefalorraquidiano, cerúmen (cera do ouvido), quilo, quimo, endolinfa, perilinfa, exsudatos, fezes, ejaculação feminina, ácido gástrico, suco gástrico, linfa, muco (incluindo drenagem nasal e catarro), líquido pericárdico, líquido peritoneal, líquido pleural, pus, reuma, saliva, sebo (óleo da pele), sêmen, expectoração, líquido sinovial, suor, lágrimas, urina, secreção vaginal, vômito e misturas de um ou mais dos mesmos. As amostras biológicas incluem culturas de células, fluidos corporais, culturas de células de fluidos corporais. Os fluidos corporais podem ser obtidos de um organismo mamífero, por exemplo, por punção ou outros procedimentos de coleta ou amostragem.
[0046] Os termos "sujeito", "indivíduo" e "paciente" são usados indistintamente neste documento para se referir a um vertebrado, de preferência um mamífero, mais preferencialmente um humano. Os mamíferos incluem, mas não estão limitados a, murinos, símios, humanos, animais de fazenda, animais de esporte e animais de estimação. Tecidos, células e sua progênie de uma entidade biológica obtida in vivo ou cultivada in vitro também estão incluídos.
[0047] "C2c2" agora é referido como "Cas13a" e os termos são usados de forma intercambiável aqui, a menos que indicado de outra forma. Os termos "Grupo 29", "Grupo 30" e Cas13b são usados de forma intercambiável neste documento.
Os termos "Cpf1" e "Cas12a" são usados de forma intercambiável neste documento. Os termos "C2c1" e "Cas12b" são usados de forma intercambiável neste documento.
[0048] Várias modalidades são descritas a seguir.
Deve-se notar que as modalidades específicas não pretendem ser uma descrição exaustiva ou uma limitação aos aspectos mais amplos discutidos neste documento. Um aspecto descrito em conjunto com uma modalidade particular não está necessariamente limitado a essa modalidade e pode ser praticado com qualquer/quaisquer outra(s) modalidade(s).
Referência ao longo deste relatório descritivo a "a modalidade", "uma modalidade", "uma de modalidade de exemplo", significa que um determinado recurso, estrutura ou característica descrita em conexão com a modalidade está incluído em pelo menos uma modalidade da presente invenção.
Assim, as aparências das frases “na modalidade” ou “em uma modalidade” em vários lugares ao longo deste relatório não são necessariamente todas referentes à mesma modalidade.
Além disso, os recursos, estruturas ou características específicas podem ser combinados de forma apropriada em uma ou mais modalidades. Além disso, embora algumas modalidades aqui descritas incluam algumas, mas não outras, características incluídas em outras modalidades, combinações de características de diferentes modalidades devem estar dentro do escopo da invenção. Por exemplo, nas reivindicações anexas, qualquer uma das modalidades reivindicadas pode ser usada em qualquer combinação.
[0049] Todas as publicações, documentos de patentes publicados e pedidos de patente citados aqui estão incorporados neste documento por referência na mesma medida como se cada publicação, documento de patente publicado ou pedido de patente individual fosse indicado especificamente e individualmente para ser incorporado por referência.
VISÃO GERAL
[0050] As modalidades aqui divulgadas fornecem métodos de amplificação de um ácido nucleico alvo sob condições isotérmicas utilizando enzimas de corte à base de CRISPR-Cas.
[0051] Em outro aspecto, as modalidades aqui divulgadas são direcionadas a um sistema para amplificar e / ou detectar um ácido nucleico alvo de fita dupla e fita simples em uma amostra. Em certas modalidades, o sistema compreende um sistema CRISPR de amplificação, uma polimerase, um par de iniciadores e, opcionalmente, um sistema de detecção para detectar a amplificação do ácido nucleico alvo. Em certas modalidades de exemplo, o sistema pode compreender ainda reagentes para converter o ácido nucleico de fita simples alvo em um ácido nucleico de fita dupla.
[0052] Em ainda outro aspecto, as modalidades aqui divulgadas são direcionadas a um kit para amplificar e / ou detectar um ácido nucleico alvo de fita dupla ou fita simples em uma amostra. Em certas modalidades exemplificativas, o kit pode compreender reagentes para purificar o ácido nucleico de fita dupla ou fita simples na amostra e um conjunto de instruções para uso.
Sistemas de Amplificação
[0053] Um sistema para amplificar um ácido nucleico de fita dupla alvo em uma amostra é fornecido. O sistema compreende um sistema CRISPR de amplificação, uma polimerase e um par de iniciadores. Em modalidades, o sistema pode incluir opcionalmente um sistema de detecção, permitindo a detecção do ácido nucleico alvo.
[0054] O sistema CRISPR de amplificação compreende um primeiro e um segundo complexo CRISPR / Cas. Cada complexo CRISPR / Cas compreende uma nickase baseada em Cas e uma molécula guia que se liga preferencialmente, é específica para, por exemplo, ter complementaridade suficiente para se ligar, a molécula alvo, guiando o complexo CRISPR / Cas para o ácido nucleico alvo. O sistema de amplificação compreende uma polimerase; um par de iniciadores compreendendo um primeiro e segundo iniciadores para a mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar a um primeiro local alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia e o segundo iniciador compreendendo uma porção que é complementar a um segundo local de ácido nucleico alvo e uma porção que compreende um sítio de ligação para a segunda molécula guia; e opcionalmente um sistema de detecção para detectar a amplificação do ácido nucleico alvo. O primeiro e o segundo locais podem estar na mesma fita, caso em que a nickase à base de Cas cortaria na mesma fita, ou o primeiro e o segundo locais podem estar em duas fitas diferentes.
Sistema CRISPR
[0055] Os sistemas CRISPR fornecidos neste documento compreendem um primeiro e um segundo complexo CRISPR-Cas. O primeiro complexo CRISPR / Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR / Cas para um primeiro local do ácido nucleico alvo, o segundo complexo CRISPR/Cas compreendendo uma segunda nickase à base de Cas e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para um segundo local do ácido nucleico alvo;
[0056] Em um aspecto, o primeiro complexo CRISPR / Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia guia o primeiro complexo CRISPR / Cas para uma primeira fita do ácido nucleico alvo e o segundo complexo CRISPR / Cas compreendendo um segundo Cas à base de nickase e segunda molécula guia que guia o segundo complexo CRISPR / Cas para uma segunda fita do ácido nucleico alvo.
Em um aspecto, o primeiro complexo CRISPR / Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR / Cas para um primeiro local em uma primeira fita do ácido nucleico alvo, o segundo complexo CRISPR/Cas compreendendo uma segunda nickase à base de Cas e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para um segundo local na primeira fita do ácido nucleico alvo.
[0057] Em geral, um sistema CRISPR-Cas ou CRISPR como usado aqui e em documentos como WO 2014/093622 (PCT/US2013/074667), refere-se coletivamente a transcritos e outros elementos envolvidos na expressão ou direcionamento da atividade de genes associados ao CRISPR ("Cas"), incluindo sequências que codificam um gene Cas, uma sequência tracr (CRISPR de ativação trans) (por exemplo, tracrRNA ou um componente parcial ativo tracrRNA), uma sequência tracr-mate (abrangendo uma “repetição direta” e uma repetição direta parcial processada por tracrRNA no contexto de um sistema CRISPR endógeno), uma sequência guia (também conhecida como “espaçador” no contexto de um sistema CRISPR endógeno) ou "RNA (s)" como esse termo é aqui usado (por exemplo, RNA (s) para guiar Cas, como Cas9, por exemplo, CRISPR RNA e RNA de transativação (tracr) ou um único RNA guia (sgRNA) (RNA quimérico)) ou outras sequências e transcritos de um locus CRISPR. Em geral, um sistema CRISPR é caracterizado por elementos que promovem a formação de um complexo CRISPR no sítio de uma sequência alvo (também chamado de protoespaçador no contexto de um sistema CRISPR endógeno). Quando a proteína CRISPR é uma proteína Cpf1, não é necessário um tracrRNA.
[0058] Como utilizado neste documento, o termo "Cas" geralmente se refere a uma proteína efetora (modificada) do sistema ou complexo CRISPR / Cas e pode ser, sem limitação, um Cas9 (modificado), um Cas12 (modificado) (por exemplo, Cas12a "Cpf1", Cas12b "C2c1," Cas12c "C2c3"), um Cas13 (modificado) (por exemplo, Cas13a "C2c2", Cas 13b "Grupo 29/30", Cas13c, Cas13d) O termo "Cas" pode ser usado aqui de forma intercambiável com os termos "proteína CRISPR", "proteína CRISPR / Cas", "efetor CRISPR", "efetor CRISPR /
Cas", "enzima CRISPR", "enzima CRISPR / Cas" e semelhantes, a menos que de outra forma aparente, como por referência específica e exclusiva a Cas9. Deve ser entendido que o termo "proteína CRISPR" pode ser usado indistintamente com "enzima CRISPR", independentemente de a proteína CRISPR ter sido alterada, como atividade enzimática aumentada ou diminuída (ou nenhuma), em comparação com a proteína CRISPR de tipo selvagem. Da mesma forma, como utilizado neste documento, em certas modalidades, quando apropriado e que será aparente para o versado na técnica, o termo "nuclease" pode se referir a uma nuclease modificada em que a atividade catalítica foi alterada, tal como ter atividade de nuclease aumentada ou diminuída, ou nenhuma atividade de nuclease, bem como atividade de nickase, bem como nuclease modificada de outra forma como aqui definido em outro lugar, a menos que de outra forma aparente, tal como por referência específica e exclusiva à nuclease não modificada.
[0059] Em certas modalidades de acordo com a presente invenção, a proteína CRISPR-Cas é preferencialmente mutada em relação a uma enzima de tipo selvagem correspondente, de modo que a proteína CRISPR-Cas mutada não tem a capacidade de clivar uma ou ambas as fitas de DNA de um locus alvo contendo uma sequência alvo.
[0060] Em certas modalidades, a proteína CRISPR-Cas é uma proteína mutada de CRISPR-Cas que cliva apenas uma fita de DNA, isto é, uma nickase. Em certas modalidades, a nickase cliva dentro da sequência não alvo, isto é, a sequência que está na fita de DNA oposta da sequência alvo e que está a 3' da sequência PAM.
[0061] A invenção contempla métodos de uso de duas ou mais nickases, em particular uma abordagem dupla ou de dupla nickase. Isso resulta no DNA alvo sendo ligado por duas Cas nickases. Além disso, também se prevê que diferentes ortólogos possam ser usados, por exemplo, uma Cas nickase em uma fita (por exemplo, a fita codificadora) do DNA e um ortólogo na fita de DNA não codificante ou oposta, ou segundo local alvo de DNA. O ortólogo pode ser, mas não está limitado a, uma Cas9 nickase, como uma SaCas9 nickase ou uma SpCas9 nickase. Pode ser vantajoso usar dois ortólogos diferentes que requerem PAMs diferentes e também podem ter requisitos de guia diferentes, permitindo assim um maior controle para o usuário.
Proteína CRISPR-Cas
[0062] A molécula de ácido nucleico que codifica uma proteína efetora CRISPR, é vantajosamente proteína efetiva CRISPR otimizada para códons. Um exemplo de uma sequência otimizada por códon é, neste caso, uma sequência otimizada para expressão em eucariotos, por exemplo, humanos (isto é, sendo otimizado para expressão em humanos), ou para outro eucarioto, animal ou mamífero como aqui discutido; ver, por exemplo, sequência otimizada por códon humano SaCas9 em WO 2014/093622 (PCT/US2013/074667). Embora isso seja preferido, será apreciado que outros exemplos são possíveis e é conhecida a otimização de códons para uma espécie hospedeira que não seja humana, ou para a otimização de códons para órgãos específicos. Em algumas modalidades, uma sequência de codificação enzimática que codifica uma proteína efetora CRISPR é um códon otimizado para expressão em células específicas, como células eucarióticas. As células eucarióticas podem ser aquelas de ou derivadas de um organismo específico, como uma planta ou um mamífero, incluindo mas não se limitando a eucariotos ou animais ou mamíferos humanos ou não humanos, como aqui discutido, por exemplo, camundongo, rato, coelho, cão, gado ou mamífero ou primata não humano. Em algumas modalidades, processos para modificar a identidade genética da linhagem germinal de seres humanos e/ou processos para modificar a identidade genética de animais que possam causar-lhes sofrimento sem qualquer benefício médico substancial para o homem ou animal, e também animais resultantes de tais processos, podem ser excluídos.
Em geral, a otimização por códon refere-se a um processo de modificação de uma sequência de ácido nucleico para expressão intensificada nas células hospedeiras de interesse, substituindo pelo menos um códon (por exemplo, aproximadamente ou mais que 1, 2, 3, 4, 5, 10, 15 , 20, 25,
50 ou mais códons) da sequência nativa com códons que são usados com mais ou mais frequência nos genes dessa célula hospedeira, mantendo a sequência de aminoácidos nativa.
Várias espécies exibem viés particular para certos códons de um aminoácido particular. O viés de utilização códons frequentemente se correlaciona com a eficiência da tradução do RNA mensageiro (mRNA), que por sua vez acredita-se que seja dependente, inter alia, das propriedades dos códons sendo traduzidos e a disponibilidade de moléculas de RNA de transferência (tRNA) particulares. A predominância de tRNAs selecionados em uma célula é geralmente um reflexo dos códons usados com mais frequência na síntese de peptídeos.
Consequentemente, os genes podem ser adaptados para a expressão genética ideal em um determinado organismo com base na otimização por códon. As tabelas de uso de códon estão prontamente disponíveis, por exemplo, no “Codon Usage Database” disponível em kazusa.orjp/codon/e essas tabelas podem ser adaptadas de várias maneiras. Ver Nakamura, Y., et al. “Codon usage tabulated from the international DNA sequence databases: status for the year 2000” Nucl. Acids Res. 28:292 (2000). Também estão disponíveis algoritmos de computador para otimizar por códon uma sequência específica para expressão em uma célula hospedeira específica, como Gene Forge (Aptagen; Aptus; Jacobus, PA). Em algumas modalidades, um ou mais códons (por exemplo, 1, 2, 3, 4, 5,
10, 15, 20, 25, 50 ou mais, ou todos os códons) em uma sequência que codifica um Cas corresponde ao códon mais frequentemente usado para um aminoácido específico.
[0063] Em certas modalidades, os métodos descritos aqui podem compreender o fornecimento de uma célula transgênica Cas, na qual um ou mais ácidos nucleicos que codificam um ou mais RNAs guia são fornecidos ou introduzidos operacionalmente conectados na célula com um elemento regulador compreendendo um promotor de um ou mais genes de interesse. Como utilizado neste documento, o termo "célula transgênica Cas" refere-se a uma célula, como uma célula eucariótica, na qual um gene Cas foi genomicamente integrado.
A natureza, tipo ou origem da célula não são particularmente limitantes de acordo com a presente invenção. Também a maneira como o transgene Cas é introduzido na célula pode variar e pode ser qualquer método como é conhecido na técnica. Em certas modalidades, a célula transgênica Cas é obtida através da introdução do transgene Cas em uma célula isolada. Em certas outras modalidades, a célula transgênica Cas é obtida isolando células de um organismo transgênico Cas. Por meio de exemplo, e sem limitação, a célula transgênica Cas, conforme aqui referida, pode ser derivada de um eucarioto transgênico Cas, tal como um eucarioto imune a Cas. É feita referência ao WO 2014/093622 (PCT/US13/74667), aqui incorporado por referência. Os métodos das Publicações de Patente US Nos. 20120017290 e 20110265198 atribuídos à Sangamo BioSciences, Inc. direcionados para atingir o locus Rosa podem ser modificados para utilizar o sistema Cas CRISPR da presente invenção. Os métodos da Publicação de Patente U.S. 20130236946 atribuída à Cellectis direcionada para direcionar o locus Rosa também podem ser modificados para utilizar o sistema Cas CRISPR da presente invenção. Por meio de outro exemplo, é feita referência a Platt et. al. (Cell; 159 (2): 440-455 (2014)), descrevendo um camundongo knock- in Cas9, que é incorporado aqui por referência. O transgene Cas pode ainda compreender uma cassete Lox-Stop-polyA-Lox (LSL), tornando assim a expressão de Cas induzível por Cre recombinase. Alternativamente, a célula transgênica Cas pode ser obtida através da introdução do transgene Cas em uma célula isolada. Os sistemas de distribuição para transgenes são bem conhecidos na técnica. Por meio de exemplo, o transgene Cas pode ser distribuído, por exemplo, em células eucarióticas por meio de vetor (por exemplo, AAV, adenovírus, lentivírus) e / ou distribuição de partículas e / ou nanopartículas, como também aqui descrito em outro lugar.
[0064] Será entendido pelo especialista que a célula, como a célula transgênica Cas, como aqui referida pode compreender outras alterações genômicas, além de ter um gene Cas integrado ou as mutações decorrentes da ação específica da sequência de Cas quando complexada com RNA capaz de guiar Cas para um locus de destino.
[0065] Em certos aspectos, a invenção envolve vetores, por exemplo, para distribuir ou introduzir em uma célula Cas e / ou RNA capaz de guiar Cas para um locus alvo (isto é, RNA guia), mas também para propagar esses componentes (por exemplo, em células procarióticas). Um usado aqui, um "vetor" é uma ferramenta que permite ou facilita a transferência de uma entidade de um ambiente para outro. "Vetor" refere-se a um replicon, tal como um plasmídeo, fago ou cosmídeo, no qual outro segmento de DNA pode ser inserido de modo a realizar a replicação do segmento inserido. Geralmente, um vetor é capaz de replicação quando associado aos elementos de controle apropriados. Conforme usado no presente documento, o termo "vetor" se refere a uma molécula de ácido nucleico com capacidade para transportar outro ácido nucleico ao qual foi ligada. Os vetores incluem, mas não estão limitados a, moléculas de ácido nucleico que são de fita simples, de fita dupla ou parcialmente de fita dupla; moléculas de ácido nucleico que compreendem uma ou mais extremidades livres, sem extremidades livres (por exemplo, circulares); moléculas de ácido nucleico que compreendem DNA, RNA ou ambos; e outras variedades de polinucleotídeos conhecidos na técnica. Um tipo de vetor é um "plasmídeo", que se refere a uma alça circular de DNA de fita dupla no qual segmentos adicionais de DNA podem ser inseridos, como por técnicas convencionais de clonagem molecular. Outro tipo de vetor é um vetor viral, em que seqüências de DNA ou RNA derivadas de vírus estão presentes no vetor para serem empacotadas em um vírus (por exemplo, retrovírus, retrovírus com defeito de replicação, adenovírus, adenovírus com defeito de replicação e vírus adeno-associados (AAVs)). Os vetores virais também incluem polinucleotídeos transportados por um vírus para transfecção para uma célula hospedeira. Certos vetores têm capacidade para replicação autônoma numa célula hospedeira na qual os mesmos são introduzidos (por exemplo, vetores bacterianos que têm uma origem bacteriana de replicação e vetores de mamíferos epissômicos). Outros vetores (por exemplo, vetores de mamíferos não epissômicos) são integrados ao genoma de uma célula hospedeira mediante introdução à célula hospedeira, e assim são replicados juntamente com o genoma hospedeiro. Além disso, certos vetores são capazes de direcionar a expressão de genes aos quais estão ligados operativamente. Estes vetores são referidos neste documento como "vetores de expressão". Em geral, vetores de expressão útil nas técnicas de DNA recombinante são frequentemente sob a forma de plasmídeos.
[0066] Os vetores de expressão recombinantes podem compreender um ácido nucleico da invenção em uma forma adequada para a expressão do ácido nucleico em uma célula hospedeira, o que significa que os vetores de expressão recombinantes incluem um ou mais elementos reguladores, que podem ser selecionados com base no hospedeiro células a serem usadas para expressão, que está operacionalmente ligada à sequência de ácido nucleico a ser expressa.
Dentro de um vetor de expressão recombinante, "operacionalmente ligados"
destina-se a dizer que a sequência de nucleotídeos de interesse está relacionada com o(s) elemento(s)
regulador(es) de uma forma que permite a expressão da sequência de nucleotídeos (por exemplo, em um sistema de transcrição e tradução in vitro ou em uma célula hospedeira quando o vetor é introduzido na célula hospedeira). No que diz respeito aos métodos de recombinação e clonagem, é mencionado o pedido de patente U.S. 10/815.730, publicado em
2 de setembro de 2004 como US 2004-0171156 A1, cujo conteúdo é aqui incorporado por referência na sua totalidade.
Assim,
as modalidades divulgadas neste documento também podem compreender células transgênicas compreendendo o sistema efetor CRISPR.
Em certas modalidades exemplificativas, a célula transgênica pode funcionar como um volume distinto individual.
Em outras palavras, amostras compreendendo um construto de mascaramento podem ser distribuídos a uma célula, por exemplo, em uma vesícula de distribuição adequada e se o alvo estiver presente na vesícula de distribuição, o efetor CRISPR é ativado e um sinal detectável é gerado.
[0067] O(s) vetor(es) pode(m) incluir o(s) elemento(s) regulador(es), por exemplo, promotor(es). O(s) vetor(es) podem compreender sequências de codificação de Cas e / ou uma única, mas possivelmente também podem compreender pelo menos 3 ou 8 ou 16 ou 32 ou 48 ou 50 sequências de codificação de RNA(s) guia (por exemplo, sgRNAs), tais como 1-2, 1-3, 1-4 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-8, 3-16, 3- 30, 3-32 , 3-48, 3-50 RNA(s) (por exemplo, sgRNAs). Em um único vetor, pode haver um promotor para cada RNA (por exemplo, sgRNA), vantajosamente quando houver até cerca de 16 RNA (s); e, quando um único vetor fornece mais de 16 RNAs, um ou mais promotores podem conduzir a expressão de mais de um RNAs, por exemplo, quando existem 32 RNAs, cada promotor pode direcionar a expressão de dois RNAs e, quando houver 48 RNAs, cada promotor pode direcionar a expressão de três RNAs.
Por aritmética simples e protocolos de clonagem bem estabelecidos e os ensinamentos nesta divulgação, um versado na técnica pode prontamente praticar a invenção quanto ao(s) RNA(s) para um exemplo de vetor adequado, como AAV, e um promotor adequado, como o promotor U6. Por exemplo, o limite de embalagem do AAV é ~4.7 kb. O comprimento de um único U6- gRNA (mais sítios de restrição para clonagem) é 361 pb.
Portanto, o versado pode facilmente ajustar cerca de 12-16,
por exemplo, 13 cassetes U6-gRNA em um único vetor.
Isso pode ser montado por qualquer meio adequado, como uma estratégia de portão dourado usada para a montagem do TALE
(genome-engineering.org/taleffectors/). O versado também pode usar uma estratégia de guia em tandem para aumentar o número de U6-gRNAs em aproximadamente 1,5 vezes, por exemplo,
para aumentar de 12-16, por exemplo, 13 para aproximadamente
18-24, por exemplo, cerca de 19 U6-gRNAs.
Portanto, um versado na técnica pode facilmente atingir aproximadamente
18-24, por exemplo, cerca de 19 RNAs promotores, por exemplo,
U6-gRNAs em um único vetor, por exemplo, um vetor AAV.
Um outro meio para aumentar o número de promotores e RNAs em um vetor é usar um único promotor (por exemplo, U6) para expressar uma matriz de RNAs separados por sequências cliváveis.
E ainda outros meios para aumentar o número de
RNAs promotores em um vetor é expressar uma matriz de RNAs promotores separados por sequências cliváveis no íntron de uma sequência ou gene codificador; e, nesse caso, é vantajoso usar um promotor da polimerase II, que pode ter expressão aumentada e permitir a transcrição de RNA longo de maneira específica do tecido (consulte, por exemplo,
nar.oxfordjournals.org/content/34/7/e53.short e nature.com/mt/journal/v16/n9/abs/mt2008144a.html). Em uma modalidade vantajosa, o AAV pode empacotar o gRNA em tandem
U6 visando até cerca de 50 genes.
Por conseguinte, a partir do conhecimento na técnica e dos ensinamentos desta divulgação, o versado pode criar e usar prontamente vetor(es), por exemplo, um único vetor, expressando múltiplos RNAs ou guias sob o controle ou operacionalmente ou funcionalmente ligados a um ou mais promotores - especialmente quanto ao número de RNAs ou guias discutidos neste documento, sem qualquer experimentação indevida.
[0068] As sequências de codificação de RNA(s) guia e / ou sequências de codificação de Cas, podem ser funcionalmente ou operativamente ligadas a elemento(s) regulador(es) e, portanto, o(s) elemento(s) regulador(es) dirigem a expressão. O(s) promotor(es) pode(m) ser promotor(es) constitutivo(s) e/ou promotor(es) condicional(is) e/ou promotor(es) induzível(is) e/ou promotor(es) específico(s) de tecido. O promotor pode ser selecionado do grupo que consiste em polimerases de RNA, pol I, pol II, pol III, T7, U6, H1, promotor LTR retroviral do vírus do sarcoma de Rous (RSV), o promotor do citomegalovírus (CMV), o promotor SV40, o promotor da di-hidrofolato redutase, o promotor da β-actina, o promotor da fosfoglicerol quinase (PGK) e o promotor EF1α. Um promotor vantajoso é o promotor é U6.
[0069] A proteína CRISPR-Cas pode ser modificada adicionalmente. Como utilizado neste documento, o termo "modificado" em relação a uma proteína CRISPR-Cas geralmente se refere a uma proteína CRISPR-Cas tendo uma ou mais modificações ou mutações (incluindo mutações pontuais, truncamentos, inserções, deleções, quimeras, proteínas de fusão, etc. ) em comparação com a proteína Cas de tipo selvagem da qual é derivada. Por derivado entende-se que a enzima derivada é amplamente baseada, no sentido de ter um alto grau de homologia de sequência com uma enzima de tipo selvagem, mas que foi mutada (modificada) de alguma forma como é conhecido na técnica ou como aqui descrito.
[0070] As modificações adicionais da proteína CRISPR-Cas podem ou não causar uma funcionalidade alterada.
Por meio de exemplo, e em particular com referência à proteína CRISPR-Cas, as modificações que não resultam em uma funcionalidade alterada incluem, por exemplo, otimização de códons para expressão em um hospedeiro particular, ou fornecer a nuclease com um marcador particular (por exemplo, para visualização). As modificações podem resultar em funcionalidade alterada também podem incluir mutações, incluindo mutações pontuais, inserções, deleções, truncamentos (incluindo nucleases divididas), etc., bem como nucleases quiméricas (por exemplo, compreendendo domínios de diferentes ortólogos ou homólogos) ou proteínas de fusão. As proteínas de fusão podem incluir, sem limitação, por exemplo, fusões com domínios heterólogos ou domínios funcionais (por exemplo, sinais de localização, domínios catalíticos, etc.).
Em certas modalidades, várias modificações diferentes podem ser combinadas (por exemplo, uma nuclease mutada que é cataliticamente inativa e que ainda é fundida a um domínio funcional, tal como, por exemplo, para induzir a metilação do DNA ou outra modificação de ácido nucleico, tal como incluindo, sem limitação, uma quebra (por exemplo, por uma nuclease diferente (domínio)), uma mutação, uma deleção, uma inserção, uma substituição, uma ligação, uma digestão, uma quebra ou uma recombinação). Como utilizado neste documento,
"funcionalidade alterada" inclui, sem limitação, uma especificidade alterada (por exemplo, reconhecimento de alvo alterado, especificidade aumentada (por exemplo, proteínas
Cas "intensificada") ou diminuída ou reconhecimento de PAM alterado), atividade alterada (por exemplo, atividade catalítica aumentada ou diminuída, incluindo nucleases ou nickases cataliticamente inativas) e / ou estabilidade alterada (por exemplo, fusões com domínios de desestabilização). Os domínios heterólogos adequados incluem, sem limitação, uma nuclease, uma ligase, uma proteína de reparo, uma metiltransferase, (viral) integrase,
uma recombinase, uma transposase, um argonauta, uma citidina desaminase, um retron, um íntron do grupo II, uma fosfatase,
uma fosforilase, uma sulfurilase, uma quinase, uma polimerase, uma exonuclease, etc.
Exemplos de todas essas modificações são conhecidos na técnica.
Será entendido que uma nuclease "modificada", conforme referido neste documento, e em particular um sistema ou complexo de Cas "modificado" ou CRISPR-Cas "modificado" de preferência ainda tem a capacidade de interagir ou se ligar ao ácido polinucleico (por exemplo, em complexo com a molécula guia).
Tal proteína Cas modificada pode ser combinada com a proteína desaminase ou domínio ativo da mesma, conforme descrito neste documento.
[0071] Em certas modalidades, a proteína CRISPR-Cas pode compreender uma ou mais modificações resultando em atividade e / ou especificidade aumentadas, como a inclusão de resíduos mutantes que estabilizam a fita direcionada ou não direcionada (por exemplo, eCas9; “Rationally engineered Cas9 nucleases with improved specificity”, Slaymaker et al.
(2016), Science, 351 (6268):84-88, aqui incorporado em sua totalidade por referência). Em certas modalidades, a atividade alterada ou modificada da proteína CRISPR engenheirada compreende maior eficiência de direcionamento ou diminuição da ligação fora do alvo. Em certas modalidades, a atividade alterada da proteína CRISPR engenheirada compreende a atividade de clivagem modificada. Em certas modalidades, a atividade alterada compreende atividade de clivagem aumentada em relação aos loci polinucleotídicos alvo. Em certas modalidades, a atividade alterada compreende atividade de clivagem diminuída em relação aos loci polinucleotídicos alvo.
Em certas modalidades, a atividade alterada compreende atividade de clivagem diminuída em relação aos loci polinucleotídicos fora do alvo.
Em certas modalidades, a atividade alterada ou modificada da nuclease modificada compreende a cinética de helicase alterada.
Em certas modalidades, a nuclease modificada compreende uma modificação que altera a associação da proteína com a molécula de ácido nucleico compreendendo RNA (no caso de uma proteína Cas), ou uma fita dos loci polinucleotídicos alvo,
ou uma fita de polinucleotídeo fora do alvo loci.
Em um aspecto da invenção, a proteína CRISPR projetada compreende uma modificação que altera a formação do complexo CRISPR.
Em certas modalidades, a atividade alterada compreende atividade de clivagem aumentada em relação aos loci polinucleotídicos fora do alvo.
Por conseguinte, em certas modalidades, há maior especificidade para loci polinucleotídicos alvo em comparação com loci polinucleotídicos fora do alvo.
Em outras modalidades, há especificidade reduzida para loci polinucleotídicos alvo em comparação com loci polinucleotídicos fora do alvo.
Em certas modalidades, as mutações resultam em efeitos fora do alvo diminuídos (por exemplo, clivagem ou propriedades de ligação, atividade ou cinética), como no caso de proteínas
Cas, por exemplo, resultando em uma tolerância mais baixa para incompatibilidades entre o RNA alvo e guia.
Outras mutações podem levar a efeitos fora do alvo aumentados (por exemplo, clivagem ou propriedades de ligação, atividade ou cinética). Outras mutações podem levar a efeitos aumentados ou reduzidos no alvo (por exemplo, clivagem ou propriedades de ligação, atividade ou cinética). Em certas modalidades, as mutações resultam em atividade de helicase alterada (por exemplo, aumento ou diminuição), associação ou formação do complexo de nuclease funcional (por exemplo, complexo CRISPR-Cas). Em certas modalidades, as mutações resultam em um reconhecimento PAM alterado, ou seja, um PAM diferente pode ser (adicionalmente ou em alternativa) ser reconhecido, em comparação com a proteína Cas não modificada (ver, por exemplo, “Engineered CRISPR-Cas9 nucleases with altered PAM specificities”, Kleinstiver et al. (2015), Nature, 523 (7561): 481-485, aqui incorporado por referência na sua totalidade). Mutações particularmente preferidas incluem resíduos carregados positivamente e / ou resíduos conservados (evolutivos), tais como resíduos carregados positivamente conservados, a fim de intensificar a especificidade. Em certas modalidades, esses resíduos podem ser mutados para resíduos não carregados, como a alanina.
Nickases à base de Cas9
[0072] Em certas modalidades, a nickase CRISPR é uma nickase à base de Cas9. O gene Cas9 é encontrado em vários genomas bacterianos diversos, tipicamente no mesmo local com os genes cas1, cas2 e cas4 e um cassete CRISPR. Além disso, a proteína Cas9 contém uma região C-terminal prontamente identificável que é homóloga ao transposon ORF-B e inclui uma nuclease semelhante a RuvC ativa, uma região rica em arginina.
[0073] Em modalidades particulares, a nickase é uma Cas9 nickase de um organismo de um gênero que compreende Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, ou Corynebacte.
[0074] Em modalidades particulares, a nickase é uma Cas9 nickase de um organismo de um gênero que compreende Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium ou Acidaminococcus.
[0075] Em outras modalidades particulares, a Cas9 nickase é de um organismo selecionado de S. mutans, S.
agalactiae, S. equisimilis, S. sanguinis, S. pneumonia; C.
jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N. gonorrhoeae; L.
monocytogenes, L. ivanovii; C. botulinum, C. difficile, C.
tetani, C. sordellii. Em modalidades particulares, a nickase é uma Cas9 nickase de um organismo de Streptococcus pyogenes, Staphylococcus aureus, ou Streptococcus thermophilus Cas9.
[0076] A nickase pode compreender uma proteína quimérica compreendendo um primeiro fragmento de uma primeira proteína efetora (por exemplo, um Cas9) ortólogo e um segundo fragmento de um segundo ortólogo de proteína efetora (por exemplo, um Cas9), e em que o primeiro e o segundo ortólogos de proteína efetora são diferentes. Pelo menos um dos primeiro e segundo ortólogos de proteínas efetoras (por exemplo, um Cas9) pode compreender uma proteína efetora (por exemplo, um Cas9) de um organismo compreendendo Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium ou Acidaminococcus; por exemplo, uma proteína efetora quimérica compreendendo um primeiro fragmento e um segundo fragmento em que cada um do primeiro e do segundo fragmentos é selecionado de um Cas9 de um organismo que compreende Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium or Acidaminococcus em que o primeiro e o segundo fragmentos não são da mesma bactéria; por exemplo, uma proteína efetora quimérica compreendendo um primeiro fragmento e um segundo fragmento em que cada um do primeiro e do segundo fragmentos é selecionado de um Cas9 de S. mutans, S. agalactiae, S. equisimilis, S. sanguinis, S.
pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N.
gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C.
difficile, C. tetani, C. sordellii; Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium
GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens and Porphyromonas macacae, em que o primeiro e o segundo fragmentos não são os primeiros e segundos fragmentos.
[0077] Em uma modalidade mais preferida, a Cas9 nickase é derivada de uma espécie bacteriana selecionada de Streptococcus pyogenes, Staphylococcus aureus, ou Streptococcus thermophilus Cas9. Em certas modalidades, o Cas9p é derivado de uma espécie bacteriana selecionada de Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens and Porphyromonas macacae. Em certas modalidades, o Cas9p é derivado de uma espécie bacteriana selecionada de Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020.
Em certas modalidades, a proteína efetora é derivada de uma subespécie de Francisella tularensis 1, incluindo, mas não limitado a Francisella tularensis subsp. Novicida.
[0078] Em modalidades particulares, o homólogo ou ortólogo de Cas9 conforme referido neste documento tem uma homologia ou identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como, por exemplo, pelo menos 95% com Cas9. Em outras modalidades, o homólogo ou ortólogo de Cas9, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o Cas9 de tipo selvagem. Quando o Cas9 possui uma ou mais mutações (mutadas), o homólogo ou ortólogo do referido Cas9, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o Cas9 mutado.
[0079] Em uma modalidade, a Cas9 nickase pode ser um ortólogo de um organismo de um gênero que inclui, mas não está limitado a Streptococcus sp. ou Staphilococcus sp.; em modalidades particulares, a proteína Cas9 pode ser um ortólogo de um organismo de uma espécie que inclui, mas não está limitada a Streptococcus pyogenes, Staphylococcus aureus ou Streptococcus thermophilus Cas9. Em modalidades particulares, o homólogo ou ortólogo de Cas9p, conforme referido neste documento, tem uma homologia ou identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com uma ou mais das sequências Cas9 aqui divulgadas. Em outras modalidades, o homólogo ou ortólogo de Cas9, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o SpCas9, SaCas9 ou StCas9 de tipo selvagem.
[0080] Em modalidades particulares, a Cas9 nickase da invenção tem uma homologia ou identidade de sequência de pelo menos 60%, mais particularmente pelo menos 70, como pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, por exemplo, pelo menos, 95% com SpCas9, SaCas9 ou StCas9. Em outras modalidades, a proteína Cas9, conforme referida neste documento, tem uma identidade de sequência de pelo menos 60%, como pelo menos 70%, mais particularmente pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, por exemplo, pelo menos, 95% com SpCas9, SaCas9 or StCas9 de tipo selvagem. O versado compreenderá que isso inclui formas truncadas da proteína
Cas9, através das quais a identidade da sequência é determinada ao longo do comprimento da forma truncada.
Proteínas Cas9 modificadas
[0081] Em modalidades particulares, é de interesse fazer uso de uma proteína Cas9 engenheirada como aqui definido, tal como Cas9, em que os complexos de proteína com uma molécula de ácido nucleico compreendendo RNA para formar um complexo CRISPR, em que, quando no complexo CRISPR, a molécula de ácido nucleico direciona um ou mais loci polinucleotídicos alvo, a proteína compreende pelo menos uma modificação em comparação com proteína Cas9 não modificada e em que o complexo CRISPR que compreende a proteína modificada tem atividade alterada em comparação com o complexo que compreende a proteína Cas9 não modificada. Deve ser entendido que, ao se referir neste documento à "proteína" CRISPR, a proteína Cas9 é preferencialmente uma proteína CRISPR-Cas modificada (por exemplo, tendo atividade enzimática aumentada ou diminuída (ou nenhuma), tal como, sem limitação, incluindo Cas9. O termo "proteína CRISPR" pode ser usado indistintamente com "proteína CRISPR-Cas", independentemente de a proteína CRISPR ter sido alterada, como atividade enzimática aumentada ou diminuída (ou nenhuma), em comparação com a proteína CRISPR de tipo selvagem.
[0082] Vários pequenos trechos de regiões não estruturadas são preditos dentro da estrutura primária Cas9.
Regiões não estruturadas, que são expostas ao solvente e não conservadas dentro de diferentes ortólogos Cas9, são lados preferidos para divisões e inserções de pequenas sequências de proteínas. Além disso, esses lados podem ser usados para gerar proteínas quiméricas entre ortólogos Cas9.
[0083] Com base nas informações acima, podem ser gerados mutantes que levam à inativação da enzima ou que modificam a nuclease de fita dupla para atividade de nickase.
Em modalidades alternativas, esta informação é usada para desenvolver enzimas com efeitos fora do alvo reduzidos (descritos em outro lugar neste documento).
[0084] Modificações de enzima Cas9 adequadas que intensificam a especificidade, em particular reduzindo os efeitos fora do alvo, são descritas, por exemplo, em PCT / US2016 / 038034, que é incorporado neste documento por referência em sua totalidade. Em modalidades particulares, uma redução da clivagem fora do alvo é assegurada pela separação desestabilizadora da fita, mais particularmente pela introdução de mutações na enzima Cas9, diminuindo a carga positiva nas regiões de interação com o DNA (como aqui descrito e exemplificado para Cas9 por Slaymaker et al. 2016 (Science, 1;351(6268):84-8). Em outras modalidades, uma redução da clivagem fora do alvo é assegurada pela introdução de mutações na enzima Cas9 que afetam a interação entre a fita alvo e a sequência de RNA guia, mais particularmente interrompendo as interações entre Cas9 e a estrutura de fosfato da fita de DNA alvo em tal uma maneira de reter a atividade específica do alvo, mas reduzir a atividade fora do alvo (conforme descrito para Cas9 por Kleinstiver et al.
2016, Nature, 28;529(7587):490-5). Em modalidades particulares, a atividade fora do alvo é reduzida por meio de um Cas9 modificado, em que tanto a interação com a fita alvo quanto a fita não alvo são modificadas em comparação com Cas9 de tipo selvagem.
[0085] Os métodos e mutações que podem ser empregados em várias combinações para aumentar ou diminuir a atividade e / ou especificidade da atividade no alvo vs.
fora do alvo, ou aumentar ou diminuir a ligação e / ou especificidade da ligação no alvo vs. fora do alvo, podem ser usados para compensar ou aumentar as mutações ou modificações feitas para promover outros efeitos. Tais mutações ou modificações feitas para promover outros efeitos incluem mutações ou modificação na proteína efetora Cas9 e / ou mutação ou modificação feita em um RNA guia.
[0086] Com uma estratégia semelhante usada para melhorar a especificidade do Cas9 (Slaymaker et al. 2015 “Rationally engineered Cas9 nucleases with improved specificity”), a especificidade de Cas9 pode ser melhorada por meio da mutação de resíduos que estabilizam a fita de DNA não direcionada. Isso pode ser realizado sem uma estrutura de cristal usando alinhamentos de estrutura linear para predizer 1) qual domínio de Cas9 se liga a qual fita de DNA e 2) quais resíduos dentro desses domínios entram em contato com o DNA.
[0087] No entanto, esta abordagem pode ser limitada devido à má conservação de Cas9 com proteínas conhecidas.
Assim, pode ser desejável investigar a função de todos os aminoácidos prováveis de interação com o DNA (lisina, histidina e arginina).
[0088] A proteína Cas9 cataliticamente ativa gera um corte cego, em que os sítios de corte estão tipicamente dentro da sequência alvo. Mais particularmente, o corte cego é tipicamente 2-3 nucleotídeos a montante do PAM. Em modalidades particulares, o corte na fita não alvo é de 3 nucleotídeos a montante do PAM (ou seja, entre o 3º e 4º nucleotídeos a montante do PAM), e o corte na fita alvo (ou seja, hibridação da fita com a sequência guia) ocorre no mesmo local na fita complementar (isto é 3 nucleotídeos a montante do complemento do PAM na fita 3' ou entre os nucleotídeos 3 e 4 a montante do complemento do PAM).
[0089] Em certas modalidades, um ou mais domínios catalíticos de uma proteína Cas9 (por exemplo, RuvC I, RuvC II e RuvC III ou o domínio HNH de uma proteína Cas9) são mutados para produzir uma proteína Cas mutada que cliva apenas uma fita de DNA de uma sequência alvo.
[0090] Por meio de orientação adicional, e sem limitação, por exemplo, uma substituição aspartato por alanina (D10A) no domínio catalítico RuvC I de Cas9 de S.
pyogenes converte Cas9 de uma nuclease que cliva ambas as fitas em uma nickase (cliva uma fita única). Outros exemplos de mutações que tornam Cas9 uma nickase incluem, sem limitação, H840A, N854A e N863A. Como orientação adicional, onde a enzima não é SpCas9, as mutações podem ser feitas em qualquer ou todos os resíduos correspondentes às posições 10, 762, 840, 854, 863 e / ou 986 de SpCas9 (que podem ser verificadas, por exemplo, por ferramentas de comparação de sequência padrão) Em particular, qualquer uma ou todas as seguintes mutações são preferidas em SpCas9: D10A, E762A, H840A, N854A, N863A e / ou D986A; bem como a substituição conservativa para qualquer um dos aminoácidos de substituição também é considerada.
[0091] Em uma primeira modalidade preferida, a proteína CRISPR-Cas é SpCas9 nickase tendo um domínio HNH cataliticamente inativo (por exemplo, uma SpCas9 nickase com mutação N863A). Em uma segunda modalidade preferida, a proteína CRISPR-Cas é SaCas9 com um domínio HNH cataliticamente inativo (por exemplo, uma SaCas9 nickase com mutação N580A). Em uma terceira modalidade preferida, a proteína CRISPR-Cas é SpCas9 nickase tendo o domínio HNH parcialmente ou totalmente removido. Em uma quarta modalidade preferida, a proteína CRISPR-Cas é SaCas9 tendo o domínio HNH parcial ou totalmente removido.
[0092] Em algumas das enzimas Cas9 descritas acima , a enzima é modificada por mutação de um ou mais resíduos, incluindo, mas não se limitando às posições D917, E1006, E1028, D1227, D1255A, N1257, de acordo com a proteína FnCas9 ou qualquer ortólogo correspondente. Em um aspecto, a invenção fornece uma composição aqui discutida em que a enzima Cas9 é uma enzima inativada que compreende uma ou mais mutações selecionadas do grupo que consiste em D917A, E1006A, E1028A, D1227A, D1255A e N1257A de acordo com a proteína FnCas9 ou posições correspondentes em um ortólogo Cas9. Em um aspecto, a invenção fornece uma composição aqui discutida, em que a proteína CRISPR-Cas compreende D917, ou E1006 e D917, ou D917 e D1255, de acordo com a proteína FnCas9 ou uma posição correspondente em um ortólogo Cas9.
[0093] Em certas modalidades, a modificação ou mutação de Cas9 compreende uma mutação em um domínio RuvCI, RuvCIII, RuvCIII ou HNH. Em certas modalidades, a modificação ou mutação compreende uma substituição de aminoácido em uma ou mais das posições 12, 13, 63, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961 , 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114,
1129, 1240, 1289, 1296, 1297, 1300, 1311 e 1325; de preferência 855; 810, 1003 e 1060; ou 848, 1003 com referência à numeração da posição do aminoácido de SpCas9.Em certas modalidades, a modificação ou mutação na posição 63, 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 ou 1325; de preferência 855; 810, 1003 e 1060; 848, 1003 e 1060; ou 497, 661, 695 e 926 compreende uma substituição de alanina. Em certas modalidades, a modificação compreende K855A; K810A, K1003A e R1060A; ou K848A, K1003A (com referência a SpCas9) e R1060A. em certas modalidades, em certas modalidades, a modificação compreende N497A, R661A, Q695A e Q926A (com referência a SpCas9).
[0094] Como outro exemplo, dois ou mais domínios catalíticos de Cas9 (RuvC I, RuvC II e RuvC III ou o domínio HNH) podem ser mutados para produzir um Cas9 mutado sem substancialmente toda a atividade de clivagem de DNA. Em algumas modalidades, uma mutação D10A é combinada com uma ou mais mutações H840A, N854A ou N863A para produzir uma enzima Cas9 sem substancialmente toda a atividade de clivagem de DNA. Em algumas modalidades, uma enzima CRISPR é considerada como tendo substancialmente nenhuma atividade de clivagem de DNA quando a atividade de clivagem de DNA da enzima mutada é inferior a cerca de 25%, 10%, 5%, 1%, 0,1%, 0,01% ou inferior com em relação à sua forma não mutada. Onde a enzima não é SpCas9, as mutações podem ser feitas em qualquer ou todos os resíduos correspondentes às posições 10, 762, 840, 854, 863 e / ou 986 de SpCas9 (que podem ser verificadas, por exemplo, por ferramentas de comparação de sequência padrão) Em particular, qualquer uma ou todas as seguintes mutações são preferidas em SpCas9: D10A, E762A, H840A, N854A, N863A e / ou D986A; bem como a substituição conservativa para qualquer um dos aminoácidos de substituição também é considerada. As mesmas (ou substituições conservativas dessas mutações) em posições correspondentes em outras Cas9s também são preferidas. Particularmente preferidos são D10 e H840 em SpCas9. No entanto, em outras Cas9s, os resíduos correspondentes a SpCas9 D10 e H840 também são preferidos.
[0095] Em certas modalidades, dois gRNAs quiméricos diferentes podem ser usados com a Cas9 nickase que, em conjunto, introduzirão a clivagem do sítio alvo com eficiência semelhante ao uso de um único gRNA quimérico. Os efeitos fora do alvo podem ser reduzidos dessa maneira porque a nickase Cas9 não tem a capacidade de induzir quebras de fita dupla como o Cas9 de tipo selvagem. Esses métodos de corte duplo são descritos, por exemplo, nas publicações PCT WO2014093622 e WO2014204725, que são aqui incorporados por referência.
Proteínas Cas12
[0096] Em certas modalidades exemplificativas, as composições, sistemas e ensaios podem compreender múltiplos ortólogos Cas12 ou um ou mais ortólogos em combinação com um ou mais ortólogos Cas9. Em certas modalidades de exemplo, os ortólogos Cas12 são ortólogos Cpf1, ortólogos C2c1 ou ortólogos C2c3.
Ortólogos de Cpf1
[0097] A presente invenção abrange o uso de nickases com base em formas mutadas da proteína efetora Cpf1 de tipo selvagem, derivada de um locus Cpf1 indicado como subtipo V- A. Aqui, tais proteínas efetoras também são referidas como "Cpf1p", por exemplo, uma proteína Cpf1 (e tal proteína efetora ou proteína Cpf1 ou proteína derivada de um locus Cpf1 também é chamada de "enzima CRISPR"). Atualmente, o subtipo V-A loci abrange cas1, cas2, um gene distinto denotado cpf1 e uma matriz CRISPR. Cpf1 (proteína Cpf1 associada ao CRISPR, subtipo PREFRAN) é uma proteína grande (cerca de 1300 aminoácidos) que contém um domínio de nuclease semelhante a RuvC homólogo ao domínio correspondente de Cas9 junto com um equivalente ao cluster característico de Cas9 rico em arginina. No entanto, Cpf1 não possui o domínio de nuclease HNH que está presente em todas as proteínas Cas9, e o domínio tipo RuvC é contíguo na sequência Cpf1, em contraste com Cas9, onde contém inserções longas, incluindo o domínio HNH. Por conseguinte, em modalidades particulares, a enzima CRISPR-Cas compreende apenas um domínio de nuclease do tipo RuvC.
[0098] Os termos "ortólogo" (também aqui referido como "ortólogo") e "homólogo" (também aqui referido como "homólogo") são bem conhecidos na técnica. Por meio de orientações adicionais, um "homólogo" de uma proteína como aqui utilizado é uma proteína da mesma espécie que desempenha a mesma ou uma função semelhante à da proteína da qual é um homólogo. As proteínas homólogas podem, mas não precisam estar relacionadas estruturalmente, ou estão apenas parcialmente relacionadas estruturalmente. Um "ortólogo" de uma proteína como utilizado neste documento é uma proteína de uma espécie diferente que desempenha a mesma função ou uma função semelhante à da qual é um ortólogo. As proteínas ortólogas podem, mas não precisam estar relacionadas estruturalmente, ou estão apenas parcialmente relacionadas estruturalmente. Homólogos e ortólogos podem ser identificados por modelagem de homologia (ver, por exemplo, Greer, Science vol. 228 (1985) 1055, e Blundell et al. Eur J Biochem vol 172 (1988), 513) ou "structural BLAST" (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a "structural BLAST": using structural relationships to infer function.
Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225.).
Ver também Shmakov et al. (2015) para aplicação no campo de
CRISPR-Cas loci. As proteínas homólogas podem, mas não precisam estar relacionadas estruturalmente, ou estão apenas parcialmente relacionadas estruturalmente.
[0099] O gene Cpf1 é encontrado em vários genomas bacterianos diversos, geralmente no mesmo local com os genes cas1, cas2 e cas4 e um cassete CRISPR (por exemplo, FNFX1_1431-FNFX1_1428 de Francisella cf. novicida Fx1).
Assim, o layout deste novo sistema putativo CRISPR-Cas parece ser semelhante ao do tipo II-B. Além disso, semelhante ao Cas9, a proteína Cpf1 contém uma região C-terminal prontamente identificável que é homóloga ao transpóson ORF- B e inclui uma nuclease ativa do tipo RuvC, uma região rica em arginina e um dedo Zn (ausente no Cas9). No entanto, ao contrário do Cas9, o Cpf1 também está presente em vários genomas sem um contexto CRISPR-Cas e sua similaridade relativamente alta com o ORF-B sugere que ele pode ser um componente do transposon. Foi sugerido que, se esse fosse um sistema CRISPR-Cas genuíno e o Cpf1 fosse um análogo funcional do Cas9, seria um novo tipo de CRISPR-Cas, o tipo V (consulte Anotação e Classificação dos Sistemas CRISPR- Cas. Makarova KS, Koonin EV. Methods Mol Biol. 2015;1311:47- 75). No entanto, como aqui descrito, Cpf1 é indicado como estando no subtipo V-A para distingui-lo de C2c1p que não possui uma estrutura de domínio idêntica e, portanto, é indicado como estando no subtipo V-B.
[0100] Em modalidades particulares, a proteína efetora é uma proteína efetora Cpf1 de um organismo de um gênero que compreende Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eactobacterium, Lactobacillus, Ephilococcus.
, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanometethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatillus, Tubitaminibilus, Bacillobacterus, Bacon.
[0101] Em outras modalidades particulares, a proteína efetora Cpf1 é de um organismo selecionado de S.
mutans, S. agalactiae, S. equisimilis, S. sanguinis, S.
pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N.
gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C.
difficile, C. tetani, C. sordellii.
[0102] A nickase pode compreender uma proteína quimérica compreendendo um primeiro fragmento de um primeiro ortólogo de proteína efetiva (por exemplo, um Cpf1) e um segundo fragmento de um segundo ortólogo de proteína efetora (por exemplo, um Cpf1) e em que a primeira e a segunda proteína efetora ortólogos são diferentes. Pelo menos um dos primeiro e segundo ortólogos de proteínas efetoras (por exemplo, um Cpf1) pode compreender uma proteína efetora (por exemplo, um Cpf1) de um organismo compreendendo
Streptococcus, Campylobacter, Nitratifractor,
Staphylococcus, Parvibaculum, Roseburia, Neisseria,
Gluconacetobacter, Azospirillum, Sphaerochaeta,
Lactobacillus, Eubacterium, Corynebacter, Carnobacterium,
Rhodobacter, Listeria, Paludibacter, Clostridium,
Lachnospiraceae, Clostridiaridium, Leptotrichia,
Francisella, Legionella, Alicyclobacillus,
Methanomethyophilus, Porphyromonas, Prevotella,
Bacteroidetes, Helcococcus, Letospira, Desulfovibrio,
Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus,
Brevibacilus, Methylobacterium ou Acidaminococcus; por exemplo, uma proteína efetora quimérica compreendendo um primeiro fragmento e um segundo fragmento em que cada um do primeiro e do segundo fragmentos é selecionado de um Cpf1 de um organismo que compreende Streptococcus, Campylobacter,
Nitratifractor, Staphylococcus, Parvibaculum, Roseburia,
Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta,
Lactobacillus, Eubacterium, Corynebacter, Carnobacterium,
Rhodobacter, Listeria, Paludibacter, Clostridium,
Lachnospiraceae, Clostridiaridium, Leptotrichia,
Francisella, Legionella, Alicyclobacillus,
Methanomethyophilus, Porphyromonas, Prevotella,
Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium or Acidaminococcus em que o primeiro e o segundo fragmentos não são da mesma bactéria; por exemplo, uma proteína efetora quimérica compreendendo um primeiro fragmento e um segundo fragmento em que cada um do primeiro e do segundo fragmentos é selecionado de um Cpf1 de S. mutans, S. agalactiae, S. equisimilis, S. sanguinis, S.
pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N.
gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C.
difficile, C. tetani, C. sordellii; Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens and Porphyromonas macacae, em que o primeiro e o segundo fragmentos não são os primeiros e segundos fragmentos.
[0103] Em uma modalidade mais preferida, a Cpf1p nickase é derivada de uma espécie bacteriana selecionada de Francisella tularensis 1, Prevotella albensis,
Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, bactéria Lachnospiraceae MA2020, Candidatus Methanoplasma termitum, Eubacterium elegens, Moraxella bovoculi 237, Leptospira inadai, bactéria Lachnospiraceae ND2006, Porphyromonas crevioricanis 3, Prevotella disiens e Porphyromonas macacae. Em certas modalidades, o Cpf1p é derivado de uma espécie bacteriana selecionada de Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020.
Em certas modalidades, a proteína efetora é derivada de uma subespécie de Francisella tularensis 1, incluindo mas não se limitando a Francisella tularensis subsp. Novicida.
[0104] Em algumas modalidades, a Cpf1p nickase é derivado de um organismo do gênero Eubacterium. Em algumas modalidades, a CRISPR nickase é derivada de um organismo da espécie bacteriana de Eubacterium rectale. Em algumas modalidades, a sequência de aminoácidos da proteína efetora Cpf1 de tipo selvagem corresponde à Sequência de Referência NCBI WP_055225123.1, Sequência de Referência NCBI WP_055237260.1, Sequência de Referência NCBI WP_055272206.1 ou GenBank ID OLA16049.1. Em algumas modalidades, a proteína efetora Cpf1 tem uma homologia de sequência ou identidade de sequência de pelo menos 60%, mais particularmente pelo menos
70, como pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo, pelo menos 95%, com a sequência de referência NCBI WP_055225123.1, a sequência de referência NCBI WP_055237260.1, a sequência de referência NCBI WP_055272206.1 ou GenBank ID OLA16049.1. O versado compreenderá que isso inclui formas truncadas da proteína Cpf1, através das quais a identidade da sequência é determinada ao longo do comprimento da forma truncada. Em algumas modalidades, o efetor Cpf1 reconhece a sequência PAM de TTTN ou CTTN.
[0105] Em modalidades particulares, o homólogo ou ortólogo de Cpf1 conforme referido neste documento tem uma homologia ou identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como, por exemplo, pelo menos 95% com Cpf1. Em outras modalidades, o homólogo ou ortólogo de Cpf1, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o Cpf1 de tipo selvagem. Quando o Cpf1 possui uma ou mais mutações (mutadas), o homólogo ou ortólogo do referido Cpf1, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o Cpf1 mutado.
[0106] Em uma modalidade, a proteína Cpf1 pode ser um ortólogo de um organismo de um gênero que inclui, mas não está limitado a Acidaminococcus sp, bactéria Lachnospiraceae ou Moraxella bovoculi; em modalidades particulares, a proteína Cas tipo V pode ser um ortólogo de um organismo de uma espécie que inclui, mas não está limitado a Acidaminococcus sp. BV3L6; Lachnospiraceae bacterium ND2006 (LbCpf1) ou Moraxella bovoculi 237. Em modalidades particulares, o homólogo ou ortólogo de Cpf1, conforme referido neste documento, tem uma homologia ou identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com uma ou mais das sequências Cpf1 aqui divulgadas. Em outras modalidades, o homólogo ou ortólogo de Cpf1as, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o tipo selvagem FnCpf1, AsCpf1 ou LbCpf1.
[0107] Em modalidades particulares, a proteína Cpf1 da invenção tem uma homologia ou identidade de sequência de pelo menos 60%, mais particularmente pelo menos 70, como pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, por exemplo, pelo menos, 95% com FnCpf1, AsCpf1 ou LbCpf1. Em outras modalidades, a proteína Cpf1, conforme referida neste documento, tem uma identidade de sequência de pelo menos 60%, como pelo menos 70%, mais particularmente pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, por exemplo, pelo menos, 95% com o tipo selvagem AsCpf1 ou LbCpf1. Em modalidades particulares, a proteína Cpf1 da presente invenção tem menos de 60% de identidade de sequência com FnCpf1. O versado compreenderá que isso inclui formas truncadas da proteína Cpf1, através das quais a identidade da sequência é determinada ao longo do comprimento da forma truncada.
[0108] Em algumas modalidades, a Cpf1 nickase compreende uma mutação no domínio Nuc. Em algumas modalidades, a Cpf1 nickase é capaz de cortar uma fita de DNA não direcionada no locus alvo de interesse deslocado pela formação do heteroduplex entre a fita de DNA direcionada e a molécula guia. Em algumas modalidades, a Cpf1 nickase compreende uma mutação correspondente a R1226A em AsCpf1.
[0109] Por meio de orientação adicional, e sem limitação, uma substituição arginina-para-alanina (R1226A) no domínio Nuc de Cpf1 de Acidaminococcus sp. converte Cpf1 de uma nuclease que cliva ambas as fitas em uma nickase (cliva uma única fita). Será entendido pelo especialista que, onde a enzima não é AsCpf1, uma mutação pode ser feita em um resíduo na posição correspondente. Em modalidades particulares, o Cpf1 é FnCpf1 e a mutação está na arginina na posição R1218. Em modalidades particulares, o Cpf1 é LbCpf1 e a mutação está na arginina na posição R1138. Em modalidades particulares, o Cpf1 é MbCpf1 e a mutação está na arginina na posição R1293.
Ortólogos de C2c1
[0110] A presente invenção abrange o uso de uma nickase à base de C2c1, derivada de um locus C2c1 indicado como subtipo V-B. Aqui, essas proteínas efetoras também são chamadas de "C2c1p", por exemplo, uma proteína C2c1 (e essa proteína efetora ou proteína C2c1 ou proteína derivada de um locus C2c1 também é chamada de "enzima CRISPR"). Atualmente, o subtipo de loci V-B abrange uma fusão cas1-Cas4, cas2, um gene distinto denotado C2c1 e uma matriz CRISPR. C2c1 (proteína C2c1 associada ao CRISPR) é uma proteína grande (cerca de 1100 - 1300 aminoácidos) que contém um domínio de nuclease semelhante ao RuvC homólogo ao domínio correspondente do Cas9, juntamente com um equivalente ao agrupamento característico de Cas9, rico em arginina. No entanto, C2c1 não possui o domínio de HNH nuclease que está presente em todas as proteínas Cas9 e o domínio tipo RuvC é contíguo na sequência C2c1, em contraste com Cas9, onde contém insertos longos, incluindo o domínio HNH. Por conseguinte, em modalidades particulares, a enzima CRISPR- Cas compreende apenas um domínio de nuclease do tipo RuvC.
[0111] As proteínas C2c1 (também conhecidas como Cas12b) são nucleases guiadas por RNA. Sua clivagem depende de um RNA tracr para recrutar um RNA guia que compreende uma sequência guia e uma repetição direta, em que a sequência guia hibrida com a sequência nucleotídica alvo para formar um DNA/RNA heteroduplex. Com base nos estudos atuais, a atividade da nuclease C2c1 também requer o reconhecimento da sequência do PAM. As sequências C2c1 PAM são sequências ricas em T. Em algumas modalidades, a sequência de PAM é 5 'TTN 3' ou 5 'ATTN 3', em que N é qualquer nucleotídeo. Numa modalidade particular, a sequência PAM é 5' TTC 3'. Numa modalidade particular, o PAM está na sequência de Plasmodium falciparum.
[0112] C2c1 cria um corte escalonado no local do alvo, com uma saliência de 5' ou uma “extremidade pegajosa” no lado distal do PAM da sequência alvo. Em algumas modalidades, a saliência 5' é 7 nt. Veja Lewis e Ke, Mol Cell. 2017 fev 2;65(3):377-379.
[0113] O gene C2c1 é encontrado em vários genomas bacterianos diversos, tipicamente no mesmo local com os genes cas1, cas2 e cas4 e um cassete CRISPR. Assim, o layout deste novo sistema putativo CRISPR-Cas parece ser semelhante ao do tipo II-B. Além disso, semelhante à Cas9, a proteína C2c1 contém uma nuclease ativa do tipo RuvC, uma região rica em arginina e um dedo de Zn (ausente no Cas9).
[0114] Em modalidades particulares, a CRISPR nickase é uma C2c1 nickase de um organismo de um gênero que compreende Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium, Citrobacter, Elusimicrobia, Methylobacterium, Omnitrophica, Phycisphaerae, Planctomycetes, Spirochaetes, e Verrucomicrobiaceae..
[0115] Em outras modalidades particulares, a C2c1 nickase é de uma espécie selecionada de Alicyclobacillus acidoterrestris (por exemplo, ATCC 49025), Alicyclobacillus contaminans (por exemplo, DSM 17975), Alicyclobacillus macrosporangiidus (por exemplo, DSM 17980), Bacillus hisashii cepa C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio inopinatus (por exemplo, DSM 10711), Desulfonatronum thiodismutans (por exemplo, cepa MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus (por exemplo, DSM 17572), Bacillus thermoamylovorans (por exemplo, cepa B4166), Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfatirhabdium butyrativorans (por exemplo, DSM 18734), Alicyclobacillus herbarius (por exemplo, DSM 13609), Citrobacter freundii (por exemplo, ATCC 8090), Brevibacillus agri (por exemplo, BAB-2500), Methylobacterium nodulans (por exemplo, ORS 2060).
[0116] A nickase pode compreender uma proteína efetora quimérica compreendendo um primeiro fragmento de um primeiro ortólogo de proteína efetora (por exemplo, um C2c1) e um segundo fragmento de um segundo ortólogo de proteína efetora (por exemplo, um C2c1) e em que o primeiro e o segundo ortólogos de proteína efetora são diferentes. Pelo menos um do primeiro e segundo ortólogos de proteínas efetoras (por exemplo, um C2c1) pode compreender uma proteína efetora (por exemplo, um C2c1) de um organismo compreendendo Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium, Elusimicrobia, Citrobacter, Methylobacterium, Omnitrophicai, Phycisphaerae, Planctomycetes, Spirochaetes, e Verrucomicrobiaceae ; por exemplo, uma proteína efetora quimérica compreendendo um primeiro fragmento e um segundo fragmento em que cada um do primeiro e do segundo fragmentos é selecionado de um C2c1 de um organismo compreendendo Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium,
Elusimicrobia, Citrobacter, Methylobacterium,
Omnitrophicai, Phycisphaerae, Planctomycetes, Spirochaetes,
e Verrucomicrobiaceae em que o primeiro e o segundo fragmentos não são da mesma bactéria; por exemplo, uma proteína efetora quimérica compreendendo um primeiro fragmento e um segundo fragmento em que cada um do primeiro e do segundo fragmentos é selecionado de um C2c1 de
Alicyclobacillus acidoterrestris (por exemplo, ATCC 49025),
Alicyclobacillus contaminans (por exemplo, DSM 17975),
Alicyclobacillus macrosporangiidus (por exemplo, DSM 17980),
Bacillus hisashii cepa C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio inopinatus (por exemplo, DSM 10711), Desulfonatronum thiodismutans (por exemplo, cepa MLF-1), Elusimicrobia bacterium RIFOXYA12,
Omnitrophica WOR_2 bactéria RIFCSPHIGHO2, Opitutaceae bactéria TAV5, Phycisphaerae bacterium ST-NAGAB-D1,
Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429,
Tuberibacillus calidus (por exemplo, DSM 17572), Bacillus thermoamylovorans (por exemplo, cepa B4166), Brevibacillus sp.
CF112, Bacillus sp.
NSP2.1, Desulfatirhabdium butyrativorans (por exemplo, DSM 18734), Alicyclobacillus herbarius (por exemplo, DSM 13609), Citrobacter freundii
(por exemplo, ATCC 8090), Brevibacillus agri (por exemplo,
BAB-2500), Methylobacterium nodulans (por exemplo, ORS
2060), em que o primeiro e o segundo fragmentos não são da mesma bactéria.
[0117] Numa modalidade mais preferida, a C2c1p nickase é derivada de uma espécie bacteriana selecionada de Alicyclobacillus acidoterrestris (por exemplo, ATCC 49025), Alicyclobacillus contaminans (por exemplo, DSM 17975), Alicyclobacillus macrosporangiidus (por exemplo, DSM 17980), Bacillus hisashii cepa C4, Candidatus Lindowbacteria bacterium RIFCSPLOWO2, Desulfovibrio inopinatus (por exemplo, DSM 10711), Desulfonatronum thiodismutans (por exemplo, cepa MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus (por exemplo, DSM 17572), Bacillus thermoamylovorans (por exemplo, cepa B4166), Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfatirhabdium butyrativorans (por exemplo, DSM 18734), Alicyclobacillus herbarius (por exemplo, DSM 13609), Citrobacter freundii (por exemplo, ATCC 8090), Brevibacillus agri (por exemplo, BAB-2500), Methylobacterium nodulans (por exemplo, ORS 2060). Em certas modalidades, o C2c1p é derivado de uma espécie bacteriana selecionada de Alicyclobacillus acidoterrestris (e.g., ATCC 49025), Alicyclobacillus contaminans (e.g., DSM 17975).
[0118] Em modalidades particulares, o homólogo ou ortólogo de C2c1, conforme referido neste documento, tem uma homologia ou identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com C2c1. Em outras modalidades, o homólogo ou ortólogo de C2c1, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o C2c1 de tipo selvagem. Quando o C2c1 possui uma ou mais mutações (mutadas), o homólogo ou ortólogo do referido C2c1, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o C2c1 mutado.
[0119] Em uma modalidade, a proteína C2c1 pode ser um ortólogo de um organismo de um gênero que inclui, mas não está limitado a Alicyclobacillus, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Candidatus, Desulfatirhabdium, Elusimicrobia, Citrobacter, Methylobacterium, Omnitrophicai, Phycisphaerae, Planctomycetes, Spirochaetes,
e Verrucomicrobiaceae ; em modalidades particulares, a proteína Cas tipo V pode ser um ortólogo de um organismo de uma espécie que inclui, mas não está limitado a Alicyclobacillus acidoterrestris (por exemplo, ATCC 49025), Alicyclobacillus contaminans (por exemplo, DSM 17975), Alicyclobacillus macrosporangiidus (por exemplo, DSM 17980), Bacillus hisashii cepa C4, Candidatus Lindowbacteria bactéria RIFCSPLOWO2, Desulfovibrio inopinatus (por exemplo, DSM 10711), Desulfonatronum thiodismutans (por exemplo, cepa MLF-1), Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bactéria RIFCSPHIGHO2, Opitutaceae bactéria TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus (e.g., DSM 17572), Bacillus thermoamylovorans (por exemplo, cepa B4166), Brevibacillus sp. CF112, Bacillus sp.
NSP2.1, Desulfatirhabdium butyrativorans (por exemplo, DSM 18734), Alicyclobacillus herbarius (por exemplo, DSM 13609), Citrobacter freundii (por exemplo, ATCC 8090), Brevibacillus agri (por exemplo, BAB-2500), Methylobacterium nodulans (por exemplo, ORS 2060).Em modalidades particulares, o homólogo ou ortólogo de C2c1, conforme referido neste documento, tem uma homologia ou identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos
95% com uma ou mais das sequências C2c1 aqui divulgadas. Em outras modalidades, o homólogo ou ortólogo de C2c1, conforme referido neste documento, tem uma identidade de sequência de pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, como por exemplo pelo menos 95% com o AacC2c1 ou BthC2c1 de tipo selvagem.
[0120] Em modalidades particulares, a C2c1 nickase da invenção tem uma homologia ou identidade de sequência de pelo menos 60%, mais particularmente pelo menos 70, como pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, por exemplo, pelo menos, 95% com AacC2c1 ou BthC2c1. Em outras modalidades, a proteína C2c1, conforme referida neste documento, tem uma identidade de sequência de pelo menos 60%, como pelo menos 70%, mais particularmente pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, por exemplo, pelo menos, 95% com o tipo selvagem AacC2c1. Em modalidades particulares, a proteína C2c1 da presente invenção tem menos de 60% de identidade de sequência com AacC2c1. O versado compreenderá que isso inclui formas truncadas da proteína C2c1, através das quais a identidade da sequência é determinada ao longo do comprimento da forma truncada.
[0121] Em certas modalidades, a C2c1 nickase pode ser fornecida ou expressa em um sistema in vitro ou em uma célula, de forma transitória ou estável, e direcionado ou desencadeado para clivar não especificamente ácidos nucleicos celulares. Numa modalidade, C2c1 é engenheirado para derrubar ssDNA, por exemplo, ssDNA viral. Em outra modalidade, C2c1 é engenheirado para knock down do RNA. O sistema pode ser concebido de modo que o knockdown seja dependente de um DNA alvo presente na célula ou sistema in vitro , ou desencadeado pela adição de um ácido nucleico alvo ao sistema ou célula.
[0122] Em certas modalidades, a proteína C2c1 é um C2c1 cataliticamente inativo que compreende uma mutação no domínio RuvC. Em algumas modalidades, a proteína C2c1 cataliticamente inativa compreende uma mutação correspondente às posições de aminoácidos D570, E848 ou D977 em Alicyclobacillus acidoterrestris C2c1. Em algumas modalidades, a proteína C2c1 cataliticamente inativa compreende uma mutação correspondente a D570A, E848A ou D977A em Alicyclobacillus acidoterrestris C2c1.
[0123] Em certas modalidades, a nickaseà base de Cas é uma C2c1 nickase que compreende uma mutação no domínio Nuc. Em algumas modalidades, a C2c1 nickase compreende uma mutação correspondente às posições de aminoácidos R911, R1000 ou R1015 em Alicyclobacillus acidoterrestris C2c1. Em algumas modalidades, a C2c1 nickase compreende uma mutação correspondente a R911A, R1000A ou R1015A em Alicyclobacillus acidoterrestris C2c1. Será entendido pelo versado que, onde a enzima não é a enzima CRISPR-Cas listada acima, uma mutação pode ser feita em um resíduo em uma posição correspondente.
[0124] As mutações também podem ser feitas em resíduos vizinhos, por exemplo, em aminoácidos próximos aos indicados acima que participam da atividade de nuclease. Em algumas modalidades, apenas o domínio RuvC é inativado e, em outras modalidades, outro domínio de nuclease putativo está inativado, em que o complexo de proteína efetora funciona como uma nickase e cliva apenas uma fita de DNA. Em algumas modalidades, duas variantes de CRISPR-Cas (cada qual uma nickase diferente) são usadas para aumentar a especificidade, duas variantes de nickase são usadas para clivar DNA em um alvo (onde ambas as nickases clivam uma fita de DNA, enquanto minimizam ou eliminam modificações fora do alvo onde apenas uma fita de DNA é clivada e posteriormente reparada).
[0125] Em certas modalidades, a proteína efetora C2c1 cliva sequências associadas a ou em um locus alvo de interesse como um homodímero compreendendo duas moléculas de proteína efetora C2c1. Em uma modalidade preferida, o homodímero pode compreender duas moléculas de proteína efetora C2c1 compreendendo uma mutação diferente em seus respectivos domínios RuvC.
Sequências Guia
[0126] Como utilizado neste documento, o termo
"sequência guia", "crRNA", "RNA guia" ou "RNA guia único" ou
"gRNA" ou "molécula guia" refere-se a um polinucleotídeo compreendendo qualquer sequência de polinucleotídeo com complementaridade suficiente com uma sequência de ácido nucleico alvo para hibridar com a sequência de ácido nucleico alvo e para direcionar a ligação específica à sequência de um complexo de direcionamento de RNA compreendendo a sequência guia e uma proteína efetora CRISPR à sequência de ácido nucleico alvo.
Em algumas modalidades de exemplo, o grau de complementaridade, quando otimamente alinhado usando um algoritmo de alinhamento adequado, é de cerca de 50%,
60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99 %, ou mais.
O alinhamento ideal pode ser determinado com o uso de qualquer algoritmo adequado para o alinhamento de sequências, dos quais um exemplo não limitativo inclui o algoritmo Smith-
Waterman, o algoritmo Needleman-Wunsch, algoritmos baseados na Transformação Burrows-Wheeler (por exemplo, o Burrows
Wheeler Aligner ), ClustalW, Clustal X, BLAT, Novoalign
(Novocraft Technologies; disponível em www.novocraft.com),
ELAND (Illumina, San Diego, CA), SOAP (disponível em soap.genomics.org.cn) e Maq (disponível em maq.sourceforge.net). A capacidade de uma sequência guia
(dentro de um RNA guia de direcionamento de ácido nucleico)
de direcionar a ligação específica de sequência de um complexo de direcionamento de ácido nucleico a uma sequência de ácido nucleico alvo pode ser avaliada por qualquer ensaio adequado.
Por exemplo, os componentes de um sistema CRISPR de direcionamento de ácido nucleico suficiente para formar um complexo de direcionamento de ácido nucleico, incluindo a sequência guia a ser testada, podem ser fornecidos a uma célula hospedeira com a sequência de ácido nucleico alvo correspondente, tal como por transfecção com vetores que codificam os componentes do complexo de direcionamento de ácido nucleico, seguido por uma avaliação de direcionamento preferencial (por exemplo, clivagem) dentro da sequência de ácido nucleico alvo, tal como por ensaio Surveyor como aqui descrito.
Da mesma forma, a clivagem de uma sequência de ácido nucleico alvo pode ser avaliada em um tubo de ensaio,
fornecendo a sequência de ácido nucleico alvo, componentes de um complexo de direcionamento de ácido nucleico, incluindo a sequência guia a ser testada e uma sequência guia de controle diferente do guia de teste e comparando a ligação ou taxa de clivagem na sequência alvo entre as reações da sequência guia de teste e controle.
Outros ensaios são possíveis e ocorrerão para os versados na técnica.
Uma sequência guia e, portanto, uma guia de direcionamento de ácido nucleico pode ser selecionada para direcionar qualquer sequência de ácido nucleico alvo.
A sequência alvo pode ser
DNA.
A sequência alvo pode ser qualquer sequência de RNA.
Em algumas modalidades, a sequência alvo pode ser uma sequência dentro de uma molécula de RNA selecionada do grupo que consiste em RNA mensageiro (mRNA), pré-mRNA, RNA ribossômico (rRNA), RNA de transferência (tRNA), micro-RNA (miRNA), RNA interferente pequeno (siRNA), RNA nuclear pequeno (snRNA), RNA nucleolar pequeno (snoRNA), RNA de fita dupla (dsRNA), RNA não codificante (ncRNA), RNA não codificante longo (lncRNA) e RNA citoplasmático pequeno ( scRNA). Em algumas modalidades preferidas, a sequência alvo pode ser uma sequência dentro de uma molécula de RNA selecionada do grupo que consiste em mRNA, pré-mRNA e rRNA. Em algumas modalidades preferidas, a sequência alvo pode ser uma sequência dentro de uma molécula de RNA selecionada do grupo que consiste em ncRNA e lncRNA. Em algumas modalidades mais preferidas, a sequência alvo pode ser uma sequência dentro de uma molécula de mRNA ou uma molécula pré-mRNA.
[0127] Em algumas modalidades, um guia de direcionamento de ácido nucleico é selecionado para reduzir o grau de estrutura secundária dentro do guia de direcionamento de ácido nucleico. Em algumas modalidades, aproximadamente ou menos de cerca de 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% ou menos dos nucleotídeos do guia de direcionamento de ácidos nucleicos participam do emparelhamento de bases autocomplementares quando idealmente dobrados. O dobramento ideal pode ser determinado por qualquer algoritmo de dobramento de polinucleotídeo adequado. Alguns programas são baseados no cálculo da energia livre mínima de Gibbs. Um exemplo de tal algoritmo é mFold, conforme descrito por Zuker and Stiegler (Nucleic Acids Res.
9 (1981), 133-148). Outro exemplo de algoritmo de dobramento é o servidor on-line RNAfold, desenvolvido no Instituto de Química Teórica da Universidade de Viena, usando o algoritmo de previsão da estrutura do centroide (ver, por exemplo, A.R. Gruber et al., 2008, Cell 106(1): 23-24; and PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).
[0128] Em certas modalidades, um RNA guia ou crRNA pode compreender, consistir essencialmente em, ou consistir em uma sequência de repetição direta (DR) e uma sequência guia ou sequência espaçadora. Em certas modalidades, o RNA guia ou o crRNA pode compreender, consistir essencialmente em, ou consistir em uma sequência de repetição direta fundida ou ligada a uma sequência guia ou sequência espaçadora. Em certas modalidades, a sequência de repetição direta pode estar localizada a montante (isto é, 5') da sequência guia ou sequência espaçadora. Em outras modalidades, a sequência de repetição direta pode estar localizada a jusante (isto é, 3') da sequência guia ou sequência espaçadora.
[0129] Em certas modalidades, o crRNA compreende uma alça de haste, preferencialmente uma alça de haste única. Em certas modalidades, a sequência de repetição direta forma uma alça de haste, preferencialmente uma alça de haste única.
[0130] Em certas modalidades, o comprimento do espaçador do RNA guia é de 15 a 35 nt. Em certas modalidades, o comprimento do espaçador do RNA guia é de pelo menos 15 nucleotídeos. Em certas modalidades, o comprimento do espaçador é de 15 a 17 nt, por exemplo, 15, 16 ou 17 nt, de 17 a 20 nt, por exemplo, 17, 18, 19 ou 20 nt, de 20 a 24 nt, por exemplo, 20, 21, 22, 23 ou 24 nt, de 23 a 25 nt, por exemplo, 23, 24 ou 25 nt, de 24 a 27 nt, por exemplo, 24, 25, 26 ou 27 nt, de 27 a 30 nt, por exemplo, 27, 28, 29 ou 30 nt, de 30 a 35 nt, por exemplo, 30, 31, 32, 33, 34 ou 35 nt, ou 35 nt ou mais.
[0131] Em geral, o sistema CRISPR-Cas, CRISPR-Cas9 or CRISPR systempode ser usado nos documentos anteriores, como WO 2014/093622 (PCT/US2013/074667) e refere-se coletivamente a transcritos e outros elementos envolvidos na expressão ou direcionamento da atividade de genes associados ao CRISPR ("Cas"), incluindo sequências que codificam um gene Cas, em particular um gene Cas9 no caso de CRISPR-Cas9, uma sequência tracr (CRISPR de ativação trans) (por exemplo, tracrRNA ou um tracrRNA parcial ativo), uma sequência tracr- mate (que inclui uma "repetição direta" e um repetição direta parcial processada por tracrRNA no contexto de um sistema CRISPR endógeno), uma sequência guia (também referida como
"espaçador" no contexto de um sistema CRISPR endógeno) ou
"RNA(s)", como esse termo é usado aqui (por exemplo, RNA (s)
para guiar Cas9, por exemplo RNA CRISPR e RNA de transativação (tracr) ou um único RNA guia (sgRNA) (RNA quimérico)) ou outras sequências e transcritos de um locus
CRISPR.
Em geral, um sistema CRISPR é caracterizado por elementos que promovem a formação de um complexo CRISPR no sítio de uma sequência alvo (também chamado de protoespaçador no contexto de um sistema CRISPR endógeno). No contexto da formação de um complexo de CRISPR, "sequência alvo" refere-
se a uma sequência na qual uma sequência guia é projetada para ter complementaridade, onde a hibridação entre uma sequência alvo e uma sequência guia promove a formação de um complexo de CRISPR.
A seção da sequência guia através da qual a complementaridade com a sequência alvo é importante para a atividade de clivagem é aqui referida como a sequência de sementes.
Uma sequência alvo pode compreender qualquer polinucleotídeo, como polinucleotídeos de DNA ou RNA.
Em algumas modalidades, uma sequência alvo está localizada no núcleo ou citoplasma de uma célula e pode incluir ácidos nucleicos em ou de mitocondrial, organelas, vesículas,
lipossomas ou partículas presentes na célula.
Em algumas modalidades, especialmente para usos não nucleares, os NLSs não são preferidos.
Em algumas modalidades, um sistema CRISPR compreende um ou mais sinais de exportação nuclear (NESs).
Em algumas modalidades, um sistema CRISPR compreende um ou mais NLSs e um ou mais NESs. Em algumas modalidades, as repetições diretas podem ser identificadas in silico , procurando motivos repetitivos que atendam a um ou todos os seguintes critérios: 1. encontrados em uma janela de 2 Kb de sequência genômica que flanqueia o locus CRISPR tipo II; 2.
alcance de 20 a 50 pb; e 3. espaçados por 20 a 50 pb. Em algumas modalidades, 2 desses critérios podem ser utilizados, por exemplo 1 e 2, 2 e 3 ou 1 e 3. Em algumas modalidades, todos os 3 critérios podem ser usados.
[0132] Nas modalidades da invenção, os termos sequência guia e RNA guia, isto é, RNA capaz de guiar Cas a um locus genômico alvo, são usados de forma intercambiável como nos documentos citados acima, como WO 2014/093622 (PCT/US2013/074667). Em geral, uma sequência guia é qualquer sequência polinucleotídica tendo complementaridade suficiente com uma sequência polinucleotídica alvo para hibridar com a sequência alvo e direcionar a ligação específica da sequência de um complexo CRISPR à sequência alvo. Em algumas modalidades, o grau de complementaridade entre uma sequência guia e sua sequência alvo correspondente, quando idealmente alinhado usando um algoritmo de alinhamento adequado, é de cerca de 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% ou mais. O alinhamento ideal pode ser determinado com o uso de qualquer algoritmo adequado para o alinhamento de sequências, dos quais um exemplo não limitativo inclui o algoritmo Smith-Waterman, o algoritmo
Needleman-Wunsch, algoritmos baseados na Transformação
Burrows-Wheeler (por exemplo, o Burrows Wheeler Aligner ),
ClustalW, Clustal X, BLAT, Novoalign (Novocraft
Technologies; disponível em www.novocraft.com), ELAND
(Illumina, San Diego, CA), SOAP (disponível em soap.genomics.org.cn) e Maq (disponível em maq.sourceforge.net). Em algumas modalidades, uma sequência guia é de cerca de 5, 10, 11, 12, 13, 14, 15, 16, 17, 18,
19, 20, 21, 22, 23, 24, 25, 26, 27 , 28, 29, 30, 35, 40, 45,
50, 75 ou mais nucleotídeos de comprimento.
Em algumas modalidades, uma sequência guia é menor que cerca de 75, 50,
45, 40, 35, 30, 25, 20, 15, 12 ou menos nucleotídeos de comprimento.
Preferencialmente, a sequência guia tem 10 30 nucleotídeos de comprimento.
A capacidade de uma sequência guia para direcionar a ligação específica da sequência de um complexo CRISPR a uma sequência alvo pode ser avaliada por qualquer ensaio adequado.
Por exemplo, os componentes de um sistema CRISPR suficientes para formar um complexo CRISPR,
incluindo a sequência guia a ser testada, podem ser fornecidos a uma célula hospedeira com a sequência alvo correspondente, como por transfecção com vetores que codificam os componentes da sequência CRISPR, seguido de uma avaliação da clivagem preferencial dentro da sequência alvo,
como no ensaio Surveyor, conforme descrito aqui. Da mesma forma, a clivagem de uma sequência polinucleotídica alvo pode ser avaliada em um tubo de ensaio, fornecendo a sequência alvo, componentes de um complexo CRISPR, incluindo a sequência guia a ser testada e uma sequência guia de controle diferente do guia de teste e comparando a ligação ou taxa de clivagem na sequência alvo entre as reações da sequência guia de teste e controle. Outros ensaios são possíveis e ocorrerão para os versados na técnica.
[0133] Em algumas modalidades de sistemasCRISPR-Cas, o grau de complementaridade entre uma sequência guia e sua sequência alvo correspondente pode ser de cerca de 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% ou 100%; um guia ou RNA ou sgRNA pode ter cerca de 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 , 28, 29, 30, 35, 40, 45, 50, 75 ou mais nucleotídeos de comprimento; ou guia ou RNA ou sgRNA pode ser menor que cerca de 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 ou menos nucleotídeos de comprimento; e vantajosamente o RNA tracr tem 30 ou 50 nucleotídeos de comprimento. No entanto, um aspecto da invenção é reduzir interações fora do alvo, por exemplo, reduzir o guia que interage com uma sequência alvo com baixa complementaridade. De fato, nos exemplos, é mostrado que a invenção envolve mutações que resultam no sistema CRISPR-Cas sendo capaz de distinguir entre sequências alvo e fora do alvo que têm mais de 80% a cerca de 95% de complementaridade, por exemplo, 83% -84% ou 88-89% ou 94-95% de complementaridade (por exemplo, distinguir entre um alvo com 18 nucleotídeos de um fora do alvo de 18 nucleotídeos com 1, 2 ou 3 incompatibilidades). Por conseguinte, no contexto da presente invenção, o grau de complementaridade entre uma sequência guia e sua sequência alvo correspondente é maior que 94,5% ou 95% ou 95,5% ou 96% ou 96,5% ou 97% ou 97,5% ou 98% ou 98,5% ou 99% ou 99,5% ou 99,9% ou 100%. Fora do alvo é inferior a 100% ou 99,9% ou 99,5% ou 99% ou 99% ou 98,5% ou 98% ou 97,5% ou 97% ou 96,5% ou 96% ou 95,5% ou 95% ou 94,5% ou 94% ou 93% ou 92% ou 91% ou 90% ou 89% ou 88% ou 87% ou 86% ou 85% ou 84% ou 83% ou 82% ou 81% ou 80% de complementaridade entre a sequência e o guia, com é vantajoso que fora do alvo seja 100% ou 99,9% ou 99,5% ou 99% ou 99% ou 98,5% ou 98% ou 97,5% ou 97% ou 96,5% ou 96% ou 95,5% ou 95% ou 94,5% de complementaridade entre as sequência e o guia.
Modificações do Guia
[0134] Em certas modalidades, os guias da invenção compreendem ácidos nucleicos de ocorrência não natural e / ou nucleotídeos de ocorrência não natural e / ou análogos de nucleotídeos e / ou modificações químicas. Os ácidos nucleicos de ocorrência não natural podem incluir, por exemplo, misturas de nucleotídeos de ocorrência natural e não natural. Nucleotídeos de ocorrência não natural e/ou análogos de nucleotídeos podem ser modificados na ribose, fosfato, e/ou fração de base. Em uma modalidade da invenção, um ácido nucleico guia compreende ribonucleotídeos e não ribonucleotídeos. Em uma dessas modalidades, um guia compreende um ou mais ribonucleotídeos e um ou mais desoxirribonucleotídeos. Em uma modalidade da invenção, o guia compreende um ou mais nucleotídeos de ocorrência não natural ou análogo de nucleotídeo, como um nucleotídeo com ligação fosforotioato, ligação boranofosfato, nucleotídeos de ácido nucleico bloqueado (LNA) compreendendo uma ponte de metileno entre os carbonos 2′ e 4′ do anel de ribose, ou ácidos nucleicos em ponte (BNA). Outros exemplos de nucleotídeos modificados incluem análogos 2'-O-metil, análogos 2'-desóxi, análogos 2-tiouridina, análogos N6- metiladenosina ou análogos 2'-fluoro. Outros exemplos de bases modificadas incluem, entre outros, 2-aminopurina, 5- bromo-uridina, pseudouridina (Ψ), N1-metilpseudouridina (me1Ψ), 5-metoxiuridina (5moU), inosina, 7-metilguanosina.
Exemplos de modificações químicas de RNA guia incluem, sem limitação, incorporação de 2'-O-metil (M), 2'-O-metil-3'- fosforotioato (MS), fosforotioato (PS), etil com constrição de S-(cEt), ou 2’-O-metil-3’-tioPACE (MSP) em um ou mais nucleotídeos terminais. Esses guias quimicamente modificados podem compreender maior estabilidade e atividade aumentada em comparação com guias não modificados, embora a especificidade no alvo versus fora do alvo não seja previsível. (Ver Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, publicado online em 29 de junho de 2015; Ragdarm et al., 0215, PNAS, E7110-E7111; Allerson et al., J. Med. Chem. 2005, 48:901-904; Bramsen et al., Front.
Genet., 2012, 3:154; Deng et al., PNAS, 2015, 112:11870- 11875; Sharma et al., MedChemComm., 2014, 5:1454-1471; Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989; Li et al., Nature Biomedical Engineering, 2017, 1, 0066 DOI:10.1038/s41551-017-0066). Em algumas modalidades, a extremidade 5' e / ou 3' de um RNA guia é modificada por uma variedade de frações funcionais, incluindo corantes fluorescentes, polietileno glicol, colesterol, proteínas ou marcadores de detecção. (Ver Kelly et al., 2016, J. Biotech.
233:74-83). Em certas modalidades, um guia compreende ribonucleotídeos em uma região que se liga a um DNA alvo e um ou mais desoxirribonucletídeos e / ou análogos de nucleotídeos em uma região que se liga a Cas9, Cpf1 ou C2c1.
Em uma modalidade da invenção, desoxirribonucleotídeos e / ou análogos de nucleotídeos são incorporados em estruturas guia engenheiradas, como, sem limitação, regiões 5' e/ou 3', regiões de alça de haste e região de semente. Em certas modalidades, a modificação não está na alça 5' das regiões de haste-alça. A modificação química na alça 5' da região de haste-alça de um guia pode abolir sua função (ver Li, et al., Nature Biomedical Engineering, 2017, 1:0066). Em certas modalidades, pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, ou 75 nucleotídeos de um guia são quimicamente modificados. Em algumas modalidades, 3-5 nucleotídeos na extremidade 3' ou 5' de um guia são quimicamente modificados. Em algumas modalidades, apenas pequenas modificações são introduzidas na região de semente, como modificações 2'-F. Em algumas modalidades, a modificação 2'-F é introduzida na extremidade 3' de um guia.
Em certas modalidades, três a cinco nucleotídeos na extremidade 5' e/ou 3' do guia são quimicamente modificados com 2'-O-metil (M), 2'-O-metil-3'-fosforotioato (MS), etil com restrição de S (cEt) ou 2'-O-metil-3'-thioPACE (MSP).
Essa modificação pode aumentar a eficiência da edição do genoma (ver, Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989). Em certas modalidades, todas as ligações fosfodiéster de um guia são substituídas por fosforotioatos (PS) para intensificar níveis de interrupção de genes. Em certas modalidades, mais de cinco nucleotídeos na extremidade 5' e/ou 3' do guia são quimicamente modificados com 2'-O-Me, 2'-F ou etil com restrição de S(cEt). Esse guia quimicamente modificado pode mediar níveis intensificados de ruptura de genes (ver Ragdarm et al., 0215, PNAS, E7110-
E7111). Em uma modalidade da invenção, um guia é modificado para compreender uma fração química em sua extremidade 3' e / ou 5'. Tais frações incluem, mas não estão limitadas a amina, azida, alcino, tio, dibenzociclo-octino (DBCO) ou rodamina. Em certa modalidade, a fração química é conjugada ao guia por um ligante, como uma cadeia alquil. Em certas modalidades, a fração química do guia modificado pode ser usada para anexar o guia a outra molécula, como DNA, RNA, proteína ou nanopartículas. Esse guia quimicamente modificado pode ser usado para identificar ou enriquecer células editadas genericamente por um sistema CRISPR (ver Lee et al., eLife, 2017, 6:e25312, DOI:10.7554).
[0135] Em certas modalidades, o sistema CRISPR aqui fornecido pode fazer uso de um crRNA ou polinucleotídeo análogo compreendendo uma sequência guia, em que o polinucleotídeo é um RNA, um DNA ou uma mistura de RNA e DNA e / ou em que o polinucleotídeo compreende um ou mais análogos de nucleotídeos. A sequência pode compreender qualquer estrutura, incluindo, mas não se limitando a, a estrutura de um crRNA nativo, como uma protuberância, um gancho de cabelo ou uma estrutura de alça de haste. Em certas modalidades, o polinucleotídeo compreendendo a sequência guia forma um duplex com uma segunda sequência polinucleotídica que pode ser um RNA ou uma sequência de DNA.
[0136] Em certas modalidades, é feito uso de RNAs guia quimicamente modificados. Exemplos de modificações químicas de RNA guia incluem, sem limitação, incorporação de 2′-O-metil (M), 2′-O-metil 3′fosforotioato (MS) ou 2′-O- metil 3′thioPACE (MSP) em um ou mais nucleotídeos terminais.
Tais RNAs guias quimicamente modificados podem compreender maior estabilidade e maior atividade em comparação com RNAs guias não modificados, embora a especificidade no alvo versus fora do alvo não seja previsível. (Ver Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, publicado on-line em 29 de junho de 2015). Os RNAs guia quimicamente modificados incluem ainda, sem limitação, RNAs com ligações fosforotioato e nucleotídeos de ácido nucleico bloqueado (LNA) compreendendo uma ponte de metileno entre os carbonos 2' e 4' do anel de ribose.
[0137] Em algumas modalidades, uma sequência guia é de cerca de 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 , 28, 29, 30, 35, 40, 45, 50, 75 ou mais nucleotídeos de comprimento. Em algumas modalidades, uma sequência guia é menor que cerca de 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 ou menos nucleotídeos de comprimento.
Preferencialmente, a sequência guia tem 10 a 30 nucleotídeos.
A capacidade de uma sequência guia para direcionar a ligação específica da sequência de um complexo CRISPR a uma sequência alvo pode ser avaliada por qualquer ensaio adequado. Por exemplo, os componentes de um sistema CRISPR suficientes para formar um complexo CRISPR, incluindo a sequência guia a ser testada, podem ser fornecidos a uma célula hospedeira com a sequência alvo correspondente, como por transfecção com vetores que codificam os componentes da sequência CRISPR, seguido de uma avaliação da clivagem preferencial dentro da sequência alvo, como no ensaio Surveyor. Da mesma forma, a clivagem de um RNA alvo pode ser avaliada em um tubo de ensaio, fornecendo a sequência alvo, componentes de um complexo CRISPR, incluindo a sequência guia a ser testada e uma sequência guia de controle diferente do guia de teste e comparando a ligação ou taxa de clivagem na sequência alvo entre as reações da sequência guia de teste e controle.
Outros ensaios são possíveis e ocorrerão para os versados na técnica.
[0138] Em algumas modalidades, a modificação do guia é uma modificação química, uma inserção, uma exclusão ou uma divisão. Em algumas modalidades, a modificação química inclui, mas não está limitada a, incorporação de análogos 2'-O-metil (M), análogos 2'-desoxi, análogos 2-tiouridina, análogos N6-metiladenosina, análogos 2'-fluoro, 2- aminopurina, 5-bromo-uridina, pseudouridina (Ψ), N1 - metilpseudouridina (me1Ψ), 5-metoxiuridina (5moU), inosina, 7-metilguanosina, 2’-O-metil-3’-fosforotioato (MS), etil com constrição de S-(cEt), fosforotioato (PS) ou 2’-O-metil-3’-
tioPACE (MSP). Em algumas modalidades, o guia compreende uma ou mais modificações de fosforotioato.
Em certas modalidades, pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11,
12, 13, 14, 15, 16, 17, 18, 19, 20 ou 25 nucleotídeos do guia é quimicamente modificado.
Em determinadas modalidades,
um ou mais nucleotídeos na região da semente são modificados quimicamente.
Em determinadas modalidades, um ou mais nucleotídeos no terminal 3' são quimicamente modificados.
Em determinadas modalidades, nenhum dos nucleotídeos no identificador 5' é quimicamente modificado.
Em algumas modalidades, a modificação química na região de semente é uma modificação menor, como a incorporação de um análogo de
2'-fluoro.
Em uma modalidade específica, um nucleotídeo da região de semente é substituído por um análogo 2’-fluoro.
Em algumas modalidades, 5 ou 10 nucleotídeos no terminal 3' são quimicamente modificados.
Tais modificações químicas no terminal 3' do Cpf1 CrRNA melhoram a eficiência do corte de genes (ver Li, et al., Nature Biomedical Engineering, 2017,
1:0066). Numa modalidade específica, 5 nucleotídeos no terminal 3' são substituídos por análogos 2'-fluoro.
Numa modalidade específica, 10 nucleotídeos no terminal 3' são substituídos por análogos 2'-fluoro.
Numa modalidade específica, 5 nucleotídeos no terminal 3' são substituídos por análogos 2'-O-metil (M).
[0139] Em algumas modalidades, a alça da haste 5' do guia é modificada. Em algumas modalidades, a alça da alça 5' do guia é modificada para ter uma exclusão, uma inserção, uma divisão ou modificações químicas. Em certas modalidades, a alça compreende 3, 4 ou 5 nucleotídeos. Em certas modalidades, a alça compreende a sequência de UCUU, UUUU, UAUU, ou UGUU.
[0140] Uma sequência guia e, portanto, um RNA guia de direcionamento de ácido nucleico pode ser selecionada para direcionar qualquer sequência de ácido nucleico alvo.
No contexto da formação de um complexo de CRISPR, "sequência alvo" refere-se a uma sequência na qual uma sequência guia é projetada para ter complementaridade, onde a hibridação entre uma sequência alvo e uma sequência guia promove a formação de um complexo de CRISPR. Uma sequência alvo pode compreender polinucleotídeos de RNA. O termo "RNA alvo" refere-se a um polinucleotídeo de RNA que é ou compreende a sequência alvo. Em outras palavras, o RNA alvo pode ser um polinucleotídeo de RNA ou uma parte de um polinucleotídeo de RNA ao qual uma parte do gRNA, isto é, a sequência guia, é projetada para ter complementaridade e à qual a função efetora mediada pelo complexo compreendendo a proteína efetora CRISPR e um gRNA deve ser direcionada. Em algumas modalidades, uma sequência alvo está localizada no núcleo ou citoplasma de uma célula. A sequência alvo pode ser DNA. A sequência alvo pode ser qualquer sequência de RNA. Em algumas modalidades, a sequência alvo pode ser uma sequência dentro de uma molécula de RNA selecionada do grupo que consiste em RNA mensageiro (mRNA), pré-mRNA, RNA ribossômico (rRNA), RNA de transferência (tRNA), micro-RNA (miRNA), RNA interferente pequeno (siRNA), RNA nuclear pequeno (snRNA), RNA nucleolar pequeno (snoRNA), RNA de fita dupla (dsRNA), RNA não codificante (ncRNA), RNA não codificante longo (lncRNA) e RNA citoplasmático pequeno (scRNA). Em algumas modalidades preferidas, a sequência alvo pode ser uma sequência dentro de uma molécula de RNA selecionada do grupo que consiste em mRNA, pré-mRNA e rRNA. Em algumas modalidades preferidas, a sequência alvo pode ser uma sequência dentro de uma molécula de RNA selecionada do grupo que consiste em ncRNA e lncRNA.
Em algumas modalidades mais preferidas, a sequência alvo pode ser uma sequência dentro de uma molécula de mRNA ou uma molécula pré-mRNA.
[0141] Em certas modalidades, o comprimento do espaçador do RNA guia é inferior a 28 nucleotídeos. Em certas modalidades, o comprimento do espaçador do RNA guia é de pelo menos 18 nucleotídeos e menos de 28 nucleotídeos. Em certas modalidades, o comprimento espaçador do RNA guia está entre 19 e 28 nucleotídeos. Em certas modalidades, o comprimento do espaçador do RNA guia está entre 19 e 25 nucleotídeos. Em certas modalidades, o comprimento do espaçador do RNA guia é de 20 nucleotídeos. Em certas modalidades, o comprimento do espaçador do RNA guia é de 23 nucleotídeos. Em certas modalidades, o comprimento do espaçador do RNA guia é de 25 nucleotídeos.
[0142] Em certas modalidades, modulações de eficiência de clivagem podem ser exploradas pela introdução de incompatibilidades, por exemplo, 1 ou mais incompatibilidades, como 1 ou 2 incompatibilidades entre a sequência espaçadora e a sequência alvo, incluindo a posição da incompatibilidade ao longo do espaçador / alvo. Quanto mais central (ou seja, não 3' ou 5'), por exemplo, uma incompatibilidade dupla, mais a eficiência da clivagem é afetada. Por conseguinte, escolhendo a posição de incompatibilidade ao longo do espaçador, a eficiência da clivagem pode ser modulada. Por exemplo, se menos de 100% de clivagem de alvos for desejada (por exemplo, em uma população de células), 1 ou mais, como preferencialmente 2 incompatibilidades entre o espaçador e a sequência alvo, podem ser introduzidos nas sequências espaçadoras. Quanto mais central ao longo do espaçador da posição de incompatibilidade, menor a porcentagem de clivagem.
[0143] Em certas modalidades de exemplo, a eficiência de clivagem pode ser explorada para projetar guias únicos que podem distinguir dois ou mais alvos que variam por um único nucleotídeo, tal como um polimorfismo de nucleotídeo único (SNP), variação ou mutação (pontual). O efetor CRISPR pode ter sensibilidade reduzida a SNPs (ou outras variações de nucleotídeo único) e continuar a clivar alvos de SNP com um certo nível de eficiência.
Assim, para dois alvos, ou um conjunto de alvos, um RNA guia pode ser projetado com uma sequência de nucleotídeos que é complementar a um dos alvos, ou seja, o SNP no alvo.
O RNA guia é ainda projetado para ter uma incompatibilidade sintética.
Como utilizado neste documento, uma
"incompatibilidade sintética" refere-se a uma incompatibilidade não natural que é introduzida a montante ou a jusante do SNP de ocorrência natural, como no máximo 5 nucleotídeos a montante ou a jusante, por exemplo 4, 3, 2 ou
1 nucleotídeo a montante ou a jusante, preferencialmente no máximo 3 nucleotídeos a montante ou a jusante, mais preferencialmente no máximo 2 nucleotídeos a montante ou a jusante, mais preferencialmente 1 nucleotídeo a montante ou a jusante (isto é, adjacente ao SNP). Quando o efetor CRISPR se liga ao SNP no alvo, apenas uma única incompatibilidade será formada com a incompatibilidade sintética e o efetor
CRISPR continuará a ser ativado e um sinal detectável será produzido.
Quando o RNA guia hibrida com um SNP fora do alvo,
duas incompatibilidades são formadas, a incompatibilidade do
SNP e a sintética e nenhum sinal detectável gerado.
Assim,
os sistemas aqui divulgados podem ser projetados para distinguir SNPs dentro de uma população. Por exemplo, os sistemas podem ser usados para distinguir cepas patogênicas que diferem por um único SNP ou detectam certos SNPs específicos da doença, tais como, mas não limitados a, SNPs associados a doenças, como, sem limitação, SNPs associados a câncer.
[0144] Em certas modalidades, o RNA guia é projetado de modo que o SNP esteja localizado nas posições 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 , 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 da sequência espaçadora (iniciando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que o SNP esteja localizado nas posições 1, 2, 3, 4, 5, 6, 7, 8 ou 9 da sequência espaçadora (começando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que o SNP esteja localizado nas posições 2, 3, 4, 5, 6 ou 7 da sequência espaçadora (iniciando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que o SNP esteja localizado nas posições 3, 4, 5, ou 6 da sequência espaçadora (começando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que o SNP esteja localizado na posição 3 da sequência espaçadora (iniciando na extremidade 5').
[0145] Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade (por exemplo, a incompatibilidade sintética, ou seja, uma mutação adicional além de um SNP) esteja localizada nas posições 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 , 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 da sequência espaçadora (começando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade esteja localizada nas posições 1, 2, 3, 4, 5, 6, 7, 8 ou 9 da sequência espaçadora (começando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade esteja localizada nas posições 4, 5, 6, ou 7 da sequência espaçadora (começando na extremidade 5'). Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade esteja localizada na posição 5 da sequência espaçadora (iniciando na extremidade 5').
[0146] Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade esteja localizada 2 nucleotídeos a montante do SNP (isto é, um nucleotídeo interveniente).
[0147] Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade esteja localizada 2 nucleotídeos a jusante do SNP (isto é, um nucleotídeo interveniente).
[0148] Em certas modalidades, o RNA guia é projetado de modo que a incompatibilidade esteja localizada na posição
5 da sequência espaçadora (iniciando na extremidade 5') e o SNP está localizado na posição 3 da sequência espaçadora (iniciando na extremidade 5') .
[0149] As modalidades aqui descritas compreendem a indução de uma ou mais modificações de nucleotídeos em uma célula eucariótica (in vitro, isto é, em uma célula eucariótica isolada), como aqui discutido, compreendendo distribuir à célula de um vetor como aqui discutido. A(s) mutação(ões) podem incluir a introdução, deleção ou substituição de um ou mais nucleotídeos em cada sequência alvo de célula(s) através do(s) RNA(s) guia(s). As mutações podem incluir a introdução, exclusão ou substituição de 1- 75 nucleotídeos em cada sequência alvo da(s) referida(s) célula(s) através do(s) RNA(s) guia(s). As mutações podem incluir a introdução, exclusão ou substituição de 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 ou 75 nucleotídeos em cada sequência alvo da(s) referida(s) célula(s) através do(s) RNA(s) guia(s). As mutações podem incluir a introdução, exclusão ou substituição de 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 ou 75 nucleotídeos em cada sequência alvo da(s) referida(s) célula(s) através do(s) RNA(s) guia(s). As mutações incluem a introdução, exclusão ou substituição de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
25, 26, 27, 28, 29, 30, 35, 40, 45, 50 ou 75 nucleotídeos em cada sequência alvo da(s) referida(s) célula(s) através do(s) RNA(s) guia(s). As mutações podem incluir a introdução, exclusão ou substituição de 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, ou 75 nucleotídeos em cada sequência alvo da(s) referida(s) célula(s) através do(s) RNA(s) guia(s). As mutações podem incluir a introdução, exclusão ou substituição de 40, 45, 50, 75, 100, 200, 300, 400 ou 500 nucleotídeos em cada sequência alvo da(s) referida(s) célula(s) através do(s) RNA(s) guia(s).
[0150] Normalmente, no contexto de um sistema CRISPR endógeno, a formação de um complexo CRISPR (compreendendo uma sequência guia hibridada com uma sequência alvo e complexada com uma ou mais proteínas Cas) resulta em clivagem em ou próximo (por exemplo, dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 ou mais pares de bases da) sequência alvo, mas podem depender, por exemplo, de estrutura secundária, em particular no caso de alvos de RNA.
Reagentes de Amplificação
[0151] Em certas modalidades exemplificativas, os sistemas aqui divulgados podem incluir reagentes de amplificação. Diferentes componentes ou reagentes úteis para amplificação de ácidos nucleicos são descritos aqui.Por exemplo, um reagente de amplificação como aqui descrito pode incluir um tampão, tal como um tampão Tris.Um tampão Tris pode ser usado em qualquer concentração apropriada para a aplicação ou uso desejado, por exemplo, incluindo, entre outros, uma concentração de 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 11 mM, 12 mM, 13 mM, 14 mM, 15 mM, 25 mM, 50 mM, 75 mM, 1 M ou semelhantes.Um versado na técnica será capaz de determinar uma concentração apropriada de um tampão, tal como Tris, para uso com a presente invenção.
[0152] Um sal, como cloreto de magnésio (MgCl2), cloreto de potássio (KCl) ou cloreto de sódio (NaCl), pode ser incluído em uma reação de amplificação, como PCR, a fim de melhorar a amplificação de fragmentos de ácido nucleico.
Embora a concentração de sal dependa da reação e aplicação particulares, em algumas modalidades, fragmentos de ácido nucleico de um tamanho específico podem produzir resultados ótimos em concentrações específicas de sal.Produtos maiores podem exigir concentrações de sal alteradas, normalmente sal inferior, para produzir os resultados desejados, enquanto a amplificação de produtos menores pode produzir melhores resultados em concentrações mais altas de sal. Um versado na técnica entenderá que a presença e / ou concentração de um sal, juntamente com a alteração das concentrações de sal, pode alterar o rigor de uma reação biológica ou química e, portanto, qualquer sal pode ser usado que forneça as condições apropriadas para uma reação da presente invenção e conforme descrito aqui.
[0153] Outros componentes de uma reação biológica ou química podem incluir um componente de lise celular, a fim de abrir ou lisar uma célula para análise dos materiais nela contidos.Um componente de lise celular pode incluir, mas não está limitado a, um detergente, um sal como descrito acima, como NaCl, KCl, sulfato de amônio [(NH4)2SO4], ou outros.Detergentes que podem ser apropriados para a invenção podem incluir Triton X-100, dodecil sulfato de sódio (SDS), CHAPS (3-[(3-colamidopropil)dimetilamônio]-1- propanossulfonato), brometo de etil trimetil amônio, nonil fenoxipolietoxietanol (NP- 40).As concentrações de detergentes podem depender da aplicação específica e, em alguns casos, podem ser específicas da reação.As reações de amplificação podem incluir dNTPs e iniciadores de ácido nucleico usados em qualquer concentração, conforme detalhado neste documento.
[0154] As reações de amplificação podem incluir dNTPs e iniciadores de ácido nucleico usados em qualquer concentração apropriada para a invenção, como incluindo, entre outros, uma concentração de 100 nM, 150 nM, 200 nM, 250 nM, 300 nM, 350 nM, 400 nM, 450 nM, 500 nM, 550 nM, 600 nM, 650 nM, 700 nM, 750 nM, 800 nM, 850 nM, 900 nM, 950 nM, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM,
20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 150 mM, 200 mM, 250 mM, 300 mM, 350 mM, 400 mM, 450 mM, 500 mM ou semelhantes.Do mesmo modo, uma polimerase útil de acordo com a invenção pode ser qualquer polimerase específica ou geral conhecida na técnica e útil ou na invenção, incluindo a Taq polimerase, a Q5 polimerase ou semelhantes.
[0155] Em algumas modalidades, os reagentes de amplificação como aqui descritos podem ser apropriados para uso na amplificação de partida a quente. A amplificação de partida a quente pode ser benéfica em algumas modalidades para reduzir ou eliminar a dimerização de moléculas ou oligos adaptadores, ou para impedir produtos ou artefatos de amplificação indesejados e obter amplificação ideal do produto desejado. Muitos componentes aqui descritos para uso em amplificação também podem ser usados em amplificação de partida a quente. Em algumas modalidades, reagentes ou componentes apropriados para uso com amplificação de partida a quente podem ser usados no lugar de um ou mais dos componentes da composição, conforme apropriado. Por exemplo, uma polimerase ou outro reagente pode ser usado que exibe uma atividade desejada a uma temperatura específica ou outra condição de reação. Em algumas modalidades, os reagentes podem ser utilizados que são projetados ou otimizados para uso em amplificação de partida a quente, por exemplo, uma polimerase pode ser ativada após a transposição ou após atingir uma temperatura específica. Tais polimerases podem ser baseadas em anticorpos ou em aptâmeros. As polimerases como aqui descritas são conhecidas na técnica.Exemplos de tais reagentes podem incluir, mas não estão limitados a, polimerases de início a quente, dNTPs de partida a quente e dNTPs fotoenvelhecidas. Tais reagentes são conhecidos e estão disponíveis na técnica. Um versado na técnica será capaz de determinar as temperaturas ideais conforme apropriado para reagentes individuais.
Polimerase
[0156] Os sistemas e métodos aqui utilizados utilizam uma polimerase para amplificação de sequências alvo. Uma polimerase útil de acordo com a invenção pode ser qualquer polimerase específica ou geral conhecida na técnica e útil ou na invenção, incluindo a Taq polimerase, a Q5 polimerase ou semelhantes.Em modalidades, a amplificação pode ser utilizada para que pedaços de DNA cortados possam ser cortados e estendidos em uma reação cíclica que amplifica exponencialmente o alvo entre os locais de corte. Em modalidades, a polimerase pode ser selecionada de Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento completo, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase de fragmento grande, phi29 DNA polimerase, T7 DNA polimerase, Gst polimerase, Taq polimerase, fragmento Klenow de E. coli
DNA polimerase I, KlenTaq, Pol III DNA polimerase, T5 DNA polimerase, Gst polimerase e Sequenase DNA polimerase.
[0157] A amplificação pode ser isotérmica e selecionada para a temperatura. Numa modalidade, a amplificação prossegue rapidamente a 37 graus. Em outras modalidades, a temperatura da amplificação isotérmica pode ser escolhida selecionando uma polimerase (por exemplo, Bsu, Bst, Phi29, fragmento klenow etc.) operável a uma temperatura diferente. A amplificação à base de nickase pode ser realizada dentro de uma faixa de temperatura ou a uma temperatura constante. Em certas modalidades, a amplificação à base de nickase pode ser realizada a cerca de 50ºC-59ºC, a cerca de 60ºC-72ºC ou a cerca de 37 ºC. A nickase à base de Cas e a polimerase podem funcionar sob a mesma temperatura ou sob diferentes temperaturas.
[0158] As reações isotérmicas geralmente se referem a reações realizadas sem ciclos drásticos de temperatura, sem flutuações de temperatura de mais de cerca de 1 ºC, 2 ºC, 3 ºC, 4 ºC, 5 ºC, 6 ºC, 7 ºC, 8 ºC, 9 ºC, 10 ºC, 11 ºC, 12 ºC, 13 ºC, 14 ºC, 15 ºC, 16 ºC , 17 ºC , 18 ºC , 19 ºC, ou 20 ºC, ou flutuações de temperatura inferiores a cerca de 1 ºC, 2 ºC, 3 ºC, 4 ºC, 5 ºC, 6 ºC, 7 ºC, 8 ºC, 9 ºC, 10 ºC, 11 ºC, 12 ºC, 13 ºC, 14 ºC, 15 ºC, 16 ºC , 17 ºC , 18 ºC , 19 ºC, ou 20 ºC. Em certas modalidades, as reações isotérmicas são realizadas em uma faixa de temperatura operacional para a polimerase.
[0159] Em algumas modalidades, os reagentes de amplificação como aqui descritos podem ser apropriados para uso na amplificação de partida a quente. A amplificação de partida a quente pode ser benéfica em algumas modalidades para reduzir ou eliminar a dimerização de moléculas ou oligos adaptadores, ou para impedir produtos ou artefatos de amplificação indesejados e obter amplificação ideal do produto desejado. Muitos componentes aqui descritos para uso em amplificação também podem ser usados em amplificação de partida a quente. Em algumas modalidades, reagentes ou componentes apropriados para uso com amplificação de partida a quente podem ser usados no lugar de um ou mais dos componentes da composição, conforme apropriado. Por exemplo, uma polimerase ou outro reagente pode ser usado que exibe uma atividade desejada a uma temperatura específica ou outra condição de reação. Em algumas modalidades, os reagentes podem ser utilizados que são projetados ou otimizados para uso em amplificação de partida a quente, por exemplo, uma polimerase pode ser ativada após a transposição ou após atingir uma temperatura específica. Tais polimerases podem ser baseadas em anticorpos ou em aptâmeros. As polimerases como aqui descritas são conhecidas na técnica.Exemplos de tais reagentes podem incluir, mas não estão limitados a,
polimerases de início a quente, dNTPs de partida a quente e dNTPs fotoenvelhecidas. Tais reagentes são conhecidos e estão disponíveis na técnica. Um versado na técnica será capaz de determinar as temperaturas ideais conforme apropriado para reagentes individuais.
Par de inicadores
[0160] Um par de iniciadores é utilizado em modalidades dos sistemas e métodos aqui fornecidos. O par de iniciadores compreende um primeiro iniciador e um segundo iniciador. O primeiro iniciador compreende uma porção que é complementar a um primeiro local em um ácido nucleico alvo e compreende uma porção que compreende um local de ligação para a primeira molécula guia. O segundo iniciador compreende uma porção que é complementar a um segundo local em um ácido nucleico alvo e compreende uma porção que compreende um local de ligação para a segunda molécula guia.
[0161] Em um aspecto, é fornecido um par de iniciadores compreendendo um primeiro e um segundo iniciadores para a mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar à primeira fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia e o segundo iniciador compreendendo uma porção que é complementar à segunda fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia.
[0162] Em um aspecto, um par de iniciadores é fornecido compreendendo um primeiro e um segundo iniciador para a mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar a um primeiro local em uma fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para o primeira molécula guia e o segundo iniciador compreendendo uma porção que é complementar a um segundo local na fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia.
[0163] Em modalidades específicas, a mistura de reação de amplificação pode compreender ainda iniciadores, capazes de hibridar com uma fita de ácido nucleico alvo. O termo "hibridação" refere-se à ligação de um iniciador de oligonucleotídeo a uma região do modelo de ácido nucleico de fita simples sob as condições em que o iniciador se liga apenas especificamente à sua sequência complementar em uma das fitas do modelo, não a outras regiões do modelo. A especificidade da hibridação pode ser influenciada pelo comprimento do oligonucleotídeo iniciador, a temperatura em que a reação de hibridação é realizada, a força iônica e o pH. O termo "iniciador" refere-se a um ácido nucleico de fita simples capaz de se ligar a uma região de fita simples em um ácido nucleico alvo para facilitar a replicação dependente de polimerase da fita de ácido nucleico alvo.
Ácido(s) nucleico(s) que são "complementares" ou "complemento(s)" são aqueles que são capazes de emparelhamento de base de acordo com as regras padrão de complementaridade de ligação Watson-Crick, Hoogsteen ou Hoogsteen reversa .
[0164] Em certas modalidades, os iniciadores são incluídos na reação capaz de hibridar com as fitas estendidas, seguido por extensão de polimerase adicional dos iniciadores para regenerar dois pedaços de dsDNA: um primeiro dsDNA que inclui o sítio de guia CRISPR da primeira fita ou ambos os sítios de guia CRISPR de primeira e segunda fita, e um segundo dsDNA que inclui o sítio de guia CRISPR de segunda fita ou ambos os sítios de guia CRISPR de primeira e segunda fita. Esses pedações continuam a ser cortados e estendidos em uma reação cíclica que amplifica exponencialmente a região do alvo entre os sítios de corte.
[0165] A presente abordagem oferece vantagens em relação às técnicas de amplificação isotérmica de corte anterior que usam enzimas de corte com preferência de sequência fixa (por exemplo, na reação de amplificação de enzima de corte ou NEAR), que requerem desnaturação do alvo de dsDNA original para permitir o recozimento e extensão de iniciadores que adicionam o substrato de corte a as extremidades do alvo. Os presentes métodos usando uma nickase CRISPR em que os sítios de corte podem ser programados por meio de RNAs guia significam que nenhuma etapa de desnaturação é necessária, permitindo que toda a reação seja verdadeiramente isotérmica. A reação é simplificada porque os iniciadores que adicionam o substrato de corte são diferentes dos iniciadores que são usados posteriormente na reação, o que significa que NEAR requer dois conjuntos de iniciadores (ou seja, 4 iniciadores) enquanto o corte CRISPR, como a amplificação de corte Cpf1, requer apenas um conjunto de iniciador (ou seja, dois iniciadores). Isso torna a amplificação de corte CRISPR muito mais simples e fácil de operar sem instrumentação complicada para realizar a desnaturação e resfriamento subsequente à temperatura isotérmica, fornecendo um método de amplificação mais simples e rápido.
[0166] Os iniciadores podem compreender uma sequência promotora. Em certas modalidades, a sequência promotora é uma sequência que pode ser usada em etapas de detecção opcionais. Em modalidades, o iniciador compreende uma sequência de promotor T7 que pode ser usada com métodos de detecção SHERLOCK. Outras sequências promotoras podem ser selecionadas para uso com outros sistemas e métodos a jusante por um versado na técnica.
[0167] O ácido nucleico pode ser submetido a uma etapa de polimerização. Uma DNA polimerase é selecionada se o ácido nucleico a ser amplificado for DNA. Quando o alvo inicial é o RNA, uma transcriptase reversa pode ser usada primeiro para copiar o RNA alvo em uma molécula de cDNA e o cDNA é então amplificado.
[0168] As reações de amplificação podem incluir dNTPs e iniciadores de ácido nucleico usados em qualquer concentração apropriada para a invenção, como incluindo, entre outros, uma concentração de 100 nM, 150 nM, 200 nM, 250 nM, 300 nM, 350 nM, 400 nM , 450 nM, 500 nM, 550 nM, 600 nM, 650 nM, 700 nM, 750 nM, 800 nM, 850 nM, 900 nM, 950 nM, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 150 mM, 200 mM, 250 mM, 300 mM, 350 mM, 400 mM, 450 mM, 500 mM ou semelhantes.
Ácido Nucleico Alvo
[0169] No contexto da formação de um complexo de CRISPR, "sequência alvo" refere-se a uma sequência na qual uma sequência guia é projetada para ter complementaridade, onde a hibridação entre uma sequência alvo e uma sequência guia promove a formação de um complexo de CRISPR. Uma sequência alvo pode compreender polinucleotídeos de RNA ou DNA. O termo "DNA ou RNA alvo" refere-se a um polinucleotídeo de DNA ou RNA sendo ou compreendendo a sequência alvo. Em outras palavras, o DNA ou RNA alvo pode ser um polinucleotídeo de DNA ou RNA ou uma parte de um polinucleotídeo de DNA ou RNA para o qual uma parte do gRNA, ou seja, a sequência guia, é projetada para ter complementaridade e para a qual a função efetora mediada pelo complexo que compreende proteína efetora CRISPR e um gRNA devem ser direcionada. Em algumas modalidades, uma sequência alvo está localizada no núcleo ou citoplasma de uma célula.
[0170] A amplificação à base de nickase pode ser usada para amplificar sequências de ácido nucleico alvo com comprimentos variados. Por exemplo, a sequência de ácido nucleico alvo pode ser cerca de 10-20, cerca de 20-30, cerca de 30-40, cerca de 40-50, cerca de 50-100, cerca de 100-200, cerca de 100-200, cerca de 100-1000, cerca de 1000-2000, cerca de 2000-3000, cerca de 3000-4000 ou cerca de 4000-5000 nucleotídeos de comprimento. O ácido nucleico alvo pode ser DNA, por exemplo, DNA genômico, DNA mitocondrial, DNA viral, DNA de plasmídeo, DNA livre de células circulantes, DNA ambiental ou DNA de fita dupla sintético. O ácido nucleico alvo pode ser ácido nucleico de fita simples, por exemplo, uma molécula de RNA. O ácido nucleico de fita simples pode ser convertido em um ácido nucleico de fita dupla antes da amplificação baseada em nickase. Por exemplo, uma molécula de RNA pode ser convertida em um DNA de fita dupla por transcrição reversa antes da amplificação. O ácido nucleico de fita simples pode ser selecionado do grupo que consiste em DNA viral de fita simples, RNA viral, RNA mensageiro, RNA ribossômico, RNA de transferência, microRNA, RNA de interferência curto, RNA nuclear pequeno, RNA sintético, RNA não codificante longo, pré-micro RNA, dsRNA e DNA de fita simples sintético.
Amostra
[0171] Como aqui descrito, uma amostra para uso com a invenção pode ser uma amostra biológica ou ambiental, como uma amostra de alimentos (frutas ou vegetais frescos, carnes), uma amostra de bebida, uma superfície de papel, uma superfície de tecido, uma superfície de metal, uma superfície de madeira, uma superfície de plástico, uma amostra de solo, uma amostra de água doce, uma amostra de águas residuais, uma amostra de água salina, exposição ao ar atmosférico ou a outra amostra de gás ou uma combinação dos mesmos. Por exemplo, superfícies domésticas / comerciais / industriais feitas de quaisquer materiais, incluindo, mas não se limitando a, metal, madeira, plástico, borracha ou semelhantes, podem ser esfregadas e testadas para contaminantes.As amostras de solo podem ser testadas quanto à presença de bactérias ou parasitas patogênicos ou outros micróbios, tanto para fins ambientais quanto para testes em humanos, animais ou plantas. Amostras de água, como amostras de água doce, amostras de águas residuais ou amostras de água salina, podem ser avaliadas quanto à limpeza e segurança e / ou potabilidade, para detectar a presença de, por exemplo, Cryptosporidium parvum, Giardia lamblia, ou outra contaminação microbiana. Em outras modalidades, uma amostra biológica pode ser obtida de uma fonte incluindo, mas não se limitando a uma amostra de tecido, saliva, sangue, plasma, soros, fezes, urina, escarro, mucosa, linfa, fluido sinovial, líquido cefalorraquidiano, ascite, derrame pleural, seroma, pus ou zaragatoa de pele ou superfície da membrana mucosa.Em algumas modalidades particulares, uma amostra ambiental ou amostras biológicas podem ser amostras brutas e / ou a uma ou mais moléculas alvo não podem ser purificadas ou amplificadas a partir da amostra antes da aplicação do método. A identificação de micróbios pode ser útil e / ou necessária para qualquer número de aplicações e, portanto, qualquer tipo de amostra de qualquer fonte considerada apropriada por um versado na técnica pode ser usado de acordo com a invenção.
[0172] Em algumas modalidades, a amostra biológica pode incluir, mas não está necessariamente limitada a sangue, plasma, soro, urina, fezes, escarro, muco, fluido linfático, fluido sinovial, bile, ascite, efusão pleural, seroma, saliva, fluido cerebrospinal, humor aquoso ou vítreo, ou qualquer secreção corporal, um transudato, um exsudato ou fluido obtido de uma articulação ou um swab de pele ou superfície de membrana mucosa.
[0173] Em modalidades específicas, a amostra pode ser sangue, plasma ou soro obtido de um paciente humano.
[0174] Em algumas modalidades, a amostra pode ser uma amostra de planta. Em algumas modalidades, a amostra pode ser uma amostra em bruto. Em algumas modalidades, a amostra pode ser uma amostra purificada.
Detecção
[0175] Os sistemas descritos neste documento podem compreender ainda sistemas para detecção. A amplificação à base de nickase pode ser combinada com uma variedade de métodos de detecção para detectar os produtos de ácido nucleico amplificados. Por exemplo, os sistemas e métodos de detecção podem compreender eletroforese em gel, detecção de corante intercalante, PCR, PCR em tempo real, fluorescência, Transferência de Energia por Ressonância de Fluorescência (FRET), espectrometria de massa, ensaios de fluxo lateral, ensaios colorimétricos (HRP, ALP, ouro, ensaios baseados em nanopartículas) e CRISPR-SHERLOCK. A amplificação e detecção combinadas podem alcançar sensibilidade attomolar ou sensibilidade femtomolar. Em certas modalidades, a detecção de DNA com os métodos ou sistemas da invenção requer a transcrição do DNA (amplificado) em RNA antes da detecção.
[0176] Será evidente que os métodos de detecção da invenção podem envolver procedimentos de amplificação e detecção de ácidos nucleicos em várias combinações. O ácido nucleico a ser detectado pode ser qualquer ácido nucleico sintético ou natural, incluindo mas não limitado a DNA e RNA, que pode ser amplificado por qualquer método adequado para fornecer um produto intermediário que pode ser detectado. A detecção do produto intermediário pode ser por qualquer método adequado, incluindo, mas não limitado a, ligação e ativação de uma proteína CRISPR que produz uma fração de sinal detectável por atividade direta ou colateral.
[0177] Em modalidades específicas, o ácido nucleico amplificado pode ser detectado por um sistema baseado em CRISPR Cas13. Em modalidades específicas, o ácido nucleico amplificado pode ser detectado por um sistema baseado em CRISPR Cas12 (ver Chen et al. Science 360:436-439 (2018) and Gootenberg et al. Science 360:439-444 (2018)). Em modalidades específicas, o ácido nucleico amplificado pode ser detectado por uma combinação de um sistema baseado em CRISPR Cas13 e um sistema baseado em CRISPR Cas12.
[0178] A detecção de ácidos nucleicos, incluindo variantes de nucleotídeo único, detecção com base em sequências de rRNA, triagem para resistência a drogas, monitoramento de surtos de micróbios, perturbações genéticas e triagem de amostras ambientais, pode ser conforme descrito,
por exemplo, em WO/2019/07105 depositado em 22 de outubro , 2018 em [0183] - [0327], aqui incorporado por referência. É feita referência a WO 2017/219027, WO2018 / 107129, US20180298445, US 2018-0274017, US 2018-0305773, WO 2018/170340, Pedido US 15 / 922.837, depositado em 15 de março de 2018 intitulado “Devices for CRISPR Effector System Based Diagnostics ”, PCT / US18 / 50091, depositado em 7 de setembro de 2018 ““Multi-Effector CRISPR Based Diagnostic Systems”, PCT / US18 / 66940 depositado em 20 de dezembro de 2018 intitulado “ CRISPR Effector System Based Multiplex Diagnostics ”, PCT / US18 / 054472 depositado em 4 de outubro de 2018, intitulado "CRISPR Effector System Based Diagnostic", Provisório U.S. 62/740.728 depositado em 3 de outubro de 2018 intitulado "CRISPR Effector System Based Diagnostics for Hemorrhagic Fever Detection", Provisório U.S. 62 / 690.278 depositado em 26 de junho de 2018 e Provisório U.S. 62 / 767.059 depositado em 14 de novembro de 2018 ambos intitulados “CRISPR Double Nickase Based Amplification, Compositions, Systems and Methods”, Provisório U.S. 62 / 690.160 depositado em 26 de junho de 2018 e 62.767.077 depositado em 14 de novembro de 2018, ambos intitulados “CRISPR / CAS e Transposase Based Amplification Composições, Systems, And Methods ", Provisório U.S. 62 /
690.257 depositado em 26 de junho de 2018 e 62 / 767.052 depositado em 14 de novembro de 2018 ambos intitulados"
CRISPR Effector System Based Amplification Methods, Systems,
And Diagnostics ", Provisório U.S. 62 / 767.076 depositado em 14 de novembro, 2018 intitulado "Multiplexing Highly
Evolving Viral Variants With SHERLOCK" e 62 / 767.070 depositado em 14 de novembro de 2018 intitulado "Droplet
SHERLOCK". É feita ainda referência a WO2017 / 127807, WO2017
/ 184786 , WO 2017/184768, WO 2017/189308, WO 2018/035388,
WO 2018/170333, WO 2018/191388, WO 2018/213708, WO
2019/005866, PCT / US18 / 67328 depositado em 21 de dezembro de 2018 intitulado “Novel CRISPR Enzymes and Systems”, PCT
/ US18 / 67225 depositado em 21 de dezembro de 2018 intitulado “Novel CRISPR Enzymes and Systems” e PCT / US18
/ 67307 depositado em 21 de dezembro de 2018 intitulado
“Novel CRISPR Enzymes and Systems ", US 62 / 712.809 depositado em 31 de julho de 2018 intitulado" Novel CRISPR
Enzymes and Systems", US 62 / 744.080 depositado em 10 de outubro de 2018 intitulado "Novel Cas12b Enzymes and Systems"
e US 62 / 751.196 depositado em 26 de outubro de 2018 "Novel
Cas12b Enzymes and Systems", US 715.640 depositado em 7 de agosto de 2-18 intitulado “Novel CRISPR Enzymes and Systems”,
WO 2016/205711, U.S. 9,790,490, WO 2016/205749, WO
2016/205764, WO 2017/070605, WO 2017/106657, and WO
2016/149661, WO2018/035387, WO2018/194963, Cox DBT, et al.,
RNA editing with CRISPR-Cas13, Science.2017 Nov
24;358(6366):1019-1027; Gootenberg JS, et al., Multiplexed and portable nucleic acid detection platform with Cas13, Cas12a, and Csm6., Science. 2018 Apr 27;360(6387):439-444; Gootenberg JS, et al., Nucleic acid detection with CRISPR- Cas13a/C2c2., Science. 2017 Apr 28;356(6336):438-442; Abudayyeh OO, et al., RNA targeting with CRISPR-Cas13, Nature. 2017 Oct 12;550(7675):280-284; Smargon AA, et al., Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28. Mol Cell. 2017 Feb 16;65(4):618-630.e7; Abudayyeh OO, et al., C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector, Science. 2016 Aug 5;353(6299):aaf5573; Yang L, et al., Engineering and optimising deaminase fusions for genome editing. Nat Commun.
2016 Nov 2;7:13330, Myrvhold et al., Field deployable viral diagnostics using CRISPR-Cas13, Science 2018 360, 444-448, Shmakov et al. “Diversity and evolution of class 2 CRISPR- Cas systems,” Nat Rev Microbiol. 2017 15 (3):169-182, cada um dos quais é incorporado neste documento por referência em sua totalidade.
[0179] Em algumas modalidades específicas, efetores de direcionamento de RNA podem ser utilizados para fornecer uma detecção baseada em CRISPR robusta. As modalidades aqui divulgadas podem detectar tanto DNA quanto RNA com níveis comparáveis de sensibilidade e podem ser usadas em conjunto com os métodos e sistema HDA divulgados. Para facilidade de referência, as modalidades de detecção divulgadas neste documento também podem ser referidas como SHERLOCK (Desbloqueio do Repórter Enzimático de Alta Sensibilidade Específica), que, em algumas modalidades, é realizado subsequentemente aos métodos HDA divulgados neste documento, incluindo sob condições isotérmicas mesofílicas e termofílicas.
[0180] Em algumas modalidades, um ou mais elementos de um sistema de detecção de direcionamento de ácido nucleico é derivado de um organismo particular que compreende um sistema de direcionamento de RNA CRISPR endógeno. Em certas modalidades de exemplo, o sistema de detecção de direcionamento de RNA de proteína efetora CRISPR compreende pelo menos um domínio HEPN, incluindo, mas não se limitando aos domínios HEPN aqui descritos, domínios HEPN conhecidos na técnica e domínios reconhecidos como domínios HEPN em comparação com os motivos de sequência de consenso. Vários desses domínios são fornecidos aqui. Em um exemplo não limitativo, uma sequência de consenso pode ser derivada das sequências de ortólogos C2c2 ou Cas13b aqui fornecidos. Em certas modalidades de exemplo, a proteína efetora compreende um único domínio HEPN. Em certas outras modalidades de exemplo, a proteína efetora compreende dois domínios HEPN.
[0181] Em uma modalidade de exemplo, a proteína efetora compreende um ou mais domínios HEPN compreendendo uma sequência de motivo RxxxxH. A sequência do motivo RxxxxH pode ser, sem limitação, de um domínio HEPN aqui descrito ou um domínio HEPN conhecido na técnica. As sequências de motivos RxxxxH incluem ainda sequências de motivos criadas pela combinação de porções de dois ou mais domínios HEPN.
Conforme observado, as sequências de consenso podem ser derivadas das sequências dos ortólogos divulgados em PCT / US2017 / 038154 intitulado “Novel Type VI CRISPR Orthologs and Systems,” por exemplo, nas páginas 256-264 e 285-336, Pedido de Patente Provisório U.S. 62 / 432.240 intitulado “Novel CRISPR Enzymes and Systems,” Pedido de Patente Provisório U.S. 62 / 471.710 intitulado “Novel Type VI CRISPR Orthologs and Systems” depositado em 15 de março de 2017, e Pedido de Patente Provisório U.S. 62/484,786 intitulado “Novel Type VI CRISPR Orthologs and Systems,” depositado em 12 de abril de 2017.
[0182] Em uma modalidade da invenção, um domínio HEPN compreende pelo menos um motivo RxxxxH compreendendo a sequência de R{N/H/K}X1X2X3H (SEQ ID NO:1). Numa modalidade da invenção, um domínio HEPN compreende um motivo RxxxxH compreendendo a sequência de R{N/H}X1X2X3H (SEQ ID NO:2).
Numa modalidade da invenção, um domínio HEPN compreende a sequência de R{N/K}X1X2X3H (SEQ ID NO:3). Em certas modalidades, X1 é R, S, D, E, Q, N, G, Y ou H. Em certas modalidades, X2 é I, S, T, V ou L. Em certas modalidades, X3 é L, F, N, Y, V, I, S, D, E ou A.
[0183] Efetores adicionais para uso de acordo com a invenção podem ser identificados por sua proximidade com os genes cas1, por exemplo, embora não limitados a, dentro da região 20 kb desde o início do gene cas1 e 20 kb a partir do final do gene cas1. Em certas modalidades, a proteína efetora compreende pelo menos um domínio HEPN e pelo menos 500 aminoácidos, e em que a proteína efetiva C2c2 está naturalmente presente em um genoma procariótico dentro de 20 kb a montante ou a jusante de um gene Cas ou de uma matriz CRISPR. Exemplos não limitativos de proteínas Cas incluem Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (também conhecidas como Csn1 e Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, homólogos das mesmas, ou versões modificadas das mesmas. Em certas modalidades exemplificativas, a proteína efetora C2c2 está naturalmente presente em um genoma procariótico dentro de 20kb a montante ou a jusante de um gene Cas1. Os termos "ortólogo" (também aqui referido como "ortólogo") e "homólogo" (também aqui referido como "homólogo") são bem conhecidos na técnica. Por meio de orientações adicionais, um "homólogo" de uma proteína como aqui utilizado é uma proteína da mesma espécie que desempenha a mesma ou uma função semelhante à da proteína da qual é um homólogo. As proteínas homólogas podem, mas não precisam estar relacionadas estruturalmente, ou estão apenas parcialmente relacionadas estruturalmente. Um "ortólogo" de uma proteína como utilizado neste documento é uma proteína de uma espécie diferente que desempenha a mesma função ou uma função semelhante à da qual é um ortólogo. As proteínas ortólogas podem, mas não precisam estar relacionadas estruturalmente, ou estão apenas parcialmente relacionadas estruturalmente.
[0184] Em modalidades particulares, a enzima Cas direcionada a RNA do Tipo VI é C2c2. Em outras modalidades de exemplo, a enzima Cas direcionada a RNA do Tipo VI é Cas 13b. Em modalidades particulares, o homólogo ou ortólogo de uma proteína Tipo VI, tal como C2c2, conforme referido aqui, tem uma homologia de sequência ou identidade de pelo menos 30%, ou pelo menos 40%, ou pelo menos 50%, ou pelo menos 60%, ou pelo menos 70%, ou pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, tal como, por exemplo, pelo menos 95% com uma proteína Tipo VI, tal como C2c2 (por exemplo, com base na sequência de tipo selvagem de qualquer um de Leptotrichia shahii C2c2, Lachnospiraceae bacterium MA2020 C2c2, Lachnospiraceae bacterium NK4A179 C2c2,
Clostridium aminophilum (DSM 10710) C2c2, Carnobacterium gallinarum (DSM 4847) C2c2, Paludibacter propionicigenes (WB4) C2c2, Listeria weihenstephanensis (FSL R9-0317) C2c2, Listeriaceae bacterium (FSL M6-0635) C2c2, Listeria newyorkensis (FSL M6-0635) C2c2, Leptotrichia wadei (F0279) C2c2, Rhodobacter capsulatus (SB 1003) C2c2, Rhodobacter capsulatus (R121) C2c2, Rhodobacter capsulatus (DE442) C2c2, Leptotrichia wadei (Lw2) C2c2, ou Listeria seeligeri C2c2).
Em outras modalidades, o homólogo ou ortólogo de uma proteína Tipo VI, como C2c2, conforme referido neste documento, tem uma identidade de sequência de pelo menos 30%, ou pelo menos 40%, ou pelo menos 50%, ou pelo menos 60%, ou pelo menos pelo menos 70% ou pelo menos 80%, mais preferencialmente pelo menos 85%, ainda mais preferencialmente pelo menos 90%, tal como, por exemplo, pelo menos 95% com o C2c2 de tipo selvagem (por exemplo, com base na sequência de tipo selvagem de qualquer um de Leptotrichia shahii C2c2, Lachnospiraceae bacterium MA2020 C2c2, Lachnospiraceae bacterium NK4A179 C2c2, Clostridium aminophilum (DSM 10710) C2c2, Carnobacterium gallinarum (DSM 4847) C2c2, Paludibacter propionicigenes (WB4) C2c2, Listeria weihenstephanensis (FSL R9-0317) C2c2, Listeriaceae bacterium (FSL M6-0635) C2c2, Listeria newyorkensis (FSL M6-0635) C2c2, Leptotrichia wadei (F0279) C2c2, Rhodobacter capsulatus (SB 1003) C2c2, Rhodobacter capsulatus (R121) C2c2, Rhodobacter capsulatus (DE442) C2c2, Leptotrichia wadei (Lw2) C2c2, ou Listeria seeligeri C2c2).
[0185] Em certas outras modalidades exemplares, o sistema CRISPR, a proteína efetora, é uma nuclease C2c2. A atividade de C2c2 pode depender da presença de dois domínios HEPN. Demonstrou-se que são domínios da RNase, isto é , RNA de corte de nuclease (em particular uma endonuclease). C2c2 HEPN também pode direcionar DNA ou potencialmente DNA e/ou RNA.Com base no fato de que os domínios HEPN de C2c2 são pelo menos capazes de se ligar e, na sua forma selvagem, cortar RNA, é preferível que a proteína efetora C2c2 tenha a função RNase. Em relação aos sistemas C2c2 CRISPR, é feita referência ao Provisório U.S. 62 / 351.662 depositado em 17 de junho de 2016 e ao Provisório U.S. 62 / 376.377 depositado em 17 de agosto de 2016. Também é feita referência ao Provisório U.S. 62 / 351.803 depositado em 17 de junho de
2016. Também é feita referência ao Provisório U.S. intitulado “Novel Crispr Enzymes and Systems” filed December 8, 2016 bearing Broad Institute No. 10035.PA4 e Arquivo do Procurador No. 47627.03.2133. Também é feita referência a East-Seletsky et al. “Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection” Nature doi:10/1038/nature19802 and Abudayyeh et al. “C2c2 is a single-component programmable RNA-guided RNA targeting CRISPR effector” bioRxiv doi:10.1101/054742.
[0186] A função RNase em sistemas CRISPR é conhecida; por exemplo, o direcionamento de mRNA foi relatado para certos sistemas CRISPR-Cas do tipo III (Hale et al., 2014, Genes Dev, vol. 28, 2432-2443; Hale et al., 2009, Cell, vol. 139, 945-956; Peng et al., 2015, Nucleic acids research, vol. 43, 406-417) e oferece vantagens significativas. No sistema Staphylococcus epidermis tipo III-A, a transcrição entre os alvos resulta na clivagem do DNA alvo e de seus transcritos, mediados por sítios ativos independentes no complexo proteico efetor de ribonucleoproteínas Cas10-Csm (ver Samai et al., 2015, Cell, 151, 1164-1174). Um sistema CRISPR-Cas, composição ou método que direciona RNA através das presentes proteínas efetoras é assim fornecido.
[0187] Em uma modalidade, a proteína Cas pode ser um ortólogo C2c2 de um organismo de um gênero que inclui, mas não está limitado a Leptotrichia, Listeria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, Campylobacter, e Lachnospira. As espécies de organismos desse gênero podem ser aqui discutidas de outra forma.
[0188] Em certas modalidades de exemplo, as proteínas efetoras C2c2 da invenção incluem, sem limitação,
as seguintes 21 espécies de ortólogos (incluindo múltiplos loci CRISPR: Leptotrichia shahii; Leptotrichia wadei (Lw2); Listeria seeligeri; Lachnospiraceae bacterium MA2020; Lachnospiraceae bacterium NK4A179; [Clostridium] aminophilum DSM 10710; Carnobacterium gallinarum DSM 4847; Carnobacterium gallinarum DSM 4847 (segundo loci CRISPR); Paludibacter propionicigenes WB4; Listeria weihenstephanensis FSL R9-0317; Listeriaceae bacterium FSL M6-0635; Leptotrichia wadei F0279; Rhodobacter capsulatus SB 1003; Rhodobacter capsulatus R121; Rhodobacter capsulatus DE442; Leptotrichia buccalis C-1013-b; Herbinix hemicellulosilytica; [Eubacterium] rectale; Eubacteriaceae bacterium CHKCI004; Blautia sp. Marseille-P2398; e Leptotrichia sp. oral taxon 879 cepa F0557. Doze (12) outros exemplos não limitativos são: Lachnospiraceae bacterium NK4A144; Chloroflexus aggregans; Demequina aurantiaca; Thalassospira sp. TSL5-1; Pseudobutyrivibrio sp. OR37; Butyrivibrio sp. YAB3001; Blautia sp. Marseille-P2398; Leptotrichia sp. Marseille-P3007; Bacteroides ihuae; Porphyromonadaceae bacterium KH3CP3RA; Listeria riparia; e Insolitispirillum peregrinum.
[0189] Alguns métodos de identificação de ortólogos de enzimas do sistema CRISPR-Cas podem envolver a identificação de sequências tracr em genomas de interesse.
A identificação de sequências tracr pode estar relacionada com as seguintes etapas: Pesquisa de repetições diretas ou sequências tracr mate em um banco de dados para identificar uma região CRISPR compreendendo uma enzima CRISPR. Procure sequências homólogas na região CRISPR que flanqueiam a enzima CRISPR nas direções de sentido e antissentido. Procure terminadores de transcrição e estruturas secundárias.
Identifique qualquer sequência que não seja uma sequência de repetição direta ou tracr mate, mas que tenha mais de 50% de identidade com a sequência de repetição direta ou tracr mate como uma sequência potencial de tracr. Pegue a sequência tracr potencial e analise as sequências terminadoras da transcrição associadas a ela.
[0190] Será apreciado que qualquer uma das funcionalidades aqui descritas pode ser engenheirada em enzimas CRISPR de outros ortólogos, incluindo enzimas quiméricas compreendendo fragmentos de múltiplos ortólogos.Exemplos de tais ortólogos são descritos em outras partes deste documento.Assim, as enzimas quiméricas podem compreender fragmentos de ortólogos da enzima CRISPR de um organismo que inclui, mas não se limitam a, Leptotrichia, Listeria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor,
Mycoplasma e Campylobacter.Uma enzima quimérica pode compreender um primeiro fragmento e um segundo fragmento, e os fragmentos podem ser de ortólogos da enzima CRISPR de organismos de gêneros aqui mencionados ou de espécies aqui mencionadas; vantajosamente os fragmentos são de ortólogos da enzima CRISPR de diferentes espécies.
[0191] Em modalidades, a proteína C2c2 como aqui referida também abrange uma variante funcional de C2c2 ou um homólogo ou um ortólogo da mesma. Uma "variante funcional" de uma proteína como aqui utilizada refere-se a uma variante dessa proteína que retém pelo menos parcialmente a atividade dessa proteína. As variantes funcionais podem incluir mutantes (que podem ser de inserção, exclusão ou substituição), incluindo polimorfos, etc. Também estão incluídos nas variantes funcionais produtos de fusão dessa proteína com outro ácido nucleico, proteína, polipeptídeo ou peptídeo, geralmente não relacionado. As variantes funcionais podem ocorrer naturalmente ou podem ser feitas pelo homem.As modalidades vantajosas podem envolver a proteína efetora de direcionamento ao RNA Tipo VI engenheirada ou de ocorrência não natural.
[0192] Em uma modalidade, a(s) molécula(s) de ácido nucleico que codificam o C2c2 ou um ortólogo ou homólogo do mesmo, podem ser otimizados por códons para expressão em uma célula eucariótica.Um eucarioto pode ser como aqui discutido. As moléculas de ácido nucleico podem ser engenheiradas ou não naturais.
[0193] Em uma modalidade, o C2c2 ou um ortólogo ou homólogo do mesmo pode compreender uma ou mais mutações (e, portanto, molécula(s) de ácido nucleico que codifica(m) para o mesmo podem ter mutação(ões). As mutações podem ser mutações introduzidas artificialmente e podem incluir, mas não estão limitadas a, uma ou mais mutações em um domínio catalítico. Exemplos de domínios catalíticos com referência a uma enzima Cas9 podem incluir, mas não estão limitados a, domínios RuvC I, RuvC II, RuvC III e HNH.
[0194] Numa modalidade, o C2c2 ou um ortólogo ou homólogo do mesmo, pode compreender uma ou mais mutações. As mutações podem ser mutações introduzidas artificialmente e podem incluir, mas não estão limitadas a, uma ou mais mutações em um domínio catalítico. Exemplos de domínios catalíticos com referência a uma enzima Cas podem incluir, mas não estão limitados a, domínios HEPN.
[0195] Numa modalidade, o C2c2 ou um ortólogo ou homólogo do mesmo, pode ser usado como uma proteína genérica de ligação ao ácido nucleico com fusão a ou estando operacionalmente ligada a um domínio funcional. Domínios funcionais exemplificativos podem incluir, mas não estão limitados a iniciador de tradução, ativador de tradução, repressor de tradução, nucleases, em particular ribonucleases, um spliceossoma, esferas, um domínio indutível / controlável por luz ou um domínio indutível / controlável quimicamente.
[0196] Em certas modalidades de exemplo, a proteína efetora C2c2 pode ser de um organismo selecionado do grupo que consiste em; Leptotrichia, Listeria, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, e Campylobacter.
[0197] Em certas modalidades, a proteína efetora pode ser uma Listeria sp. C2c2p, preferencialmente Listeria seeligeria C2c2p, mais preferencialmente Listeria seeligeria serovar 1 / 2b cepa SLCC3954 C2c2p e a sequência de crRNA podem ter 44 a 47 nucleotídeos de comprimento, com uma repetição direta 5' 29-nt (DR) e um espaçador de 15-nt a 18- nt.
[0198] Em certas modalidades, a proteína efetora pode ser uma Leptotrichia sp. C2c2p, de preferência Leptotrichia shahii C2c2p, mais preferencialmente Leptotrichia shahii DSM 19757 C2c2p e a sequência de crRNA pode ter 42 a 58 nucleotídeos de comprimento, com uma repetição direta 5' de pelo menos 24 nt, tal como repetição direta 5' 24-28-nt (DR) e um espaçador de pelo menos 14 nt,
como um espaçador de 14 nt a 28 nt, ou um espaçador de pelo menos 18 nt, como 19, 20, 21, 22 ou mais nt, como 18-28, 19- 28, 20-28, 21-28 ou 22-28 nt.
[0199] Em certas modalidades de exemplo, a proteína efetora pode ser uma Leptotrichia sp., Leptotrichia wadei F0279 ou uma Listeria sp., de preferência Listeria newyorkensis FSL M6-0635.
[0200] Em certas modalidades de exemplo, as proteínas efetoras C2c2 da invenção incluem, sem limitação, as seguintes 21 espécies de ortólogos (incluindo múltiplos loci CRISPR: Leptotrichia shahii; Leptotrichia wadei (Lw2); Listeria seeligeri; Lachnospiraceae bacterium MA2020; Lachnospiraceae bacterium NK4A179; [Clostridium] aminophilum DSM 10710; Carnobacterium gallinarum DSM 4847; Carnobacterium gallinarum DSM 4847 (segundo loci CRISPR); Paludibacter propionicigenes WB4; Listeria weihenstephanensis FSL R9-0317; Listeriaceae bacterium FSL M6-0635; Leptotrichia wadei F0279; Rhodobacter capsulatus SB 1003; Rhodobacter capsulatus R121; Rhodobacter capsulatus DE442; Leptotrichia buccalis C-1013-b; Herbinix hemicellulosilytica; [Eubacterium] rectale; Eubacteriaceae bacterium CHKCI004; Blautia sp. Marseille-P2398; e Leptotrichia sp. táxon oral 879 cepa F0557. Doze (12) outros exemplos não limitativos são: bactéria Lachnospiraceae NK4A144; Agregadores de cloroflexo; Demequina aurantiaca;
Thalassospira sp. TSL5-1; Pseudobutyrivibrio sp. OR37; Butyrivibrio sp. YAB3001; Blautia sp. Marseille-P2398; Leptotrichia sp. Marseille-P3007; Bacteroides ihuae; Porphyromonadaceae bacterium KH3CP3RA; Listeria riparia; e Insolitispirillum peregrinum.
[0201] Em certas modalidades, a proteína C2c2 de acordo com a invenção é ou é derivada de um dos ortólogos ou é uma proteína quimérica de dois ou mais dos ortólogos conforme descrito neste pedido, ou é um mutante ou variante de um dos ortólogos (ou um mutante quimérico ou variante), incluindo C2c2 morta, C2c2 dividida, C2c2 desestabilizada, etc. conforme definido neste documento em outro lugar, com ou sem fusão com um domínio heterólogo / funcional.
[0202] Em certas modalidades de exemplo, a proteína efetora direcionada a RNA é uma proteína efetora do Tipo VI- B, como Cas13b e proteínas do Grupo 29 ou do Grupo 30. Em certas modalidades de exemplo, a proteína efetora de direcionamento de RNA compreende um ou mais domínios HEPN.
Em certas modalidades de exemplo, a proteína efetora de direcionamento de RNA compreende um domínio HEPN C-terminal, um domínio HEPN N-terminal ou ambos. Em relação ao exemplo de proteínas efetoras do Tipo VI-B que podem ser usadas no contexto desta invenção, é feita referência ao Pedido US 15/331.792, intitulado “Novel CRISPR Enzymes and Systems” e depositado em 21 de outubro de 2016, Pedido Internacional de
Patente PCT/US2016/058302, intitulado “Novel CRISPR Enzymes and Systems”, and filed October 21, 2016, and Smargon et al.
“Cas13b is a Type VI-B CRISPR-associated RNA-Guided RNase differentially regulated by accessory proteins Csx27 and Csx28” Molecular Cell, 65, 1-13 (2017); dx.doi.org/10.1016/j.molcel.2016.12.023, e Pedido Provisório U.S. a ser atribuído, intitulado “Novel Cas13b Orthologues CRISPR Enzymes and System” depositado em 15 de março de 2017. Em uma modalidade preferida, a proteína Cas 13 é LwaCas13.
Construtos de mascaramento
[0203] Como utilizado neste documento, um "construto de mascaramento" refere-se a uma molécula que pode ser clivada ou de outra forma desativada por uma proteína efetora do sistema CRISPR ativada aqui descrita. O termo "construto de mascaramento" também pode ser referido alternativamente como "construto de detecção".Em certas modalidades de exemplo, o construto de mascaramento é um construto de mascaramento baseado em RNA. O construto de mascaramento baseado em RNA compreende um elemento de RNA que é clivável por uma proteína efetora CRISPR. A clivagem do elemento de RNA libera agentes ou produz mudanças conformacionais que permitem que um sinal detectável seja produzido. Construtos de exemplo que demonstram como o elemento de RNA pode ser usado para prevenir ou mascarar a geração de sinal detectável são descritas abaixo e as modalidades da invenção compreendem variantes do mesmo. Antes da clivagem, ou quando o construto de mascaramento está em um estado "ativo", o construto de mascaramento bloqueia a geração ou detecção de um sinal detectável positivo. Será entendido que em certas modalidades de exemplo, um sinal de fundo mínimo pode ser produzido na presença de um construto de mascaramento de RNA ativo. Um sinal detectável positivo pode ser qualquer sinal que pode ser detectado usando métodos ópticos, fluorescentes, quimioluminescentes, eletroquímicos ou outros métodos de detecção conhecidos na técnica. O termo "sinal detectável positivo" é usado para diferenciar de outros sinais detectáveis que podem ser detectáveis na presença do construto de mascaramento. Por exemplo, em certas modalidades, um primeiro sinal pode ser detectado quando o agente de mascaramento está presente (ou seja, um sinal detectável negativo), que então se converte em um segundo sinal (por exemplo, o sinal detectável positivo) após a detecção das moléculas alvo e clivagem ou desativação do agente de mascaramento pela proteína efetora CRISPR ativada.
[0204] Em certas modalidades de exemplo, o construto de mascaramento pode suprimir a geração de um produto genético. O produto genético pode ser codificado por um construto repórter que é adicionado à amostra. O construto de mascaramento pode ser um RNA interferente envolvido em uma via de interferência de RNA, como um RNA em hairpin curto (shRNA) ou um RNA interferente pequeno (siRNA). O construto de mascaramento também pode compreender microRNA (miRNA).
Enquanto presente, o construto de mascaramento suprime a expressão do produto genético. O produto genético pode ser uma proteína fluorescente ou outro transcrito ou proteínas de RNA que, de outro modo, seriam detectáveis por uma sonda, aptâmero ou anticorpo marcado, mas pela presença do construto de máscara. Após a ativação da proteína efetora, o construto de máscara é clivado ou silenciado de outro modo, permitindo a expressão e a detecção do produto genético como sinal detectável positivo.
[0205] Em certas modalidades de exemplo, o construto de mascaramento pode sequestrar um ou mais reagentes necessários para gerar um sinal positivo detectável de modo que a liberação de um ou mais reagentes do construto de mascaramento resulte na geração do sinal positivo detectável. O um ou mais reagentes podem combinar para produzir um sinal colorimétrico, um sinal quimioluminescente, um sinal fluorescente ou qualquer outro sinal detectável e podem compreender quaisquer reagentes conhecidos como adequados para tais fins. Em certas modalidades de exemplo, o um ou mais reagentes são sequestrados por aptâmeros de RNA que se ligam a um ou mais reagentes. O um ou mais reagentes são liberados quando a proteína efetora é ativada após a detecção de uma molécula alvo e os aptâmeros de RNA são degradados.
[0206] Em outras modalidades da invenção, o construto de mascaramento baseado em RNA suprime a geração de um sinal positivo detectável ou o construto de mascaramento baseado em RNA suprime a geração de um sinal positivo detectável mascarando o sinal positivo detectável ou gerando um sinal negativo detectável em vez disso, ou o construto de mascaramento baseado em RNA compreende um RNA de silenciamento que suprime a geração de um produto genético codificado por um construto repórter, em que o produto genético gera o sinal positivo detectável quando expresso.
[0207] Em outras modalidades, o construto de mascaramento baseado em RNA é uma ribozima que gera o sinal detectável negativo e em que o sinal detectável positivo é gerado quando a ribozima é desativada ou a ribozima converte um substrato em uma primeira cor e em que o substrato se converte em uma segunda cor quando a ribozima é desativada.
[0208] Em outras modalidades, o agente de mascaramento baseado em RNA é um aptâmero de RNA, ou o aptâmero sequestra uma enzima, em que a enzima gera um sinal detectável após a liberação do aptâmero, agindo sobre um substrato, ou o aptâmero sequestra um par de agentes que quando liberados dos aptâmeros se combinam para gerar um sinal detectável.
[0209] Em outra modalidade, o construto de mascaramento baseado em RNA compreende um oligonucleotídeo de RNA ao qual um ligando detectável e um componente de mascaramento estão ligados.Em outra modalidade, o ligando detectável é um fluoróforo e o componente de mascaramento é uma molécula supressora ou os reagentes para amplificar moléculas de RNA alvo, como
[0210] Em certas modalidades de exemplo, o construto de mascaramento pode ser imobilizado em um substrato sólido em um volume distinto individual (definido mais abaixo) e sequestrar um único reagente. Por exemplo, o reagente pode ser uma esfera que compreende um corante. Quando sequestradas pelo reagente imobilizado, as esferas individuais são muito difusas para gerar um sinal detectável, mas após a liberação do construto de mascaramento são capazes de gerar um sinal detectável, por exemplo, por agregação ou aumento simples na concentração da solução. Em certas modalidades de exemplo, o agente de mascaramento imobilizado é um aptâmero baseado em RNA que pode ser clivado pela proteína efetora ativada após a detecção de uma molécula alvo.
[0211] Em certas outras modalidades de exemplo, o construto de mascaramento se liga a um reagente imobilizado em solução, bloqueando assim a capacidade do reagente de se ligar a um parceiro de ligação marcado separado que está livre em solução. Assim, após a aplicação de uma etapa de lavagem a uma amostra, o parceiro de ligação marcado pode ser lavado para fora da amostra na ausência de uma molécula alvo. No entanto, se a proteína efetor for ativada, o construto de mascaramento é clivado em um grau suficiente para interferir com a capacidade do construto de mascaramento de se ligar ao reagente, permitindo assim que o parceiro de ligação marcado se ligue ao reagente imobilizado. Assim, o parceiro de ligação marcado permanece após a etapa de lavagem, indicando a presença da molécula alvo na amostra.
Em certos aspectos, o construto de mascaramento que liga o reagente imobilizado é um aptâmero de RNA. O reagente imobilizado pode ser uma proteína e o parceiro de ligação marcado pode ser um anticorpo marcado. Alternativamente, o reagente imobilizado pode ser estreptavidina e o parceiro de ligação marcado pode ser biotina marcada. O marcador no parceiro de ligação usado nas modalidades acima pode ser qualquer marcador detectável conhecido na técnica. Além disso, outros parceiros de ligação conhecidos podem ser usados de acordo com o projeto geral aqui descrito.
[0212] Em certas modalidades de exemplo, o construto de mascaramento pode compreender uma ribozima. As ribozimas são moléculas de RNA com propriedades catalíticas. As ribozimas, tanto naturais quanto engenheiradas, compreendem ou consistem em RNA que pode ser direcionado pelas proteínas efetoras aqui divulgadas. A ribozima pode ser selecionada ou projetada para catalisar uma reação que gera um sinal detectável negativo ou impede a geração de um sinal de controle positivo. Após a desativação da ribozima pela proteína efetora ativada, a reação que gera um sinal de controle negativo, ou evita a geração de um sinal detectável positivo, é removida, permitindo assim que um sinal detectável positivo seja gerado. Em um exemplo de modalidade, a ribozima pode catalisar uma reação colorimétrica fazendo com que uma solução apareça como uma primeira cor. Quando a ribozima é desativada, a solução muda para uma segunda cor, sendo a segunda cor o sinal positivo detectável. Um exemplo de como as ribozimas podem ser usadas para catalisar uma reação colorimétrica são descritas em Zhao et al. “Signal amplification of glucosamine-6-phosphate based on ribozyme glmS,” Biosens Bioelectron. 2014; 16: 337-42, e fornecem um exemplo de como tal sistema pode ser modificado para funcionar no contexto das modalidades aqui divulgadas.
Alternativamente, as ribozimas, quando presentes, podem gerar produtos de clivagem, por exemplo, transcritos de RNA.
Assim, a detecção de um sinal detectável positivo pode compreender a detecção de transcritos de RNA não clivados que são gerados apenas na ausência da ribozima.
[0213] Em certas modalidades de exemplo, o um ou mais reagentes são uma proteína, como uma enzima, capaz de facilitar a geração de um sinal detectável, como um sinal colorimétrico, quimioluminescente ou fluorescente, que é inibido ou sequestrado de modo que a proteína não possa gerar o sinal detectável pela ligação de um ou mais aptâmeros de RNA à proteína. Após a ativação das proteínas efetoras aqui divulgadas, os aptâmeros de RNA são clivados ou degradados a uma extensão que não inibem mais a capacidade da proteína de gerar o sinal detectável. Em certas modalidades de exemplo, o aptâmero é um aptâmero inibidor de trombina. Em certas modalidades de exemplo, o aptâmero do inibidor de trombina tem uma sequência de GGGAACAAAGCUGAAGUACUUACCC (SEQ ID NO:4). Quando este aptâmero é clivado, a trombina se torna ativa e cliva um substrato colorimétrico ou fluorescente do peptídeo. Em certas modalidades de exemplo, o substrato colorimétrico é para-nitroanilida (pNA) covalentemente ligado ao substrato peptídico da trombina. Após a clivagem pela trombina, o pNA é liberado e se torna amarelo e facilmente visível aos olhos. Em certas modalidades de exemplo, o substrato fluorescente é 7-amino-4-metilcumarina, um fluoróforo azul que pode ser detectado usando um detector de fluorescência. Aptâmeros inibitórios também podem ser usados para peroxidase de rábano silvestre (HRP), beta- galactosidase ou fosfatase alcalina de bezerro (CAP) e dentro dos princípios gerais descritos acima.
[0214] Em certas modalidades, a atividade de RNAse é detectada colorimetricamente via clivagem de aptâmeros inibidores de enzima. Um modo potencial de converter a atividade de RNAse em um sinal colorimétrico é acoplar a clivagem de um aptâmero de RNA à reativação de uma enzima capaz de produzir uma saída colorimétrica. Na ausência de clivagem de RNA, o aptâmero intacto se ligará ao alvo da enzima e inibirá sua atividade. A vantagem deste sistema de leitura é que a enzima fornece uma etapa de amplificação adicional: uma vez liberada de um aptâmero por meio de atividade colateral (por exemplo, atividade colateral de Cas13a), a enzima colorimétrica continuará a produzir produto colorimétrico, levando a uma multiplicação do sinal.
[0215] Em certas modalidades, um aptâmero existente que inibe uma enzima com uma leitura colorimétrica é usado.
Existem vários pares de aptâmeros / enzimas com leituras colorimétricas, como trombina, proteína C, elastase de neutrófilos e subtilisina. Estas proteases têm substratos colorimétricos baseados em pNA e estão disponíveis comercialmente. Em certas modalidades, um novo aptâmero direcionado a uma enzima colorimétrica comum é utilizado.
Enzimas comuns e robustas, como beta-galactosidase, peroxidase de rábano ou fosfatase alcalina intestinal de bezerro, podem ser direcionadas por aptâmeros engenheirados por estratégias de seleção como SELEX. Tais estratégias permitem a seleção rápida de aptâmeros com eficiências de ligação nanomolar e podem ser usadas para o desenvolvimento de pares adicionais de enzima / aptâmero para leitura colorimétrica.
[0216] Em certas modalidades, a atividade de RNAse é detectada colorimetricamente por meio da clivagem de inibidores fixos de RNA. Muitas enzimas colorimétricas comuns têm inibidores reversíveis competitivos: por exemplo, a beta-galactosidase pode ser inibida por galactose. Muitos desses inibidores são fracos, mas seu efeito pode ser aumentado pelo aumento da concentração local. Ao ligar a concentração local de inibidores à atividade de RNAse, os pares de enzimas colorimétricas e inibidores podem ser transformados em sensores de RNAse. O sensor de RNAse colorimétrico baseado em inibidores de moléculas pequenas envolve três componentes: a enzima colorimétrica, o inibidor e um RNA em ponte que está covalentemente ligado ao inibidor e à enzima, amarrando o inibidor à enzima. Na configuração não clivada, a enzima é inibida pelo aumento da concentração local da pequena molécula; quando o RNA é clivado (por exemplo, por clivagem colateral Cas13a), o inibidor será liberado e a enzima colorimétrica será ativada.
[0217] Em certas modalidades, a atividade de RNAse é detectada colorimetricamente via formação e/ou ativação de G-quadruplexos. G quadraplexos no DNA podem complexar com heme (ferro (III)-protoporfirina IX) para formar uma DNAzima com atividade de peroxidase. Quando fornecido com um substrato de peroxidase (por exemplo, ABTS: (2,2'-Azinobis [3-etilbenzotiazolina-6-ácido sulfônico]sal de diamônio)), o complexo G-quadraplexo-heme na presença de peróxido de hidrogênio causa a oxidação do substrato, que então forma uma cor verde em solução. Um exemplo de sequência de DNA formando G-quadraplexo é: GGGTAGGGCGGGTTGGGA (SEQ. ID NO:5).
Ao hibridar uma sequência de RNA com este aptâmero de DNA, a formação da estrutura do G-quadraplexo será limitada. Após a ativação colateral da RNAse (por exemplo, ativação colateral do complexo C2c2), o grampo do RNA será clivado, permitindo que o G quadruplexo se forme e o heme se ligue.
Essa estratégia é particularmente atraente porque a formação da cor é enzimática, o que significa que há amplificação adicional além da ativação da RNAse.
[0218] Em certas modalidades de exemplo, o construto de mascaramento pode ser imobilizado em um substrato sólido em um volume distinto individual (definido mais abaixo) e sequestrar um único reagente. Por exemplo, o reagente pode ser uma esfera que compreende um corante. Quando sequestradas pelo reagente imobilizado, as esferas individuais são muito difusas para gerar um sinal detectável, mas após a liberação do construto de mascaramento são capazes de gerar um sinal detectável, por exemplo, por agregação ou aumento simples na concentração da solução. Em certas modalidades de exemplo, o agente de mascaramento imobilizado é um aptâmero baseado em RNA que pode ser clivado pela proteína efetora ativada após a detecção de uma molécula alvo.
[0219] Em uma modalidade de exemplo, o construto de mascaramento compreende um agente de detecção que muda de cor dependendo se o agente de detecção está agregado ou disperso em solução. Por exemplo, certas nanopartículas, como o ouro coloidal, passam por uma mudança de cor púrpura visível para vermelha à medida que se movem de agregados para partículas dispersas. Por conseguinte, em certas modalidades de exemplo, tais agentes de detecção podem ser mantidos em agregado por uma ou mais moléculas de ponte.
Pelo menos uma porção da molécula em ponte compreende RNA.
Após a ativação das proteínas efetoras aqui divulgadas, a porção de RNA da molécula de ponte é clivada, permitindo que o agente de detecção se disperse e resultando na mudança de cor correspondente. Em certas modalidades de exemplo, a molécula em ponte é uma molécula de RNA. Em certas modalidades de exemplo, o agente de detecção é um metal coloidal. O material de metal coloidal pode incluir partículas de metal insolúveis em água ou compostos metálicos dispersos em um líquido, um hidrossol ou um sol de metal.O metal coloidal pode ser selecionado dentre os metais dos grupos IA, IB, IIB e IIIB da tabela periódica, bem como os metais de transição, especialmente os do grupo VIII.Metais preferidos incluem ouro, prata, alumínio, rutênio, zinco,
ferro, níquel e cálcio.Outros metais adequados também incluem o seguinte em todos os seus vários estados de oxidação: lítio, sódio, magnésio, potássio, escândio, titânio, vanádio, cromo, manganês, cobalto, cobre, gálio, estrôncio, nióbio, molibdênio, paládio, índio, estanho, tungstênio, rênio, platina e gadolínio.Os metais são preferencialmente fornecidos na forma iônica, derivados de um composto de metal apropriado, por exemplo os íons A13+, Ru3+, Zn2+, Fe3+, Ni2+ e Ca2+ .
[0220] Quando a ponte de RNA é cortada pelo efetor CRISPR ativado, a mudança de cor mencionada anteriormente é observada. Em certas modalidades de exemplo, as partículas são metais coloidais. Em certas outras modalidades de exemplo, o metal coloidal é um ouro coloidal. Em certas modalidades de exemplo, as nanopartículas coloidais são nanopartículas de ouro de 15 nm (AuNPs). Devido às propriedades de superfície únicas das nanopartículas de ouro coloidal, a absorbância máxima é observada a 520 nm quando totalmente dispersa em solução e aparece na cor vermelha a olho nu. Após a agregação de AuNPs, eles exibem um desvio para o vermelho na absorbância máxima e parecem mais escuros na cor, eventualmente precipitando da solução como um agregado roxo escuro. Em certas modalidades exemplificativas, as nanopartículas são modificadas para incluir ligantes de DNA que se estendem da superfície da nanopartícula. As partículas individuais são ligadas entre si por pontes de RNA de fita simples (ssRNA) que hibridam em cada extremidade do RNA para pelo menos uma parte dos ligantes de DNA. Assim, as nanopartículas formarão uma rede de partículas ligadas e agregadas, aparecendo como um precipitado escuro. Após a ativação dos efetores CRISPR divulgados neste documento, a ponte de ssRNA será clivada, liberando o AU NPS da malha ligada e produzindo uma cor vermelha visível. Exemplos de ligantes de DNA e sequências em ponte de RNA estão listados abaixo. Os ligantes tiol na extremidade dos ligantes de DNA podem ser utilizados para a conjugação da superfície com o AuNPS. Outras formas de conjugação podem ser usadas. Em certas modalidades de exemplo, duas populações de AuNPs podem ser geradas, uma para cada ligante de DNA. Isso ajudará a facilitar a ligação adequada da ponte ssRNA com a orientação adequada. Em certas modalidades de exemplo, um primeiro ligante de DNA é conjugado pela extremidade 3', enquanto um segundo ligante de DNA é conjugado pela extremidade 5'.
Tabela 1.
DNA1 TTATAACTATTCCTAAAAAAAAAAA/3ThioMC3- colorimétrico D/ C2c2 (SEQ ID NO: 6)
DNA2 /5ThioMC6- colorimétrico D/AAAAAAAAAACTCCCCTAATAACAAT C2c2 (SEQ ID NO: 7) Ponte colorimétrica GGGUAGGAAUAGUUAUAAUUUCCCUUUCCCAUUGUU C2c2 AUUAGGGAG (SEQ ID NO:8)
[0221] Em certas outras modalidades de exemplo, o construto de mascaramento pode compreender um oligonucleotídeo de RNA ao qual está anexado um marcador detectável e um agente de mascaramento desse marcador detectável. Um exemplo de tal par marcador / agente de mascaramento detectável é um fluoróforo e um inibidor do fluoróforo. A extinção do fluoróforo pode ocorrer como resultado da formação de um complexo não fluorescente entre o fluoróforo e outro fluoróforo ou molécula não fluorescente.
Esse mecanismo é conhecido como formação de complexo no estado fundamental, resfriamento estático ou resfriamento por contato. Consequentemente, o oligonucleotídeo de RNA pode ser projetado de modo que o fluoróforo e o inibidor estejam em proximidade suficiente para que ocorra a extinção de contato. Os fluoróforos e seus inibidores cognatos são conhecidos na técnica e podem ser selecionados para este propósito por um versado na técnica. O par particular de fluoróforo / inibidor não é crítico no contexto desta invenção, apenas aquela seleção dos pares fluoróforo / inibidor garante o mascaramento do fluoróforo. Após a ativação das proteínas efetoras aqui divulgadas, o oligonucleotídeo de RNA é clivado, cortando assim a proximidade entre o fluoróforo e o inibidor necessário para manter o efeito de extinção de contato. Por conseguinte, a detecção do fluoróforo pode ser usada para determinar a presença de uma molécula alvo em uma amostra.
[0222] Em certas outras modalidades de exemplo, o construto de mascaramento pode compreender um ou mais oligonucleotídeos de RNA aos quais estão ligados uma ou mais nanopartículas de metal, tais como nanopartículas de ouro.
Em algumas modalidades, o construto de mascaramento compreende uma pluralidade de nanopartículas de metal reticuladas por uma pluralidade de oligonucleotídeos de RNA formando uma alça fechada. Em uma modalidade, o construto de mascaramento compreende três nanopartículas de ouro reticuladas por três oligonucleotídeos de RNA formando uma alça fechada.Em algumas modalidades, a clivagem dos oligonucleotídeos de RNA pela proteína efetora CRISPR leva a um sinal detectável produzido pelas nanopartículas de metal.
[0223] Em certas outras modalidades de exemplo, o construto de mascaramento pode compreender um ou mais oligonucleotídeos de RNA aos quais estão ligados um ou mais pontos quânticos. Em algumas modalidades, a clivagem dos oligonucleotídeos de RNA pela proteína efetora CRISPR leva a um sinal detectável produzido pelos pontos quânticos.
[0224] Em uma modalidade de exemplo, o construto de mascaramento pode compreender um ponto quântico. O ponto quântico pode ter várias moléculas de ligação ligadas à superfície. Pelo menos uma porção da molécula de ligante compreende RNA. A molécula de ligante é ligada ao ponto quântico em uma extremidade e a um ou mais inibidores ao longo do comprimento ou nas extremidades terminais do ligante de modo que os inibidores sejam mantidos em proximidade suficiente para que ocorra a extinção do ponto quântico. O ligante pode ser ramificado. Como acima, o par ponto quântico/extintor não é crítico, apenas a seleção do par ponto quântico/extintor garante o mascaramento do fluoróforo. Os pontos quânticos e seus inibidores cognatos são conhecidos na técnica e podem ser selecionados para este propósito por um versado na técnica. Após a ativação das proteínas efetoras aqui divulgadas, a porção de RNA da molécula de ligação é clivada, eliminando assim a proximidade entre os pontos quânticos e um ou mais extintores necessários para manter o efeito de extinção.Em certas modalidades de exemplo, o ponto quântico é conjugado com estreptavidina. O RNA é ligado por meio de ligantes de biotina e recruta moléculas de extinção com as sequências /5Biosg/UCUCGUACGUUC/3IAbRQSp/ (SEQ ID NO:9) ou /5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/(SEQ ID NO:10), onde /5Biosg/ é um marcador de biotina e /3lAbRQSp/ é um extintor preto Iowa. Após a clivagem, pelos efetores ativados divulgados neste documento, o ponto quântico irá apresentar fluorescência visível.
[0225] De forma semelhante, a transferência de energia de fluorescência (FRET) pode ser usada para gerar um sinal positivo detectável. FRET é um processo não radiativo pelo qual um fóton de um fluoróforo energeticamente excitado (ou seja, "fluoróforo doador") eleva o estado de energia de um elétron em outra molécula (ou seja, "o aceitador") para níveis vibracionais mais elevados do estado singuleto excitado. O fluoróforo doador retorna ao estado fundamental sem emitir uma característica de fluorescência desse fluoróforo. O aceitador pode ser outro fluoróforo ou molécula não fluorescente. Se o aceitador for um fluoróforo, a energia transferida é emitida como característica de fluorescência desse fluoróforo. Se o aceitador for uma molécula não fluorescente, a energia absorvida é a perda como calor.
Assim, no contexto das modalidades aqui divulgadas, o par fluoróforo / inibidor é substituído por um par fluoróforo / aceitador doador ligado à molécula de oligonucleotídeo.
Quando intacta, o construto de mascaramento gera um primeiro sinal (sinal detectável negativo) conforme detectado pela fluorescência ou calor emitido pelo aceitador. Após a ativação das proteínas efetoras aqui divulgadas, o oligonucleotídeo de RNA é clivado e FRET é interrompido de modo que a fluorescência do fluoróforo doador é agora detectada (sinal detectável positivo).
[0226] Em certas modalidades de exemplo, o construto de mascaramento compreende o uso de corantes intercalantes que mudam sua absorbância em resposta à clivagem de RNAs longos em nucleotídeos curtos. Existem vários desses corantes. Por exemplo, a pironina-Y irá complexar com o RNA e formar um complexo que tem uma absorbância a 572 nm. A clivagem do RNA resulta em perda de absorbância e mudança de cor. O azul de metileno pode ser usado de maneira semelhante, com alterações na absorbância a 688 nm após a clivagem do RNA. Por conseguinte, em certas modalidades de exemplo, o construto de mascaramento compreende um RNA e complexo de corante intercalante que muda a absorbância após a clivagem do RNA pelas proteínas efetoras aqui divulgadas.
[0227] Em certas modalidades de exemplo, o construto de mascaramento pode compreender um iniciador para uma reação de HCR. Veja, por exemplo, Dirks e Pierce. PNAS 101, 15275- 15728 (2004). As reações de HCR utilizam a energia potencial em duas espécies de hairpin. Quando um iniciador de fita simples com uma porção complementar a uma região correspondente em um dos hairpin é liberado na mistura previamente estável, ele abre um hairpin de uma espécie.
Este processo, por sua vez, expõe uma região de fita simples que abre um hairpin das outras espécies. Esse processo, por sua vez, expõe uma região de fita simples idêntica ao iniciador original. A reação em cadeia resultante pode levar à formação de uma hélice dupla cortada que cresce até o suprimento de hairpin estar esgotado. A detecção dos produtos resultantes pode ser feita em gel ou colorimetricamente.
Métodos de detecção colorimétricos de exemplo incluem, por exemplo, aqueles divulgados em Lu et al. “Ultra-sensitive colorimetric assay system based on the hybridization chain reaction-triggered enzyme cascade amplification ACS Appl Mater Interfaces, 2017, 9(1):167-175, Wang et al. “An enzyme- free colorimetric assay using hybridization chain reaction amplification and split aptamers” Analyst 2015, 150, 7657- 7662, e Song et al. “Non covalent fluorescent labeling of hairpin DNA probe coupled with hybridization chain reaction for sensitive DNA detection.” Applied Spectroscopy, 70(4): 686-694 (2016).
[0228] Em certas modalidades de exemplo, o construto de mascaramento pode compreender uma sequência de iniciador de HCR e um elemento estrutural clivável, como uma alça ou hairpin, que impede o iniciador de iniciar a reação de HCR.
Após a clivagem do elemento de estrutura por uma proteína efetora CRISPR ativada, o iniciador é então liberado para desencadear a reação de HCR, sendo que sua detecção indica a presença de um ou mais alvos na amostra. Em certas modalidades de exemplo, o construto de mascaramento compreende um hairpin com um laço de RNA. Quando uma proteína efetora CRISRP ativada corta a alça de RNA, o iniciador pode ser liberado para desencadear a reação HCR.
[0229] Em modalidades específicas, o ácido nucleico alvo pode ser detectado na sensibilidade atomolar. Em modalidades específicas, o ácido nucleico alvo pode ser detectado na sensibilidade femtomolar. Em algumas modalidades específicas, os métodos são realizados em menos de cerca de 2 horas, menos de cerca de 90 minutos, menos de cerca de 60 minutos, menos de cerca de 30 minutos ou menos de cerca de 15 minutos. Em algumas modalidades preferidas, a amplificação e a detecção podem ocorrer em um método de um pote com detecção de 2 fM em menos de cerca de 2 horas.
Kits para amplificação e detecção
[0230] Também são fornecidos neste documento kits para amplificar e / ou detectar um ácido nucleico de fita dupla alvo em uma amostra. Esses kits podem incluir, mas não estão necessariamente limitados a, um sistema CRISPR de amplificação conforme descrito neste documento.
[0231] Em algumas modalidades, o kit pode incluir reagentes para purificar o ácido nucleico de fita dupla na amostra.
[0232] Em algumas modalidades, o kit pode ser um kit para amplificar e / ou detectar um ácido nucleico de fita simples alvo em uma amostra e pode incluir reagentes para purificar o ácido nucleico de fita simples na amostra. O kit também pode incluir um conjunto de instruções de uso.
[0233] O kit pode ainda compreender um sistema de detecção, em modalidades preferidas, um sistema de detecção CRISPR. O sistema de detecção pode ser conforme descrito, por exemplo, nos Pedidos U.S. 62 / 432.553 depositados em 9 de dezembro de 2016; US 62/456.645 depositado em 8 de fevereiro de 2017; 62 / 471.930 depositado em 15 de março de 2017; 62 / 484.869 depositado em 12 de abril de 2017; 62 /
568.268 depositado em 4 de outubro de 2017, todos incorporados em sua totalidade por referência; e também conforme descrito em PCT / US2017 / 065477 depositado em 8 de dezembro de 2017, intitulado CRISPR Effector System Based Diagnostics, incorporado neste documento por referência e, em particular, descrevendo os componentes de um sistema CRISPR para detecção em [0142] - [0289].
MÉTODOS
[0234] Métodos de amplificação e / ou detecção são fornecidos e podem ser utilizados com os sistemas conforme divulgado neste documento.
[0235] Em uma modalidade da invenção pode compreender amplificação à base de nickase. A enzima de corte pode ser uma proteína CRISPR. Consequentemente, a introdução de cortes no dsDNA pode ser programável e específica para a sequência. A Fig. 1 representa uma modalidade da invenção, que começa com duas guias projetadas para atingir fitas opostas de um alvo de dsDNA. De acordo com a invenção, a nickase pode ser Cpf1, C2c1, Cas9 ou qualquer ortólogo ou proteína CRISPR que cliva ou é engenheirada para clivar uma única fita de um duplex de DNA. As fitas cortadas podem então ser estendidas por uma polimerase. Em uma modalidade, os sítios dos cortes são selecionados de modo que a extensão dos filamentos por uma polimerase seja em direção à porção central do DNA duplex alvo entre os sítios de corte. Em certas modalidades, os iniciadores são incluídos na reação capaz de hibridar com as fitas estendidas, seguido por extensão de polimerase adicional dos iniciadores para regenerar dois pedaços de dsDNA: um primeiro dsDNA que inclui o sítio de guia CRISPR da primeira fita ou ambos os sítios de guia CRISPR de primeira e segunda fita, e um segundo dsDNA que inclui o sítio de guia CRISPR de segunda fita ou ambos os sítios de guia CRISPR de primeira e segunda fita. Esses pedações continuam a ser cortados e estendidos em uma reação cíclica que amplifica exponencialmente a região do alvo entre os sítios de corte.
[0236] Em certas modalidades, a amplificação é uma amplificação à base de CRISPR-nickase, uma amplificação de corte CRISPR programável. A amplificação pode compreender: (a) combinar uma amostra compreendendo o ácido nucleico de fita dupla alvo com uma mistura de reação de amplificação, a mistura de reação de amplificação compreendendo: (i) um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e segundo complexo CRISPR/Cas, o primeiro complexo CRISPR/Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR/Cas para uma primeira fita do ácido nucleico alvo e o segundo complexo CRISPR/Cas compreendendo um segundo Cas à base de nickase e segunda molécula guia que guia o segundo complexo CRISPR/Cas para uma segunda fita do ácido nucleico alvo; e (ii) uma polimerase; (b) amplificar o ácido nucleico alvo cortando a primeira e a segunda fita do ácido nucleico alvo usando o primeiro e o segundo complexos CRISPR/Cas e deslocando e estendendo os suportes cortados usando a polimerase, gerando assim duplexes compreendendo uma sequência de ácido nucleico alvo entre o primeiro e o segundo sítios de corte; (c)
adicionar um par de iniciadores compreendendo um primeiro e um segundo iniciador à mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar à primeira fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia, e o segundo iniciador compreendendo uma porção que é complementar à segunda fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e (d) amplificação adicional do ácido nucleico alvo por extensão repetida e corte sob condições isotérmicas.
A primeira nickase à base de Cas e a segunda nickase à base de Cas podem ser iguais ou diferentes.
[0237] A amplificação de ácidos nucleicos pode ser realizada utilizando máquinas ou equipamentos de ciclo térmico específico, e pode ser realizada em reações únicas ou a granel, de modo que qualquer número desejado de reações possa ser realizado simultaneamente.Em algumas modalidades, a amplificação pode ser realizada usando dispositivos microfluídicos ou robóticos, ou pode ser realizada usando alteração manual nas temperaturas para alcançar a amplificação desejada. Em algumas modalidades, a otimização pode ser realizada para obter as condições ideais de reação para a aplicação ou materiais específicos.Um versado na técnica compreenderá e poderá otimizar as condições de reação para obter amplificação suficiente.
[0238] Em algumas modalidades, a amplificação do ácido nucleico alvo é realizada a cerca de 37ºC-65ºC. Em algumas modalidades, a amplificação do ácido nucleico alvo é realizada a cerca de 50ºC-59ºC. Em algumas modalidades, a amplificação do ácido nucleico alvo é realizada a cerca de 60ºC-72ºC. Em algumas modalidades, a amplificação do ácido nucleico alvo é realizada a cerca de 37ºC. Em algumas modalidades, a amplificação do ácido nucleico alvo é realizada à temperatura ambiente.
[0239] Modalidades adicionais são divulgadas nos seguintes parágrafos numerados:
1. Um método para amplificar e/ou detectar um ácido nucleico de fita dupla alvo, compreendendo: a. combinar uma amostra compreendendo o ácido nucleico de fita dupla alvo com uma mistura de reação de amplificação, a mistura de reação de amplificação compreendendo: i. um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e um segundo complexos CRISPR/Cas, o primeiro complexo CRISPR/Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR/Cas para um primeiro local de ácido nucleico alvo, o segundo complexo CRISPR/Cas compreendendo uma segunda nickase à base de Cas e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para um segundo local de ácido nucleico alvo; e ii. uma polimerase; b. amplificar o ácido nucleico alvo; c. adicionar um par de iniciadores compreendendo um primeiro e um segundo iniciadores à mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar ao primeiro local e o segundo iniciador compreendendo uma porção que é complementar ao segundo local e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e d. amplificar adicionalmente o ácido nucleico alvo por extensão repetida e quebra sob condições isotérmicas.
2. O método do parágrafo 1, em que a primeira molécula guia orienta o primeiro complexo CRISPR/Cas para uma primeira fita do ácido nucleico alvo e a segunda molécula guia orienta o segundo complexo CRISPR/Cas para uma segunda fita do ácido nucleico alvo.
3. O método do parágrafo 1, em que o primeiro local de ácido nucleico alvo e o segundo local de ácido nucleico alvo estão na primeira fita do ácido nucleico alvo, desse modo gerando um ssDNA compreendendo a sequência da primeira fita do ácido nucleico alvo entre o primeiro local de ácido nucleico alvo e o segundo local do ácido nucleico alvo.
4. O método do parágrafo 2, em que compreende amplificar o ácido nucleico alvo cortando a primeira e a segunda fitas do ácido nucleico alvo usando o primeiro e o segundo complexos CRISPR/Cas e deslocando e estendendo as fitas cortadas usando a polimerase, desse modo gerando duplexes compreendendo uma sequência de ácido nucleico alvo entre o primeiro e o segundo sítios de corte.
5. O método do parágrafo 1, em que a nickase à base de Cas é selecionada do grupo consistindo em Cas9 nickase, Cpf1 nickase e C2c1 nickase.
6. O método do parágrafo 2, em que a nickase à base de Cas é uma proteína Cas9 nickase que compreende uma mutação no domínio HNH.
7. O método do parágrafo 2, em que a nickase à base de Cas é uma proteína Cas9 nickase que compreende uma mutação correspondente a N863A em SpCas9 ou N580A em SaCas9.
8. O método do parágrafo 3 ou 4, em que a nickase à base de Cas é uma proteína Cas9 derivada de uma espécie bacteriana selecionada do grupo que consiste em Streptococcus pyogenes, Staphylococcus aureus, Streptococcus thermophilus, S. mutans, S. agalactiae, S. equisimilis, S.
sanguinis, S. pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N. gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum,
C. difficile, C. tetani, C. sordellii, Francisella tularensis 1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens e Porphyromonas macacae.
9. O método do parágrafo 2, em que a nickase à base de Cas é uma proteína Cpf1 nickase que compreende uma mutação no domínio Nuc.
10. O método do parágrafo 6, em que a nickase à base de Cas é uma proteína Cpf1 nickase que compreende uma mutação correspondente a R1226A em AsCpf1.
11. O método do parágrafo 6 ou 7, em que a nickase à base de Cas é uma proteína Cpf1 derivada de uma espécie bacteriana selecionada do grupo que consiste em Francisella tularensis, Prevotella albensis, Lachnospiraceae bacterium, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium, Parcubacteria bacterium, Smithella sp., Acidaminococcus sp., Lachnospiraceae bacterium, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi, Leptospira inadai, Porphyromonas crevioricanis, Prevotella disiens and Porphyromonas macacae, Succinivibrio dextrinosolvens, Prevotella disiens, Flavobacterium branchiophilum, Helcococcus kunzii, Eubacterium sp., Microgenomates (Roizmanbacteria) bacterium, Flavobacterium sp., Prevotella brevis, Moraxella caprae, Bacteroidetes oral, Porphyromonas cansulci, Synergistes jonesii, Prevotella bryantii, Anaerovibrio sp., Butyrivibrio fibrisolvens, Candidatus Methanomethylophilus, Butyrivibrio sp., Oribacterium sp., Pseudobutyrivibrio ruminis e Proteocatella sphenisci.
12. O método do parágrafo 2, em que a nickase à base de Cas é uma proteína C2c1 nickase que compreende uma mutação no domínio Nuc.
13. O método do parágrafo 9, em que a nickase à base de Cas é uma proteína C2c1 nickase que compreende uma mutação correspondente a D570A, E848A ou D977A em AacC2c1.
14. O método do parágrafo 9 ou 10, em que a nickase à base de Cas é uma proteína C2c1 derivada de uma espécie bacteriana selecionada do grupo que consiste em Alicyclobacillus acidoterrestris, Alicyclobacillus contaminans, Alicyclobacillus macrosporangiidus, Bacillus hisashii, Candidatus Lindowbacteria, Desulfovibrio inopinatus, Desulfonatronum thiodismutans, Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus, Bacillus thermoamylovorans, Brevibacillus sp.
CF112, Bacillus sp. NSP2.1, Desulfatirhabdium butyrativorans, Alicyclobacillus herbarius, Citrobacter freundii, Brevibacillus agri (por exemplo, BAB-2500) e Methylobacterium nodulans.
15. O método de qualquer um dos parágrafos anteriores, em que a primeira nickase à base de Cas e a segunda nickase à base de Cas são as mesmas.
16. O método de qualquer um dos parágrafos 1-11, em que a primeira nickase à base de Cas e a segunda nickase à base de Cas são diferentes.
17. O método de qualquer um dos parágrafos anteriores, em que a polimerase é selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento total, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase de fragmento grande, phi29 DNA polimerase, T7 DNA polimerase, Gst polimerase, Taq polimerase, fragmento Klenow de E. coli DNA polimerase I, KlenTaq, Pol III DNA polimerase, T5 DNA polimerase, Gst polimerase e Sequenase DNA polimerase.
18. O método de qualquer um dos parágrafos anteriores, em que a amplificação do ácido nucleico alvo é realizada a cerca de 50ºC a 59ºC.
19. O método de qualquer um dos parágrafos 1-14, em que a amplificação do ácido nucleico alvo é realizada a cerca de 60ºC a 72ºC.
20. O método de qualquer um dos parágrafos 1-14, em que a amplificação do ácido nucleico alvo é realizada a cerca de 37°C ou a cerca de 65°C.
21. O método de qualquer um dos parágrafos 1-14, em que a amplificação do ácido nucleico alvo é realizada a uma temperatura constante.
22. O método de qualquer um dos parágrafos anteriores, em que a sequência de ácido nucleico alvo é de cerca de 20- 30, cerca de 30-40, cerca de 40-50 ou cerca de 50-100 nucleotídeos de comprimento.
23. O método de qualquer um dos parágrafos 1-18, em que a sequência de ácido nucleico alvo é de cerca de 100- 200, cerca de 100-500 ou cerca de 100-1000 nucleotídeos de comprimento.
24. O método de qualquer um dos parágrafos 1-18, em que a sequência de ácido nucleico alvo é de cerca de 1.000-
2.000, cerca de 2.000-3.000, cerca de 3.000-4.000 ou cerca de 4.000-5.000 nucleotídeos de comprimento.
25. O método de qualquer um dos parágrafos anteriores, em que o primeiro ou o segundo iniciadores compreendem um promotor de RNA polimerase.
26. O método de qualquer um dos parágrafos anteriores, em que compreende ainda detectar o ácido nucleico amplificado por um método selecionado do grupo que consiste em eletroforese em gel, detecção de corante intercalante, PCR, PCR em tempo real, fluorescência, Transferência de Energia de Ressonância de Fluorescência (FRET), espectrometria de massa e CRISPR-SHERLOCK.
27. O método do parágrafo 23, em que o ácido nucleico amplificado é detectado pelo método CRISPR-SHERLOCK baseado em Cas13.
28. O método de qualquer um dos parágrafos anteriores, em que o ácido nucleico alvo é detectado em sensibilidade attomolar.
29. O método de qualquer um dos parágrafos 1-24, em que o ácido nucleico alvo é detectado em sensibilidade femtomolar.
30. O método de qualquer um dos parágrafos anteriores, em que o ácido nucleico alvo é selecionado do grupo que consiste em DNA genômico, DNA mitocondrial, DNA viral, DNA de plasmídeo e DNA de fita dupla sintético.
31. O método de qualquer um dos parágrafos anteriores, em que a amostra é uma amostra biológica ou uma amostra ambiental.
32. O método do parágrafo 28, em que a amostra biológica é um sangue, plasma, soro, urina, fezes, escarro, muco, fluido linfático, fluido sinovial, bile, ascite, efusão pleural, seroma, saliva, fluido cerebrospinal, humor aquoso ou vítreo, ou qualquer secreção corporal, um transudato, um exsudato ou fluido obtido de uma articulação ou um swab de pele ou superfície de membrana mucosa.
33. O método do parágrafo 29, em que a amostra é sangue, plasma ou soro obtido de um paciente humano.
34. O método do parágrafo 28, em que a amostra é uma amostra de planta.
35. O método de qualquer um dos parágrafos anteriores, em que a amostra é uma amostra em bruto.
36. O método de qualquer um dos parágrafos 1-31, em que a amostra é uma amostra purificada.
37. Um método para amplificar e/ou detectar um ácido nucleico de fita simples alvo, compreendendo: (a) converter o ácido nucleico de fita simples em uma amostra em um ácido nucleico de fita dupla alvo; e (b) executar as etapas do parágrafo 1.
38. O método do parágrafo 34, em que o ácido nucleico de fita simples alvo é uma molécula de RNA.
39. O método do parágrafo 35, em que a molécula de RNA é convertida no ácido nucleico de fita dupla por uma etapa de transcrição reversa e amplificação.
40. O método do parágrafo 34, em que o ácido nucleico de fita simples alvo é selecionado do grupo que consiste em DNA viral de fita simples, RNA viral, RNA mensageiro, RNA ribossômico, RNA de transferência, microRNA, RNA de interferência curto, RNA nuclear pequeno, RNA sintético e DNA de fita simples sintético.
41. Um sistema para amplificar e/ou detectar um ácido nucleico de fita dupla alvo em uma amostra, o sistema compreendendo: a) um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e um segundo complexos CRISPR/Cas, o primeiro complexo CRISPR/Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR/Cas para uma primeira fita do ácido nucleico alvo, o segundo complexo CRISPR/Cas compreendendo uma segunda nickase à base de Cas e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para uma segunda fita do ácido nucleico alvo; b) uma polimerase; c) um par de iniciadores compreendendo um primeiro e um segundo iniciadores para a mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar à primeira fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia e o segundo iniciador compreendendo uma porção que é complementar à segunda fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e opcionalmente d) um sistema de detecção para detectar amplificação do ácido nucleico alvo.
42. O sistema do parágrafo 38, em que a nickase à base de Cas é selecionada do grupo consistindo em Cas9 nickase, Cpf1 nickase e C2c1 nickase.
43. O sistema do parágrafo 38 ou 39, em que a polimerase é selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento tota, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase, phi29 DNA polimerase, T7 DNA polimerase e Sequenase DNA polimerase.
44. O sistema de qualquer um dos parágrafos 38-40, em que a nickase à base de Cas e a polimerase atuam sob a mesma temperatura.
45. Um sistema para amplificar e/ou detectar um ácido nucleico de fita simples alvo em uma amostra, o sistema compreendendo:
a) reagentes para converter o ácido nucleico de fita simples alvo em um ácido nucleico de fita dupla; b) componentes do parágrafo 38.
46. Um kit para amplificar e / ou detectar um ácido nucleico de fita dupla alvo em uma amostra, compreendendo componentes da reivindicação 38 e um conjunto de instruções para uso.
47. O kit do parágrafo 43, compreendendo ainda reagentes para purificar o ácido nucleico de fita dupla na amostra.
48. Um kit para amplificar e / ou detectar um ácido nucleico de fita simples alvo em uma amostra, compreendendo componentes da reivindicação 43 e um conjunto de instruções para uso.
49. O kit do parágrafo 4, compreendendo ainda reagentes para purificar o ácido nucleico de fita simples na amostra.
[0240] A invenção será descrita ainda nos exemplos a seguir, que não limitam o escopo da invenção descrito nas reivindicações.
EXEMPLOS Exemplos de trabalho Exemplo 1 - Amplificação à base de CRISPR-Nickase (CRISPR-NEAR) e DETECÇÃO DE NEAR SHERLOCK
[0241] Neste exemplo, a amplificação à base de nickase foi testada usando enzimas CRISPR-Cas, referidas como CRISPR-NEAR, em combinação com métodos de detecção CRISPR SHERLOCK. A Fig. 1 mostra um esquema de uma amplificação à base de nickase usando a enzima CRISPR-Cas.
[0242] CRISPR-NEAR pode ser realizado com entrada de DNA ou RNA. Ao incorporar uma sequência de promotor T7 nos iniciadores de amplificação, CRISPR-NEAR também é compatível com o método de detecção SHERLOCK a jusante. Fig. 9 mostra um esquema de CRISPR-NEAR combinado com detecção SHERLOCK.
Uma das principais vantagens de usar CRISPR-NEAR é que ele pode ser muito mais rápido do que a amplificação RPA. O método usa um tampão muito simples que permite a fácil combinação de todas as etapas de detecção de SHERLOCK em uma reação. A amplificação RPA, por outro lado, usa um tampão muito viscoso e é difícil de usar com outros reagentes.
[0243] Fig. 2 é uma imagem de eletroforese em gel que demonstra a otimização da reação de amplificação da enzima nickase. O resultado mostra que a amplificação NEAR é dependente da enzima nickase e da polimerase. Sem iniciador, ocorre apenas amplificação linear. Os iniciadores e outros aditivos de PCR (como gp32 SSB ou trealose) podem aumentar a amplificação e modular a formação de produtos não específicos.
[0244] Figs. 3A - 3F mostram uma série de experiências que demonstram que a amplificação linear à base de nickase é dependente da concentração ideal de nickase.
Nestes experimentos, iniciadores adicionais não foram incluídos nas reações, portanto, ocorre apenas a amplificação linear baseada em corte. Os nickases usados nestes experimentos foram Nt. A1w1 (usado como controle positivo), T7 incompatível com nAsCpf1 ou nAsCpf1 compatível. As concentrações guia foram mantidas uniformes na entrada de 5 µM enquanto a concentração de nickase foi diminuída. nAsCpf1 é capaz de cortar DNA de fita dupla que é amplificado por uma polimerase de deslocamento de fita.
Estes dados mostram que a concentração óptica para amplificação de nAsCpf1 é de 500 nM, não a concentração mais alta testada (1 µM).
[0245] Usando reações NEAR amplificadas como entrada, um experimento contínuo foi realizado onde o alvo de ácido nucleico é amplificado e detectado usando corante intercalante SYTO (Figs. 4A - 4C), leitura baseada em gel (Figs. 4D - 4F) ou SHERLOCK baseado em Cas13 detecção (Figs.
4G - 4I). Esses resultados sugerem que a amplificação com NEAR cria muitos produtos não específicos, portanto, não são compatíveis com SYTO ou leitura baseada em gel. A detecção baseada em CRISPR SHERLOCK, no entanto, pode contornar o problema e permite a detecção específica dos produtos de interesse. Os dados usando detecção baseada em SYTO ou CRISPR SHERLOCK (usando a detecção Cas13 ou Cpf1) foram ainda representados como razões de alvo / sem alvo (Fig. 5). O gráfico mostra que os complexos de guia LwCas13a e Cpf1 programados para o sítio alvo são capazes de distinguir a amplificação específica vs. não específica, ao passo que a detecção do corante intercalante SYTO não poderia sob condições padrão.
[0246] As Figs. 6A e 6B são dois gráficos que mostram dados de NEAR sozinho vs. NEAR combinados com detecção de SHERLOCK. Várias conclusões podem ser tiradas desses gráficos. Primeiro, o LwCas13s SHERLOCK permite um limite inferior de detecção por meio da amplificação de T7 e forte atividade de RNAse colateral. Em segundo lugar, o limite de detecção de 2 aM pode ser alcançado usando Nt. A1w1 NEAR com detecção de Cas13, enquanto o limite de detecção de 2 fM pode ser alcançado usando nAsCpf1-NEAR com detecção de Cas
13. Finalmente, a detecção de AsCpf1 combinada com qualquer reação NEAR não é sensível o suficiente para fornecer sinais confiáveis a <20 fM.
[0247] NEAR SHERLOCK pode ser executado em diferentes temperaturas dependendo da polimerase usada.
Figs. 7A - 7C demonstram que NEAR pode ser realizado a 60°C usando polimerase de partida a quente Bst 2.0; Figs. 8A - 8B demonstram que NEAR também pode ser realizado a 37˚C usando a polimerase Sequenase 2.0.
***
[0248] Diversas modificações e variações do método e sistema descrito da invenção serão evidentes para os versados na técnica sem se afastar do escopo e espírito da invenção. Embora a invenção tenha sido descrita em conexão com modalidades preferenciais específicas, deve ser entendido que a invenção como reivindicada não deve ser excessivamente limitada por essas modalidades específicas.
De fato, várias modificações dos modos descritos para realizar a invenção que são óbvias para os versados nas ciências médicas se destinam a estar no escopo das reivindicações que seguem. Enquanto a invenção tem sido descrita em conexão modalidades específicas da mesma, será compreendido que ela é também capaz de ainda outras modificações, e este pedido tem a intenção de cobrir quaisquer variações, usos, ou adaptações da invenção que segue, em geral, os princípios da invenção e incluindo tais divergências da presente divulgação como conhecido e de costume na técnica da qual a invenção é pertinente, e pode ser aplicado às características essenciais apresentadas neste documento.

Claims (49)

REIVINDICAÇÕES
1. Método para amplificar e/ou detectar um ácido nucleico de fita dupla alvo, caracterizado pelo fato de que compreende: a. combinar uma amostra compreendendo o ácido nucleico de fita dupla alvo com uma mistura de reação de amplificação, a mistura de reação de amplificação compreendendo: i. um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e um segundo complexos CRISPR/Cas, o primeiro complexo CRISPR/Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR/Cas para uma primeira localização de ácido nucleico alvo, o segundo complexo CRISPR/Cas compreendendo uma segunda nickase à base de Cas e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para uma segunda localização de ácido nucleico alvo; e ii. uma polimerase; b. amplificar o ácido nucleico alvo; c. adicionar um par de iniciadores compreendendo um primeiro e um segundo iniciadores à mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar à primeira localização e o segundo iniciador compreendendo uma porção que é complementar à segunda localização e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e d. amplificar adicionalmente o ácido nucleico alvo por extensão repetida e quebra sob condições isotérmicas.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a primeira molécula guia orienta o primeiro complexo CRISPR/Cas para uma primeira fita do ácido nucleico alvo e a segunda molécula guia orienta o segundo complexo CRISPR/Cas para uma segunda fita do ácido nucleico alvo.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a primeira localização de ácido nucleico alvo e a segunda localização de ácido nucleico alvo estão na primeira fita do ácido nucleico alvo, desse modo gerando um ssDNA compreendendo a sequência da primeira fita do ácido nucleico alvo entre a primeira localização de ácido nucleico alvo e a segunda localização de ácido nucleico alvo.
4. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que compreende amplificar o ácido nucleico alvo quebrando a primeira e a segunda fitas do ácido nucleico alvo usando o primeiro e o segundo complexos CRISPR/Cas e deslocando e estendendo as fitas quebradas usando a polimerase, desse modo gerando duplexes compreendendo uma sequência de ácido nucleico alvo entre o primeiro e o segundo sítios de quebra.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a nickase à base de Cas é selecionada do grupo consistindo em Cas9 nickase, Cpf1 nickase e C2c1 nickase.
6. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a nickase à base de Cas é uma proteína Cas9 nickase que compreende uma mutação no domínio HNH.
7. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a nickase à base de Cas é uma proteína Cas9 nickase que compreende uma mutação correspondente a N863A em SpCas9 ou N580A em SaCas9.
8. Método, de acordo com a reivindicação 3 ou 4, caracterizado pelo fato de que a nickase à base de Cas é uma proteína Cas9 derivada de uma espécie bacteriana selecionada do grupo que consiste em Streptococcus pyogenes, Staphylococcus aureus, Streptococcus thermophilus, S.
mutans, S. agalactiae, S. equisimilis, S. sanguinis, S.
pneumonia; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N.
gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C.
difficile, C. tetani, C. sordellii, Francisella tularensis
1, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp.
BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens e Porphyromonas macacae.
9. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a nickase à base de Cas é uma proteína Cpf1 nickase que compreende uma mutação no domínio Nuc.
10. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a nickase à base de Cas é uma proteína Cpf1 nickase que compreende uma mutação correspondente a R1226A em AsCpf1.
11. Método, de acordo com a reivindicação 6 ou 7, caracterizado pelo fato de que a nickase à base de Cas é uma proteína Cpf1 derivada de uma espécie bacteriana selecionada do grupo que consiste em Francisella tularensis, Prevotella albensis, Lachnospiraceae bacterium, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium, Parcubacteria bacterium, Smithella sp., Acidaminococcus sp., Lachnospiraceae bacterium, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi, Leptospira inadai, Porphyromonas crevioricanis, Prevotella disiens and Porphyromonas macacae, Succinivibrio dextrinosolvens, Prevotella disiens, Flavobacterium branchiophilum, Helcococcus kunzii, Eubacterium sp., Microgenomates (Roizmanbacteria) bacterium, Flavobacterium sp., Prevotella brevis, Moraxella caprae, Bacteroidetes oral, Porphyromonas cansulci, Synergistes jonesii, Prevotella bryantii, Anaerovibrio sp., Butyrivibrio fibrisolvens, Candidatus Methanomethylophilus, Butyrivibrio sp., Oribacterium sp., Pseudobutyrivibrio ruminis e Proteocatella sphenisci.
12. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a nickase à base de Cas é uma proteína C2c1 nickase que compreende uma mutação no domínio Nuc.
13. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que a nickase à base de Cas é uma proteína C2c1 nickase que compreende uma mutação correspondente a D570A, E848A ou D977A em AacC2c1.
14. Método, de acordo com a reivindicação 9 ou 10, caracterizado pelo fato de que a niquase à base de Cas é uma proteína C2c1 derivada de uma espécie bacteriana selecionada do grupo que consiste em Alicyclobacillus acidoterrestris, Alicyclobacillus contaminans, Alicyclobacillus macrosporangiidus, Bacillus hisashii, Candidatus Lindowbacteria, Desulfovibrio inopinatus, Desulfonatronum thiodismutans, Elusimicrobia bacterium RIFOXYA12, Omnitrophica WOR_2 bacterium RIFCSPHIGHO2, Opitutaceae bacterium TAV5, Phycisphaerae bacterium ST-NAGAB-D1, Planctomycetes bacterium RBG_13_46_10, Spirochaetes bacterium GWB1_27_13, Verrucomicrobiaceae bacterium UBA2429, Tuberibacillus calidus, Bacillus thermoamylovorans, Brevibacillus sp. CF112, Bacillus sp. NSP2.1, Desulfatirhabdium butyrativorans, Alicyclobacillus herbarius, Citrobacter freundii, Brevibacillus agri (por exemplo, BAB-2500) e Methylobacterium nodulans.
15. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que a primeira nickase à base de Cas e a segunda nickase à base de Cas são as mesmas.
16. Método, de acordo com qualquer das reivindicações 1 a 11, caracterizado pelo fato de que a primeira niquase à base de Cas e a segunda niquase à base de Cas são diferentes.
17. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que a polimerase é selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento total, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase de fragmento grande,
phi29 DNA polimerase, T7 DNA polimerase, Gst polimerase, Taq polimerase, fragmento Klenow de E. coli DNA polimerase I, KlenTaq, Pol III DNA polimerase, T5 DNA polimerase, Gst polimerase e Sequenase DNA polimerase.
18. Método, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que a amplificação do ácido nucleico alvo é realizada a cerca de 50ºC a 59ºC.
19. Método, de acordo com qualquer uma das reivindicações 1 a 14, caracterizado pelo fato de que a amplificação do ácido nucleico alvo é realizada a cerca de 60ºC a 72ºC.
20. Método, de acordo com qualquer uma das reivindicações 1 a 14, caracterizado pelo fato de que a amplificação do ácido nucleico alvo é realizada a cerca de 37°C ou a cerca de 65°C.
21. Método, de acordo com qualquer uma das reivindicações 1 a 14, caracterizado pelo fato de que a amplificação do ácido nucleico alvo é realizada a uma temperatura constante.
22. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que a sequência de ácido nucleico alvo é de cerca de 20-30, cerca de 30-40, cerca de 40-50 ou cerca de 50-100 nucleotídeos de comprimento.
23. Método, de acordo com qualquer das reivindicações 1 a 18, caracterizado pelo fato de que a sequência de ácido nucleico alvo é de cerca de 100-200, cerca de 100-500 ou cerca de 100-1000 nucleotídeos de comprimento.
24. Método, de acordo com qualquer uma das reivindicações 1-18, caracterizado pelo fato de que a sequência de ácido nucleico alvo é de cerca de 1.000-2.000, cerca de 2.000-3.000, cerca de 3.000-4.000 ou cerca de 4.000-
5.000 nucleotídeos de comprimento.
25. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o primeiro ou o segundo iniciadores compreendem um promotor de RNA polimerase.
26. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que compreende ainda detectar o ácido nucleico amplificado por um método selecionado do grupo que consiste em eletroforese em gel, detecção de corante intercalante, PCR, PCR em tempo real, fluorescência, Transferência de Energia de Ressonância de Fluorescência (FRET), espectrometria de massa e CRISPR- SHERLOCK.
27. Método, de acordo com a reivindicação 23, caracterizado pelo fato de que o ácido nucleico amplificado é detectado pelo método CRISPR-SHERLOCK baseado em Cas13.
28. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o ácido nucleico alvo é detectado em sensibilidade attomolar.
29. Método, de acordo com qualquer das reivindicações 1 a 24, caracterizado pelo fato de que o ácido nucleico alvo é detectado em sensibilidade femtomolar.
30. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o ácido nucleico alvo é selecionado do grupo que consiste em DNA genômico, DNA mitocondrial, DNA viral, DNA de plasmídeo e DNA de fita dupla sintético.
31. Método, de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que a amostra é uma amostra biológica ou uma amostra ambiental.
32. Método, de acordo com a reivindicação 28, caracterizado pelo fato de que a amostra biológica é um sangue, plasma, soro, urina, fezes, escarro, muco, fluido linfático, fluido sinovial, bile, ascite, efusão pleural, seroma, saliva, fluido cerebrospinal, humor aquoso ou vítreo, ou qualquer secreção corporal, um transudato, um exsudato ou fluido obtido de uma articulação ou um swab de pele ou superfície de membrana mucosa.
33. Método, de acordo com a reivindicação 29, caracterizado pelo fato de que a amostra é sangue, plasma ou soro obtido de um paciente humano.
34. Método, de acordo com a reivindicação 28, caracterizado pelo fato de que a amostra é uma amostra de planta.
35. Método, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que a amostra é uma amostra em bruto.
36. Método, de acordo com qualquer uma das reivindicações 1 a 31, caracterizado pelo fato de que a amostra é uma amostra purificada.
37. Método para amplificar e/ou detectar um ácido nucleico de fita simples alvo, caracterizado pelo fato de que compreende: (a) converter o ácido nucleico de fita simples em uma amostra em um ácido nucleico de fita dupla alvo; e (b) realizar as etapas da reivindicação 1.
38. Método, de acordo com a reivindicação 34, caracterizado pelo fato de que o ácido nucleico de fita simples alvo é uma molécula de RNA.
39. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que a molécula de RNA é convertida no ácido nucleico de fita dupla por uma etapa de transcrição reversa e amplificação.
40. Método, de acordo com a reivindicação 34, caracterizado pelo fato de que o ácido nucleico de fita simples alvo é selecionado do grupo que consiste em DNA viral de fita simples, RNA viral, RNA mensageiro, RNA ribossômico, RNA de transferência, microRNA, RNA de interferência curto, RNA nuclear pequeno, RNA sintético e DNA de fita simples sintético.
41. Sistema para amplificar e/ou detectar um ácido nucleico de fita dupla alvo em uma amostra, o sistema caracterizado pelo fato de que compreende: e) um sistema CRISPR de amplificação, o sistema CRISPR de amplificação compreendendo um primeiro e um segundo complexos CRISPR/Cas, o primeiro complexo CRISPR/Cas compreendendo uma primeira nickase à base de Cas e uma primeira molécula guia que orienta o primeiro complexo CRISPR/Cas para uma primeira fita do ácido nucleico alvo, o segundo complexo CRISPR/Cas compreendendo uma segunda nickase à base de Cas e segunda molécula guia que orienta o segundo complexo CRISPR/Cas para uma segunda fita do ácido nucleico alvo; f) uma polimerase; g) um par de iniciadores compreendendo um primeiro e um segundo iniciadores para a mistura de reação, o primeiro iniciador compreendendo uma porção que é complementar à primeira fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a primeira molécula guia e o segundo iniciador compreendendo uma porção que é complementar à segunda fita do ácido nucleico alvo e uma porção compreendendo um sítio de ligação para a segunda molécula guia; e opcionalmente h) um sistema de detecção para detectar amplificação do ácido nucleico alvo.
42. Método, de acordo com a reivindicação 38, caracterizado pelo fato de que a nickase à base de Cas é selecionada do grupo consistindo em Cas9 nickase, Cpf1 nickase e C2c1 nickase.
43. Sistema, de acordo com a reivindicação 38 ou 39, caracterizado pelo fato de que a polimerase é selecionada do grupo que consiste em Bst 2.0 DNA polimerase, Bst 2.0 WarmStart DNA polimerase, Bst 3.0 DNA polimerase, Bst DNA polimerase de comprimento tota, Bst DNA polimerase de fragmento grande, Bsu DNA polimerase, phi29 DNA polimerase, T7 DNA polimerase e Sequenase DNA polimerase.
44. Sistema, de acordo com qualquer das reivindicações 38 a 40, caracterizado pelo fato de que a nickase à base de Cas e a polimerase atuam sob a mesma temperatura.
45. Sistema para amplificar e/ou detectar um ácido nucleico de fita simples alvo em uma amostra, o sistema caracterizado pelo fato de que compreende: c) reagentes para converter o ácido nucleico de fita simples alvo em um ácido nucleico de fita dupla; d) componentes da reivindicação 38.
46. Kit para amplificar e/ou detectar um ácido nucleico de fita dupla alvo em uma amostra, caracterizado pelo fato de que compreende componentes da reivindicação 38 e um conjunto de instruções para uso.
47. Kit, de acordo com a reivindicação 43, caracterizado pelo fato de que compreende ainda reagentes para purificar o ácido nucleico de fita dupla na amostra.
48. Kit para amplificar e/ou detectar um ácido nucleico de fita simples alvo em uma amostra, caracterizado pelo fato de que compreende componentes da reivindicação 43 e um conjunto de instruções para uso.
49. Kit, de acordo com a reivindicação 4, caracterizado pelo fato de que compreende ainda reagentes para purificar o ácido nucleico de fita simples na amostra.
BR112020026246-3A 2018-06-26 2019-06-26 composições, sistemas e métodos de amplificação com base em nickase dupla crispr BR112020026246A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862690278P 2018-06-26 2018-06-26
US62/690,278 2018-06-26
US201862767059P 2018-11-14 2018-11-14
US62/767,059 2018-11-14
PCT/US2019/039221 WO2020006067A1 (en) 2018-06-26 2019-06-26 Crispr double nickase based amplification compositions, systems, and methods

Publications (1)

Publication Number Publication Date
BR112020026246A2 true BR112020026246A2 (pt) 2021-04-20

Family

ID=67297327

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020026246-3A BR112020026246A2 (pt) 2018-06-26 2019-06-26 composições, sistemas e métodos de amplificação com base em nickase dupla crispr

Country Status (12)

Country Link
US (1) US20210207203A1 (pt)
EP (1) EP3814520A1 (pt)
JP (1) JP2021528091A (pt)
KR (1) KR20210024010A (pt)
CN (1) CN112639121A (pt)
AU (1) AU2019291827A1 (pt)
BR (1) BR112020026246A2 (pt)
CA (1) CA3102211A1 (pt)
IL (1) IL278963A (pt)
MX (1) MX2020013461A (pt)
SG (1) SG11202012785VA (pt)
WO (1) WO2020006067A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021247870A1 (en) * 2020-06-03 2021-12-09 Siphox, Inc. Cascading amplification for chemical and biosensing
CN111733216B (zh) * 2020-06-22 2023-03-28 山东舜丰生物科技有限公司 一种提高目标核酸检测效率的方法
CN112831544B (zh) * 2020-12-31 2024-06-14 华南农业大学 一种基于CRISPR/Cas12a系统的生物检测方法和生物检测装置
CN113186253B (zh) * 2021-04-27 2022-06-21 福州大学 一种用于检测路易体病标志物的Cas12a-DNAzyme传感器及其制备方法
EP4373963A2 (en) 2021-07-21 2024-05-29 Montana State University Nucleic acid detection using type iii crispr complex

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US715640A (en) 1902-09-10 1902-12-09 Whitney Mfg Company Clutch mechanism.
US5541099A (en) 1989-08-10 1996-07-30 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'-to-5' exonuclease activity
US6555349B1 (en) 1993-01-22 2003-04-29 Cornell Research Foundation, Inc. Methods for amplifying and sequencing nucleic acid molecules using a three component polymerase
NZ520579A (en) 1997-10-24 2004-08-27 Invitrogen Corp Recombinational cloning using nucleic acids having recombination sites and methods for synthesizing double stranded nucleic acids
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
US9689031B2 (en) * 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
US9567573B2 (en) 2010-04-26 2017-02-14 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using nucleases
US9096897B2 (en) * 2012-04-09 2015-08-04 Envirologix Inc. Compositions and methods for quantifying a nucleic acid sequence in a sample comprising a primer oligonucleotide with a 3′-terminal region comprising a 2′-modified nucleotide
RU2721275C2 (ru) 2012-12-12 2020-05-18 Те Брод Инститьют, Инк. Доставка, конструирование и оптимизация систем, способов и композиций для манипуляции с последовательностями и применения в терапии
US20140255928A1 (en) * 2013-03-11 2014-09-11 Elitech Holding B.V. Methods for true isothermal strand displacement amplification
AU2014281027A1 (en) 2013-06-17 2016-01-28 Massachusetts Institute Of Technology Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation
AU2015305570C1 (en) * 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
WO2016149661A1 (en) 2015-03-18 2016-09-22 The Broad Institute, Inc. Massively parallel on-chip coalescence of microemulsions
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3436575A1 (en) * 2015-06-18 2019-02-06 The Broad Institute Inc. Novel crispr enzymes and systems
CA3012631A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
CA3024543A1 (en) 2015-10-22 2017-04-27 The Broad Institute, Inc. Type vi-b crispr enzymes and systems
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
JP6914274B2 (ja) 2016-01-22 2021-08-04 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprcpf1の結晶構造
US20200263190A1 (en) 2016-04-19 2020-08-20 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3445848A1 (en) 2016-04-19 2019-02-27 The Broad Institute, Inc. Novel crispr enzymes and systems
AU2017253107B2 (en) 2016-04-19 2023-07-20 Massachusetts Institute Of Technology CPF1 complexes with reduced indel activity
EP3457840B1 (en) * 2016-05-20 2024-04-10 Regeneron Pharmaceuticals, Inc. Methods for breaking immunological tolerance using multiple guide rnas
CA3028158A1 (en) 2016-06-17 2017-12-21 The Broad Institute, Inc. Type vi crispr orthologs and systems
WO2018035388A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2018035387A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
JP7228514B2 (ja) 2016-12-09 2023-02-24 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprエフェクターシステムベースの診断法
WO2018170340A1 (en) 2017-03-15 2018-09-20 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
US11739308B2 (en) 2017-03-15 2023-08-29 The Broad Institute, Inc. Cas13b orthologues CRISPR enzymes and systems
US11174515B2 (en) 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11104937B2 (en) 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11618928B2 (en) 2017-04-12 2023-04-04 The Broad Institute, Inc. CRISPR effector system based diagnostics for malaria detection
BR112019021378A2 (pt) 2017-04-12 2020-05-05 Massachusetts Inst Technology ortólogos de crispr tipo vi inovadores e sistemas
US20210121280A1 (en) 2017-04-16 2021-04-29 Sanford Health Filter for Stent Retriever and Methods for Use Thereof
JP7364472B2 (ja) 2017-05-18 2023-10-18 ザ・ブロード・インスティテュート・インコーポレイテッド 標的化された核酸編集のための系、方法、及び組成物
WO2019005866A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. NEW TYPE VI CRISPR ORTHOLOGISTS AND ASSOCIATED SYSTEMS
CN109209763B (zh) 2017-07-06 2019-11-29 北京金风科创风电设备有限公司 风力发电机组叶片变桨装置、变桨方法及风力发电机组
CN107488710B (zh) * 2017-07-14 2020-09-22 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒

Also Published As

Publication number Publication date
JP2021528091A (ja) 2021-10-21
US20210207203A1 (en) 2021-07-08
CN112639121A (zh) 2021-04-09
IL278963A (en) 2021-01-31
WO2020006067A1 (en) 2020-01-02
CA3102211A1 (en) 2020-01-02
MX2020013461A (es) 2021-04-28
AU2019291827A1 (en) 2020-12-24
KR20210024010A (ko) 2021-03-04
EP3814520A1 (en) 2021-05-05
SG11202012785VA (en) 2021-01-28

Similar Documents

Publication Publication Date Title
BR112020026306A2 (pt) Métodos de amplificação, sistemas e diagnósticos baseados em sistema efeitor crispr
US11912992B2 (en) CRISPR DNA targeting enzymes and systems
BR112020026246A2 (pt) composições, sistemas e métodos de amplificação com base em nickase dupla crispr
US20200172935A1 (en) Modified cpf1 mrna, modified guide rna, and uses thereof
KR102210323B1 (ko) Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
CA3106035A1 (en) Cas12b enzymes and systems
EA038500B1 (ru) Термостабильные нуклеазы cas9
US20220333208A1 (en) Crispr effector system based multiplex cancer diagnostics
Wandera et al. An enhanced assay to characterize anti-CRISPR proteins using a cell-free transcription-translation system
BR112020025319A2 (pt) Composições, sistemas e métodos de amplificação baseada em crispr/cas e transposase
CA3093580A1 (en) Novel crispr dna and rna targeting enzymes and systems
US20220195405A1 (en) Engineered ssdnase-free crispr endonucleases
Li et al. Phosphorothioate-modified DNA oligonucleotides inactivate CRISPR-Cpf1 mediated genome editing
CN117693585A (zh) Ii类v型crispr系统