BR112021002476A2 - nova proteína associada a crispr e uso da mesma - Google Patents

nova proteína associada a crispr e uso da mesma Download PDF

Info

Publication number
BR112021002476A2
BR112021002476A2 BR112021002476-0A BR112021002476A BR112021002476A2 BR 112021002476 A2 BR112021002476 A2 BR 112021002476A2 BR 112021002476 A BR112021002476 A BR 112021002476A BR 112021002476 A2 BR112021002476 A2 BR 112021002476A2
Authority
BR
Brazil
Prior art keywords
seq
amino acid
protein
fact
mgcas12a
Prior art date
Application number
BR112021002476-0A
Other languages
English (en)
Inventor
Sunghwa Choe
Han Seong Kim
Dong Wook Kim
Jongjin Park
Jiyoung YOON
Original Assignee
G+Flas Life Sciences
Seoul National University R&Db Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G+Flas Life Sciences, Seoul National University R&Db Foundation filed Critical G+Flas Life Sciences
Publication of BR112021002476A2 publication Critical patent/BR112021002476A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

NOVA PROTEÍNA ASSOCIADA A CRISPR E USO DA MESMA. A presente invenção refere-se a uma nova proteína associada a CRISPR e ao seu uso. Uma proteína representada por uma sequência de aminoácidos de SEQ ID NO: 1 ou SEQ ID NO: 3, de acordo com a presente invenção, exibe a atividade de endonucleases, que reconhecem e clivam uma sequência de ácido nucleico intracelular ligada a um RNA guia. Portanto, uma nova proteína associada a CRISPR da invenção pode ser usada como uma nuclease diferente para edição de genoma, em um sistema CRISPR-Cas.

Description

“NOVA PROTEÍNA ASSOCIADA A CRISPR E USO DA MESMA” CAMPO DA INVENÇÃO
[001] A presente invenção refere-se a uma nova proteína associada a CRISPR e ao uso da mesma.
FUNDAMENTOS DA INVENÇÃO
[002] A edição do genoma é uma técnica pela qual a informação genética de um organismo vivo é editada livremente. Os avanços no campo das ciências da vida e o desenvolvimento da tecnologia de sequenciamento do genoma tornaram possível compreender uma ampla gama de informações genéticas. Por exemplo, a compreensão dos genes para a reprodução de animais e plantas, doenças e crescimento, mutações genéticas que causam várias doenças genéticas humanas e produção de biocombustíveis já foi alcançada; entretanto, novos avanços tecnológicos devem ser feitos para utilizar diretamente esse conhecimento com o propósito de melhorar os organismos vivos e tratar doenças humanas.
[003] As técnicas de edição de genoma podem ser usadas para alterar a informação genética de animais, incluindo humanos, plantas e micro-organismos e, portanto, sua faixa de aplicação pode ser drasticamente expandida. Tesouras genéticas, que são ferramentas moleculares projetadas e feitas para cortar com precisão a informação genética desejada, desempenham um papel fundamental nas técnicas de edição do genoma. Similar às técnicas de sequenciamento de última geração que levaram o campo do sequenciamento de genes para o próximo nível, o uso da tesoura de genes está se tornando uma técnica chave para aumentar a velocidade e a faixa de utilização da informação genética e criar novos campos industriais.
[004] As tesouras genéticas desenvolvidas até agora podem ser divididas em três gerações de acordo com a ordem em que aparecem. A primeira geração de tesouras genéticas é a nuclease dedo de zinco (ZFN); a segunda geração de tesouras genéticas é a nuclease efetora do tipo ativador de transcrição (TALEN); e a mais recentemente estudada, repetições palindrômicas curtas agrupadas e regularmente espaçadas (CRISPR) / proteína associada a CRISPR 9 (Cas9) é a terceira geração de tesouras genéticas.
[005] Os CRISPRs são loci contendo múltiplas repetições diretas curtas que são encontradas nos genomas de aproximadamente 40% das bactérias sequenciadas e 90% das arqueias sequenciadas. A proteína Cas9 forma uma endonuclease ativa quando complexada com dois RNAs denominados RNA CRISPR (crRNA) e crRNA transativador (tracrRNA), cortando assim elementos genéticos estranhos em fagos invasores ou plasmídeos para proteger as células hospedeiras. O crRNA é transcrito a partir do elemento CRISPR do genoma do hospedeiro que foi previamente ocupado por invasores estranhos.
[006] As nucleases guiadas por RNA derivadas deste sistema CRISPR-Cas fornecem uma ferramenta capaz de edição do genoma. Em particular, estudos têm sido realizados ativamente relacionados a técnicas capazes de editar genomas de células e órgãos usando um RNA guia único (sgRNA) e uma proteína Cas. Recentemente, a proteína Cpf1 (derivada de Prevotella e Francisella 1) foi descrita como outra proteína nuclease no sistema CRISPR-Cas (B. Zetsche, e outros, 2015), o que resulta em uma gama mais ampla de opções na edição do genoma.
SUMÁRIO DA INVENÇÃO Problema Técnico
[007] Como um resultado dos esforços contínuos em desenvolver uma proteína que é mais eficaz na edição do genoma do que as nucleases conhecidas, os presentes inventores encontraram uma nova proteína associada a CRISPR que reconhece e cliva uma sequência de ácido nucleico alvo e, assim, completaram a presente invenção.
[008] Consequentemente, um objetivo da presente invenção é fornecer uma nova proteína associada a CRISPR que reconhece e cliva uma sequência de ácido nucleico alvo. Solução para o Problema
[009] Para atingir o objetivo mencionado acima, a presente invenção fornece uma proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 1.
[010] Além disso, a presente invenção fornece uma proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 1, cuja lisina (Lys) na posição 925 é substituída por outro aminoácido.
[011] Além disso, a presente invenção fornece uma proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 3.
[012] Além disso, a presente invenção fornece uma proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 3, cuja lisina (Lys) na posição 930 é substituída por outro aminoácido.
[013] Além disso, a presente invenção fornece uma proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 1, cujo ácido aspártico (Asp) na posição 877 é substituído por outro aminoácido.
[014] Além disso, a presente invenção fornece uma proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 3, cujo ácido aspártico (Asp) na posição 873 é substituído por outro aminoácido.
[015] Além disso, a presente invenção fornece uma composição farmacêutica para o tratamento de câncer, compreendendo como ingredientes ativos: mgCas12a; e crRNA que tem como alvo uma sequência de ácido nucleico especificamente presente em células cancerosas.
EFEITOS DA INVENÇÃO
[016] A proteína representada pela sequência de aminoácidos da SEQ ID NO: 1 ou SEQ ID NO: 3, de acordo com a presente invenção, tem atividade de endonuclease que reconhece e cliva uma sequência de ácido nucleico intracelular ligada a um RNA guia. Portanto, a nova proteína associada a CRISPR da presente invenção pode ser usada como outra nuclease, que realiza a edição do genoma, no sistema CRISPR-Cas.
BREVE DESCRIÇÃO DOS DESENHOS
[017] A Figura 1 ilustra um diagrama esquemático de um processo de descoberta de Cas12a a partir do metagenoma.
[018] A Figura 2A ilustra uma árvore filogenética do Cas12a descoberto.
[019] A Figura 2B ilustra estruturas de novos Cas12a’s e AsCas12a.
[020] As Figuras 3 a 8 ilustram sequências de aminoácidos de Cas12a’s e mgCas12a’s existentes da presente invenção, que foram alinhadas usando o programa ESPript.
[021] As Figuras 9A e 9B ilustram as tabelas obtidas comparando e resumindo as informações de sequência de Cas12a’s e mgCas12a’s da presente invenção.
[022] As Figuras 10 a 12 ilustram os resultados obtidos pela identificação da atividade, dependendo do pH, dos mgCas12a’s de acordo com a presente invenção. Por outro lado, crRNA # 1 na Figura 10 tem a sequência de nucleotídeos de SEQ ID NO: 25 e crRNA # 2 na Figura 11 tem a sequência de nucleotídeos de SEQ ID NO:
26.
[023] A Figura 13 ilustra um diagrama no qual uma sequência de ácido nucleico alvo e posições onde os crRNAs se ligam são indicadas.
[024] A Figura 14 ilustra os resultados obtidos pela identificação da eficiência de edição de genes alcançada pelas respectivas proteínas (mock, mgCas12a-1 e mgCas12a-2) em um caso em que crRNA para cada um dos genes CCR5 e DNMT1 é usado.
[025] A Figura 15 ilustra os resultados obtidos pela identificação da eficiência de edição de genes alcançada pelas respectivas proteínas (FnCpf1, mgCas12a-1 e mgCas12a-2) em um caso em que dois crRNAs para os respectivos genes FucT14-1 e FucT14-2 são usados.
[026] As Figuras 16A e 16B ilustram os resultados obtidos pela identificação da atividade de clivagem de DNA da proteína FnCas12a, WT mgCas12a-1 ou WT mgCas12a-2.
[027] A Figura 17 ilustra os resultados obtidos pela identificação de funções DNase não específicas de Cas12a existente (AsCas12a, FnCas12a ou LbCas12a) e novo Cas12a (WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 ou d_mgCas12a- 2).
[028] As Figuras 18A e 18B ilustram os resultados obtidos identificando se a proteína FnCas12a, WT mgCas12a-1 ou WT mgCas12a-2 tem uma função DNase não específica sem crRNA.
[029] A Figura 19 ilustra os resultados obtidos identificando se o mgCas12a pode realizar a clivagem de DNA usando a alça 5’ de Cas12a existente.
[030] As Figuras 20A e 20B ilustram a atividade de clivagem de DNA da proteína FnCas12a, mgCas12a-1 ou mgCas12a-2 em íons divalentes.
DESCRIÇÃO DETALHADA
[031] Em um aspecto da presente invenção, é fornecida uma nova proteína Cas12a obtida a partir de metagenoma.
[032] Tal como aqui utilizado, o termo “Cas12a” é uma proteína relacionada a CRISPR e também pode ser descrito como Cpf1. Além disso, a Cpf1 é uma proteína efetora encontrada nos sistemas CRISPR tipo V. Cas12a, que é uma única proteína efetora, é semelhante a Cas9, que é uma proteína efetora encontrada em sistemas CRISPR tipo II, em que se combina com crRNA para clivar um gene alvo. No entanto, as duas diferem na forma como funcionam. A proteína Cas12a funciona com um único crRNA. Portanto, para a proteína Cas12a, não há necessidade de usar simultaneamente crRNA e crRNA de transativação (tracrRNA) ou criar um RNA guia único (sgRNA) por combinação sintética de tracrRNA e crRNA, como em Cas9.
[033] Além disso, ao contrário do Cas9, o sistema Cas12a reconhece um PAM presente na posição 5’ de uma sequência alvo. Além disso, no sistema Cas12a, um RNA guia que determina um alvo também tem um comprimento mais curto do que Cas9. Além disso, Cas12a é vantajoso por gerar uma saliência 5’ (extremidade pegajosa), em vez de uma extremidade cega, em um sítio de clivagem em um DNA alvo e, portanto, permite uma edição de genes mais precisa e diversificada.
[034] Convencionalmente, as proteínas Cas12a podem ser derivadas do gênero Candidatus, do gênero Lachnospira, do gênero Butyrivibrio, do gênero Peregrinibacteria, do gênero Acidominococcus, do gênero Porphyromonas, do gênero Prevotella, do gênero Francisella, do gênero Candidatus Methanoplasma, ou do gênero Eubacterium. Especificamente, PbCas12a é uma proteína derivada de Parcubacteria bacterium GWC2011_GWC2_44_17; PeCas12a é uma proteína derivada de Peregrinibacteria Bacterium GW2011_GWA_33_10; AsCas12a é uma proteína derivada de Acidaminococcus sp. BVBLG; PmCas12a é uma proteína derivada de Porphyromonas macacae; LbCas12a é uma proteína derivada de Lachnospiraceae bacterium ND2006; PcCas12a é uma proteína derivada de Porphyromonas crevioricanis; PdCas12a é uma proteína derivada de Prevotella disiens; e FnCas12a é uma proteína derivada de Francisella novicida U112. No entanto, cada proteína Cas12a pode ter uma atividade diferente, dependendo do micro-organismo do qual ela é derivada.
[035] Na presente invenção, novas Cas12a’s foram identificadas através da análise de genes em metagenomas. Daqui em diante, Cas12a derivada de metagenoma pode ser descrito como mgCas12a. Como AsCas12a, a mgCas12a da presente invenção inclui domínios WED, REC, PI, RuvC, BH e NUC (Figura 2). Além disso, foi identificado que similar às proteínas Cas12a previamente conhecidas, a proteína mgCas12a da presente invenção pode realizar a clivagem do gene com um gRNA incluindo crRNA e alça 5’. Foi identificado que o mgCas12a usa RNA de alça 5’
tendo a mesma sequência de FnCas12a. Especificamente, o RNA de alça 5’ pode ter uma sequência de AAUUUCUACUGUUGUAGAU (SEQ ID NO: 12). No entanto, foi identificado que a mgCas12a funciona mesmo com um RNA de alça 5’ em AsCas12a e LbCas12a (Figura 19).
[036] A mgCas12a pode incluir adicionalmente uma etiqueta para separação e purificação. A etiqueta pode ser ligada ao N-terminal ou C-terminal da mgCas12a. Além disso, a etiqueta pode ser ligada simultaneamente ao N-terminal e C-terminal da mgCas12a. Um exemplo específico da etiqueta pode ser uma etiqueta 6XHis.
[037] Como um exemplo específico da mgCas12a, é fornecida uma proteína tendo a sequência de aminoácidos de SEQ ID NO: 1. Além disso, desde que a atividade de mgCas12a não seja alterada, a deleção ou a substituição de parte dos aminoácidos pode ser feita. Especificamente, a mgCas12a pode ser uma proteína tendo a sequência de aminoácidos de SEQ ID NO: 1, cuja lisina (Lys) na posição 925 é substituída por outro aminoácido. Aqui, o outro aminoácido pode ser qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido aspártico (Asp), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina ( Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys). Especificamente, a proteína pode ter a sequência de aminoácidos de SEQ ID NO: 1, cuja lisina na posição 925 é substituída por glutamina. Ou seja, a proteína pode ter a sequência de aminoácidos de SEQ ID NO: 5.
[038] Além disso, o gene que codifica a proteína com a sequência de aminoácidos da SEQ ID NO: 1 pode ser um polinucleotídeo com a sequência de nucleotídeos da SEQ ID NO: 2. Além disso, a mgCas12a com a sequência de aminoácidos da SEQ ID NO: 1, de acordo com a presente invenção, pode ter atividade ótima em pH 7,0 a pH 7,9.
[039] Como outro exemplo específico de mgCpf1, é fornecida uma proteína tendo a sequência de aminoácidos de SEQ ID NO: 3. Além disso, desde que a atividade da mgCpf1 não seja alterada, a deleção ou a substituição de parte dos aminoácidos pode ser feita. Especificamente, a mgCpf1 pode ser uma proteína tendo a sequência de aminoácidos de SEQ ID NO: 3, cuja lisina (Lys) na posição 930 é substituída por outro aminoácido. Aqui, o outro aminoácido pode ser qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido aspártico (Asp), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys). Especificamente, a proteína pode ter a sequência de aminoácidos de SEQ ID NO: 3, cuja lisina na posição 930 é substituída por glutamina. Ou seja, a proteína pode ter a sequência de aminoácidos de SEQ ID NO: 6.
[040] O gene que codifica a proteína com a sequência de aminoácidos de SEQ ID NO: 3 pode ser um polinucleotídeo tendo a sequência de nucleotídeos de SEQ ID NO: 4.
[041] Além disso, a mgCas12a tendo a sequência de aminoácidos de SEQ ID NO: 3, de acordo com a presente invenção, pode ter atividade ótima em pH 7,0 a pH 7,9.
[042] Em outro aspecto da presente invenção, é fornecida uma proteína mgCas12a com atividade de endonuclease diminuída. Um exemplo específico desta pode ser mgCas12a tendo a sequência de aminoácidos de SEQ ID NO: 1, cujo ácido aspártico (Asp) na posição 877 é substituído por outro aminoácido. Aqui, o outro aminoácido pode ser qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln ), tirosina (Tyr), alanina (Ala), lisina (Lys), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys). Especificamente, a proteína pode ser uma proteína obtida por substituição do ácido aspártico (Asp) por alanina (Ala).
[043] Outro exemplo específico da proteína mgCas12a pode ser mgCas12a tendo a sequência de aminoácidos de SEQ ID NO: 3, cujo ácido aspártico (Asp) na posição 873 é substituído por outro aminoácido. Aqui, o outro aminoácido pode ser qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), lisina (Lys), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys). Especificamente, a proteína pode ser uma proteína obtida por substituição do ácido aspártico (Asp) por alanina (Ala). Aqui, a mgCas12a com atividade de endonuclease diminuída pode ser descrita como mgCas12a morto ou d_mgCas12a. A d_mgCas12a pode ter a sequência de aminoácidos de SEQ ID NO: 13 ou SEQ ID NO: 14.
[044] Além disso, em ainda outro aspecto da presente invenção, é fornecida uma composição farmacêutica para o tratamento de câncer, compreendendo como ingredientes ativos: mgCas12a; e crRNA que tem como alvo uma sequência de ácido nucleico especificamente presente em células cancerosas. Aqui, a mgCas12a pode ter qualquer sequência de aminoácidos selecionada a partir do grupo que consiste de SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 e SEQ ID NO: 6. Conforme usado neste documento, o termo “sequência de ácido nucleico especificamente presente em células cancerosas” refere-se a uma sequência de ácido nucleico que não está presente em células normais e está presente apenas em células cancerosas. Ou seja, este termo se refere a uma sequência diferente daquela em células normais, e as duas sequências podem diferir em pelo menos um ácido nucleico. Além disso, essa diferença pode ser causada pela substituição ou deleção de parte do gene. Como um exemplo específico, a sequência de ácido nucleico especificamente presente em células cancerosas pode ser um SNP presente em células cancerosas. Um DNA alvo tendo a sequência mencionada acima, que está presente em células cancerosas, e um RNA guia tendo uma sequência complementar ao DNA alvo ligam-se especificamente um ao outro.
[045] Em particular, no que diz respeito à sequência de ácido nucleico especificamente presente em células cancerosas, crRNAs podem ser criados encontrando SNPs específicos, que existem apenas em células cancerosas, por meio do sequenciamento do genoma de vários tecidos cancerosos e usando os mesmos. Isso é feito de forma a exibir toxicidade específica para células cancerosas e, assim, torna possível desenvolver fármacos terapêuticos anticâncer específicos para pacientes. Além disso, a sequência de ácido nucleico especificamente presente em células cancerosas pode ser um gene tendo variação elevada do número de cópias (CNV) em células cancerosas, ao contrário das células normais.
[046] Um exemplo específico do câncer pode ser qualquer um selecionado a partir do grupo que consiste de câncer de bexiga, câncer ósseo, câncer de sangue, câncer de mama, melanoma, câncer de tireoide, câncer de paratireoide, câncer de medula óssea, câncer retal, câncer de garganta, câncer de laringe, câncer de pulmão, câncer de esôfago, câncer de pâncreas, câncer gástrico, câncer de língua, câncer de pele, tumor cerebral, câncer uterino, câncer de cabeça ou pescoço, câncer de vesícula biliar, câncer oral, câncer de cólon, câncer perianal, tumor do sistema nervoso central, câncer de fígado e câncer colorretal. Em particular, o câncer pode ser câncer gástrico, câncer colorretal, câncer de fígado, câncer de pulmão e câncer de mama, que são conhecidos como os cinco principais cânceres na Coreia.
[047] Aqui, o crRNA que tem como alvo a sequência de ácido nucleico especificamente presente nas células cancerosas pode incluir uma ou mais sequências de gRNA. Por exemplo, o crRNA pode usar um gRNA capaz de direcionar simultaneamente os éxons 10 e 11 de BRCA1 presentes no câncer de ovário ou câncer de mama. Além disso, o crRNA pode usar dois ou mais gRNAs direcionados ao éxon 11 de BRCA1. Como tal, a combinação de gRNAs pode ser selecionada de forma apropriada, dependendo dos objetivos do tratamento de câncer e dos tipos de câncer. Ou seja, diferentes gRNAs podem ser selecionados e usados. Modo para a Invenção
[048] A seguir, a presente invenção será descrita em mais detalhes por meio dos seguintes exemplos. No entanto, os seguintes exemplos são apenas para fins ilustrativos, e o escopo da presente invenção não está limitado aos mesmos.
[049] Exemplo 1. Descoberta de proteína Cas12a derivada de metagenoma
[050] As sequências de nucleotídeos do metagenoma foram transferidas a partir do banco de dados NCBI Genbank BLAST e construídas em um banco de dados local BLASTp. Além disso, 16 Cas12a’s e várias sequências de aminoácidos de proteínas relacionadas a CRISPR (Cas1) foram transferidas a partir do banco de dados Uniprot. O programa MetaCRT foi usado para encontrar repetições CRISPR e sequências espaçadoras no metagenoma. Em seguida, apenas as sequências de metagenoma tendo a sequência CRISPR foram extraídas e seus genes foram preditos usando o programa Prodigal.
[051] Dentre os genes preditos, aqueles dentro de uma faixa que é 10 kb a montante ou à jusante da sequência CRISPR foram extraídos, e a sequência de aminoácidos de Cas12a foi usada para predizer um homólogo de Cas12a dentre os genes em questão. O gene Cas1 foi usado para predizer se havia um homólogo Cas1 a montante ou à jusante do homólogo Cas12a; e genes Cas12a variando de 800 aa a
1.500 aa, que tinham Cas1 ao redor, foram selecionados. Para cada um desses genes, BLASTp foi usado no banco de dados não redundante NCBI Genbank para determinar se o gene era um gene que já havia sido relatado ou se o gene era um gene não tendo qualquer associação com CRISPR.
[052] Depois de remover Cas12a’s fragmentados que não começam com metionina (Met), esses genes foram alinhados usando um alinhamento múltiplo usando o programa de transformada rápida de Fourier (MAFFT). Em seguida, uma árvore filogenética foi desenhada com Neighbour-joining (100x bootstrap) usando MEGA7. O gene que forma um táxon monofilético com o gene Cas12a previamente conhecido foi selecionado, e uma árvore filogenética do mesmo foi desenhada, juntamente com a sequência de aminoácidos do Cas12a existente, usando MEGA7, probabilidade máxima, e 1000x bootstrap, para examinar sua relação evolucionária. Aqui, o processo de descoberta de Cas12a a partir do metagenoma é ilustrado esquematicamente na Figura 1. Além disso, a árvore filogenética de Cas12a é ilustrada na Figura 2A. Aqui, uma nova proteína tendo a sequência de aminoácidos de SEQ ID NO: 1 foi denominada WT mgCas12a-1. Além disso, uma nova proteína tendo a sequência de aminoácidos de SEQ ID NO: 3 foi denominada WT mgCas12a-
2. Além disso, as estruturas de AsCas12a, mgCas12a-1 e mgCas12a-2 são ilustradas na Figura 2B. Exemplo 2. Produção de variantes de mgCas12a
[053] Os candidatos Cas12a foram alinhados com base nas estruturas de AsCas12a e LbCas12a usando o programa ESPript. Para WT mgCas12a-1 e WT mgCas12a-2, a substituição de parte dos aminoácidos foi feita para aumentar sua atividade de endonuclease. A WT mgCas12a-1, na qual o 925º aminoácido Lys (K) foi substituído por Glu (Q), foi denominada mgCas12a-1. Além disso, a WT mgCas12a- 2, na qual o 930º aminoácido Lys (K) foi substituído por Glu (Q), foi denominada mgCas12a-2. As variantes resultantes foram submetidas à otimização de códons considerando os usos de códons de humanos, de Arabidopsis, e de E. coli, e, em seguida, uma solicitação para a síntese de genes foi feita à Bionics. Aqui, as sequências de nucleotídeos de mgCas12a-1 e mgCas12a-2 códon-otimizados humanos são mostradas em SEQ ID NO: 7 e SEQ ID NO: 8, respectivamente. Além disso, as sequências de aminoácidos das Cas12a’s existentes (AsCas12a (SEQ ID NO: 9), LbCas12a (SEQ ID NO: 10) e FnCas12a (SEQ ID NO: 11)) e os candidatos
Cas12a (mgCas12a-1 e mgCas12a -2), que foram alinhados usando o programa ESPript, são ilustrados nas Figuras 3 a 8; e os resultados obtidos comparando e resumindo suas informações de sequência são ilustrados nas Figuras 9A e 9B.
[054] Em seguida, cada um dos genes WT mgCas12a-1, WT mgCas12a-2, mgCas12a-1 e mgCas12a-2, que haviam sido clonados no vetor pUC57, foi novamente inserido no vetor pET28a-KanR-6xHis-BPNLS e, em seguida, a clonagem foi realizada. O vetor clonado foi transformado nas cepas de E. coli DH5a e Rosetta, respectivamente. Uma sequência de alça 5’ de crRNA foi extraída da sequência de repetição CRISPR do metagenoma. O RNA extraído foi sintetizado em um oligo DNA. A transcrição do oligômero de DNA foi realizada usando o kit de RNA transcriptase MEGAshortscript T7, e uma concentração da alça 5’ transcrita foi verificada por FLUOstar Omega. Exemplo 3. Expressão e purificação de proteínas
[055] 5 ml de E. coli Rosetta (DE3), que foi cultivada durante a noite, foram inoculados em 500 ml de meio TB líquido suplementado com 100 mg / ml de antibiótico canamicina. O meio foi cultivado em uma incubadora a 37° C até a OD600 atingir 0,6. Para a expressão da proteína, o tratamento com 0,4 uM de isopropil β-D-1- tiogalactopiranosídeo (IPTG) foi realizado e, em seguida, cultura adicional foi realizada a 22º C por 16 a 18 horas. Após centrifugação, as células obtidas foram misturadas com 10 ml de tampão de lise (20 mM HEPES pH 7,5, 100 mM KCl, 20 mM imidazol, glicerol a 10%, e coquetel de inibidor de protease livre de EDTA) e, em seguida, submetidas à ultrassonicação para ruptura celular. A ruptura foi centrifugada três vezes a 6.000 rpm por 20 minutos cada e, em seguida, filtrada através de um filtro de 0,22 mícron.
[056] Posteriormente, a lavagem e a eluição foram realizadas usando uma coluna de níquel (HisTrap FF, 5 ml) e tampão 300 mM imidazol, e as proteínas foram purificadas por cromatografia de afinidade. Os tamanhos das proteínas foram verificados por eletroforese SDS-PAGE, e a diálise foi realizada durante a noite contra o tampão de diálise (20 mM HEPES pH 7,5, 100 mM KCl, 1 mM DTT, glicerol a 10%). Em seguida, as proteínas foram submetidas seletivamente à filtração e concentração (Amicon Ultra Centrifugal Filter 100.000 MWCO) dependendo do seu tamanho. Para as proteínas, o método quantitativo de Bradford foi usado para medir sua concentração. Em seguida, as proteínas foram armazenadas a -80º C e utilizadas. Exemplo 4. Identificação da faixa de pH adequada para mgCas12a através de análise de clivagem
[057] A xilosiltransferase de alface (Lactuca sativa) foi amplificada por PCR para predizer um motivo adjacente do protoespaçador (PAM), e um RNA guia (gRNA) para tal foi designado. Para complexos de ribonucleoproteína (RNP) para mgCas12a- 1 e mgCas12a-2, cada proteína mgCas12a foi misturada com o gRNA em uma relação molecular de 1:1,25 em temperatura ambiente por 20 minutos, para produzir cada complexo RNP. O produto de PCR de xilosiltransferase purificado foi submetido a tratamento com os RNPs em várias concentrações. Em seguida, o ajuste da concentração foi realizado com NEBuffer 1.1 (componentes de tampão 1X, 10 mM Bis-Tris-Propano-HCl, 10 mM MgCl2 e 100 μg / ml BSA), NEBuffer 2.1 (componentes de tampão 1X, 50 mM NaCl, 10 mM Tris-HCl, 10 mM MgCl2 e 100 μg / ml BSA), e NEBuffer 3.1 (componentes de tampão 1X, 100 mM NaCl, 50 mM Tris-HCl, 10 mM MgCl2 e 100 μg / ml BSA), e uma análise de clivagem in vitro foi realizada a 37º C. Aqui, o NEBuffer 1.1, o NEBuffer 2.1 e o NEBuffer 3.1 tinham valores de pH 7,0, pH 7,9 e pH 7,9, respectivamente, a 25° C. Após cada reação ser completada, a reação foi interrompida por incubação a 65º C por 10 minutos, e a reação completa foi verificada por eletroforese em gel de agarose a 1,5%. Os resultados são ilustrados nas Figuras 10 a 12. Nas Figuras 10 a 12, a mgCas12a-1 e a mgCas12a-2 são designadas por hemgCas12a-1 e hemgCas12a-2, respectivamente. Além disso, a sequência de ácido nucleico alvo, que está na xilosiltransferase, e as posições onde os crRNAs se ligam foram indicadas em um diagrama, e este diagrama é ilustrado na Figura 13.
[058] Conforme ilustrado nas Figuras 10 a 12, em um caso em que o complexo mgCas12a-1 e crRNA foi tratado com o NEBuffer 1.1, o dsDNA alvo foi clivado. Além disso, no caso em que o complexo mgCas12a-2 e crRNA foi tratado com o NEBuffer
1.1, o dsDNA alvo foi clivado. A partir desses resultados, verificou-se que a mgCas12a-1 e a mgCas12a-2 estavam ativas em pH 7,0. Exemplo 5. Análise da eficiência de edição de genes de mgCas12a em células animais Exemplo 5.1. Produção de RNP incluindo mgCas12a-1 ou mgCas12a-2 para edição de genes de CCR5 e DNMT1
[059] As células HEK 293T foram cultivadas em uma incubadora de CO2 a 5% em 37 ° C em meio DMEM suplementado com 10% de soro fetal bovino (FBS) e penicilina-estreptomicina (P / S). Cada 100 pmole da proteína mgCas12a-1 e da proteína mgCas12a-2, e 200 pmole de cada um dos crRNA direcionados a CCR5 e crRNA direcionado a DNMT1 foram incubados em temperatura ambiente por 20 minutos, para preparar cada RNP. Aqui, as sequências de crRNA para CCR5 e DNMT1 foram sintetizadas por Integrated DNA Technologies (IDT), e são mostradas na Tabela 1 abaixo. [Tabela 1] Genes Sequência de crRNA (5’-3’)
CACCGAAUUUCUACUGUUGUAGAUGGAGUGAAGGGAGAGUUUGUCAAUUUUUUG CCR5 (SEQ ID NO: 12)
GGUCAAUUUCUACUGUUGUAGAUGCUCAGCAGGCACCUGCCUCUUUU DNMT1 (SEQ ID NO: 13)
[060] As células HEK293T cultivadas em 2 × 105 foram misturadas com 20 μl de reagente de nucleofecção e, em seguida, misturadas com 10 μl de complexo RNP. Subsequentemente, o dispositivo 4D-Nucleofector (Lonza) foi usado para a transfecção. 48 e 72 horas após a transfecção, o DNA genômico foi extraído das células usando Mini Kit de DNA Genômico PureLink™ (Invitrogen).
Exemplo 5.2. Análise de sequenciamento para sítio alvo
[061] O DNA genômico extraído no Exemplo 5.1 foi amplificado usando iniciadores adaptadores para CCR5 ou DNMT1 mostrados na Tabela 2 abaixo. [Tabela 2] Genes Sequência de Iniciador Adaptador (5’-3’)
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGTATTTCTGTTCAGATCAC (SEQ ID NO: 15) CCR5
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGCCCATCAATTATAGAAAGCC (SEQ ID NO: 16)
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTGCACACAGCAGGCCTTTG (SEQ ID NO: 17) DNMT1
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCCCAATAAGTGGCAGAGTGC (SEQ ID NO: 18)
[062] Subsequentemente, a purificação e a preparação da biblioteca de sequenciamento foram realizadas de acordo com o protocolo da Illumina e, em seguida, uma análise de sequenciamento profundo foi realizada no sítio alvo usando equipamento MiniSeq. A eficiência da edição de genes alcançada pelas proteínas mgCas12a-1 e mgCas12a-2 é ilustrada na Figura 14, e os resultados da análise de sequenciamento para o sítio alvo são mostrados na Tabela 3 abaixo. Conforme ilustrado na Figura 14, as proteínas mgCas12a-1 e mgCas12a-2 exibiram maior eficiência de edição de genes do que a proteína mock. [Tabela 3] Amost Gen Tem Nome Sequên Com Mais Inserç Deleç Frequê Frequê ras es po cias ambas da ões ões ncia de ncia de Totais as frequê Indel Indel sequên ncia (%) cias mínim indicad a oras 1 Mock 137952 137475 13719 0 187 187 0,1 48 h 6 (0,1%) 2 mgCas 119684 119250 11895 36 418 454 0,4 CCR 12a-1 2 (0,4%) 3 5 mgCas 112387 112077 11182 8 150 158 0,1 12a-2 6 (0,1%) 4 Mock 139323 138942 13864 8 179 187 0,1 72 h 7 (0,1%) 5 mgCas 156705 156159 15585 39 738 777 0,5 12a-1 7 (0,5%) 6 mgCas 158717 158392 15804 5 237 242 0,2 12a-2 8 (0,2%) 7 Mock 141182 136856 13646 19 316 335 0,2
48 h 9 (0,2%) 8 mgCas 122368 120871 12047 70 424 494 0,4 DNM 12a-1 6 (0,4%) 9 T1 mgCas 121928 120592 12021 46 509 555 0,5 12a-2 8 (0,5%) 10 Mock 98480 96480 96170 0 192 192 0,2 72 h (0,2%) 11 mgCas 126317 123792 12337 2 511 513 0,4 12a-1 0 (0,4%) 12 mgCas 47398 47000 46738 12 199 211 0,5 12a-2 (0,5%) Exemplo 6. Análise da eficiência de edição de genes de mgCas12a em células de plantas Exemplo 6.1. Isolamento de protoplasto de planta
[063] As sementes de tabaco foram esterilizadas por tratamento com Clorox a 50% durante 1 minuto. As sementes esterilizadas foram colocadas em meio para germinação de sementes e cultivadas por uma semana. Em seguida, as sementes foram transferidas para uma caixa magenta usada para cultivo, e cultivadas por 3 semanas. A condição de cultivo à luz utilizada foi de 16 horas de luz e 8 horas de escuridão, e as sementes foram cultivadas a uma temperatura de 25° C a 28° C. Para a planta, foram utilizadas folhas cultivadas por 4 a 6 semanas. A folha foi colocada sobre uma placa de vidro, e o ápice da folha e o pecíolo foram cortados de modo que apenas uma parte interna da folha foi usada. Aqui, a folha foi cortada em pedaços de 0,5 mm ou menores. Os pedaços de folhas cortadas foram colocados em 10 mL de solução enzimática e incubados em um agitador orbital (50 rpm) em temperatura ambiente por 3 a 4 horas no escuro.
[064] Após a incubação, 10 mL de solução W5 foram adicionados e cuidadosamente misturados. Um filtro celular (70 μm) foi usado para filtrar os protoplastos presentes na solução enzimática. Os protoplastos filtrados foram centrifugados a 100 xg por 6 minutos. O sobrenadante foi descartado, e o pelete de protoplasto foi cuidadosamente suspenso pela adição de solução de MMG. Em seguida, a suspensão foi colocada em gelo por 10 a 30 minutos. Para uma parte da suspensão, o número de protoplastos foi contado usando um citômetro Hem, que é uma contraplaca, e um microscópio. Subsequentemente, a solução de MMG foi adicionalmente adicionada para diluição de modo que a concentração de protoplastos atingisse 2 × 106 células / mL. A composição para cada da solução enzimática, da solução de MMG e da solução de PEG é mostrada na Tabela 4 abaixo. [Tabela 4] Solução Enzimática 20 mL 1,0% Celulase R10 200 mg 0,5% Macerozima R10 100 mg 0,4 M Manitol 10 mL (0,8 M solução estoque de manitol) 20 mM MES, pH 5,7 4 mL (100 mM solução estoque de MES, pH 5,7) 20 mM KCl 200 μL (2 M solução estoque de KCl) A combinação dos reagentes mencionados acima é realizada, a incubação é realizada por 10 minutos a 60°C, e então a combinação com os seguintes reagentes é realizada. 10 mM CaCl2∙2H2O 200 μL (1 M solução estoque de CaCl2∙2H2O) 0,1 % BSA 200 μL (solução estoque de BSA a 10%) Solução de MMG 10 mL 0,4 M Manitol 5 mL (0,8 M solução estoque de manitol) 4 mM MES, pH 5,7 400 μL (0,1 M solução estoque de MES, pH 5,7) 15 mM MgCl2 150 μL (1 M solução estoque de MgCl2) Água isenta de nuclease 4,45 mL Solução de PEG 5 mL 0,2 M Manitol 1,25 mL (0,8 M solução estoque de manitol) 40% peso / volume PEG-4000 2 g (polietileno glicol 4000) 100 mM CaCl2∙2H2O 500 μL (1 M solução estoque de CaCl2∙2H2O) Água isenta de nuclease 1,5 mL Solução W5 50 mL 154 mM NaCl 3,85 mL (2 M solução estoque de NaCl) 125 mM CaCl2∙2H2O 6,25 mL (1 M solução estoque de CaCl2∙2H2O) 5 mM KCI 125 μL (2 M solução estoque de KCl) 2 mM MES, pH 5,7 500 μL (0,1 M solução estoque de MES) Água isenta de nuclease 39,275 mL Exemplo 6.2. Análise de sequenciamento para sítio alvo e identificação da eficiência de edição para o mesmo
[065] crRNA, proteína mgCas12a, e NEBuffer 1.1 foram adicionados a um e- tubo de 2 mL para um volume final de 20 μL e, em seguida, a reação foi deixada prosseguir em temperatura ambiente por 10 minutos. 200 μL (5 × 105 células) do protoplasto obtido no Exemplo 6.1, e o crRNA reagido e a proteína mgCas12 (volume 20 μL) foram adicionados a um e-tubo (2 mL), bem misturados, e depois cultivados por 10 minutos em uma bancada limpa. Subsequentemente, 220 μL de solução de PEG, que era o mesmo volume do volume incubado, foram adicionados e cuidadosamente misturados. A mistura foi cultivada em temperatura ambiente durante 15 minutos. Em seguida, 840 μL de solução W5 foram adicionados e bem misturados. Após centrifugação a 100 xg por 2 minutos, o sobrenadante foi descartado. Em seguida, a cultura foi realizada em solução W5 por dois dias. Em seguida, as células foram colhidas e o DNA foi extraído delas.
[066] Usando o DNA extraído, a porção alvo foi submetida a PCR e, em seguida, a eficiência de edição do gene alvo foi identificada por sequenciamento de próxima geração (NGS). Os resultados são mostrados na Tabela 5 abaixo. Conforme mostrado na Tabela 5, a eficiência de edição de genes alcançada pela proteína mgCas12a-1 foi 1,8 vezes maior do que a de FnCpf1. [Tabela 5] Com ambas Mais do que Sequências Frequência Gene Alvo crRNA Nuclease sequências a frequência Inserções Deleções Totais de Indel indicadoras mínima Nenhuma 161551 161421 160896 4 180 184 (0,1%) mgCas12a- 124361 124255 123844 3 168 171 (0,1%) 1 2 mgCas12a- 99154 99053 98734 0 131 131 (0,1%) 2 FnCpf1 50060 50022 49808 0 63 63 (0,1%) FucT14-1 Nenhuma 161551 161411 160899 4 178 182 (0,1%) mgCas12a- 106782 106706 106330 0 1877 1877 (1,8%) 1 4 mgCas12a- 126665 126544 126057 79 885 964 (0,8%) 2 FnCpf1 64554 64501 64272 15 470 485 (0,8%) Nenhuma 49459 49422 49192 2 49 51 (0,1%) mgCas12a- 81191 81101 80738 0 90 90 (0,1%) 1 2 mgCas12a- FucT14-2 83694 83614 83286 0 99 99 (0,1%) 2 FnCpf1 108803 108682 108260 0 112 112 (0,1%) 4 Nenhuma 49459 49427 49199 2 49 51 (0,1%)
mgCas12a- 54918 54854 54532 6 689 695 (1,3%) 1 mgCas12a- 127825 127691 127213 2 143 145 (0,1%) 2 FnCpf1 64265 64168 63882 0 162 162 (0,3%)
[067] Além disso, a eficiência de edição de genes alcançada usando dois crRNAs para os genes FucT14 de tabaco foi identificada para cada proteína. Os resultados são ilustrados na Figura 15. Conforme ilustrado na Figura 15, a eficiência de edição de genes alcançada pela proteína mgCas12a-1 foi 2 vezes maior do que a de FnCpf1. Aqui, os crRNAs e as sequências de iniciadores para os genes alvo NbFucT14_1 e NbFucT14_2 são mostrados nas Tabelas 6 e 7 abaixo. [Tabela 6] crRNA Gene Alvo Sequência de crRNA (sítio PAM) (nome de iniciador) TTTGGATAATTTGTACTCTTGTCGATGT (SEQ ID NO: NbFTa14_1/2-2 NbFucT14_1 19) NbFucT14_2 TTTAGTCCACAAACAGCTAAGCCCACAT (SEQ ID NO: NbFTa14_1/2-4 20) [Tabela 7] Gene Alvo Nome de Iniciador Sequência Tamanho (bp)
TGAGCTGAAGATGGATTATG NGS NbFTa14_1_F (SEQ ID NO: 21) NbFucT14_1 216
NGS TCATGCTTAAGATAAAAGAG NbFTa14_1_R (SEQ ID NO: 22)
TCATGAGCTTAAGATGGATC NGS NbFTa14_2_F (SEQ ID NO: 23) NbFucT14_2 217
NGS GTTTAAGCTAAAAGAACTAC NbFTa14_2_R (SEQ ID NO: 24) Exemplo 7. Comparação da eficiência de edição de genes entre FnCas12a e mgCas12a
[068] Para formar cada complexo de ribonucleoproteína (RNP) consistindo de FnCas12a, WT mgCas12a-1 ou proteína WT mgCas12a-2 e crRNA, 6 pmol de FnCas12a, WT mgCas12a-1 ou proteína WT mgCas12a-2, e 7,5 pmol de crRNA foram misturados com NEBuffer 1.1 e água destilada 1X em temperatura ambiente por 30 minutos. Para identificar a atividade de clivagem de dsDNA usando o Cas12a dependente de crRNA (FnCas12a, WT mgCas12a-1 ou WT mgCas12a-2), 0,3 pmol de dsDNA alvo (linear ou circular) foi adicionado, e a reação foi deixada prosseguir a 37º C por 2 horas. Aqui, HsCCR5, HsDNMT1 e HsEMX1 foram usados como DNA. Além disso, os DNAs lineares (SEQ ID NO: 27 a SEQ ID NO: 29) usados no experimento foram produtos purificados por PCR, e os DNAs circulares (SEQ ID NO: 30 a SEQ ID NO: 32) foram plasmídeos purificados. SDS e EDTA (corante de carregamento de gel, NEB) foram adicionados e, em seguida, a mistura foi armazenada a -20° C por 10 minutos para interromper a reação. Cada DNA foi carregado em um gel de agarose a 1% e, em seguida, submetido à eletroforese para verificar a atividade de clivagem do DNA causada pelo FnCas12a, WT mgCas12a-1 ou WT mgCas12a-2. Os resultados são ilustrados nas Figuras 16A (DNA linear) e 16B (DNA circular). Nas Figuras 16A e 16B, S denota um substrato, e cada número indicado na parte inferior do gel denota quão escura é a banda de DNA do substrato. Exemplo 8. Identificação de atividade DNase não específica de mgCas12a
[069] Para identificar as funções DNase aleatórias de Cas12a (AsCas12a, FnCas12a ou LbCas12a) e de mgCas12a (WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 ou d_mgCas12a-2), um experimento foi realizado da mesma maneira que no Exemplo 7. Aqui, d-mgCas12a-1 e d_mgCas12a-2 referem-se a proteínas obtidas a partir de WT mgCas12a-1 e de WT mgCas12a-2, respectivamente, por substituição de Asp (na posição 877 para WT mgCas12a-1 ou na posição 873 para WT mgCas12a-2) por Ala.
[070] Especificamente, para formar cada complexo de ribonucleoproteína (RNP) que consiste de cada um dos 7 tipos de Cas12a e crRNA, 6 pmol de cada proteína Cas12a e 7,5 pmol de crRNA foram deixados reagir em temperatura ambiente por 30 minutos na presença de NEBuffer 1.1 e água destilada 1X. Subsequentemente, 0,3 pmol de dsDNA alvo foi adicionado e, em seguida, a reação foi deixada prosseguir a 37° C por 12 horas ou 24 horas. Aqui, HsCCR5, HsDNMT1 e HsEMX1 foram usados como DNA. SDS e EDTA (corante de carregamento de gel,
NEB) foram adicionados a isso e, em seguida, a mistura foi armazenada a -20° C por 10 minutos para interromper a reação. Cada DNA foi carregado em um gel de agarose a 1% e, em seguida, submetido à eletroforese para verificar a atividade de clivagem do DNA causada pelos 7 tipos de Cas12a. Os resultados são ilustrados na Figura 17. Na Figura 17, S denota um substrato, e cada número indicado na parte inferior do gel denota o quão escura é a banda de DNA do substrato.
[071] Conforme ilustrado na Figura 17, cada complexo de ribonucleoproteína consistindo de WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 ou d_mgCas12a- 2, que é a nova Cas12a, e crRNA exibiu uma função DNase não específica mais fraca do que o complexo de ribonucleoproteína consistindo de AsCas12a, FnCas12a ou LbCas12a, que é Cas12a existente e crRNA. Além disso, no geral, pode-se presumir que a reação de Cas12a RNP com o DNA resulta em uma função DNase não específica. Exemplo 9. Identificação de função DNase não específica de Cas12a sob condição isenta de crRNA
[072] Para identificar se Cas12a tem uma função DNase aleatória, mesmo sem crRNA, para a proteína FnCas12a, WT mgCas12a-1 ou WT mgCas12a-2, um experimento foi realizado da mesma maneira que no Exemplo 7 com tempos variáveis, exceto que uma condição isenta de crRNA foi usada. Os resultados são ilustrados nas Figuras 18A e 18B. Conforme ilustrado nas Figuras 18A e 18B, a proteína FnCas12a, WT mgCas12a-1 ou WT mgCas12a-2 tinha uma função DNase aleatória mesmo sem crRNA, na qual a função DNase aleatória da proteína FnCas12a apareceu primeiro. Exemplo 10. Identificação da função de clivagem de DNA de mgCas12a usando a alça de Cas12a existente
[073] Para identificar se a nova Cas12a (d_mgCas12a ou WT mgCas12a) pode realizar a clivagem de DNA usando uma alça localizada na extremidade 5’ da sequência de Cas12a existente (AsCas12a, FnCas12a ou LbCas12a), um experimento foi realizado da mesma maneira que no Exemplo 7 com tempos de reação variáveis, exceto que a alça de cada uma de AsCas12a, FnCas12a ou LbCas12a foi usada. Os resultados são ilustrados na Figura 19.
[074] Conforme ilustrado na Figura 19, em um caso em que a clivagem de DNA foi realizada com a proteína d_mgCas12a ou WT mgCas12a usando a alça de AsCas12a, FnCas12a ou LbCas12a, todas as proteínas d_mgCas12a ou WT mgCas12a usando os três tipos de alças tiveram uma função de clivagem de DNA, embora a eficiência de clivagem de DNA era ligeiramente diferente dependendo das respectivas alças. A partir desses resultados, verificou-se que para a clivagem do DNA, a mgCas12a pode usar a alça de AsCas12a, FnCas12a ou LbCas12a. Exemplo 11. Identificação da atividade de FnCas12a ou mgCas12a em íons divalentes
[075] Em adição, para identificar a atividade de clivagem de DNA da proteína FnCas12a, mgCas12a-1 ou mgCas12a-2 em íons divalentes (CaCl2, CoCl2, CuSO4, FeCl2, MnSO4, NiSO4 ou ZnSO4), um experimento foi realizado da mesma maneira que no Exemplo 4, exceto que uma quantidade predeterminada de íons divalentes foi usada no lugar de NEBuffer 1.1. Os resultados são ilustrados nas Figuras 20A e 20B. Conforme ilustrado nas Figuras 20A e 20B, a proteína FnCas12a, mgCas12a-1 ou mgCas12a-2 exibiu atividade de clivagem de DNA similar nos mesmos íons divalentes.

Claims (20)

REIVINDICAÇÕES
1. Proteína Cas12a, CARACTERIZADA pelo fato de que tem a sequência de aminoácidos de SEQ ID NO: 1.
2. Proteína Cas12a, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que a proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 1 é codificada pela sequência de nucleotídeos de SEQ ID NO: 2.
3. Proteína Cas12a, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que a proteína tem atividade de endonuclease.
4. Proteína Cas12a, de acordo com a reivindicação 1, CARACTERIZADA pelo fato de que a proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 1 tem atividade ótima em pH 7,0 a pH 7,9.
5. Proteína Cas12a, CARACTERIZADA pelo fato de que tem a sequência de aminoácidos de SEQ ID NO: 1, cuja lisina (Lys) na posição 925 é substituída por outro aminoácido.
6. Proteína Cas12a, de acordo com a reivindicação 5, CARACTERIZADA pelo fato de que o outro aminoácido é qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido aspártico (Asp), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys).
7. Proteína Cas12a, CARACTERIZADA pelo fato de que tem a sequência de aminoácidos de SEQ ID NO: 3.
8. Proteína Cas12a, de acordo com a reivindicação 7, CARACTERIZADA pelo fato de que a proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 3 é codificada pela sequência de nucleotídeos de SEQ ID NO: 4.
9. Proteína Cas12a, de acordo com a reivindicação 7, CARACTERIZADA pelo fato de que a proteína tem atividade de endonuclease.
10. Proteína Cas12a, de acordo com a reivindicação 7, CARACTERIZADA pelo fato de que a proteína Cas12a tendo a sequência de aminoácidos de SEQ ID NO: 3 tem atividade ótima em pH 7,0 a pH 7,9.
11. Proteína Cas12a, CARACTERIZADA pelo fato de que tem a sequência de aminoácidos de SEQ ID NO: 3, cuja lisina (Lys) na posição 930 é substituída por outro aminoácido.
12. Proteína Cas12a, de acordo com a reivindicação 11, CARACTERIZADA pelo fato de que o outro aminoácido é qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido aspártico (Asp), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys).
13. Proteína Cas12a, CARACTERIZADA pelo fato de que tem a sequência de aminoácidos de SEQ ID NO: 1, cujo ácido aspártico (Asp) na posição 877 é substituído por outro aminoácido.
14. Proteína Cas12a, de acordo com a reivindicação 13, CARACTERIZADA pelo fato de que o outro aminoácido é qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), lisina (Lys), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp ), glicina (Gly), prolina (Pro) e cisteína (Cys).
15. Proteína Cas12a, de acordo com a reivindicação 13, CARACTERIZADA pelo fato de que a proteína diminuiu a atividade de endonuclease.
16. Proteína Cas12a, CARACTERIZADA pelo fato de que tem a sequência de aminoácidos de SEQ ID NO: 3, cujo ácido aspártico (Asp) na posição 873 é substituído por outro aminoácido.
17. Proteína Cas12a, de acordo com a reivindicação 16, CARACTERIZADA pelo fato de que o outro aminoácido é qualquer um selecionado a partir do grupo que consiste de arginina (Arg), histidina (His), ácido glutâmico (Glu), serina (Ser), treonina (Thr), asparagina (Asn), glutamina (Gln), tirosina (Tyr), alanina (Ala), lisina (Lys), isoleucina (Ile), leucina (Leu), valina (Val), fenilalanina (Phe), metionina (Met), triptofano (Trp), glicina (Gly), prolina (Pro) e cisteína (Cys).
18. Proteína Cas12a, de acordo com a reivindicação 16, CARACTERIZADA pelo fato de que a proteína diminuiu a atividade de endonuclease.
19. Composição farmacêutica para tratar câncer, CARACTERIZADA pelo fato de que compreende como ingredientes ativos: mgCas12a; e crRNA que tem como alvo uma sequência de ácido nucleico especificamente presente em células cancerosas.
20. Composição farmacêutica, de acordo com a reivindicação 19, CARACTERIZADA pelo fato de que a mgCas12a tem qualquer sequência de aminoácidos selecionada a partir do grupo que consiste de SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 e SEQ ID NO: 6.
BR112021002476-0A 2018-08-09 2019-08-09 nova proteína associada a crispr e uso da mesma BR112021002476A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20180093336 2018-08-09
KR10-2018-0093336 2018-08-09
PCT/KR2019/010110 WO2020032711A1 (ko) 2018-08-09 2019-08-09 신규한 crispr 연관 단백질 및 이의 용도

Publications (1)

Publication Number Publication Date
BR112021002476A2 true BR112021002476A2 (pt) 2021-07-27

Family

ID=69415629

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021002476-0A BR112021002476A2 (pt) 2018-08-09 2019-08-09 nova proteína associada a crispr e uso da mesma

Country Status (15)

Country Link
US (1) US20210292722A1 (pt)
EP (1) EP3835418A4 (pt)
JP (1) JP2021532819A (pt)
KR (2) KR102096592B1 (pt)
CN (1) CN112567031A (pt)
AU (1) AU2019319377A1 (pt)
BR (1) BR112021002476A2 (pt)
CA (1) CA3109105A1 (pt)
EA (1) EA202190454A1 (pt)
IL (1) IL280631A (pt)
MX (1) MX2021001578A (pt)
PH (1) PH12021550256A1 (pt)
SG (1) SG11202101227TA (pt)
WO (1) WO2020032711A1 (pt)
ZA (1) ZA202101250B (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
CA3109083A1 (en) 2018-08-09 2020-02-13 G+Flas Life Sciences Compositions and methods for genome engineering with cas12a proteins
KR102497690B1 (ko) * 2020-09-22 2023-02-10 (주)지플러스생명과학 신규한 crispr 연관 단백질 및 이의 용도
US20230374478A1 (en) * 2020-09-22 2023-11-23 G Flas Life Sciences Modified cas12a protein and use thereof
WO2024062138A1 (en) 2022-09-23 2024-03-28 Mnemo Therapeutics Immune cells comprising a modified suv39h1 gene

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3325622B1 (en) * 2015-07-25 2023-06-07 Frost, Habib A system, device and a method for providing a therapy or a cure for cancer and other pathological states
EP3374494A4 (en) * 2015-11-11 2019-05-01 Coda Biotherapeutics, Inc. CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY
KR102093570B1 (ko) * 2015-12-04 2020-03-25 카리부 바이오사이언시스 인코포레이티드 조작된 핵산 표적화 핵산
WO2017099494A1 (ko) * 2015-12-08 2017-06-15 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도
US20190264186A1 (en) * 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
US9896696B2 (en) * 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
CA3026112A1 (en) * 2016-04-19 2017-10-26 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
US20190330659A1 (en) * 2016-07-15 2019-10-31 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
EP3526326A4 (en) * 2016-10-12 2020-07-29 The Regents of The University of Colorado, A Body Corporate NEW MODIFIED AND CHEMERICAL NUCLEASES
KR20180018466A (ko) * 2017-11-10 2018-02-21 주식회사 툴젠 면역세포의 면역조절 유전자의 활성 조절을 위한 조성물 및 그 용도

Also Published As

Publication number Publication date
MX2021001578A (es) 2021-06-15
EA202190454A1 (ru) 2021-04-22
AU2019319377A1 (en) 2021-03-11
WO2020032711A1 (ko) 2020-02-13
KR20200018364A (ko) 2020-02-19
JP2021532819A (ja) 2021-12-02
EP3835418A1 (en) 2021-06-16
US20210292722A1 (en) 2021-09-23
KR20200018345A (ko) 2020-02-19
ZA202101250B (en) 2022-09-28
KR102096604B1 (ko) 2020-04-02
IL280631A (en) 2021-03-25
CN112567031A (zh) 2021-03-26
SG11202101227TA (en) 2021-03-30
CA3109105A1 (en) 2020-02-13
PH12021550256A1 (en) 2021-11-03
KR102096592B1 (ko) 2020-04-02
EP3835418A4 (en) 2022-05-04

Similar Documents

Publication Publication Date Title
BR112021002476A2 (pt) nova proteína associada a crispr e uso da mesma
ES2894725T3 (es) Proteína asociada a CRISPR (CAS)
JP2023002712A (ja) S.ピオゲネスcas9変異遺伝子及びこれによってコードされるポリペプチド
CN106922154B (zh) 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
JP2023027277A (ja) Rna誘導型核酸修飾酵素及びその使用方法
JP6408914B2 (ja) 改変されたcascadeリボ核タンパク質およびそれらの用途
JP2023030067A (ja) Rna誘導型核酸修飾酵素及びその使用方法
JP2021100410A (ja) Crisprcpf1の結晶構造
US20140349405A1 (en) Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
TW202039847A (zh) 可用於基因編輯之多胜肽及使用方法
CA2983364A1 (en) Compositions and methods for the treatment of nucleotide repeat expansion disorders
WO2017107898A2 (en) Compositions and methods for gene editing
JP2001503962A (ja) 細胞のゲノム中に組込まれる付加核酸物質を細胞に付与するためのベクターおよび方法
WO2018172798A1 (en) Argonaute system
BR112016015820B1 (pt) Transformante para expressar cis-preniltransferase e receptor nogo b
BR112020006311A2 (pt) Método para preparar um coelho knockout de gene de fator viii ou fator ix e uso do mesmo
US20230374478A1 (en) Modified cas12a protein and use thereof
JP2021505158A (ja) Tprドメイン含有タンパク質の遺伝子改変を介した藻類脂質生産性の改善方法
EP4271805A1 (en) Novel nucleic acid-guided nucleases
OA20789A (en) Novel CRISPR-Associated Protein And Use Thereof
BR102016020994B1 (pt) PROCESSO DE OBTENÇÃO DA PROTEÍNA L-LISINA a-OXIDASE RECOMBINANTE (RLO), INICIADORES, PROTEÍNA RLO OBTIDA E SEU USO
KR102497690B1 (ko) 신규한 crispr 연관 단백질 및 이의 용도
EP4209589A1 (en) Miniaturized cytidine deaminase-containing complex for modifying double-stranded dna
JP2024058391A (ja) ゲノム編集方法およびゲノム編集用組成物
JP2024521806A (ja) 合成Casタンパク質

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]