WO2020032711A1 - 신규한 crispr 연관 단백질 및 이의 용도 - Google Patents

신규한 crispr 연관 단백질 및 이의 용도 Download PDF

Info

Publication number
WO2020032711A1
WO2020032711A1 PCT/KR2019/010110 KR2019010110W WO2020032711A1 WO 2020032711 A1 WO2020032711 A1 WO 2020032711A1 KR 2019010110 W KR2019010110 W KR 2019010110W WO 2020032711 A1 WO2020032711 A1 WO 2020032711A1
Authority
WO
WIPO (PCT)
Prior art keywords
protein
seq
amino acid
mgcas12a
cas12a
Prior art date
Application number
PCT/KR2019/010110
Other languages
English (en)
French (fr)
Inventor
최성화
김한성
김동욱
박종진
윤지영
Original Assignee
(주)지플러스 생명과학
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201980053705.0A priority Critical patent/CN112567031A/zh
Priority to BR112021002476-0A priority patent/BR112021002476A2/pt
Priority to MX2021001578A priority patent/MX2021001578A/es
Priority to US17/266,882 priority patent/US20210292722A1/en
Priority to EA202190454A priority patent/EA202190454A1/ru
Priority to EP19846625.2A priority patent/EP3835418A4/en
Priority to JP2021506585A priority patent/JP2021532819A/ja
Priority to CA3109105A priority patent/CA3109105A1/en
Application filed by (주)지플러스 생명과학, 서울대학교산학협력단 filed Critical (주)지플러스 생명과학
Priority to SG11202101227TA priority patent/SG11202101227TA/en
Priority to AU2019319377A priority patent/AU2019319377A1/en
Publication of WO2020032711A1 publication Critical patent/WO2020032711A1/ko
Priority to PH12021550256A priority patent/PH12021550256A1/en
Priority to IL280631A priority patent/IL280631A/en
Priority to ZA2021/01250A priority patent/ZA202101250B/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Definitions

  • the present invention relates to novel CRISPR associated proteins and uses thereof.
  • Genome Editing is a technology that freely edits genetic information of living things. Advances in the life sciences and advances in genomic sequencing technology allow us to gain a broad understanding of a variety of genetic information. For example, understanding of genes for breeding plants, diseases and growth, gene mutations that cause various human genetic diseases, and production of biofuels has already been secured, but they can be used directly to improve life and improve human diseases. Further technological advances are necessary to reach therapeutic levels.
  • Genome editing technology can dramatically expand the scope of use by changing the genetic information of animals, plants, and microorganisms, including humans.
  • Genetic scissors play a key role in genome editing technology as a molecular tool designed to cut precisely the desired genetic information.
  • next generation sequencing technology which has taken the field of gene sequencing to the next level, genetic scissors have become a key technology for expanding the speed and scope of genetic information utilization and creating new industries.
  • the first generation of scissors is ZFN (Zinc Finger Nuclease)
  • the second generation is TALEN (Transcription Activator-Like Effector Nuclease)
  • CRISPR Clustered regularly interspaced short palindromic repeat
  • CRISPR-associated 9 3rd generation gene scissors
  • CRISPRs are loci that contain several short direct repeats found in the genome of approximately 40% of the genome-discovered bacteria and 90% of the archaea.
  • the Cas protein forms an active endonuclease when complexed with two RNAs, termed CRISPR RNA (crRNA) and trans-activating crRNA (tracrRNA), thereby externalizing the invasion of phage or plasmids. It protects host cells by ignoring genetic elements.
  • crRNA is transcribed from the CRISPR element of the host genome that was occupied by an external invader for delivery.
  • RNA-guided nucleases derived from this CRISPR-Cas system provide a means to correct the genome.
  • research has been actively conducted on techniques for editing genomes of cells and organs using single guide RNAs (sgRNAs) and Cas proteins.
  • sgRNAs single guide RNAs
  • Cpf1 protein derived from Prevotella and Francisella 1
  • Cpf1 protein has been reported as another nuclease protein of the CRISPR-Cas system (B. Zetsche, et al., 2015), thus increasing the choice of genome correction. .
  • the present inventors have continually researched to develop a protein that is more effective than a known nuclease in genome editing. As a result, a novel CRISPR-associated protein that recognizes and cleaves a target nucleic acid sequence has been completed.
  • the present invention provides a Cas12a protein having an amino acid sequence of SEQ ID NO: 1.
  • the present invention also provides a Cas12a protein in which lysine (Lys) at position 925 in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid.
  • the present invention also provides a Cas12a protein having the amino acid sequence of SEQ ID NO.
  • the present invention also provides a Cas12a protein in which lysine (Lys) at position 930 in the amino acid sequence of SEQ ID 3 is substituted with another amino acid.
  • the present invention also provides a Cas12a protein in which aspartic acid (Asp) at position 877 of the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid.
  • Asp aspartic acid
  • the present invention also provides a Cas12a protein in which aspartic acid (Asp) at position 873 in amino acid sequence of SEQ ID NO: 3 is substituted with another amino acid.
  • the present invention provides mgCas12a; And it provides a pharmaceutical composition for treating cancer comprising crRNA targeting a nucleic acid sequence specifically present in cancer cells as an active ingredient.
  • the protein represented by the amino acid sequence of SEQ ID NO: 1 or SEQ ID NO: 3 according to the present invention has an endonuclease activity that recognizes and cleaves a nucleic acid sequence in a cell bound to the guide RNA.
  • the novel CRISPR associated proteins of the invention can be used as another nuclease to correct the genome in the CRISPR-Cas system.
  • FIG 1 illustrates the process of excavating Cas12a from the metagenome.
  • Figure 2a shows the phylogenetic tree of the excavated Cas12a.
  • Figure 2b shows the structural diagram of the novel Cas12a and AsCas12a.
  • Figures 3 to 8 show the amino acid sequence of the existing Cas12a and mgCas12a of the present invention aligned using the ESPript program.
  • 9a and 9b are shown in a table comparing and arranging the sequence information of Cas12a and mgCas12a of the present invention.
  • crRNA # 1 of FIG. 10 has a nucleotide sequence of SEQ ID NO: 25
  • crRNA # 2 of FIG. 11 has a nucleotide sequence of SEQ ID NO: 26.
  • FIG. 13 shows the positions where the target nucleic acid sequence and the crRNA bind.
  • FIG. 15 shows gene editing efficiencies using two crRNAs of FucT14-1 and FucT14-2 genes (FnCpf1, mgCas12a-1 and mgCas12a-2).
  • 16a and 16b confirm the DNA cleavage activity of FnCas12a, WT mgCas12a-1 or WT mgCas12a-2 protein.
  • Figure 17 confirms the nonspecific DNase function of existing Cas12a (AsCas12a, FnCas12a or LbCas12a) and new Cas12a (WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 or d_mgCas12a-2).
  • Figure 19 confirms that mgCas12a is capable of DNA cleavage using the 5 'handle of the existing Cas12a.
  • 20A and 20B show DNA cleavage activity of FnCas12a, mgCas12a-1 or mgCas12a-2 protein in divalent ions.
  • the present invention provides a novel Cas12a protein obtained from metagenome.
  • Cas12a is a CRISPR associated protein and may also be referred to as Cpf1.
  • Cpf1 is also a type V CRISPR system protein.
  • Cas12a is a single protein that binds to crRNA and cleaves the target gene, similar to Cas9, a type II CRISPR system protein. There is a difference in how it works. Cas12a protein acts as one crRNA. Therefore, as in the case of Cas9, it is not necessary to simultaneously use crRNA and trans-activating crRNA (tracrRNA) or to artificially produce single guide RNA (sgRNA) combining tracrRNA and crRNA.
  • tracrRNA trans-activating crRNA
  • sgRNA single guide RNA
  • Cas12a unlike Cas9, PAM is present at the 5 'position of the target sequence.
  • the Cas12a system has a shorter length of guide RNA than Cas9.
  • Cas12a generates a 5 'overhang (sticky end) instead of a blunt-end at the position where the target DNA is cut, and thus has an advantage of allowing more accurate and various gene correction.
  • Cas12a protein is a genus Candidatus , Lachnospira , Butyrivibrio , Peregrinibacteria , Peregrinibacteria , Acidominococcus , Porphyromonas. Genera ), Prevotella genus, Francisella genus, Candidatus Methanoplasma , or Eubacterium genus.
  • PbCas12a is a protein derived from Parcubacteria bacterium GWC2011_GWC2_44_17
  • PeCas12a is a protein derived from Peregrinibacteria Bacterium GW2011_GWA_33_10
  • AsCas12a is Acidaminococcus sp.
  • PmCas12a is a protein derived from Porphyromonas macacae
  • LbCas12a is a protein derived from Lachnospiraceae bacterium ND2006
  • PcCas12a is a protein derived from Porphyromonas crevioricanis
  • PdCas12a is a protein 12a derived from Prevotella disiens
  • It is a protein derived from Francisella novicida U112.
  • Cas12a protein may have different activities depending on the microorganism from which it is derived.
  • the present invention is to identify a new Cas12a by analyzing the genes of the metagenome.
  • Cas12a derived from metagenome may be referred to as mgCas12a.
  • the mgCas12a of the present invention like AsCas12a, also includes WED, REC, PI, RuvC, BH and NUC domains (FIG. 2).
  • the mgCas12a protein of the present invention was confirmed that the gene can be cleaved with gRNA including crRNA and 5'-handle, like the Cas12a protein known in the art.
  • mgCas12a was confirmed to use 5'-handle RNA having the same sequence as FnCas12a.
  • the sequence of the 5'-handle RNA may be AAUUUCUACUGUUGUAGAU (SEQ ID NO: 12).
  • SEQ ID NO: 12 AAUUUCUACUGUUGUAGAU
  • the mgCas12a may further include a tag for separation and purification.
  • Tag may be linked to the N terminus or C terminus of mgCas12a.
  • the tag may be simultaneously bound to the N- and C-terminus of mgCas12a.
  • One embodiment of the tag may be 6XHis Tag.
  • mgCas12a provides a protein having the amino acid sequence of SEQ ID NO: 1.
  • some amino acids may be deleted or substituted.
  • lysine (Lys) at position 925 in the amino acid sequence of SEQ ID NO: 1 may be a protein substituted with another amino acid.
  • amino acids include arginine (Arg), histidine (His), aspartic acid (Asp), glutamic acid (Glu), serine (Ser), threonine (Thr), asparagine (Asn), glutamine (Gln), tyrosine (Tyr) , Alanine (Ala), Isoleucine (Ile), Leucine (Leu), Valine (Val), Phenylalanine (Phe), Methionine (Met), Tryptophan (Trp), Glycine (Gly), Proline (Pro), and Cysteine (Cys) It may be any one selected from the group consisting of). Specifically, the protein may be one in which the lysine at position 925 of the amino acid sequence of SEQ ID NO: 1 is substituted with glutamine, and may have the amino acid sequence of SEQ ID NO: 5.
  • the gene encoding the protein having the amino acid sequence of SEQ ID NO: 1 may be a polynucleotide having the nucleotide sequence of SEQ ID NO: 2.
  • mgCas12a having the amino acid sequence of SEQ ID NO: 1 according to the present invention may have optimal activity at pH 7.0 to pH 7.9.
  • a protein having the amino acid sequence of SEQ ID NO: 3 is provided.
  • some amino acids may be deleted or substituted.
  • lysine (Lys) at position 930 of the amino acid sequence of SEQ ID NO: 3 may be a protein substituted with another amino acid.
  • amino acids include arginine (Arg), histidine (His), aspartic acid (Asp), glutamic acid (Glu), serine (Ser), threonine (Thr), asparagine (Asn), glutamine (Gln), tyrosine (Tyr) , Alanine (Ala), Isoleucine (Ile), Leucine (Leu), Valine (Val), Phenylalanine (Phe), Methionine (Met), Tryptophan (Trp), Glycine (Gly), Proline (Pro), and Cysteine (Cys) It may be any one selected from the group consisting of).
  • the protein may be a lysine at position 930 of the amino acid sequence of SEQ ID NO: 3 substituted with glutamine, and may have an amino acid sequence of SEQ ID NO: 6.
  • the gene encoding the protein having the amino acid sequence of SEQ ID NO: 3 may be a polynucleotide having the nucleotide sequence of SEQ ID NO: 4.
  • mgCas12a having the amino acid sequence of SEQ ID NO: 3 according to the present invention may have optimal activity at pH 7.0 to pH 7.9.
  • a protein with reduced endonuclease activity in mgCas12a in another aspect of the invention, there is provided a protein with reduced endonuclease activity in mgCas12a.
  • the 877th aspartic acid (Asp) of mgCas12a having the amino acid sequence of SEQ ID NO: 1 may be substituted with another amino acid.
  • the other amino acids are arginine (Arg), histidine (His), glutamic acid (Glu), serine (Ser), threonine (Thr), asparagine (Asn), glutamine (Gln), tyrosine (Tyr), alanine (Ala), Lysine, isoleucine (Ile), leucine (Leu), valine (Val), phenylalanine (Phe), methionine (Met), tryptophan (Trp), glycine (Gly), proline (Pro), and cysteine (Cys) It may be any one selected from the group consisting of. Specifically, the aspartic acid (Asp) may be a protein substituted with alanine (Ala).
  • the 873th aspartic acid (Asp) of mgCas12a having the amino acid sequence of SEQ ID NO: 3 may be substituted with another amino acid.
  • the other amino acids are arginine (Arg), histidine (His), glutamic acid (Glu), serine (Ser), threonine (Thr), asparagine (Asn), glutamine (Gln), tyrosine (Tyr), alanine (Ala), Lysine, isoleucine (Ile), leucine (Leu), valine (Val), phenylalanine (Phe), methionine (Met), tryptophan (Trp), glycine (Gly), proline (Pro), and cysteine (Cys) It may be any one selected from the group consisting of.
  • the aspartic acid (Asp) may be a protein substituted with alanine (Ala).
  • mgCas12a having reduced endonuclease activity may be referred to as dead mgCas12a or d_mgCas12a.
  • the d_mgCas12a may have an amino acid sequence of SEQ ID NO: 13 or SEQ ID NO: 14.
  • mgCas12a provides a pharmaceutical composition for treating cancer comprising crRNA targeting a nucleic acid sequence specifically present in cancer cells as an active ingredient.
  • the mgCas12a may have any one amino acid sequence selected from the group consisting of SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 and SEQ ID NO: 6.
  • the term "nucleic acid sequence specifically present in cancer cells” refers to a nucleic acid sequence that does not exist in normal cells but exists only in cancer cells. That is, it means a sequence different from normal cells, and at least one nucleic acid may be different. In addition, part of the gene may be substituted or deleted.
  • the sequence specifically present in cancer cells may be SNPs present in cancer cells.
  • the target DNA present in the cancer cells having the sequence and the guide RNA having a sequence complementary to the target RNA specifically bind to each other.
  • nucleic acid sequences that are specifically present in cancer cells can be used to find specific SNPs present only in cancer cells from genome sequencing of various cancer tissues, and to use them to prepare crRNAs. Therefore, since the method exhibits cancer cell specific toxicity, it may be possible to develop patient-specific chemotherapy.
  • the nucleic acid sequence specifically present in cancer cells may be a gene having a high copy number variation (CNV) in cancer cells, unlike normal cells.
  • One embodiment of the cancer is bladder cancer, bone cancer, blood cancer, breast cancer, melanoma, thyroid cancer, parathyroid cancer, bone marrow cancer, rectal cancer, throat, laryngeal cancer, lung cancer, esophageal cancer, pancreatic cancer, colon cancer, stomach cancer, tongue cancer, skin cancer, brain tumor, uterine cancer , Head or neck cancer, gallbladder cancer, oral cancer, colon cancer, proximal cancer, central nervous system tumor, liver cancer and colon cancer can be any one selected from the group consisting of. In particular, it can be gastric cancer, colon cancer, liver cancer, lung cancer, breast cancer known as Korea's five major cancers.
  • the crRNA targeting the nucleic acid sequence specifically present in the cancer cells may include one or more gRNA sequences.
  • gRNAs capable of simultaneously targeting exons 10 or 11 of BRCA1 present in ovarian or breast cancer can be used.
  • two or more gRNAs targeting exon 11 of BRCA1 can be used.
  • the combination of gRNA may be appropriately selected depending on the purpose of cancer treatment and the type of cancer. That is, different gRNAs can be selected and used.
  • Metagenome sequences were downloaded from the NCBI Genbank BLAST database and constructed into a local BLASTp database.
  • 16 Cas12a and various CRISPR related protein (Cas1) amino acid sequences were downloaded from the Uniprot database.
  • the MetaCRT program was used to find CRISPR repeat and spacer sequences in the metagenome.
  • only the meta-genome sequence having the CRISPR sequence was extracted to predict the gene using the Prodigal program.
  • Cas1 genes were used to predict whether Cas1 homologs were above and below Cas12a homologs, and Cas12a genes ranging from 800 aa to 1,500 aa with Cas1 surrounding were selected. They used BLASTp from the NCBI Genbank non-redundant database to determine if the gene had been reported and if it was not related to CRISPR at all.
  • the novel protein having the amino acid sequence of SEQ ID NO: 1 was named WT mgCas12a-1.
  • the novel protein having the amino acid sequence of SEQ ID NO: 3 was named WT mgCas12a-2.
  • the structural diagrams of AsCas12a, mgCas12a-1, and mgCas12a-2 are shown in FIG. 2B.
  • Cas12a candidates were sorted based on the structure of AsCas12a and LbCas12a using the ESPript program. In order to enhance the activity of endonucleases in WT mgCas12a-1 and WT mgCas12a-2, some amino acids were substituted. Substitution of Lys (K), the 925th amino acid of WT mgCas12a-1, with Glu (Q) was named mgCas12a-1. In addition, the substitution of Glu (Q) for Lys (K), which is the 930th amino acid of WT mgCas12a-2, was named mgCas12a-2.
  • the WT mgCas12a-1, WT mgCas12a-2, mgCas12a-1 and mgCas12a-2 genes cloned into the pUC57 vector were inserted into the pET28a-KanR-6xHis-BPNLS vector and cloned.
  • the cloned vector was transformed into E. coli DH5a and Rosetta strains, respectively.
  • the 5'-handle sequence of the crRNA was extracted from the metagenome CRISPR repeat sequence. The extracted RNA was synthesized with DNA oligos. DNA oligomers were transcribed using the MEGAshortscript T7 RNA transcriptase kit, and the concentration of the transcribed 5'-handle was confirmed with FLUOstar Omega.
  • the cells obtained after centrifugation were mixed with 10 ml of lysis buffer (20 mM HEPES pH 7.5, 100 mM KCl, 20 mM imidazole, 10% glycerol and EDTA-free protease inhibitor cocktail), followed by sonication.
  • lysis buffer (20 mM HEPES pH 7.5, 100 mM KCl, 20 mM imidazole, 10% glycerol and EDTA-free protease inhibitor cocktail
  • the xyllosyltransferase of Lactuca sativa was amplified by PCR to predict PAM (protospacer adjacent motif), and guide RNA (gRNA) was designed.
  • RNP ribonucleoprotein
  • mgCas12a-1 and mgCas12a-2 were mixed at room temperature for 20 minutes at a molecular ratio of mgCas12a protein and gRNA of 1: 1.25, thereby preparing an RNP complex.
  • xylosiltransferase PCR products were subjected to RNP at various concentrations, followed by NEBuffer 1.1 (1X Buffer Components, 10 mM Bis-Tris-Propane-HCl, 10 mM MgCl 2 and 100 ⁇ g / ml BSA), NEBuffer 2.1.
  • FIGS. 10 to 12 mgCas12a-1 and mgCas12a-2 are designated as hemgCas12a-1 and hemgCas12a-2.
  • FIG. 13 the position where the target nucleic acid sequence and the crRNA bind in the xyloxytransferase is shown in FIG. 13.
  • Example 5.1 RNP Construction Including mgCas12a-1 and mgCas12a-2 for Gene Editing of CCR5 and DNMT1
  • HEK 293T cells were cultured in a 5% CO 2 incubator at 37 ° C. in DMEM medium containing 10% fetal bovine serum FBS and P / S (penicillin-streptomycin).
  • RNPs were prepared by incubating 100 pmole of mgCas12a-1 protein, mgCas12a-2 protein, and 200 pmole of crRNA targeting CCR5 and DNMT1 at room temperature for 20 minutes.
  • the crRNA sequences of CCR5 and DNMT1 were synthesized from IDT (Integrated DNA Technologies), which are shown in Table 1 below.
  • Genomic DNA extracted in Example 5.1 was amplified using adapter primers of CCR5 and DNMT1 shown in Table 2 below.
  • Tobacco seeds were treated with 50% Clorox for 1 minute to sterilize the seeds.
  • the sterilized seeds were placed on seed sowing medium, incubated for one week, and then transferred to a magenta box used for cultivation for three weeks.
  • Culture light conditions were 16 hours photoculture and 8 hours cancer culture, and were grown at a temperature of 25 ° C to 28 ° C.
  • Plants were used leaves grown for 4 to 6 weeks, and the leaves were placed on a glass plate, cut off the leaf disease and the leaf tips, and only the inner part of the leaves was used. At this time, it cut to 0.5 mm or less.
  • the cut leaves were incubated on an orbital shaker (50 rpm) for 3 to 4 hours in a dark state at room temperature in 10 mL of Enzyme solution.
  • the target gene editing efficiency was confirmed by NGS (Next-Generation Sequencing). This is shown in Table 5 below. As shown in Table 5, the gene editing efficiency by mgCas12a-1 protein was 1.8 times higher than that of FnCpf1.
  • RNP ribonucleoprotein
  • dsDNA cleavage activity using crRNA dependent Cas12a FnCas12a, WT mgCas12a-1 or WT mgCas12a-2
  • 0.3 pmol of target dsDNA linear, circular
  • HsCCR5, HsDNMT1 and HsEMX1 were used as DNA.
  • the linear DNA (SEQ ID NO: 27 to SEQ ID NO: 29) used in the experiment is a PCR purified product
  • the circular DNA SEQ ID NO: 30 to SEQ ID NO: 32) is a purified plasmid.
  • FIGS. 16A and 16B circular DNA.
  • S denotes a substrate, and each of the numbers described below the gel means a dark degree of the substrate DNA band.
  • the experiment was conducted in the same manner as in Example 7 above.
  • the d-mgCas12a-1 and d_mgCas12a-2 refers to a protein in which Asp of No. 877 and 873 of WT mgCas12a-1 and WT mgCas12a-2 is substituted with Ala.
  • RNP ribonuclear protein
  • 6 pmol of each Cas12a protein and 7.5 pmol of crRNA were operated at room temperature for 30 minutes with NEB1.1 buffer and 1X distilled water. . Thereafter, 0.3 pmol of target dsDNA was added, followed by reaction at 37 ° C. for 12 hours and 24 hours. At this time, HsCCR5, HsDNMT1 and HsEMX1 were used as DNA. After the addition of SDS and EDTA (Gel loading dye, NEB) was stored for 10 minutes at -20 °C to stop the reaction.
  • SDS and EDTA Gel loading dye, NEB
  • ribonucleoproteins composed of WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 or d_mgCas12a-2 and crRNA, which are newer Cas12a than ribonucleoprotein complexes consisting of existing Cas12a, AsCas12a, FnCas12a or LbCas12a and crRNA
  • the complex showed weak nonspecific DNase function.
  • DNA was cut with d_mgCas12a or WT mgCas12a protein using AsCas12a, FnCas12a or LbCas12a handles, but DNA cutting efficiency was slightly different depending on the handles, but d_mgCas12a or WT mgCas12a using three types of handles. DNA from both proteins had the ability to cut. Through this, it can be seen that mgCas12a can use the handle of AsCas12a, FnCas12a or LbCas12a for DNA cleavage.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 발명은 신규한 CRISPR 연관 단백질 및 이의 용도에 관한 것이다. 본 발명에 따른 서열번호 1 또는 서열번호 3의 아미노산 서열로 표시되는 단백질은 가이드 RNA와 결합된 세포 내 핵산 서열을 인식하여 절단하는 엔도뉴클레아제 활성을 가진다. 따라서, 본 발명의 신규한 CRISPR 연관 단백질은 CRISPR-Cas 시스템에서 유전체를 교정하는 또 다른 뉴클레아제로서 사용될 수 있다.

Description

신규한 CRISPR 연관 단백질 및 이의 용도
본 발명은 신규한 CRISPR 연관 단백질 및 이의 용도에 관한 것이다.
유전체 교정(Genome Editing)이란 생명체의 유전정보를 자유롭게 교정하는 기술이다. 생명과학분야의 진보와 유전체 서열 분석 기술의 발전을 통해 우리는 다양한 유전정보에 대해 폭넓게 이해할 수 있게 되었다. 예를 들어 동식물의 번식, 질병과 성장, 다양한 인간 유전질병을 일으키는 유전자 변이, 바이오연료의 생산 등을 위한 유전자에 대한 이해는 이미 확보된 상황이지만 이를 직접적으로 활용하여 생명체를 개선하고, 인간 질병을 치료하는 수준에까지 이르기 위해서는 그 이상의 기술 진보가 필수적이다.
유전체 교정 기술은 인간을 포함하여 동물, 식물, 미생물의 유전정보를 변화시켜 그 활용범위를 획기적으로 확장시킬 수 있다. 유전자가위는 원하는 유전정보를 정확히 자를 수 있도록 설계되어 만들어지는 분자 도구로 유전체 교정 기술에서 핵심역할을 하고 있다. 유전자 서열분석 분야를 한 차원 발전시켰던 차세대시퀀싱(Next generation sequencing) 기술과 같이, 유전자가위는 유전정보 활용의 속도와 그 범위를 확장시키고 새로운 산업분야를 창출해 내는 핵심 기술이 되고 있다.
지금까지 개발된 유전자 가위는 그 순서에 따라 3세대로 나눌 수 있다. 1세대 유전자 가위는 ZFN(Zinc Finger Nuclease), 2세대 유전자 가위는 TALEN(Transcription Activator-Like Effector Nuclease), 가장 최근에 연구된 CRISPR(Clustered regularly interspaced short palindromic repeat)-Cas(CRISPR-associated)9은 3세대 유전자 가위다
CRISPRs는 유전자 서열이 밝혀진 박테리아의 대략 40% 및 유전자 서열이 밝혀진 고세균의 90%의 유전체에서 발견되는 여러 짧은 직접 반복을 포함하는 좌위이다. Cas 단백질은 CRISPR RNA(crRNA) 및 trans-activating crRNA(tracrRNA)로 명명된 두 개의 RNA와 복합체를 형성했을 때, 활성 엔도뉴클레아제(endonuclease)를 형성하고, 그렇게 함으로써 파지 또는 플라스미드의 침입에서 외부 유전적 요소를 묵살하여 숙주 세포를 보호한다. crRNA는 전달에 외부 침입자로부터 점유되었던 숙주 유전체의 CRISPR 요소로부터 전사된다.
이러한 CRISPR-Cas 시스템 유래의 RNA-가이드 뉴클레아제(RNA-guided nuclease)는 유전체를 교정할 수 있는 수단을 제공해준다. 특히, 단일 가이드 RNA(sgRNA)와 Cas 단백질을 이용하여 세포 및 기관의 유전체를 편집할 수 있는 기술과 관련된 연구들이 활발히 진행되어왔다. 최근, Cpf1 단백질(Prevotella 및 Francisella 1 유래)이 CRISPR-Cas 시스템의 또 다른 뉴클레아제 단백질로서 보고되었고(B. Zetsche, et al., 2015), 이에 따라 유전체 교정에 있어서 선택의 폭이 넓어졌다.
본 발명자들은 유전체 교정에 있어서 기존에 알려진 뉴클레아제보다 더 효과적인 단백질을 개발하기 위하여 지속적으로 연구한 결과, 표적 핵산 서열을 인식하여 절단하는 신규한 CRISPR 연관 단백질을 발견하여 본 발명을 완성하였다.
따라서, 본 발명의 목적은 표적 핵산 서열을 인식하여 절단하는 신규한 CRISPR 연관 단백질을 제공하는 것이다.
상기 목적을 달성하기 위해, 본 발명은 서열번호 1의 아미노산 서열을 갖는 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 3의 아미노산 서열을 갖는 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 1의 아미노산 서열 중 877번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 서열번호 3의 아미노산 서열 중 873번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질을 제공한다.
또한, 본 발명은 mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물을 제공한다.
본 발명에 따른 서열번호 1 또는 서열번호 3의 아미노산 서열로 표시되는 단백질은 가이드 RNA와 결합된 세포 내 핵산 서열을 인식하여 절단하는 엔도뉴클레아제 활성을 가진다. 따라서, 본 발명의 신규한 CRISPR 연관 단백질은 CRISPR-Cas 시스템에서 유전체를 교정하는 또 다른 뉴클레아제로서 사용될 수 있다.
도 1은 메타지놈으로부터 Cas12a를 발굴하는 과정을 도식화한 것이다.
도 2a는 발굴된 Cas12a의 계통수를 나타낸 것이다.
도 2b는 신규 Cas12a와 AsCas12a의 구조도를 나타낸 것이다.
도 3 내지 도 8은 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a 및 본 발명의 mgCas12a의 아미노산 서열을 나타낸 것이다.
도 9a 및 9b는 Cas12a 및 본 발명의 mgCas12a의 서열 정보를 비교 및 정리하여 표로 나타낸 것이다.
도 10 내지 도 12는 pH에 따른 본 발명에 따른 mgCas12a의 활성을 확인한 것이다. 한편, 도 10의 crRNA #1은 서열번호 25의 염기서열을 가지고, 도 11의 crRNA #2는 서열번호 26의 염기서열을 가진다.
도 13은 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여 나타낸 것이다.
도 14는 CCR5 및 DNMT1 각 유전자의 crRNA를 이용한 유전자 편집 효율을 단백질별(mock, mgCas12a-1 및 mgCas12a-2)로 나타낸 것이다.
도 15는 FucT14-1 및 FucT14-2 각 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별(FnCpf1, mgCas12a-1 및 mgCas12a-2)로 확인하여 나타낸 것이다.
도 16a 및 도 16b는 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질의 DNA 절단 활성을 확인한 것이다.
도 17은 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 신규 Cas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 비특이적인 DNase 기능을 확인한 것이다.
도 18a 및 도 18b는 crRNA 없이 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 비특이적인 DNase 기능을 가지는지를 확인한 것이다.
도 19는 mgCas12a가 기존 Cas12a의 5' handle을 이용하여 DNA 절단이 가능한지를 확인한 것이다.
도 20a 및 도 20b는 이가이온들에서 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 나타낸 것이다.
본 발명은 일 측면으로, 메타지놈에서 수득한 신규한 Cas12a 단백질을 제공한다.
본 명세서에서 사용한 용어 "Cas12a" 는 CRISPR 연관 단백질로서, Cpf1로도 지칭될 수 있다. 또한, Cpf1은 type V CRISPR 시스템 단백질이다. Cas12a는 단일 단백질로서, crRNA과 결합하여 표적 유전자를 절단한다는 점은 type II CRISPR 시스템 단백질인 Cas9와 유사하다. 다만, 그 작동 방식에서 차이가 있다. Cas12a 단백질은 하나의 crRNA로 작동한다. 따라서, Cas9의 경우와 같이 crRNA와 trans-activating crRNA(tracrRNA)를 동시에 사용하거나, 인위적으로 tracrRNA와 crRNA를 합친 single guide RNA(sgRNA)를 제작할 필요가 없다.
또한, Cas12a 시스템은 Cas9와 달리 PAM이 표적 서열의 5' 위치에 존재한다. 또한, Cas12a 시스템은 표적을 결정하는 guide RNA의 길이도 Cas9에 비해 짧다. 또한, Cas12a는 표적 DNA가 절단된 위치에 blunt-end가 아닌 5' overhang(sticky end)을 발생시키므로, 보다 정확하고 다양한 유전자 교정이 가능하다는 이점을 갖는다.
종래에 Cas12a 단백질은 캔디다투스(Candidatus) 속, 라치노스피라(Lachnospira) 속, 뷰티리비브리오(Butyrivibrio) 속, 페레그리니박테리아(Peregrinibacteria), 액시도미노코쿠스(Acidominococcus) 속, 포르파이로모나스(Porphyromonas) 속, 프레보텔라(Prevotella) 속, 프란시셀라(Francisella) 속, 캔디다투스 메타노플라스마(Candidatus Methanoplasma), 또는 유박테리움(Eubacterium) 속 유래의 것일 수 있다. 구체적으로, PbCas12a는 Parcubacteria bacterium GWC2011_GWC2_44_17에서 유래한 단백질이며, PeCas12a는 Peregrinibacteria Bacterium GW2011_GWA_33_10에서 유래한 단백질이며, AsCas12a는 Acidaminococcus sp. BVBLG에서 유래한 단백질이며, PmCas12a는 Porphyromonas macacae에서 유래한 단백질이며, LbCas12a는 Lachnospiraceae bacterium ND2006에서 유래한 단백질이며, PcCas12a는 Porphyromonas crevioricanis에서 유래한 단백질이며, PdCas12a는 Prevotella disiens에서 유래한 단백질이며, FnCas12a는 Francisella novicida U112에서 유래한 단백질이다. 다만, Cas12a 단백질은 유래된 미생물에 따라 다른 활성을 가질 수 있다.
본 발명은 메타지놈의 유전자들을 분석하여 새로운 Cas12a를 규명한 것이다. 이하, 메타지놈에서 유래한 Cas12a를 mgCas12a로 지칭할 수 있다. 본 발명의 mgCas12a도 AsCas12a와 같이, WED, REC, PI, RuvC, BH 및 NUC 도메인을 포함한다(도 2). 또한, 본 발명의 mgCas12a 단백질은 종래에 알려진 Cas12a 단백질과 동일하게, crRNA 및 5' -handle을 포함한 gRNA로 유전자를 절단할 수 있음을 확인하였다. mgCas12a는 FnCas12a와 동일한 서열을 가지는 5' -handle RNA를 이용함을 확인하였다. 구체적으로, 5' -handle RNA의 서열은 AAUUUCUACUGUUGUAGAU(서열번호 12)일 수 있다. 다만, AsCas12a 및 LbCas12a의 5' -handle RNA에도 작동함을 확인하였다(도 19).
상기 mgCas12a는 분리 정제를 위해 Tag를 추가적으로 포함할 수 있다. Tag는 mgCas12a의 N 말단 또는 C 말단에 결합될 수 있다. 또한, Tag는 mgCas12a의 N 말단 및 C 말단에 동시에 결합될 수 있다. 상기 Tag의 일 구체예로는 6XHis Tag일 수 있다.
mgCas12a의 일 구체예로 서열번호 1의 아미노산 서열을 갖는 단백질을 제공한다. 또한, 상기 mgCas12a의 활성이 변하지 않는 한, 일부 아미노산을 결실, 치환 시킬 수 있다. 구체적으로, 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 단백질 일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 단백질은 서열번호 1의 아미노산 서열의 925번째 위치의 라이신이 글루타민으로 치환된 것일 수 있으며, 서열번호 5의 아미노산 서열을 가질 수 있다.
또한, 서열번호 1의 아미노산 서열을 갖는 단백질을 코딩하는 유전자는 서열번호 2의 염기 서열을 갖는 폴리뉴클레오티드일 수 있다. 또한, 본 발명에 따른 서열번호 1의 아미노산 서열을 갖는 mgCas12a는 pH 7.0 내지 pH 7.9에서 최적의 활성을 가질 수 있다.
mgCpf1의 또 다른 구체예로, 서열번호 3의 아미노산 서열을 갖는 단백질을 제공한다. 또한, 상기 mgCpf1의 활성이 변하지 않는 한, 일부 아미노산을 결실, 치환 시킬 수 있다. 구체적으로, 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 단백질 일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 단백질은 서열번호 3의 아미노산 서열의 930번째 위치의 라이신이 글루타민으로 치환된 것일 수 있으며, 서열번호 6의 아미노산 서열을 가질 수 있다.
상기 서열번호 3의 아미노산 서열을 갖는 단백질을 코딩하는 유전자는 서열번호 4의 염기 서열을 갖는 폴리뉴클레오티드일 수 있다.
또한, 본 발명에 따른 서열번호 3의 아미노산 서열을 갖는 mgCas12a는 pH 7.0 내지 pH 7.9에서 최적의 활성을 가질 수 있다.
본 발명의 또 다른 측면으로는, mgCas12a에서 엔도뉴클레아제 활성이 감소된 단백질을 제공한다. 일 구체예로, 서열번호 1의 아미노산 서열을 가지는 mgCas12a의 877번째 아스파르트산(Asp)이 다른 아미노산으로 치환된 형태일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 아스파르트산(Asp)이 알라닌(Ala)으로 치환된 단백질일 수 있다.
또 다른 구체예로, 서열번호 3의 아미노산 서열을 가지는 mgCas12a의 873번째 아스파르트산(Asp)이 다른 아미노산으로 치환된 형태일 수 있다. 이때, 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나일 수 있다. 구체적으로, 상기 아스파르트산(Asp)이 알라닌(Ala)으로 치환된 단백질일 수 있다. 이때, 엔도뉴클레아제 활성이 감소된 mgCas12a를 dead mgCas12a 또는 d_mgCas12a로 지칭할 수 있다. 상기 d_mgCas12a는 서열번호 13 또는 서열번호 14의 아미노산 서열을 가질 수 있다.
또한, 본 발명의 또 다른 측면으로, mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물을 제공한다. 이때, 상기 mgCas12a는 서열번호 1, 서열번호 3, 서열번호 5 및 서열번호 6으로 이루어진 군에서 선택되는 어느 하나의 아미노산 서열을 가질 수 있다. 본 명세서에서 사용된 용어, "암세포에 특이적으로 존재하는 핵산 서열" 은 정상세포에는 존재하지 않으나 암세포에만 존재하는 핵산 서열을 의미한다. 즉, 정상 세포와 상이한 서열을 의미하며, 적어도 1개의 핵산이 상이할 수 있다. 또한, 유전자의 일부가 치환, 결실된 것일 수 있다. 일 구체예로 암세포에 특이적으로 존재하는 서열은 암세포에 존재하는 SNP일 수 있다. 상기 서열을 갖는 암세포 내에 존재하는 타겟 DNA와 타겟 RNA에 상보적인 서열을 갖는 가이드 RNA는 서로 특이적으로 결합한다.
특히, 암세포에 특이적으로 존재하는 핵산 서열은 여러 암조직의 유전체 서열분석으로부터 암세포에만 존재하는 특이적 SNP를 찾아서 이를 이용해서 crRNA를 제작할 수 있다. 따라서, 암세포 특이적 독성을 나타내는 방식이므로, 환자 맞춤형 항암치료제 개발이 가능할 수 있다. 뿐만 아니라, 암세포에 특이적으로 존재하는 핵산 서열은 정상세포와 달리 암세포에서 높은 CNV(copy number variation)를 가지는 유전자 일 수 있다.
상기 암의 일 구체예는 방광암, 골암, 혈액암, 유방암, 흑색종양, 갑상선암, 부갑상선암, 골수암, 직장암, 인후암, 후두암, 폐암, 식도암, 췌장암, 대장암, 위암, 설암, 피부암, 뇌종양, 자궁암, 두부 또는 경부암, 담낭암, 구강암, 결장암, 항문 부근암, 중추신경계 종양, 간암 및 대장암으로 구성된 군으로부터 선택되는 어느 하나일 수 있다. 특히, 우리나라 5대 암으로 알려진 위암, 대장암, 간암, 폐암, 유방암일 수 있다.
이때, 상기 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA는 하나 이상의 gRNA 서열을 포함할 수 있다. 예를 들어, 난소암 또는 유방암에 존재하는 BRCA1의 엑손 10 또는 11을 동시에 타겟팅할 수 있는 gRNA를 사용할 수 있다. 또한, BRCA1의 엑손 11을 타겟팅 하는 두개 이상의 gRNA를 사용할 수 있다. 이와 같이 gRNA의 조합은 암 치료 목적 및 암의 종류에 따라 적합하게 선택될 수 있다. 즉, 서로 다른 gRNA를 선택하여 사용할 수 있다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예 1. 메타지놈 유래의 Cas12a 단백질 발굴
NCBI Genbank BLAST 데이터베이스에서 메타지놈 염기서열을 다운로드하고 로컬 BLASTp 데이터베이스로 구축하였다. 또한, 16개의 Cas12a과 다양한 CRISPR 관련 단백질(Cas1) 아미노산 서열을 Uniprot 데이터베이스에서 다운로드하였다. MetaCRT 프로그램을 이용하여 메타지놈에서 CRISPR 리피트(repeat)와 스페이서(spacer) 서열을 발견하였다. 그리고, CRISPR 서열을 갖는 메타지놈 서열만 추출하여 Prodigal 프로그램을 이용하여 유전자를 예측하였다.
상기 예측된 유전자 중, CRISPR 서열의 상하위 10 kb 범위 안에 있는 것을 추출하였고, Cas12a 아미노산 서열을 이용하여 해당 유전자 중 Cas12a의 호몰로그(homolog)를 예측하였다. Cas1 유전자를 이용하여 Cas12a 호몰로그의 상하위에 Cas1 호몰로그가 있는지 예측하였고, Cas1을 주위에 갖는 800 aa 내지 1,500 aa 범위의 Cas12a 유전자들을 선별하였다. 이들을 대상으로 NCBI Genbank non-redundant 데이터베이스에서 BLASTp를 이용하여, 이미 보고된 바 있는 유전자인지, 또한 전혀 CRISPR와 관계 없는 유전자는 아닌지 판별하였다.
메티오닌(Met)으로 시작하지 않는 조각난 Cas12a를 제외한 후, 이들을 MAFFT(multiple alignment using fast fourier transform) 프로그램을 이용하여 정렬하였다. 그 후, MEGA7을 이용하여 Neighbor-joining(100x부트스트랩(bootstrap))으로 계통수를 그렸다. 기존에 알려진 Cas12a 유전자와 단계통군을 이루는 유전자를 선별하여, 기존의 Cas12a 아미노산 서열과 함께 MEGA7, 최대공산(maximum-likelihood), 1000x부트스트랩(bootstrap)으로 계통수를 그려 진화적 유연관계를 살폈다. 이때, 상기 메타지놈으로부터의 Cas12a 발굴과정을 도 1에 도식화하여 나타내다. 또한, Cas12a의 계통수를 도 2a에 나타내었다. 이때, 서열번호 1의 아미노산 서열을 가지는 신규한 단백질을 WT mgCas12a-1 이라고 명명하였다. 또한, 서열번호 3의 아미노산 서열을 가지는 신규한 단백질을 WT mgCas12a-2 라고 명명하였다. 또한, 이때, AsCas12a와 mgCas12a-1 및 mgCas12a-2의 구조도를 도 2b에 나타내었다.
실시예 2. mgCas12a의 변이체 제작
ESPript 프로그램을 이용하여 Cas12a 후보군을 AsCas12a 및 LbCas12a의 구조를 기반으로 하여 정렬하였다. 상기 WT mgCas12a-1 및 WT mgCas12a-2에서 엔도뉴클레아제의 활성을 높이기 위해서 일부 아미노산을 치환하였다. WT mgCas12a-1의 925번째 아미노산인 Lys(K)를 Glu(Q)으로 치환한 것을 mgCas12a-1로 명명하였다. 또한, WT mgCas12a-2의 930번째 아미노산인 Lys(K)를 Glu(Q)으로 치환한 것을 mgCas12a-2로 명명하였다. 인간과 애기장대, 대장균의 코돈 사용빈도(codon usage)를 고려하여, 코돈 최적화(codon optimization)를 진행한 후 Bionics에 유전자 합성을 의뢰하였다. 이때, 인간 코돈 최적화된 mgCas12a-1 및 mgCas12a-2의 염기서열을 각각 서열번호 7 및 서열번호 8에 나타내었다. 또한, 상기 ESPript 프로그램을 이용하여 정렬한 기존의 Cas12a(AsCas12a(서열번호 9), LbCas12a(서열번호 10) 및 FnCas12a(서열번호 11)) 및 Cas12a 후보군(mgCas12a-1 및 mgCas12a-2)의 아미노산 서열을 도 3 내지 도 8에 나타내었으며, 이들의 서열 정보를 비교 정리하여 도 9a 및 도 9b에 나타내었다.
그리고, pUC57 벡터에 클로닝된 WT mgCas12a-1, WT mgCas12a-2, mgCas12a-1 및 mgCas12a-2 유전자를 다시 pET28a-KanR-6xHis-BPNLS 벡터에 삽입한 후 클로닝하였다. 클로닝된 벡터는 대장균 DH5a와 로제타(Rosetta) 균주에 각각 형질전환하였다. crRNA의 5'-핸들 서열을 메타지놈 CRISPR 반복 서열에서 추출하였다. 추출된 RNA를 DNA 올리고로 합성하였다. DNA 올리고머를 MEGAshortscript T7 RNA 전사효소 키트를 이용하여 전사하였고, 전사된 5'-핸들의 농도를 FLUOstar Omega로 확인하였다.
실시예 3. 단백질 발현과 정제
하룻밤 동안 배양한 로제타(DE3) 대장균 5 ml를 100 mg/ml의 카나마이신 항생제를 추가한 500 ml의 액체 TB 배지에 접종하였다. 배지는 37℃ 배양기에서 0.6 OD600이 될 때까지 배양하였다. 단백질 발현을 위해 0.4 uM의 IPTG(Isopropyl β-D-1-thiogalactopyranoside)를 처리한 뒤, 22℃에서 16 내지 18시간 더 배양하였다. 원심분리 후 수득한 세포를 10 ml의 용해 버퍼(20 mM HEPES pH 7.5, 100 mM KCl, 20 mM 이미다졸, 10% 글리세롤 및 EDTA-프리 프로테아제 인히비터 칵테일)와 혼합한 후, 초음파를 처리하여 세포를 분쇄하였다. 분쇄물을 6,000 rpm에서 20분간 세 번 원심분리한 후 0.22 마이크론 필터로 여과하였다.
이후, 니켈 컬럼(HisTrap FF 5 ml) 및 300 mM 이미다졸 버퍼를 이용하여 세척 및 용출하였고 친화-크로마토그래피로 단백질을 정제하였다. SDS-PAGE 전기영동으로 단백질의 크기를 확인하였고, 투석 버퍼(20 mM HEPES pH 7.5, 100 mM KCl, 1 mM DTT, 10% 글리세롤)로 하룻밤 동안 투석하였다. 이후, 단백질 크기에 맞춰 선택적으로 여과 및 농축(Amicon Ultra Centrifugal Filter 100,000 MWCO)하였다. 브래드포드 정량법으로 농도를 측정한 후, -80℃에 보관 및 사용하였다.
실시예 4. 클리비지 분석을 통한 mgCas12a에 적합한 pH 범위 확인
상추(Lactuca sativa)의 자일로실트랜스퍼레이즈(xylosyltransferase)를 PCR로 증폭하여 PAM(protospacer adjacent motif)을 예측하였고, 가이드 RNA(gRNA)를 디자인하였다. mgCas12a-1 및 mgCas12a-2의 RNP(ribonucleoprotein) 복합체를 mgCas12a 단백질 및 gRNA가 1:1.25의 분자비가 되도록 하여 상온에서 20분간 혼합하여, RNP 복합체를 제작하였다. 정제된 자일로실트랜스퍼레이즈 PCR 프로덕트를 다양한 농도로 RNP에 처리한 후, NEBuffer 1.1(1X Buffer Components, 10 mM Bis-Tris-Propane-HCl, 10 mM MgCl2 및 100 ㎍/ml BSA), NEBuffer 2.1(1X Buffer Components, 50 mM NaCl, 10 mM Tris-HCl, 10 mM MgCl2 및 100 ㎍/ml BSA) 및 NEBuffer 3.1(1X Buffer Components, 100 mM NaCl, 50 mM Tris-HCl, 10 mM MgCl2 및 100 ㎍/ml BSA)로 농도를 맞추어 37℃에서 in vitro 클리비지(cleavage) 분석을 실시하였다. 이때, NEBuffer 1.1, NEBuffer 2.1 및 NEBuffer 3.1는 25℃에서 각각 pH 7.0, pH 7.9 및 pH 7.9 값을 갖는다. 각 반응이 완료된 후 65℃에서 10분간 인큐베이션하여 반응을 정지하였으며, 완료된 반응을 1.5% 아가로스 겔 전기영동을 통해 확인하였다. 그 결과를 도 10 내지 도 12에 나타내었다. 도 10 내지 도 12에서 mgCas12a-1 및 mgCas12a-2를 hemgCas12a-1 및 hemgCas12a-2로 표기하였다. 또한, 상기 자일로실트랜스퍼레이즈에서 표적 핵산 서열 및 crRNA가 결합하는 위치를 표시하여도 13에 나타내었다.
도 10 내지 도 12에 나타난 바와 같이, mgCas12a-1 및 crRNA 복합체에 NEBuffer 1.1을 처리한 경우 표적 dsDNA가 절단되었다. 또한, mgCas12a-2 및 crRNA 복합체에 NEBuffer 1.1을 처리한 경우 표적 dsDNA가 절단되었다. 이를 통해, mgCas12a-1 및 mgCas12a-2는 pH 7.0에서 활성이 활발해짐을 알 수 있었다.
실시예 5. 동물세포에서 mgCas12a의 유전자 편집 효율 분석
실시예 5.1. CCR5 및 DNMT1의 유전자 편집을 위한 mgCas12a-1 및 mgCas12a-2를 포함한 RNP 제작
HEK 293T 세포를 10% 태아 소혈청인 FBS와 P/S(penicillin-streptomycin)가 함유된 DMEM 배지에서 37℃의 온도로 5% CO2 배양기에서 배양하였다. 각각 100 pmole의 mgCas12a-1 단백질 및 mgCas12a-2 단백질과 200 pmole의 CCR5 및 DNMT1를 타겟팅하는 crRNA를 상온에서 20분간 배양하여 RNP를 제작하였다. 이때, 상기 CCR5 및 DNMT1의 crRNA 서열은 IDT(Integrated DNA Technologies)로부터 합성하였고, 이를 하기 표 1에 나타내었다.
Figure PCTKR2019010110-appb-T000001
상기 배양된 HEK293T 세포 2x105개를 20 μl의 뉴클레오펙션(nucleofection) 시약과 혼합한 후, 이를 10 μl의 RNP 복합체와 혼합하였다. 이후, 형질감염을 위해 4D-Nucleofector 기기(Lonza)를 사용하였다. 형질감염한지 48시간 및 72시간이 지났을 때, PureLinkTM Genomic DNA Mini Kit(invitrogen)를 사용하여 상기 세포로부터 genomic DNA를 추출하였다.
실시예 5.2. 표적 부위에 대한 염기서열 분석
상기 실시예 5.1에서 추출한 genomic DNA를 하기 표 2에 나타낸 CCR5와 DNMT1의 어댑터 프라이머(primer)를 이용하여 증폭시켰다.
Figure PCTKR2019010110-appb-T000002
이후, 일루미나(Illumina)의 프로토콜대로 정제 과정 및 시퀀싱 라이브러리를 제조한 후, MiniSeq 장비를 이용하여 표적 부위에 대한 deep sequencing 분석을 진행하였다. mgCas12a-1와 mgCas12a-2 단백질에 의한 유전자 편집 효율을 도 14에 나타내었고, 표적 부위에 대한 시퀀싱 분석 결과를 하기 표 3에 나타내었다. 도 14에 나타난 바와 같이, mock 단백질보다 mgCas12a-1와 mgCas12a-2 단백질에 의한 유전자 편집 효율이 더 높게 나타났다.
Figure PCTKR2019010110-appb-T000003
실시예 6. 식물세포에서 mgCas12a 의 유전자 편집 효율 분석
실시예 6.1. 식물 원형질체 분리
담배 종자를 50% Clorox로 1분간 처리하여 종자를 멸균하였다. 멸균된 종자를 종자파종 배지에 올려 일주일간 배양한 후, 배양에 사용되는 마젠타 박스(magenta box)에 옮겨 3주 동안 키웠다. 배양 빛 조건은 광배양 16시간 및 암배양 8시간이며, 25℃ 내지 28℃의 온도에서 키웠다. 식물은 4주 내지 6주 자란 잎을 사용하였고, 상기 잎을 유리판에 올려 잎병과 잎끝 부분을 자른 후 잎 안쪽부분만을 사용하였다. 이때, 0.5 mm 이하로 잘랐다. 자른 잎은 Enzyme 용액 10 mL에 올려 상온에서 암 상태로 3시간 내지 4시간 동안 orbital shaker(50 rpm) 위에서 배양하였다.
배양 후, W5 용액 10 mL을 첨가하고 조심스럽게 잘 섞어주었다. Cell strainer(70 μm)를 이용하여 Enzyme 용액 내에 존재하는 원형질체를 걸러주었다. 상기 걸러진 원형질체를 100 xg로 6분 동안 원심분리 하였다. 상층액을 버리고 MMG 용액을 첨가하여 조심스럽게 원형질체 펠렛을 풀어준 후, 아이스에서 10분 내지 30분 정도 두었다. 이 중 일부를 계수판인 Hem cytometer와 현미경을 이용하여 원형질체의 수를 계수하였다. 이후, MMG 용액을 더 첨가하여 원형질체의 농도가 2 X 106 세포/mL가 되도록 희석하였다. 상기 enzyme 용액, MMG 용액 및 PEG 용액의 구성을 하기 표 4에 나타내었다.
Figure PCTKR2019010110-appb-T000004
실시예 6.2. 표적 부위에 대한 염기서열 분석 및 편집 효율 확인
2 mL e-tube에 crRNA, mgCas12a 단백질 및 NEB buffer 1.1을 최종 volume 20 μL가 되게한 후 상온에서 10분동안 반응시켰다. 상기 실시예 6.1에서 수득한 원형질체 200 μL(5 X 105 세포)와 반응시킨 crRNA 및 mgCas12 단백질(볼륨 20 μL)을 E-tube(2 mL)에 넣고 잘 섞은 후, 클린 벤치(Clean bench)에서 10분간 배양하였다. 이후, 상기 배양한 볼륨과 동일한 PEG 용액 220 μL를 넣고 조심스럽게 섞어주었다. 상온에서 15분 간 배양한 후, W5 용액 840 μL을 첨가하여 잘 섞어주었다. 100 xg에서 2분간 원심 분리한 후, 상등액을 제거하였다. 그리고, W5 용액에서 이틀간 배양한 후 세포를 수거하여 DNA를 추출하였다.
상기 추출한 DNA를 이용하여 타겟 부분에 PCR을 수행한 후, NGS(Next-Generation Sequencing)로 타겟 유전자 편집 효율을 확인하였다. 이를 하기 표 5에 나타내었다. 표 5에 나타난 바와 같이, FnCpf1에 비해 mgCas12a-1 단백질에 의한 유전자 편집 효율이 1.8배 높게 나타났다.
Figure PCTKR2019010110-appb-T000005
또한, 담배 FucT14 유전자의 두 가지 crRNA를 이용한 유전자 편집 효율을 단백질별로 확인하여 도 15에 나타내었다. 도 15에 나타난 바와 같이, FnCpf1보다 mgCas12a-1 단백질에 의한 유전자 편집이 두 배 높게 나타났다. 이때, 상기 타겟 유전자 NbFucT14_1NbFucT14_2의 crRNA 및 프라이머 서열을 하기 표 6 및 표 7에 나타내었다.
Figure PCTKR2019010110-appb-T000006
Figure PCTKR2019010110-appb-T000007
실시예 7. FnCas12a와 mgCas12a의 유전자 편집 효율 비교
FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질, 및 crRNA로 구성된 리보핵단백질(RNP) 복합체를 형성하기 위해, FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질 6 pmol과 crRNA 7.5 pmol을 NEB1.1 버퍼 및 1X 증류수와 함께 상온에서 30분간 혼합하였다. crRNA 의존적인 Cas12a(FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2)를 이용하여 dsDNA 절단 활성을 확인하기 위하여, 0.3 pmol의 타겟 dsDNA(선형, 원형)를 첨가한 후 37℃에서 2시간 동안 반응시켰다. 이때, DNA로는 HsCCR5, HsDNMT1 및 HsEMX1를 사용하였다. 또한, 실험에 사용된 선형 DNA(서열번호 27 내지 서열번호 29)는 PCR 정제산물이고, 원형 DNA(서열번호 30 내지 서열번호 32)는 정제된 플라스미드이다. SDS와 EDTA(Gel loading dye, NEB)를 첨가한 후 -20℃에서 10분간 보관하여 상기 반응을 멈추었다. 각각의 DNA를 1% 아가로즈 겔에 로딩한 후 전기영동하여 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2에 의한 DNA 절단 활성을 확인하였다. 그 결과를 도 16a(선형 DNA) 및 도 16b(원형 DNA)에 나타내었다. 상기 도 16a 및 도 16b에서 S는 기질(substrate)를 의미하고, 겔 아래 기재된 각 숫자들은 기질 DNA 밴드의 짙은 정도를 의미한다.
실시예 8. mgCas12a의 비특이적인 DNase 활성 확인
Cas12a(AsCas12a, FnCas12a 또는 LbCas12a)와 mgCas12a(WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2)의 무작위한 DNase 기능을 확인하기 위하여, 상기 실시에 7과 동일한 방법으로 실험을 수행하였다. 이때, 상기 d-mgCas12a-1 및 d_mgCas12a-2는 WT mgCas12a-1 및 WT mgCas12a-2의 877번 및 873번의 Asp를 Ala으로 치환시킨 단백질을 의미한다.
구체적으로, 상기 7 종류의 Cas12a와 crRNA로 구성된 리보핵단백질(RNP) 복합체를 형성하기 위해, 각각의 Cas12a 단백질 6 pmol과 crRNA 7.5 pmol을 NEB1.1 버퍼 및 1X 증류수와 함께 상온에서 30분간 작용시켰다. 이후, 0.3 pmol의 타겟 dsDNA를 첨가한 후 37℃에서 12시간 및 24시간 동안 반응시켰다. 이때, DNA로는 HsCCR5, HsDNMT1 및 HsEMX1를 사용하였다. SDS와 EDTA(Gel loading dye, NEB)를 첨가한 후 -20℃에서 10분간 보관하여 상기 반응을 멈추었다. 각각의 DNA를 1% 아가로즈 겔에 로딩한 후 전기영동하여 상기 7 종류의 Cas12a에 의한 DNA 절단 활성을 확인하였다. 그 결과를 도 17에 나타내었다. 상기 도 17에서 S는 기질(substrate)를 의미하고, 겔 아래 기재된 각 숫자들은 기질 DNA 밴드의 짙은 정도를 의미한다.
도 17에 나타난 바와 같이, 기존 Cas12a인 AsCas12a, FnCas12a 또는 LbCas12a와 crRNA로 구성된 리보핵단백질 복합체보다 신규 Cas12a인 WT mgCas12a-1, d_mgCas12a-1, WTmgCas12a-2 또는 d_mgCas12a-2와 crRNA로 구성된 리보핵단백질 복합체가 약한 비특이적인 DNase 기능을 나타내었다. 또한, 전반적으로 Cas12a RNP와 DNA를 반응시킬 경우 비특이적인 DNase 기능이 발생하는 것을 추측할 수 있었다.
실시예 9. crRNA 없는 조건에서 Cas12a의 비특이적인 DNase 기능 확인
crRNA 없이도 Cas12a가 무작위한 DNase 기능을 갖는지를 확인하기 위하여, FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질을 crRNA 없는 조건에서 시간을 달리하여 상기 실시예7과 동일한 방법으로 실험을 수행하였다. 그 결과를 도 18a 및 도 18b에 나타내었다. 도 18a 및 도 18b에 나타난 바와 같이, crRNA 없이도 FnCas12a, WT mgCas12a-1 또는 WT mgCas12a-2 단백질이 무작위한 DNase 기능을 가졌고, FnCas12a 단백질의 무작위한 DNase 기능이 가장 먼저 발생되었다.
실시예 10. 기존 Cas12a의 handle을 사용한 mgCas12a의 DNA 절단 기능 확인
신규 Cas12a(d_mgCas12a 또는 WT mgCas12a)가 기존 Cas12a(AsCas12a, FnCas12a 또는 LbCas12a) 서열의 5' 말단에 존재하는 handle을 이용하여 DNA 절단이 가능한지를 확인하기 위해, AsCas12a, FnCas12a 또는 LbCas12a 각각의 handle과 반응시간을 달리하여 상기 실시예 7과 동일한 방법으로 실험을 수행하였다. 그 결과를 도 19에 나타내었다.
도 19에 나타난 바와 같이, AsCas12a, FnCas12a 또는 LbCas12a의 handle을 이용하여 d_mgCas12a 또는 WT mgCas12a 단백질로 DNA를 절단한 결과, 상기 각 handle에 따라 DNA 절단 효율이 조금씩 달랐지만 세 종류의 handle을 이용한 d_mgCas12a 또는 WT mgCas12a 단백질에서 모두 DNA를 절단 기능이 있었다. 이를 통해, DNA 절단을 위해 mgCas12a가 AsCas12a, FnCas12a 또는 LbCas12a의 handle을 이용할 수 있음을 알 수 있었다.
실시예 11. 이가이온에 의한 FnCas12a 또는 mgCas12a의 활성 확인
또한, 이가이온들(CaCl2, CoCl2, CuSO4, FeCl2, MnSO4, NiSO4 또는 ZnSO4)에 의한 FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질의 DNA 절단 활성을 확인하기 위하여, NEBuffer 1.1 대신 정해진 양의 이가이온들을 대신 사용하여 상기 실시예 4와 동일한 방법으로 실험을 수행하였다. 그 결과를 도 20a 및 도 20b에 나타내었다. 도 20a 및 도 20b에 나타난 바와 같이, FnCas12a, mgCas12a-1 또는 mgCas12a-2 단백질이 같은 이가이온에서 비슷한 DNA 절단 활성을 나타내었다.

Claims (20)

  1. 서열번호 1의 아미노산 서열을 갖는 Cas12a 단백질.
  2. 제1항에 있어서,
    상기 서열번호 1의 아미노산 서열을 갖는 Cas12a 단백질은 서열번호 2의 염기서열에 의해 코딩되는 것인, Cas12a 단백질.
  3. 제1항에 있어서,
    상기 단백질이 엔도뉴클레아제 활성을 갖는 것을 특징으로 하는, Cas12a 단백질.
  4. 제1항에 있어서,
    상기 서열번호 1의 아미노산 서열을 갖는 Cas12a 단백질은 pH 7.0 내지 pH 7.9에서 최적의 활성을 갖는 것을 특징으로 하는, Cas12a 단백질.
  5. 서열번호 1의 아미노산 서열 중 925번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질.
  6. 제5항에 있어서,
    상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질.
  7. 서열번호 3의 아미노산 서열을 갖는 Cas12a 단백질.
  8. 제7항에 있어서,
    상기 서열번호 3의 아미노산 서열을 갖는 Cas12a 단백질은 서열번호 4의 염기서열에 의해 코딩되는 것인, Cas12a 단백질.
  9. 제7항에 있어서,
    상기 단백질이 엔도뉴클레아제 활성을 갖는 것을 특징으로 하는, Cas12a 단백질.
  10. 제7항에 있어서,
    상기 서열번호 3의 아미노산 서열을 갖는 Cas12a 단백질은 pH 7.0 내지 pH 7.9에서 최적의 활성을 갖는 것을 특징으로 하는, Cas12a 단백질.
  11. 서열번호 3의 아미노산 서열 중 930번째 위치의 라이신(Lys)이 다른 아미노산으로 치환된 Cas12a 단백질.
  12. 제11항에 있어서,
    상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 아스파르트산(Asp), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질.
  13. 서열번호 1의 아미노산 서열 중 877번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질.
  14. 제13항에 있어서,
    상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질.
  15. 제13항에 있어서,
    상기 단백질이 엔도뉴클레아제 활성이 감소된 것인, Cas12a 단백질.
  16. 서열번호 3의 아미노산 서열 중 873번째 위치의 아스파르트산(Asp)이 다른 아미노산으로 치환된 Cas12a 단백질.
  17. 제16항에 있어서,
    상기 다른 아미노산은 아르기닌(Arg), 히스티딘(His), 글루탐산(Glu), 세린(Ser), 트레오닌(Thr), 아스파라긴(Asn), 글루타민(Gln), 티로신(Tyr), 알라닌(Ala), 라이신(Lys), 이소류신(Ile), 류신(Leu), 발린(Val), 페닐알라닌(Phe), 메티오닌(Met), 트립토판(Trp), 글리신(Gly), 프롤린(Pro), 및 시스테인(Cys)으로 구성된 군에서 선택되는 어느 하나인, Cas12a 단백질.
  18. 제16항에 있어서,
    상기 단백질이 엔도뉴클레아제 활성이 감소된 것인, Cas12a 단백질.
  19. mgCas12a; 및 암세포에 특이적으로 존재하는 핵산 서열을 타겟팅하는 crRNA를 유효성분으로 포함하는 암 치료용 약학적 조성물.
  20. 제19항에 있어서,
    상기 mgCas12a는 서열번호 1, 서열번호 3, 서열번호 5 및 서열번호 6으로 이루어진 군에서 선택되는 어느 하나의 아미노산 서열을 갖는 것인, 약학적 조성물.
PCT/KR2019/010110 2018-08-09 2019-08-09 신규한 crispr 연관 단백질 및 이의 용도 WO2020032711A1 (ko)

Priority Applications (13)

Application Number Priority Date Filing Date Title
JP2021506585A JP2021532819A (ja) 2018-08-09 2019-08-09 新規のcrispr関連タンパク質及びその使用
MX2021001578A MX2021001578A (es) 2018-08-09 2019-08-09 Proteina asociada a crispr novedosa y uso de la misma.
US17/266,882 US20210292722A1 (en) 2018-08-09 2019-08-09 Novel crispr-associated protein and use thereof
EA202190454A EA202190454A1 (ru) 2018-08-09 2019-08-09 Новый crispr-ассоциированный белок и его применение
EP19846625.2A EP3835418A4 (en) 2018-08-09 2019-08-09 NOVEL CRISPR-ASSOCIATED PROTEIN AND USE THEREOF
CN201980053705.0A CN112567031A (zh) 2018-08-09 2019-08-09 新型crispr相关蛋白及其用途
CA3109105A CA3109105A1 (en) 2018-08-09 2019-08-09 Novel crispr-associated protein and use thereof
BR112021002476-0A BR112021002476A2 (pt) 2018-08-09 2019-08-09 nova proteína associada a crispr e uso da mesma
SG11202101227TA SG11202101227TA (en) 2018-08-09 2019-08-09 Novel crispr-associated protein and use thereof
AU2019319377A AU2019319377A1 (en) 2018-08-09 2019-08-09 Novel CRISPR-associated protein and use thereof
PH12021550256A PH12021550256A1 (en) 2018-08-09 2021-02-03 Novel crispr-associated protein and use thereof
IL280631A IL280631A (en) 2018-08-09 2021-02-03 A new CRISPR-related protein and its use
ZA2021/01250A ZA202101250B (en) 2018-08-09 2021-02-24 Novel crispr-associated protein and use thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20180093336 2018-08-09
KR10-2018-0093336 2018-08-09

Publications (1)

Publication Number Publication Date
WO2020032711A1 true WO2020032711A1 (ko) 2020-02-13

Family

ID=69415629

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/010110 WO2020032711A1 (ko) 2018-08-09 2019-08-09 신규한 crispr 연관 단백질 및 이의 용도

Country Status (15)

Country Link
US (1) US20210292722A1 (ko)
EP (1) EP3835418A4 (ko)
JP (1) JP2021532819A (ko)
KR (2) KR102096592B1 (ko)
CN (1) CN112567031A (ko)
AU (1) AU2019319377A1 (ko)
BR (1) BR112021002476A2 (ko)
CA (1) CA3109105A1 (ko)
EA (1) EA202190454A1 (ko)
IL (1) IL280631A (ko)
MX (1) MX2021001578A (ko)
PH (1) PH12021550256A1 (ko)
SG (1) SG11202101227TA (ko)
WO (1) WO2020032711A1 (ko)
ZA (1) ZA202101250B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11434478B2 (en) 2018-08-09 2022-09-06 Gflas Life Sciences, Inc. Compositions and methods for genome engineering with Cas12a proteins
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102497690B1 (ko) * 2020-09-22 2023-02-10 (주)지플러스생명과학 신규한 crispr 연관 단백질 및 이의 용도
WO2022065867A1 (ko) * 2020-09-22 2022-03-31 (주)지플러스생명과학 변형된 cas12a 단백질 및 이의 용도
WO2024062138A1 (en) 2022-09-23 2024-03-28 Mnemo Therapeutics Immune cells comprising a modified suv39h1 gene

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017017016A1 (en) * 2015-07-25 2017-02-02 Frost Habib A system, device and a method for providing a therapy or a cure for cancer and other pathological states
WO2017083722A1 (en) * 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
KR20170068400A (ko) * 2015-12-08 2017-06-19 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도
KR20180018466A (ko) * 2017-11-10 2018-02-21 주식회사 툴젠 면역세포의 면역조절 유전자의 활성 조절을 위한 조성물 및 그 용도

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
RU2018117360A (ru) * 2015-12-04 2020-01-09 Карибо Биосайенсиз, Инк. Сконструированные нуклеиновые кислоты, нацеленные на нуклеиновую кислоту
EP3405570A1 (en) * 2016-01-22 2018-11-28 The Broad Institute, Inc. Crystal structure of crispr cpf1
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
WO2017184786A1 (en) * 2016-04-19 2017-10-26 The Broad Institute Inc. Cpf1 complexes with reduced indel activity
WO2018013990A1 (en) 2016-07-15 2018-01-18 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
WO2018071672A1 (en) * 2016-10-12 2018-04-19 The Regents Of The University Of Colorado Novel engineered and chimeric nucleases

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017017016A1 (en) * 2015-07-25 2017-02-02 Frost Habib A system, device and a method for providing a therapy or a cure for cancer and other pathological states
WO2017083722A1 (en) * 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
KR20170068400A (ko) * 2015-12-08 2017-06-19 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도
KR20180018466A (ko) * 2017-11-10 2018-02-21 주식회사 툴젠 면역세포의 면역조절 유전자의 활성 조절을 위한 조성물 및 그 용도

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DATABASE NCBI 23 December 2016 (2016-12-23), "type V CRISPR-associated protein Cpfl", Database accession no. OLA16049.1 *
See also references of EP3835418A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US11434478B2 (en) 2018-08-09 2022-09-06 Gflas Life Sciences, Inc. Compositions and methods for genome engineering with Cas12a proteins

Also Published As

Publication number Publication date
PH12021550256A1 (en) 2021-11-03
JP2021532819A (ja) 2021-12-02
KR20200018345A (ko) 2020-02-19
ZA202101250B (en) 2022-09-28
EP3835418A1 (en) 2021-06-16
BR112021002476A2 (pt) 2021-07-27
AU2019319377A1 (en) 2021-03-11
EP3835418A4 (en) 2022-05-04
EA202190454A1 (ru) 2021-04-22
CN112567031A (zh) 2021-03-26
KR102096592B1 (ko) 2020-04-02
US20210292722A1 (en) 2021-09-23
KR20200018364A (ko) 2020-02-19
MX2021001578A (es) 2021-06-15
IL280631A (en) 2021-03-25
KR102096604B1 (ko) 2020-04-02
CA3109105A1 (en) 2020-02-13
SG11202101227TA (en) 2021-03-30

Similar Documents

Publication Publication Date Title
WO2020032711A1 (ko) 신규한 crispr 연관 단백질 및 이의 용도
Ramakrishna et al. Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA
KR20190059966A (ko) S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드
KR20180069898A (ko) 핵염기 편집제 및 그의 용도
WO2019161783A1 (en) Fusion proteins for base editing
US11946039B2 (en) Class II, type II CRISPR systems
CN114438110B (zh) 一种精确无pam限制的腺嘌呤碱基编辑器及其构建方法
CA3192224A1 (en) Base editing enzymes
CA3234233A1 (en) Endonuclease systems
Kuzmichev et al. Role of histone deacetylase complexes in the regulation of chromatin metabolism
WO2022065867A1 (ko) 변형된 cas12a 단백질 및 이의 용도
CN108373497B (zh) 一种用于大豆疫霉遗传转化的氟噻唑吡乙酮抗性筛选标记
CN104093855B (zh) 特异结合和靶定dna‑rna杂合双链的方法
WO2021249536A1 (zh) 含barstar基因的工程菌及其在barnase基因克隆中的应用
CN111454367B (zh) 一种碱基编辑分子及其用途
US20240018550A1 (en) Adenine base editor having increased thymine-cytosine sequence-specific cytosine editing activity, and use thereof
OA20789A (en) Novel CRISPR-Associated Protein And Use Thereof
CN113614247A (zh) Dna切割剂
Doyon A marker-free co-selection strategy for high efficiency human genome engineering
Wei et al. Engineering of a high-fidelity Cas12a nuclease variant capable of allele-specific editing
Carruthers Biochemical and structural studies of RNA damage and repair in bacteria
OA20812A (en) Use of CAS9 protein from the bacterium pasteurella pneumotropica.
WO2023023519A1 (en) Crispr-associated transposons and uses thereof
CN117645978A (zh) 人sirt6突变体
CN115896070A (zh) 一种新型基因组编辑工具EbCas12a-D141R及其在基因编辑中的应用

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19846625

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021506585

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 3109105

Country of ref document: CA

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112021002476

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 2019319377

Country of ref document: AU

Date of ref document: 20190809

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2019846625

Country of ref document: EP

Effective date: 20210309

ENP Entry into the national phase

Ref document number: 112021002476

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20210209