WO2021215827A1 - Cas9 또는 cas9 변이체를 이용한 유전체 교정 - Google Patents

Cas9 또는 cas9 변이체를 이용한 유전체 교정 Download PDF

Info

Publication number
WO2021215827A1
WO2021215827A1 PCT/KR2021/005031 KR2021005031W WO2021215827A1 WO 2021215827 A1 WO2021215827 A1 WO 2021215827A1 KR 2021005031 W KR2021005031 W KR 2021005031W WO 2021215827 A1 WO2021215827 A1 WO 2021215827A1
Authority
WO
WIPO (PCT)
Prior art keywords
seq
sequence
cas9
group
amino acid
Prior art date
Application number
PCT/KR2021/005031
Other languages
English (en)
French (fr)
Inventor
김진수
이현지
강범창
Original Assignee
기초과학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 기초과학연구원 filed Critical 기초과학연구원
Publication of WO2021215827A1 publication Critical patent/WO2021215827A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Definitions

  • the present invention relates to a composition for editing a genome using a Cas9 variant or a nucleic acid encoding the same, a Cas9 or a Cas9 variant or a nucleic acid encoding the same, and a genome editing method using the same, specifically, a nuclease for prime editing or It relates to a composition for reducing unwanted insertions/deletions (indels) by using a variant thereof, for example, Cas9 or a Cas9 variant or a nucleic acid encoding the same, and for editing a genome with excellent efficiency, and a genome editing method using the same.
  • indels unwanted insertions/deletions
  • CRISPR CRISPR-mediated genome editing
  • Nikase Cas9 induces modification to cut only one strand of DNA, and reverse transcriptase copies a single RNA template to create a new
  • a prime editing method in which DNA is generated and the prime editing guide RNA (pegRNA) sends the prime editor protein complex to the target site to correct the genome has been reported (Anzalone AV, Randolph PB, Davis JR et al., “Search -and-replace genome editing without double-strand breaks or donor DNA,” Nature. 2019 Oct 21).
  • prime editor proteins containing non-nickease nucleases can also cause prime editing, and introduce mutations in Nikease to cut non-target strands
  • By constructing an enzyme or deleting some amino acid residues unwanted insertions/deletions that may occur while repairing DSBs can be significantly reduced, and desired gene correction can be performed with excellent efficiency, and the size of It was confirmed that there is an advantage that it can be delivered through a restricted AAV (Adeno-associated virus) vector, and the present invention was completed.
  • AAV Ado-associated virus
  • the present invention provides a nuclease variant or a nucleic acid encoding the same in which one or more amino acids selected from the group consisting of D839, H840, N854 and N863 in the sequence of SEQ ID NO: 1 are substituted with other amino acids. .
  • the present invention also provides a nuclease variant or a nucleic acid encoding the same comprising a deletion of one or more amino acid residues selected from the group consisting of:
  • the present invention also provides (1) a prime editor protein comprising a nuclease or a variant thereof and a reverse transcriptase or a nucleic acid encoding the same; And (2) it provides a composition for genome editing, comprising a prime editing guide RNA (pegRNA, prime editing guide RNA) comprising a binding region (binding site) and a editing sequence that binds to the genome to be edited.
  • a prime editing guide RNA pegRNA, prime editing guide RNA
  • the present invention provides use of a composition for use in the preparation of an agent for genome editing, wherein the composition comprises (1) a nuclease or a variant thereof and a reverse transcriptase prime editor protein (prime editor protein) or a nucleic acid encoding it; and (2) a prime editing guide RNA (pegRNA) including a binding site binding to a genome to be edited and a editing sequence.
  • a nuclease or a variant thereof and a reverse transcriptase prime editor protein (prime editor protein) or a nucleic acid encoding it and
  • a prime editing guide RNA pegRNA
  • the present invention also provides (1) a prime editor protein comprising a nuclease or a variant thereof and a reverse transcriptase or a nucleic acid encoding the same; And (2) a binding region (binding site) binding to the genome to be edited and a prime editing guide RNA (pegRNA, prime editing guide RNA) comprising a proofing sequence, treating the subject with a composition for genome editing It provides a genome editing method comprising the.
  • 1 shows the predicted and experimental results for the cleavage results for the target sequence using Cas9, nCas9-D10A, and nCas9-H840A.
  • Nt.BbvCI enzymes that cut one strand and SpeI enzymes that cut both strands were used to prepare open circular and linear comparison groups, respectively. Thereafter, Cas9, nCas9-D10A, and nCas9-H840A were treated to observe the shape of the plasmid. In Cas9, it was confirmed that both strands of most plasmids were cut and left in a linear form, and when nCas9-D10A was treated, it was confirmed that most of the plasmids were cut and remained in an open circular form.
  • Figure 2 shows the results of confirming the Cas9 variant production and unwanted insertion / deletion (indel: insertion and deletion) efficiency that can be introduced using the same.
  • HNH domain and RuvC domain exist, which cut target DNA and non-target DNA, respectively. If a mutation is introduced into the HNH domain or RuvC domain of Cas9, it can be produced as a Cas9 nickase that can cut only one strand.
  • Cas9 nickase mainly uses the form in which the D10A mutation is introduced into the RuvC domain or the form in which the H840A or N863A mutation is introduced into the HNH domain.
  • Cas9 variants having a combination of D839A, H840A, N854A, and N863A in the Cas9 HNH domain were prepared, and as a result of using this, various variants (HNHv5 (H840A / N863A), HNHv7 (H840A / N854A), HNHv9 (N863A / N854A) ), HNHv11 (H840A/N863A/N854A), HNHv12 (H840A/D839A/N854A), HNHv13 (N863A/D839A/N854A), HNHv14 (H840A/N863A/D839A/N854A)) with an average of less than 1% unwanted indel efficiency was found to decrease.
  • Figure 3 confirms the result of the change of the cleavage pattern (cleavage pattern) in the in vitro test.
  • nCas9-H840A and nCas9-H840A/N863A were treated with gDNA of isolated HAP1 cells, respectively, and the change in the cleavage pattern was observed through WGS.
  • nCas9-H840A caused partial double strand cleavage
  • nCas9-H840A/N863A treated the desired non-target strand ( A change in the pattern of cleavage occurred only in the non-target strand) was confirmed.
  • PE Primary Editor
  • nCas9 and MMLV reverse transcriptase is delivered to cells together with pegRNA capable of inducing a mutation to be introduced, and DNA is analyzed by a targeted deep-sequencing method
  • a The efficiency of the intended gene editing ( correct editing) and (b) unintended indel activity were measured. All of the values shown were normalized by setting the value of the existing PEv1 (PE-H840A) to 1, pink when the efficiency of intended gene editing is higher than 1, green when the efficiency is lower than 1 / red when the unintended indel efficiency is higher than 1. , lower than 1 is indicated in blue.
  • PEv1 PE-H840A
  • PE-HNHv5 PE2-H840A/N863A
  • the frequency of occurrence of unwanted indels is reduced than that of the existing PE-HNHv1 (PE2-H840A)
  • Figure 5 shows the results of confirming the gene correction and indel efficiency through the Cas9 variant including the deletion of additional amino acid residues.
  • HNH deletion variant HNH ⁇ 1-12
  • PE variants were prepared using various HNH deletion variants (HNH ⁇ 1 ⁇ 12), and after processing them in cells, the intended genome editing efficiency was measured by the targeted deep-sequencing method. As a result, it was confirmed that the desired calibration efficiency occurred well with similar or half the efficiency in the PE-HNH ⁇ 4 ⁇ 9 form compared to the existing PE or PE-HNHv5.
  • prime editing may be caused even by using a prime editor protein in the form of Cas9 nuclease (Cas9 WT).
  • Cas9 WT Cas9 nuclease
  • deletion variants HNH ⁇ 4 ⁇ 6( ⁇ 792-897), HNH7 ⁇ 9( ⁇ 786-885) have the advantage that they work well even when the size of the Cas9 protein is reduced by about 100 amino acids. If a size-restricted AAV (Adeno-associated virus) vector is used, it is much more advantageous to use a deletion variant that has a small size and reduces unintended indels.
  • AAV Ado-associated virus
  • the present invention relates to a nuclease variant or a nucleic acid encoding the same in which one or more amino acids selected from the group consisting of D839, H840, N854 and N863 in the sequence of SEQ ID NO: 1 are substituted with other amino acids. .
  • the present invention relates to a nuclease variant or a nucleic acid encoding the same in which one or more amino acid amino acid residues in positions 765 to 908 in a sequence selected from the group consisting of SEQ ID NOs: 1 to 15 are deleted.
  • the present invention may include a nuclease variant comprising a deletion of one or more amino acid residues selected from the group consisting of:
  • the present invention further provides (1) a prime editor protein comprising a nuclease or a variant thereof and a reverse transcriptase or a nucleic acid encoding the same; And (2) it relates to a composition for genome editing, comprising a prime editing guide RNA (pegRNA, prime editing guide RNA) comprising a binding region (binding site) and a editing sequence that binds to the genome to be edited.
  • a prime editing guide RNA pegRNA, prime editing guide RNA
  • the nuclease may be target-specific, for example, zinc finger nuclease (ZNFN), transcriptional activator-like effector nuclease (TALEN), or Cas protein, but is not limited thereto.
  • the Cas protein is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, Cas12j, Cas13a, Cas13b, Cas13c, Cas13d, Cas14, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, CsMT2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Csb3, Csx17, Csb
  • the Cas protein is a major protein component of the CRISPR/Cas system, and is a protein capable of forming an activated endonuclease or nickase.
  • the Cas protein is, for example, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus.
  • Streptococcus pyogenes Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Azospirillum, gluconaseto Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus: Staphylococcus aureus, Nitratifractor, Corynebacterium And Campylobacter (Campylobacter) derived from the microbial genus comprising an ortholog of the Cas protein selected from the group consisting of, may be a simple isolated or recombinant from them.
  • the Cas9 sequence may be identified in a known database such as GenBank of the National Center for Biotechnology Information (NCBI).
  • the Cas9 may include, for example, the amino acid sequence of SEQ ID NO: 1.
  • the target-specific nuclease may be isolated from a microorganism or artificially or non-naturally occurring, such as a recombinant method or a synthetic method.
  • the target-specific nuclease eg, Cas9, Cpf1, etc.
  • Recombinant DNA refers to a DNA molecule artificially created by a genetic recombination method such as molecular cloning in order to contain heterologous or homologous genetic material obtained from various organisms.
  • the recombinant DNA when expressed in an appropriate organism to produce a target-specific nuclease ( in vivo or in vitro ), the recombinant DNA is a codon optimized for expression in the organism among codons encoding the protein to be prepared. It may have a nucleic acid sequence reconstituted by selecting .
  • the nuclease variant may be a mutated target-specific nuclease in a mutated form.
  • the mutated target-specific nuclease may mean that it is mutated to lose the endonuclease activity that cuts DNA double strands, for example, it may be mutated to lose the endonuclease activity and have a nickase activity. have.
  • a nick may be introduced into either strand through the nicking.
  • the nuclease variant may be, for example, a variant of Cas9.
  • the nuclease domain of Cas9 includes an HNH domain and a RuvC domain, which can cut target DNA and non-target DNA, respectively. If a mutation is introduced into the HNH domain or RuvC domain of Cas9, it can be produced as a Cas9 nickase that can cut only one strand.
  • one or more amino acids selected from the group consisting of D839, H840, N854 and N863 in the sequence of SEQ ID NO: 1 which is the amino acid sequence of Cas9 may be substituted with another amino acid.
  • the present invention relates to a nuclease variant in which one or more amino acids selected from the group consisting of D839, H840, N854 and N863 in the sequence of SEQ ID NO: 1 are substituted with other amino acids.
  • the nuclease variant may include one or more mutations selected from the group consisting of:
  • D839 in the sequence of SEQ ID NO: 1 is substituted with alanine
  • H840 in the sequence of SEQ ID NO: 1 is substituted with alanine
  • N854 in the sequence of SEQ ID NO: 1 is substituted with alanine
  • N863 was substituted with alanine.
  • a Cas9 variant in which one or more amino acids selected from the group consisting of D839, H840, N854 and N863 were substituted with other amino acids in the HNH domain of Cas9 was constructed.
  • the Cas9 variants are HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHvN4(N863A/N854A) ), or HNHv14 (H840A/N863A/D839A/N854A)).
  • the Cas9 variant of (H840A/N863A/D839A/N854A)) was used, it was confirmed that the unwanted indel efficiency was reduced to an average of 1% or less.
  • nuclease variant comprising a sequence selected from the group consisting of SEQ ID NOs: 2 to 15 may be included.
  • PE-HNHv5 PE2-H840A / N863A
  • the frequency of occurrence of unwanted indels is reduced than that of the conventionally known PE-HNHv1 (PE2-H840A).
  • PE-HNHv1 PE2-H840A
  • the desired genome editing efficiency could be obtained even when PE2-Cas9-WT composed of the Cas9 nuclease form, for example, the conventionally known H840A mutation removed) was used, and in a target with very low PE efficiency, accurate It was confirmed that the correct editing efficiency was improved.
  • the nuclease variant may comprise a deletion of a nuclease amino acid residue.
  • the nuclease variant comprises a deletion of at least one amino acid residue at positions 765 to 908 in any one of the sequences selected from the group consisting of SEQ ID NOs: 1 to 15.
  • the nuclease variant may comprise a deletion of one or more amino acid residues selected from the group consisting of:
  • the nuclease variant comprises a deletion in the HNH domain of Cas9, for example, an amino acid deletion at positions 824 to 874 (HNH ⁇ 1, HNH ⁇ 2 and HNH ⁇ 3), an amino acid deletion at positions 792 to 897 (HNH ⁇ 4, HNH ⁇ 5 and HNH ⁇ 6), amino acid deletions from positions 786 to 885 (HNH ⁇ 7, HNH ⁇ 8 and HNH ⁇ 9), or amino acid deletions from positions 765 to 908 (HNH ⁇ 10, HNH ⁇ 11 and HNH ⁇ 12).
  • an amino acid deletion at positions 824 to 874 HNH ⁇ 1, HNH ⁇ 2 and HNH ⁇ 3
  • an amino acid deletion at positions 792 to 897 HNH ⁇ 4, HNH ⁇ 5 and HNH ⁇ 6
  • amino acid deletions from positions 786 to 885 HNH ⁇ 7, HNH ⁇ 8 and HNH ⁇ 9
  • amino acid deletions from positions 765 to 908 HNH ⁇ 10, HNH ⁇ 11 and HNH ⁇ 12
  • a prime editor protein variant was prepared using various HNH domain deletion variants (deletion variant: HNH ⁇ 1 ⁇ 12), and after processing it in cells, the genome editing efficiency was measured.
  • the conventional prime editor protein PE or PE- Compared with HNHv5 it was confirmed that the desired calibration efficiency occurred well with similar or half the efficiency in the PE-HNH ⁇ 4 ⁇ 9 form.
  • an amino acid deletion at the deleted position for example, positions 824 to 874, 792 to 897, 786 to 885, or 765 to 908 in any one of the sequences selected from the group consisting of SEQ ID NOs: 1 to 15
  • a peptide linker may be further included at the amino acid C-terminus at position 823, at the amino acid C-terminus at position 791, at the amino acid C-terminus at position 785, or at the amino acid C-terminus at position 764.
  • the peptide linker may be about 2-25aa in length.
  • amino acids such as alanine, glycine and/or serine may be included, but are not limited thereto.
  • the prime editing guide RNA contains a proofreading sequence and serves as a reverse transcriptase template.
  • the reverse transcriptase (RT) is an RNA-dependent DNA polymerase capable of synthesizing a DNA strand (ie, complementary DNA, cDNA) using a reverse transcriptase template.
  • the reverse transcriptase is, for example, M-MLV (Moloney murine leukemia virus) reverse transcriptase or a variant thereof, for example, M-MLV-RT lacking RNase H activity, or M-MLV variants (D200N, T306K, W313F, T330P, L603W), bovine leukemia virus (BLV) RT or variant thereof, Rous sarcoma virus (RSV) RT or variant thereof, or Avian Myeloblastosis Virus (AMV) RT or variant thereof.
  • M-MLV Maloney murine leukemia virus reverse transcriptase or a variant thereof
  • M-MLV-RT lacking RNase H activity
  • M-MLV variants D200N, T306K, W313F, T330P, L603W
  • BLV bovine leukemia virus
  • RSV Rous sarcoma virus
  • AMV Avian Myeloblastosis Virus
  • the reverse transcriptase may be an M-MLV reverse transcriptase derived from M-MLV (Moloney Murine Leukemia Virus) or a variant thereof, for example, an M-MLV variant comprising the sequence of SEQ ID NO: 29 (D200N, T306K, W313F, T330P, L603W).
  • M-MLV Moloney Murine Leukemia Virus
  • the nuclease or a variant thereof and the reverse transcriptase may individually include each nuclease or a variant thereof and a reverse transcriptase, and may be included in the form of a fusion protein of the nuclease or a variant thereof and a reverse transcriptase.
  • the prime editing guide RNA (pegRNA, prime editing guide RNA) or DNA encoding the same includes a binding site binding to a genome to be edited and a editing sequence.
  • the sequence comprising the correction sequence serves as a reverse transcriptase template.
  • the reverse transcriptase template contains the desired corrective sequence and has homology to the genomic DNA locus.
  • the correction sequence is a heterologous sequence and includes a target sequence to be corrected in the genome.
  • the binding region may be optionally located in the 5' direction or 3' direction of the reverse transcriptase template, and specifically, the binding region may be located in the 3' direction of the reverse transcriptase template.
  • the binding region may include a sequence complementary to a genomic DNA strand nicked by a nuclease or a variant thereof included in the prime editor protein, for example, nickelase.
  • the binding region may hybridize to a target site, thereby serving as a target site for the initiation of reverse transcriptase activity.
  • the binding region is 80% or more, for example, 85% or more, 90% or more, 95% or more, 97% or more, 98% or more, 99% or more, 5 or more having 100% homology with the sequence of the target site; 6 or more, 7 or more, 8 or more, 9 or more, 10 or more, 11 or more, 12 or more, 13 or more, 14 or more, 15 or more, 20 or more, 25 or more nucleotides.
  • composition according to the present invention comprises (1) a prime editor protein comprising a nuclease or a variant thereof and a reverse transcriptase or a nucleic acid encoding the same; and (2) a prime editing guide RNA (pegRNA) comprising a binding site binding to a genome to be edited and a proofing sequence, and a single single agent to deliver (1) and (2).
  • a prime editor protein comprising a nuclease or a variant thereof and a reverse transcriptase or a nucleic acid encoding the same
  • pegRNA prime editing guide RNA
  • a plurality of delivery means may be used in combination in the same or different configurations.
  • each delivery system is simultaneously a viral delivery means, one is a viral delivery means and the other is a non-viral delivery means means, or at the same time a non-viral delivery means.
  • the nucleic acid may be an RNA sequence, a DNA sequence, or a combination thereof (RNA-DNA combination sequence).
  • the prime editing guide RNA may include an RNA sequence of the guide RNA or a DNA sequence encoding the same.
  • the DNA sequence encoding the prime editor protein of (1) and the DNA sequence encoding the prime editing guide RNA of (2) may be provided through a delivery means such as a vector.
  • the DNA sequence encoding (1) and the DNA sequence encoding (2) can be simultaneously transferred through one vector by positioning them on the same vector.
  • the DNA sequence encoding the prime editor protein of (1) and the DNA sequence encoding the prime editing guide RNA of (2) can be delivered by positioning them on separate vectors.
  • composition according to the present invention may be used in a viral vector such as an Adeno-Associated Viral Vector (AAV), Adenoviral Vector (AdV), Lentiviral Vector (LV) or Retroviral Vector (RV), other viral vectors such as Simian virus Episomal vectors containing 40 (SV40) ori, bovine papilloma virus (BPV) ori, or Epstein-Barr nuclear antigen (EBV) ori can be used for delivery.
  • AAV Adeno-Associated Viral Vector
  • AdV AdV
  • Lentiviral Vector Lentiviral Vector
  • RV Retroviral Vector
  • Simian virus Episomal vectors containing 40 (SV40) ori, bovine papilloma virus (BPV) ori, or Epstein-Barr nuclear antigen (EBV) ori can be used for delivery.
  • the vector is each local injection method (e.g., direct injection of a lesion or target site), electroporation, lipofection, viral vectors, nanoparticles, as well as PTD (Protein translocation domain) fusion protein method, etc. It can be delivered in vivo or into a cell.
  • local injection method e.g., direct injection of a lesion or target site
  • electroporation e.g., electroporation, lipofection, viral vectors, nanoparticles, as well as PTD (Protein translocation domain) fusion protein method, etc. It can be delivered in vivo or into a cell.
  • PTD Protein translocation domain
  • the DNA sequence encoding the prime editing guide of (2) may be delivered via a vector.
  • the prime editor protein of (1) or an RNA sequence encoding it may be delivered in the form of mRNA.
  • the prime editor protein or mRNA may be delivered directly or delivered through a carrier.
  • RNA sequence encoding the prime editor protein of (1) and the prime editing guide RNA sequence of (2) may include the RNA sequence encoding the prime editor protein of (1) and the prime editing guide RNA sequence of (2). It can be delivered in the form of mRNA encoding (1) and (2) mRNA. The mRNA may be delivered directly or delivered through a carrier.
  • the mRNA of the prime editor protein of (1) and (2) the prime editing guide RNA can be delivered by forming an assembled RNP (ribonucleoprotein) complex.
  • the RNP may be delivered directly or delivered through a carrier.
  • the RNP complex can be prepared by microinjection, electroporation, DEAE-dextran treatment, lipofection, nanoparticle-mediated transfection, protein transduction domain mediated transduction, and PEG-mediated transfection, etc. It can be delivered to the cell by various methods in the art, but is not limited thereto.
  • the RNP complex can be carried out in the form of co-transfection or step-transfection.
  • Co-transfection is the simultaneous transfection of (1) prime editor protein and (2) prime editing guide RNA
  • step-transfection is the first transfection of (1) prime editor protein, and then (2) prime editing guide RNA It may be performed by the second transfection, but is not limited thereto.
  • RNPs are degraded in vivo normally within 72 hours, they remain persistent and are less likely to cause toxicity and off-target correction, which is advantageous when used in gene therapy.
  • PE can be introduced into eukaryotic cells in the form of plasmid DNA rather than RNP, but in this case, a plasmid fragment can be inserted into the genome.
  • plasmid DNA rather than RNP
  • a plasmid fragment can be inserted into the genome.
  • the RNP method will not be regulated by GMOs, unlike the DNA method.
  • the carrier may include, for example, a cell penetrating peptide (CPP), nanoparticles, or a polymer, but is not limited thereto.
  • CPPs are short peptides that facilitate cellular uptake of a variety of molecular cargoes (from nanosized particles to small chemical molecules and large fragments of DNA).
  • the cargo comprises (1) a prime editor protein or a nucleic acid encoding the same; and (2) a prime editing guide RNA.
  • the prime editor protein of (1) or a nucleic acid encoding the same may be assembled through a chemical bond through a covalent bond or a non-covalent interaction.
  • the (2) prime editing guide RNA or polynucleotide encoding the same is complexed with CPP to form condensed positively charged particles.
  • the composition according to the present invention may be delivered via polymer nanoparticles, metal nanoparticles, metal/inorganic nanoparticles or lipid nanoparticles.
  • the polymer nanoparticles may be, for example, DNA nanoclew synthesized by rolling circle amplification, or thread-like DNA nanoparticles.
  • DNA nanoclew, thread-like DNA nanoparticles (1) prime editor protein or a nucleic acid encoding the same; And (2) loading the prime editing guide RNA, and coated with PEI to improve the endosomes escape ability. These complexes bind to the cell membrane, become internalized, and then migrate to the nucleus through endosomal escape, allowing (1) and (2) to be delivered simultaneously.
  • a prime editor protein (prime editor protein) or a nucleic acid encoding the same; and (2) linking gold particles to the prime editing guide RNA, forming a complex with a cationic endosomal disruptive polymer, and delivering it to the cell.
  • the cationic endosomes escape polymer is, for example, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2- ⁇ (2-aminoethyl)amino ⁇ -ethyl -aspartamide] (pAsp(DET)), poly(ethylene glycol) (PEG) and poly(arginine) block co-polymer, PEG and poly(lysine) block co-polymer, or PEG and poly ⁇ N-[N It may be a block co-polymer of -(2-aminoethyl)-2-aminoethyl]aspartamide ⁇ (PEG-pAsp(DET)).
  • metal/inorganic nanoparticles for example, via ZIF-8 (zeolitic imidazolate framework-8) (1) a prime editor protein or a nucleic acid encoding the same; and (2) encapsulate prime editing guide RNA, and encapsulate negatively charged RNP with positively charged nanoscale ZIF. It is possible to change the expression of the desired target gene through the efficient endosomal escape.
  • ZIF-8 zeolitic imidazolate framework-8
  • DNA or nucleic acids encoding negatively charged (1) and (2) can combine with cationic substances to form nanoparticles, which are receptor-mediated into cells It can penetrate through receptor-mediated endocytosis or phagocytosis.
  • the RNP complex of (1) and (2) may be bound to a cationic polymer.
  • polyallylamine as a cationic polymer; polyethyleneimine (PEI); poly(L-lysine) (PLL); poly(L-arginine) (PLA); polyvinylamine homo- or copolymers; poly(vinylbenzyl-tri-C1-C4-alkylammonium salt); polymers of aliphatic or araliphatic dihalides and aliphatic N,N,N',N'-tetra-C1-C4-alkyl-alkylenediamines; poly(vinylpyridine) or poly(vinylpyridinium salt); poly(N,N-diallyl-N,N-di-C1-C4-alkyl-ammonium halide); homo- or copolymers of quaternized di-C1-C4-alkyl-aminoethyl acrylates or methacrylates; POLYQUADTM; polyaminoamides and the like may be included.
  • PEI poly
  • Cationic lipids may include cationic liposome preparations.
  • the lipid bilayer of the liposome protects the encapsulated nucleic acid from degradation and can prevent specific neutralization by antibodies capable of binding to the nucleic acid.
  • endosomal maturation the endosomal membrane and the liposome are fused, allowing efficient endosomal escape of cationic lipid-nucleases.
  • Representative cationic liposomes include N-[1-(2,3-dioleoloxy)-propyl]-N,N,N-trimethylammonium chloride (DOTMA), N-[1-(2,3-dioleoloxy) -Propyl]-N,N,N-trimethylammonium methylsulfate (DOTAP), 3 ⁇ -[N-(N',N'-dimethylaminoethane)carbamoyl]cholesterol (DC-Chol), 2,3- Dioleyloxy-N-[2(sperminecarboxamido)ethyl]-N,N-dimethyl-1-propanaminium trifluoroacetate (DOSPA), 1,2-dimyristyloxypropyl-3 -dimethyl-hydroxyethyl ammonium bromide; or dimethyldioctadecylammonium bromide (DDAB).
  • DOTMA N-[1-(2,3
  • Liposomes are spherical vesicular structures composed of a single or multiple lamellar lipid bilayers surrounding an inner aqueous compartment and a relatively impermeable outer lipophilic phospholipid bilayer.
  • the liposome formulation may mainly contain natural phospholipids and lipids such as 1,2-distearolyl-sn-glycero-3-phosphatidyl choline (DSPC), sphingomyelin, phosphatidylcholine or monosialoganglioside, and the like.
  • DSPC 1,2-distearolyl-sn-glycero-3-phosphatidyl choline
  • sphingomyelin phosphatidylcholine or monosialoganglioside, and the like.
  • cholesterol or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine may be added to the lipid membrane to resolve instability in plasma. Addition of cholesterol decreases the rapid release of encapsulated bioactive compounds into plasma or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine (DOPE) increases stability.
  • DOPE 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine
  • the present invention relates to a genome editing method comprising the step of treating cells with the composition.
  • the cells are eukaryotic cells (eg, fungi such as yeast, eukaryotic and / or eukaryotic plant-derived cells (eg, embryonic cells, stem cells, somatic cells, germ cells, etc.), etc.), eukaryotic animals (eg, humans, monkeys It may be a primate dog, pig, cow, sheep, goat, mouse, rat, etc.), or a eukaryotic plant (eg, algae such as green algae, corn, soybean, wheat, rice, etc.), but is not limited thereto.
  • fungi such as yeast
  • eukaryotic and / or eukaryotic plant-derived cells eg, embryonic cells, stem cells, somatic cells, germ cells, etc.
  • eukaryotic animals eg, humans, monkeys It may be a primate dog, pig, cow, sheep, goat, mouse, rat, etc.
  • a eukaryotic plant eg, algae such as green algae, corn, soybean, wheat,
  • Example 1 Cleavage of target sequence using Cas9, nCas9-D10A, nCas9-H840A
  • Cas9 variants were treated at 37C for 16 hours, and WGS results were confirmed.
  • FIG. 1B Cas9 and nCas9-D10A showed the same cleavage form as expected, but in the case of nCas9-H840A, partial cleavage occurred in the target strand, unlike expected.
  • an HNH domain and a RuvC domain exist, which cut target DNA and non-target DNA, respectively. If a mutation is introduced into the HNH domain or RuvC domain of Cas9, it can be produced as a Cas9 nickase that can cut only one strand.
  • Cas9 nickase mainly uses the form in which the D10A mutation is introduced into the RuvC domain or the form in which the H840A or N863A mutation is introduced into the HNH domain.
  • nCas9 Nikase Cas9
  • plasmids expressing nCas9 and sgRNA targeting various genes were delivered to HEK293T cells together. Thereafter, cell DNA was isolated and confirmed by a targeted deep-sequencing method. According to FIG. 2b, it was confirmed that 0.035 to 15% (average 2.5%) of indels appeared by HNHv1 (Cas9-H840A), which is a form mainly used in the past.
  • Cas9 variants having a combination of D839A, H840A, N854A, and N863A in the Cas9 HNH domain were prepared, and as a result of using this, various variants (HNHv5 (H840A / N863A), HNHv7 (H840A / N854A), HNHv9 (N863A / N854A) ), HNHv11 (H840A/N863A/N854A), HNHv12 (H840A/D839A/N854A), HNHv13 (N863A/D839A/N854A), HNHv14 (H840A/N863A/D839A/N854A)) with an average of less than 1% unwanted indel efficiency was found to decrease.
  • the undesired Cas9 variant with reduced indel efficiency was either 1) Cas9 became a Nikase form that cuts only one strand accurately, or 2) Cas9 itself loses its activity and is enzymatically inactive, unable to cut both strands (
  • a double nicking experiment (an experiment using two sgRNAs that cut different strands) was performed to confirm whether it was catalytically dead Cas9).
  • sgRNA-A or sgRNA-1 was treated, indel was not observed, and when sgRNA-A and sgRNA-1 were treated at the same time, both strands (DNA double strand break) were cut and indel this will be observed.
  • HNHv5 HNHv9
  • HNHv13 less than 1% of indels were observed when only each sgRNA-A or sgRNA-1 was treated, but more than 1% of indels were observed when sgRNA-A and sgRNA-1 were simultaneously treated. , it was confirmed that it was in the form of Cas9 nicking that cuts one strand.
  • nCas9-H840A and nCas9-H840A/N863A were treated with gDNA of isolated HAP1 cells, respectively, and the change in the cleavage pattern was observed through WGS.
  • FIG. 3a as a result of targeting and confirming three types of sites (HEK4, EMX1 and RUNX1), nCas9-H840A all caused partial double strand cleavage, whereas nCas9-H840A/N863A was treated when It was possible to confirm the change in the pattern in which cleavage occurs only in the desired non-target strand.
  • Digenome sequencing is one of the methods that can detect double-strand breaks in whole genes. Through this, the patterns of double-strand breaks appearing in all genes were compared and expressed through circos plots. According to FIG. 3b, when nCas9-H840A was treated at three types of sites (HEK4, EMX1 and RUNX1), double-strand breaks were observed at the target site and the off-target site. On the other hand, when nCas9-H840A/N863A was treated, double-stranded break could not be confirmed at the target site, and it could be confirmed that the double-stranded break disappeared or the ratio was significantly reduced even at off-target sites except for the target site. As a result of this in vitro experiment, it was confirmed that Cas0-H840A/N863A was in the form of a nickase Cas9 capable of cutting only one strand of DNA, as in FIG. 1 .
  • PE Primary Editor
  • nCas9 and MMLV reverse transcriptase was delivered to cells together with pegRNA capable of inducing a mutation to be introduced, and DNA was analyzed by a targeted deep-sequencing method, and the results are shown in FIG. 4 .
  • PE-HNHv5 PE2-H840A/N863A
  • the frequency of occurrence of unwanted indels is reduced than that of the existing PE-HNHv1 (PE2-H840A)
  • HNH deletion variants (HNH ⁇ 1-12) were produced by deleting a part of the HNH domain of Cas9 and connecting them with linkers of various lengths (amino acid sequences: AS, GGGGS, GGGGSGGGGS). (Fig. 5a).
  • PE variants were prepared using various HNH deletion variants (HNH ⁇ 1 ⁇ 12), and after processing them in cells, the intended genome editing efficiency was measured by a targeted deep-sequencing method. According to FIG. 5c, it was confirmed that the desired calibration efficiency occurred well with similar or half the efficiency in the PE-HNH ⁇ 4 ⁇ 9 form compared to the existing PE or PE-HNHv5.
  • HNH ⁇ 1 to 12 The frequency of unwanted indels that can be introduced by PE-HNH deletion mutations (HNH ⁇ 1 to 12) was measured. According to FIG. 5d, it was confirmed that unintended indels were significantly reduced in the PE-HNH ⁇ 4 ⁇ 9 form. And it was confirmed that it was improved compared to when using the previous HNH point mutation variant (point mutation variant: HNHv1 ⁇ 14). Through this, it was confirmed that the use of PE without the 792 to 897 amino acid portion or the 786 to 885 amino acid portion of Cas9 can reduce the introduction of unwanted indels and cause the intended gene correction well. As a result, even if about 100 amino acids of the Cas9 sequence are deleted, the gene editing function for PE can be performed well, and the size of Cas9 and PE proteins is also smaller.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 Cas9 변이체 또는 이를 코딩하는 핵산, Cas9 또는 Cas9 변이체 또는 이를 코딩하는 핵산을 이용하여 유전체를 교정하기 위한 조성물 및 이를 이용한 유전체 교정 방법에 관한 것으로, 구체적으로는 프라임 에디팅을 위한 뉴클레아제 또는 이의 변이체 예를 들어 Cas9 또는 Cas9 변이체 또는 이를 코딩하는 핵산을 이용하여, 원하지 않는 삽입/결실(indel)을 줄이고, 우수한 효율로 유전체를 교정하기 위한 조성물 및 이를 이용한 유전체 교정 방법에 관한 것이다.

Description

CAS9 또는 CAS9 변이체를 이용한 유전체 교정
본 발명은 Cas9 변이체 또는 이를 코딩하는 핵산, Cas9 또는 Cas9 변이체 또는 이를 코딩하는 핵산을 이용하여 유전체를 교정하기 위한 조성물 및 이를 이용한 유전체 교정 방법에 관한 것으로, 구체적으로는 프라임 에디팅을 위한 뉴클레아제 또는 이의 변이체 예를 들어 Cas9 또는 Cas9 변이체 또는 이를 코딩하는 핵산을 이용하여, 원하지 않는 삽입/결실(indel)을 줄이고, 우수한 효율로 유전체를 교정하기 위한 조성물 및 이를 이용한 유전체 교정 방법에 관한 것이다.
유전체의 특정위치를 인지하는 가이드 DNA와 DNA의 이중나선을 자르는 Cas9 효소로 결합된 분자 복합체를 포함하는 CRISPR에 의한 유전자 에디팅 (editing)에서 보여지는 유연성과 정밀성의 한계를 극복하기 위해, 개선된 유전체 교정방법이 보고된 바 있다.
구체적으로, 니케이즈 Cas9 (H840A) 및 M-MLV 역전사 효소로 구성된 프라임 에디터 단백질 복합체를 통해 니케이즈 Cas9은 한 가닥의 DNA만 절단하도록 변형을 유도하고, 역전사효소는 하나의 RNA 주형을 복사함으로써 새로운 DNA를 생성하며, 프라임 에디팅 가이드 RNA (pegRNA)가 프라임 에디터 단백질 복합체를 표적부위로 보내어, 유전체를 교정하는 프라임 에디팅 방법이 보고된 바 있다 (Anzalone AV, Randolph PB, Davis JR et al., “Search-and-replace genome editing without double-strand breaks or donor DNA,” Nature. 2019 Oct 21).
이러한 기술적 배경하에서, 본 출원의 발명자들은 니케이즈가 아닌 뉴클레아제를 포함하는 프라임 에디터 단백질도 프라임 에디팅을 일으킬 수 있고, 니케이즈에 변이를 도입하여 비타겟 가닥(non-target strand)을 자르는 니케이즈를 제작하거나, 일부 아미노산 잔기를 결실시킴으로써, DSB를 복구 (repair)하면서 발생될 수 있는 원하지 않는 삽입/결실을 현저히 줄일 수 있고, 우수한 효율로 목적하는 유전자 교정을 할 수 있을 뿐 아니라, 크기의 제한이 있는 AAV (Adeno-associated virus) 벡터를 통해 전달할 수 있다는 이점이 있음을 확인하고, 본 발명을 완성하였다.
발명의 요약
본 발명의 목적은 Cas9 또는 Cas9 변이체를 이용한 유전체 교정용 조성물 및 이를 이용한 유전체 교정 방법을 제공하는데 있다.
본 발명의 목적은 뉴클레아제 변이체 예를 들어 Cas9 변이체를 제공하는데 있다.
상기 목적을 달성하기 위하여, 본 발명은 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체 또는 이를 코딩하는 핵산을 제공한다.
본 발명은 또한, 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산을 제공한다:
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
본 발명은 또한, (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물을 제공한다.
본 발명은 유전체 교정을 위한 제제의 제조에 사용하기 위한 조성물의 용도로, 상기 조성물은 (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함한다.
본 발명은 또한, (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물을 대상에 처리하는 단계를 포함하는 유전체 교정 방법을 제공한다.
도 1은 Cas9, nCas9-D10A, nCas9-H840A를 이용하여 표적 서열에 대한 절단 결과에 대한 예상 및 실험 결과를 나타낸 것이다.
(a) 전체적인 Digenome-seq의 개요. 표적 서열의 정보와 Cas9, nCas9-D10A, nCas9-H840A를 in vitro 절단 처리하였을 때 예상되는 절단 위치와 (Red arrowhead: 절단 위치, Blue: PAM sequence) 이 후 WGS (Whole Genome Sequencing)의 데이터를 IGV로 확인할 때 예상되는 결과 모식도 (red: forward strand& blue: reverse strand). (b) gDNA in vitro 절단의 결과. HAP1 세포의 gDNA를 사용하여 Cas9 variants들을 37C에 16시간동안 처리하고 WGS결과를 확인하였다. Cas9, nCas9-D10A는 예상과 동일한 절단 형태를 보였지만, nCas9-H840A의 경우, 예상과는 달리 타겟 가닥에도 부분적 절단이 일어났다. (c) 플라스미드 in vitro 절단 실험. gDNA에서 진행한 절단 실험을 다시 확인하기 위하여 플라스미드를 사용한 in vitro 절단 실험을 진행하였다. Supercoiled 형태의 플라스미드는 양쪽 가닥이 절단되면 선형 (linear), 한쪽 가닥이 절단 되면 오픈 원형 (open circular)의 형태로 전기 영동에 의하여 크기가 분리된다. 6030bp크기의 플라스미드를 가지고 한쪽 가닥을 절단하는 Nt.BbvCI 효소와 양쪽 가닥을 절단하는 SpeI 효소를 사용하여 각각 오픈 원형 (open circular)과 선형 (linear) 형태의 비교군을 제작하였다. 이 후 Cas9, nCas9-D10A, nCas9-H840A를 처리하여 플라스미드의 형태를 관찰하였다. Cas9에서는 대부분의 플라스미드가 양쪽 가닥이 잘려 선형 (linear) 형태로 남는 것을 확인 하였으며, nCas9-D10A를 처리하였을 때 대부분 한쪽 가닥이 절단되어 오픈 원형 (open circular) 형태로 남아있는 것을 확인하였다. 그러나 nCas9-H840A를 사용하였을 때 선형 (linear) 형태의 플라스미드가 nCas9-D10A를 처리한 때보다 더 많이 나타나는 것을 확인하였다. 이를 ImageJ software를 이용하여 밴드들의 강도 (intensity)를 측정하고 상대적 선형 밴드 강도 (linear band intensity)값을 얻은 결과, nCas9-D10A는 16.0%, nCas9-H840A는 43.3%로 각각 관찰되었다.
도 2는 Cas9 변이체 제작 및 이를 이용하여 도입될 수 있는 원하지 않는 삽입/결실 (indel : insertion and deletion) 효율을 확인한 결과를 나타낸 것이다.
(a) SpCas9의 뉴클레아제 도메인 (nuclease domain)으로는 HNH 도메인과 RuvC 도메인이 존재하는데, 이들은 각각 타겟 DNA와 비타겟 DNA (non-target DNA)를 자른다. Cas9의 HNH 도메인 또는 RuvC 도메인에 변이를 도입하면 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈로 제작할 수 있다. Cas9 니케이즈는 주로 RuvC 도메인에 D10A 변이를 도입한 형태나 HNH 도메인에 H840A 또는 N863A 변이를 도입한 형태를 사용한다. 이 연구에서는 HNH 도메인 내에서 DNA 절단에 관여하는 D839, H840, N854, N863 위치에 변이를 도입하여 완전하게 비타겟 가닥 (non-target strand) 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈를 만들고자 하였다.
(b) 세포 내에서 니케이즈 Cas9 (nCas9)에 의해 도입될 수 있는 원치 않는 indel (insertion and deletion) 효율을 확인하기 위하여, HEK293T 세포에 nCas9과 다양한 유전자를 타겟으로하는 sgRNA를 발현하는 플라스미드를 함께 전달하였다. 그 후 세포의 DNA를 분리하여 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 확인한 결과, 기존에 주로 사용하던 형태인 HNHv1(Cas9-H840A)에 의해 0.035~15% (평균 2.5%)의 indel이 나타나는 것을 확인하였다. 이를 줄이기 위하여 Cas9 HNH 도메인 내에 D839A, H840A, N854A, N863A 조합의 변이를 갖는 Cas9 변이체를 제작하였고, 이를 사용한 결과 다양한 변이체(HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), HNHv14(H840A/N863A/D839A/N854A)) 에서 원치 않는 indel 효율이 평균 1% 이하로 감소하는 것을 확인할 수 있었다.
(c) 앞선 실험에서 원치 않는 indel 효율의 감소한 Cas9 변이체가 1) Cas9이 한쪽 가닥만을 정확하게 자르는 니케이즈 형태가 되어서 인지, 혹은 2) Cas9 자체의 활성을 잃고 양쪽 가닥을 모두 못 자르는 효소적으로 불활성인 Cas9 (catalytically dead Cas9) 형태가 되어서 인지를 확인하기 위하여 이중 니킹 (double nicking) 실험(서로 다른 strand를 자르는 두 개의 sgRNA를 사용한 실험)을 진행하였다. 만약 1)의 경우라면 sgRNA-A나 sgRNA-1을 각각 처리하였을 때에는 indel 이 관찰되지 않고, sgRNA-A와 sgRNA-1을 동시에 처리한 경우에는 양쪽가닥(DNA double strand break)이 잘리게 되어 indel이 관찰되게 될 것이다. 만약 2)의 경우라면, sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 indel이 관찰되지 않을 것이다. 이를 실험적으로 2개의 타겟 사이트 (target site)에 대해서 확인해본 결과, HNHv7, HNHv11, HNHv12, HNHv14는 sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 1% 이하의 indel이 관찰되어 Cas9의 활성을 거의 잃은 효소적으로 불활성인 Cas9 (catalytically dead Cas9)임을 확인할 수 있었다. 반면, HNHv5, HNHv9, HNHv13의 경우, 각각의 sgRNA-A나 sgRNA-1만 처리했을 때에는 1% 이하의 indel이 관찰되지만 sgRNA-A와 sgRNA-1을 동시에 처리한 경우 1% 이상의 indel이 관찰되어, 한쪽 가닥을 자르는 Cas9 니케이즈 형태임을 확인할 수 있었다.
도 3은 in vitro 시험에서 절단 패턴 (cleavage pattern)의 변화 결과를 확인한 것이다.
(a) nCas9-H840A와 nCas9-H840A/N863A를 각각 분리된 HAP1 세포의 gDNA에 처리하여 WGS을 통해 절단 패턴의 변화를 관찰하였다. 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)를 타겟하여 확인해 본 결과, nCas9-H840A는 모두 일부 이중 가닥 (partial double strand) 절단을 일으키는 반면, nCas9-H840A/N863A를 처리하였을 때 원하는 비타겟 가닥(non-target strand)에서만 절단이 일어나는 패턴의 변화를 확인 할 수 있었다. (b) 다이게놈 시퀀싱 (Digenome sequencing)을 통한 전체 게놈 (whole genome)에서의 패턴 변화. 다이게놈 시퀀싱 (Digenome sequencing)은 전체 유전자에서 이중 가닥 절단 (double strand break)을 찾아낼 수 있는 방법 중 하나이다. 이를 통해 전체 유전자에서 나타나는 이중 가닥 절단 의 패턴을 비교하여 circos plot을 통해 나타내었다. 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)에 nCas9-H840A를 처리하였을 때, 표적 사이트와 오프 타겟 (off-target) 사이트에 이중 가닥 절단들이 관찰 되었다. 반면 nCas9-H840A/N863A를 처리하였을 때, 표적 사이트에서 이중 가닥 절단을 확인 할 수 없었고, 표적사이트를 제외한 오프 타겟 사이트들에서도 이중 가닥 절단이 사라지거나 그 비율이 현저히 줄어드는 것을 확인 할 수 있었다. 이를 통해 in vitro 실험 결과에서도 도 1과 마찬가지로 Cas0-H840A/N863A은 DNA의 한쪽 가닥만 자를 수 있는 니케이즈 (nickase) Cas9 형태임을 확인하였다.
도 4는 본 발명에 따른 프라임 에디터 단백질을 통한 유전자 교정 및 indel 효율을 확인한 결과를 나타낸 것이다.
nCas9과 MMLV 역전사효소로 구성된 PE (Prime Editor)를 도입하고자 하는 돌연변이를 유도할 수 있는 pegRNA와 함께 세포에 전달하고, DNA를 targeted deep-sequencing 방법으로 분석하여 (a) 의도한 유전자 교정의 효율(correct editing)와 (b) 의도치 않은 indel 효율 (unwanted indel activity)을 측정하였다. 나타낸 값은 모두 기존 형태인 PEv1(PE-H840A)의 값을 1로 두어 normalization 하였고, 의도한 유전자 교정의 효율이 1보다 높으면 분홍색, 1보다 낮으면 초록색 / 의도치 않은 indel 효율이 1보다 높으면 빨간색, 1보다 낮으면 파란색으로 표시하였다. (c, d) 정규화 (normalization) 하지 않은 NGS 데이터값.
(a, c) 도 1에서 사용했던 Cas9 변이체 형태를 그대로 활용하여 PE 형태로 제작하여 실험하였을 때, 기존의 PE-HNHv1(PE2-H840A)와 비교하여 PE-HNHv2, PE-HNHv3, PE-HNHv5, PE-HNHv6, PE-HNHv8, PE-HNHv10의 경우, 정확한 편집 (correct editing) 효율이 유지되는 것을 볼 수 있다. (의도한 교정 효율은 감소하지 않는 것이 좋으므로 도 4a의 값이 초록색이 아니여야 한다.)
(b, d) PE-HNHv1에 의한 도입되는 의도치 않은 indel 효율이 PE-HNHv5, PE-HNHv7, PE-HNHv9, PE-HNHv11, PE-HNHv12, PE-HNHv13, PE-HNHv14를 사용하면 절반 이하로 줄어드는 것을 확인할 수 있다. (의도치 않은 indel의 효율은 감소하는 것이 좋으므로 도 4b의 값이 파란색일수록 좋다.)
이를 통해 HNH 도메인에 변이를 도입한 PE의 HNH 도메인 변이체들 중 PE-HNHv5 (PE2-H840A/N863A)를 사용하면 기존 형태인 PE-HNHv1(PE2-H840A) 보다 원치 않는 indel의 발생 빈도를 줄어들고, 원하는 유전체 교정 효율은 유지함을 확인하였다. 또한, Cas9 뉴클레아제 형태 (기존에 있던 H840A 변이를 없앤 형태)로 구성된 PE2-Cas9-WT를 이용했을 때에도 평균 13.0%의 원하는 유전체 교정 효율을 얻을 수 있었고, PE의 효율이 아주 낮은 타겟에서는 간혹 Cas9 뉴클레아제를 사용했을 때 정확한 교정 (correct editing) 효율이 향상되는 것을 확인할 수 있었다 (도 4a. 에서 PE-Cas9-WT 부분에서 관찰되는 분홍색).
도 5는 추가 아미노산 잔기 결실을 포함하는 Cas9 변이체를 통한 유전자 교정 및 indel 효율을 확인한 결과를 나타낸 것이다.
(a) 의도치 않은 indel 돌연변이를 더 줄이기 위하여 Cas9의 HNH 도메인의 일부를 삭제한 후 다양한 길이의 링커 (아미노산 서열: AS, GGGGS, GGGGSGGGGS) 로 연결시킨 HNH 결실 변이 (HNH deletion variant : HNHΔ1-12) 들을 제작하였다.
(b) Cas9에 HNH 결실을 도입한 다양한 HNH 결실 변이 (HNHΔ1~12)들에 도입되는 indel 효율을 세가지 서로 다른 타겟 사이트 (target site)에서 측정하였다. 기존의 Cas9-H840A, 그리고 앞선 실험에서 발견한 Cas9-HNHv5 (Cas9-H840A/N863A)보다 Cas9-HNHΔ1~12는 훨씬 더 낮은 효율로 indel을 도입함을 확인하였다.
(c) 다양한 HNH deletion variant (HNHΔ1~12)를 사용하여 PE 변형체를 제작해보았고, 이를 세포에 처리한 후 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 의도한 유전체 교정 효율을 측정하였다. 그 결과, 기존 PE 또는 PE-HNHv5와 비교하여 PE-HNHΔ4~9 형태에서 비슷하거나 절반 정도의 효율로 원하는 교정 효율이 잘 일어남을 확인하였다.
(d) PE-HNH 결실 변이 (HNHΔ1~12)들에 의해 도입될 수 있는 원치 않는 indel의 빈도를 측정하였다. PE-HNHΔ4~9 형태에서는 의도치 않은 indel이 확연히 줄어드는 것을 확인하였다. 그리고 이는 앞선 HNH 포인트 뮤테이션 변이체 (point mutation variant : HNHv1~14)를 사용했을 때 보다도 개선됨을 확인하였다. 이를 통해 Cas9의 792~897 아미노산 부분 또는 786~885 아미노산 부분이 없는 PE를 사용하면 원치 않는 indel의 도입은 줄이고 의도했던 유전자 교정을 잘 일으킬 수 있음을 확인하였다. 결과적으로Cas9 서열의 100 아미노산 정도가 삭제되어도 PE로의 유전자 교정 기능을 잘 수행할 수 있으며, Cas9 및 PE의 단백질의 크기 또한 더 작아지는 이점이 있다.
도 6은 야생형 Cas9과 Cas9 변이체의 서열 비교 결과를 나타낸 것이다.
발명을 실시하기 위한 구체적인 내용
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
PE를 구성하는 H840A Cas9 니케이즈가 완전한 니케이즈가 아니여서 의도치 않은 indel 변이가 도입되는 문제점을 개선하고자, Cas9의 HNH 도메인 부분을 다양하게 변형시킨 변형체를 제작하였다. HNH 도메인 내에 포인트 뮤테이션 (point mutation)을 도입한 ‘포인트 뮤테이션 변이체 (point mutation variant)’와 HNH 도메인 일부를 삭제한 ‘결실 뮤테이션 변이체 (deletion mutation variant)’로 만들어진 다양한 Cas9 변형체들과 PE 변형체들의 의도치 않은 indel 도입 효율과 의도한 정확한 교정 (correct-editing)의 효율을 측정한 결과, 특정 변형체 (HNHv5(H840A/N863A), HNHΔ4~6(Δ792-897), HNH7~9(Δ786-885))를 사용하면 원치 않는 indel의 도입없이 의도한 유전자 교정을 유도할 수 있음을 확인하였다. 이를 활용한다면 의도하지 않은 돌연변이의 도입 없이, 정확하게 유전자 교정을 유도할 수 있으며, 더욱이 결실 변이체 (deletion variant)는 단백질의 크기를 100 아미노산 가량 줄일 수 있는 장점이 있다.
본 발명에 따른 구체적 실시예에서, Cas9 뉴클레아제 (Cas9 WT) 형태로 구성된 프라임 에디터 단백질 (prime editor protein)을 이용하여서도 프라임 에디팅 (Prime Editing)을 일으킬 수 있다.
또한, Cas9의 HNH 도메인에 다양한 변이를 도입하여 불완전한 니케이즈 (비타겟 가닥 (non-target strand)과 일부 타겟 가닥 (target-strand)을 자름)를 비타겟 가닥만을 자르는 니케이즈 형태로 만들 수 있었다. 또한, Cas9 니케이즈를 구성요소로 갖는 프라임 에디터 단백질 (prime editor protein)을 사용하는 프라임 에디팅 (Prime Editing) 방법에서도 비타겟 가닥 (non-target strand)만을 자르는 Cas9 니케이즈 변이체들을 (HNHv5(H840A/N863A), HNHΔ4~6(Δ792-897), HNH7~9(Δ786-885))를 사용하면 의도치 않은 indel이 도입되는 문제점을 개선할 수 있고, 원하는 유전자 교정을 정확하게 유도할 수 있다. 특히 결실 변이체 (deletion variant: HNHΔ4~6(Δ792-897), HNH7~9(Δ786-885)) 의 경우, Cas9 단백질의 크기가 100 아미노산 가량 줄어들어도 잘 작동한다는 강점이 있다. 크기의 제한이 있는 AAV (Adeno-associated virus) 벡터를 활용하게 된다면, 작은 크기이면서 의도하지 않은 indel을 줄여주는 결실 (deletion) 변형체를 사용하는 것이 훨씬 유리하다.
이를 바탕으로, 본 발명은 일 관점에서 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체 또는 이를 코딩하는 핵산에 관한 것이다.
본 발명은 다른 관점에서, 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 아미노산 잔기가 결실된 뉴클레아제 변이체 또는 이를 코딩하는 핵산에 관한 것이다.
구체적으로, 본 발명은 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산을 포함할 수 있다:
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
본 발명은 더욱이, (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물에 관한 것이다.
상기 뉴클레아제는 표적 특이적으로, 예를 들어, ZNFN (zinc finger nuclease), TALEN(transcriptional activator-like effector nuclease) 또는 Cas 단백질일 수 있으나, 이에 제한되는 것은 아니다. 상기 Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, Cas12j, Cas13a, Cas13b, Cas13c, Cas13d, Cas14, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, CsMT2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3 또는 Csf4의 엔도뉴클레아제, 특히 Cas9일 수 있으나, 이에 제한되는 것은 아니다.
상기 Cas 단백질은 Cas 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 니케이즈를 형성할 수 있는 단백질이다. 상기 Cas 단백질은 예를 들어, 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 피리팩터(Filifactor), 유박테리움(Eubacterium), 스트렙토코커스(Streptococcus: Streptococcus pyogenes), 락토바실러스(Lactobacillus), 미코플라즈마(Mycoplasma), 박터로이드(Bacteroides), 플라비플라비이볼라(Flaviivola), 플라보박테리움(Flavobacterium), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 나이세리아(Neisseria), 로세부리아(Roseburia), 파비바큐럼(Parvibaculum), 스타필로코커스(Staphylococcus: Staphylococcus aureus), 니트라티프랙터(Nitratifractor), 코리네박터리움(Corynebacterium) 및 캠필로박터(Campylobacter)로 이루어지는 군으로부터 선택되는 Cas 단백질의 오소로그(ortholog)를 포함하는 미생물 속으로부터 유래하고, 이들로부터 단순 분리된 것 또는 재조합된 것일 수 있다.
상기 Cas9은 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 서열을 확인할 수 있다. 상기 Cas9은 예를 들어, 서열번호 1의 아미노산 서열을 포함할 수 있다.
상기 표적 특이적 뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것(non-naturally occurring)일 수 있다. 일 실시예에서, 상기 표적 특이적 뉴클레아제 (예컨대, Cas9, Cpf1, 등)은 재조합 DNA에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN(Recombinant DNA; rDNA)는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 뉴클레아제를 생산 (in vivo 또는 in vitro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 암호화 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 핵산 서열을 갖는 것일 수 있다.
상기 뉴클레아제 변이체는 변이된 형태의 변이 표적 특이적 뉴클레아제일 수 있다. 상기 변이 표적 특이적 뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니케이즈 활성을 가지도록 변이될 수 있다. 상기 니케이즈를 통해 두 가닥 중 어느 한 가닥에 닉 (nick)이 도입될 수 있다.
상기 뉴클레아제 변이체는 예를 들어, Cas9의 변이체일 수 있다. 상기 Cas9의 뉴클레아제 도메인은 HNH 도메인과 RuvC 도메인이 존재하는데, 이들은 각각 타겟 DNA와 비타겟 DNA를 자를 수 있다. Cas9의 HNH 도메인 또는 RuvC 도메인에 변이를 도입하면 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈로 제작할 수 있다.
하나의 실시예에서, 상기 뉴클레아제 변이체는 Cas9의 아미노산 서열인 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환될 수 있다.
이를 바탕으로, 본 발명은 또 다른 관점에서, 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체에 관한 것이다.
구체적으로, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 변이를 포함할 수 있다:
서열번호 1의 서열 중 D839이 알라닌으로 치환;
서열번호 1의 서열 중 H840이 알라닌으로 치환;
서열번호 1의 서열 중 N854가 알라닌으로 치환; 및
서열번호 1의 서열 중 N863이 알라닌으로 치환.
본 발명에 따른 구체적 실시예에서, Cas9의 HNH 도메인에 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산을 다른 아미노산으로 치환시킨 Cas9 변이체를 제작하였다. 상기 Cas9 변이체는 HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), 또는 HNHv14(H840A/N863A/D839A/N854A))로 표시되었다. HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), 또는 HNHv14(H840A/N863A/D839A/N854A))의 Cas9 변이체를 사용하는 경우, 원치 않는 indel 효율이 평균 1% 이하로 감소하는 것을 확인할 수 있었다.
본 발명에 따른 구체적 실시예에서, 서열번호 2 내지 15로 구성된 군에서 선택되는 서열을 포함하는 뉴클레아제 변이체를 포함할 수 있다.
Figure PCTKR2021005031-appb-I000001
특히, HNH 도메인 변이를 도입한 프라임 에디터 단백질의 HNH 도메인 변이체 중 PE-HNHv5 (PE2-H840A/N863A)를 사용하면, 종래 공지된 PE-HNHv1(PE2-H840A) 보다 원치 않는 indel의 발생 빈도를 줄어들고, 원하는 유전체 교정 효율은 유지함을 확인하였다.
또한, 상기 Cas9 뉴클레아제 형태, 예를 들어 종래 공지된 H840A 변이를 없앤 형태)로 구성된 PE2-Cas9-WT를 이용했을 때에도 원하는 유전체 교정 효율을 얻을 수 있었고, PE의 효율이 아주 낮은 타겟에서는 정확한 교정 (correct editing) 효율이 향상되는 것을 확인할 수 있었다.
다른 관점에서, 상기 뉴클레아제 변이체는 뉴클레아제 아미노산 잔기의 결실을 포함할 수 있다. 상기 뉴클레아제 변이체는 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실을 포함한다. 구체적으로, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함할 수 있다:
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
구체적으로, 상기 뉴클레아제 변이체는 Cas9의 HNH 도메인에서의 결실 예를 들어, 824 내지 874 위치의 아미노산 결실 (HNHΔ1, HNHΔ2 및 HNHΔ3), 792 내지 897 위치의 아미노산 결실 (HNHΔ4, HNHΔ5 및 HNHΔ6), 786 내지 885 위치의 아미노산 결실 (HNHΔ7, HNHΔ8 및 HNHΔ9), 또는 765 내지 908 위치 (HNHΔ10, HNHΔ11 및 HNHΔ12)의 아미노산 결실을 포함할 수 있다.
Figure PCTKR2021005031-appb-I000002
위에 따른, 다양한 HNH 도메인 결실 변이체 (deletion variant : HNHΔ1~12)를 사용하여 프라임 에디터 단백질 변형체를 제작해 보았고, 이를 세포에 처리한 후 유전체 교정 효율을 측정한 결과, 종래 프라임 에디터 단백질 PE 또는 PE-HNHv5와 비교하여 PE-HNHΔ4~9 형태에서 비슷하거나 절반 정도의 효율로 원하는 교정 효율이 잘 일어남을 확인하였다. 다만, PE-HNHΔ4~9 형태에서는 의도치 않은 indel이 확연히 줄어드는 것을 확인하였다.
경우에 따라서, 상기 결실된 위치 예를 들어, 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 824 내지 874 위치, 792 내지 897 위치, 786 내지 885 위치 또는 765 내지 908 위치의 아미노산 결실을 대신하여, 823 위치의 아미노산 C-말단, 791 위치의 아미노산 C-말단, 785 위치의 아미노산 C-말단, 또는 764 위치의 아미노산 C-말단에 펩타이드 링커를 추가로 포함할 수 있다.
상기 펩타이드 링커는 약 2-25aa 길이를 가질 수 있다. 예를 들어, 알라닌, 글리신 및/또는 세린과 같은 아미노산이 포함될 수 있으나, 이에 제한되는 것은 아니다.
상기 링커는 예를 들어, (AnS)m (n, m은 각각 1 내지 10), (GS)n, (GGS)n, (GSGGS)n 또는 (GnS)m (n, m은 각각 1 내지 10)을 포함할 수 있으나, 상기 링커는 예를 들어 (AnS)m 또는 (GnS)m (n, m은 각각 1 내지 10)일 수 있다. 구체적으로, 상기 링커는 (AnS)m에서 n=1, m=1, 또는 (GnS)m에서 n=4이고, m은 1 또는 2인 G4S 또는 (G4S)2일 수 있다.
상기 프라임 에디팅 가이드 RNA는 교정 서열을 포함하고, 역전사 효소 주형 (template)으로 기능한다. 상기 역전사 효소(RT)는 역전사 효소 주형을 이용하여 DNA 가닥(즉, 상보적 DNA, cDNA)을 합성할 수 있는 RNA-의존적 DNA 폴리머라아제이다. 상기 역전사 효소는 예를 들어, M-MLV(Moloney murine leukemia virus) 역전사 효소 또는 이의 변이체, 예를 들어 RNase H 활성이 결여된 M-MLV-RT, 또는 M-MLV 변이체 (D200N, T306K, W313F, T330P, L603W), BLV(bovine leukemia virus) RT 또는 이의 변이체, RSV(Rous sarcoma virus) RT 또는 이의 변이체, 또는 AMV(Avian Myeloblastosis Virus) RT 또는 이의 변이체를 포함할 수 있으나, 이에 제한되는 것은 아니다.
구체적으로, 상기 역전사 효소는 M-MLV (Moloney Murine Leukemia Virus) 유래의 M-MLV 역전사 효소 또는 이의 변이체일 수 있고, 예를 들어 서열번호 29의 서열을 포함하는 M-MLV 변이체 (D200N, T306K, W313F, T330P, L603W)일 수 있다.
상기 뉴클레아제 또는 이의 변이체와 역전사 효소는 개별적으로 각각의 뉴클레아제 또는 이의 변이체와 역전사 효소를 포함할 수 있고, 뉴클레아제 또는 이의 변이체와 역전사 효소의 융합단백질 형태로 포함될 수 있다.
상기 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA) 또는 이를 코딩하는 DNA는 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함한다.
상기 교정 서열을 포함하는 서열은 역전사 효소 주형 (template)으로 작용한다. 상기 역전사 효소 주형은 목적하는 교정 서열을 포함하고, 게놈 DNA 로커스에 상동성을 가진다. 상기 교정 서열은 이종성 (heterologous) 서열로, 게놈에서 교정하고자 하는 대상 서열을 포함한다.
상기 결합 영역은 역전사 효소 주형의 5’ 방향 또는 3’ 방향에 임의로 위치할 수 있고, 구체적으로 결합 영역은 역전사 효소 주형의 3’ 방향에 위치할 수 있다.
상기 결합 영역은 프라임 에디터 단백질에 포함된 뉴클레아제 또는 이의 변이체 예를 들어 니케이즈에 의해 닉이 생긴 게놈 DNA 가닥에 상보적인 서열을 포함할 수 있다. 상기 결합 영역이 타겟 사이트 (target site)에 혼성화하여, 역전사 효소의 활성 개시점으로 작용할 타겟 사이트 수 있다.
상기 결합 영역은 타겟 사이트의 서열과 80% 이상, 예를 들어 85% 이상, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 100%의 상동성을 가지는 5 이상, 6 이상, 7 이상, 8 이상, 9 이상, 10 이상, 11 이상, 12 이상, 13 이상, 14 이상, 15 이상, 20 이상, 25 이상의 뉴클레오티드를 포함할 수 있다.
본 발명에 따른 조성물은 (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하며, (1) 및 (2)를 전달하기 위해 단일 또는 복수의 전달 수단을 동일 또는 상이한 구성으로 조합하여 사용할 수 있다.
상기 (1)은 제1전달 수단에 포함되고, (2)는 제2전달 수단에 포함될 수 있고, 각각의 전달 시스템은 동시에 바이러스 전달수단이거나, 하나는 바이러스 전달수단이고 다른 하나는 비-바이러스 전달수단이거나, 동시에 비-바이러스 전달수단일 수 있다.
상기 핵산은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다. 상기 프라임 에디팅 가이드 RNA는 가이드 RNA의 RNA 서열 또는 이를 코딩하는 DNA 서열을 포함할 수 있다.
상기 (1)의 프라임 에디터 단백질을 코딩하는 DNA 서열 및 (2)의 프라임 에디팅 가이드 RNA를 코딩하는 DNA 서열이 벡터와 같은 전달 수단을 통해 제공될 수 있다. 상기 (1)을 코딩하는 DNA 서열 및 (2)를 코딩하는 DNA 서열을 동일한 벡터 상에 위치하도록 하여 하나의 벡터를 통해 동시에 전달할 수 있다. 상기 (1)의 프라임 에디터 단백질을 코딩하는 DNA 서열 및 (2)의 프라임 에디팅 가이드 RNA를 코딩하는 DNA 서열을 별개의 다른 벡터상에 위치하도록 하여 전달할 수 있다.
본 발명에 따른 조성물은 바이러스 벡터 예를 들어, Adeno-Associated Viral Vector (AAV), Adenoviral Vector (AdV), Lentiviral Vector (LV) 또는 Retroviral Vector (RV), 이외 기타 바이러스 벡터, 예를 들어, Simian virus 40 (SV40) ori, bovine papilloma virus (BPV) ori 또는 Epstein-Barr nuclear antigen (EBV) ori를 포함하는 에피좀 벡터를 사용하여 전달할 수 있다.
상기 벡터는 각각 국소주입법 (예컨대, 병변 또는 표적 부위 직접 주입), 전기천공법 (electroporation), 리포펙션, 바이러스 벡터, 나노파티클 (nanoparticles) 뿐만 아니라, PTD (Protein translocation domain) 융합 단백질 방법 등을 통해 생체 내 또는 세포 내로 전달될 수 있다.
경우에 따라서, (2)의 프라임 에디팅 가이드를 코딩하는 DNA 서열은 벡터를 통해 전달될 수 있다. 상기 (1)의 프라임 에디터 단백질 또는 이를 코딩하는 RNA 서열을 mRNA 형태로 전달할 수 있다. 상기 프라임 에디터 단백질 또는 mRNA는 직접 전달되거나, 캐리어를 통해 전달될 수 있다.
또한, 상기 (1)의 프라임 에디터 단백질을 코딩하는 RNA 서열 및 (2)의 프라임 에디팅 가이드 RNA 서열을 포함할 수 있다. 상기 (1)을 코딩하는 mRNA 및 (2)의 mRNA 형태로 전달할 수 있다. 상기 mRNA는 직접 전달되거나, 캐리어를 통해 전달될 수 있다.
더욱이, 상기 (1)의 프라임 에디터 단백질 및 (2) 프라임 에디팅 가이드 RNA의 mRNA가 조립된 RNP (ribonucleoprotein) 복합체를 형성하도록 하여 전달할 수 있다. 상기 RNP는 직접 전달되거나, 캐리어를 통해 전달될 수 있다.
상기 RNP 복합체는 미세주입법 (microinjection), 전기천공법 (electroporation), DEAE-덱스트란 처리, 리포펙션 (lipofection), 나노파티클-매개 형질주입, 단백질 전달 도메인 매개 도입, 및 PEG-매개 형질주입 등과 같은 당업계의 다양한 방법에 의해 세포로 전달될 수 있지만, 이에 제한되는 것은 아니다.
상기 RNP 복합체는 공동-형질주입 또는 단계적-형질주입 형태로 수행될 수 있다. 공동-형질주입은 (1)의 프라임 에디터 단백질 및 (2) 프라임 에디팅 가이드 RNA를 동시에, 단계적-형질주입은 (1)의 프라임 에디터 단백질을 먼저 형질주입한 다음, (2) 프라임 에디팅 가이드 RNA를 두 번째 형질주입하여 수행되는 것일 수 있으나, 이에 제한되지 않는다.
RNP는 생체 내에서 통상적으로 72시간 내에 분해 되므로 계속적으로 남아 독성 및 비표적 교정을 일으킬 가능성이 낮으므로 유전자치료에 사용할 때 이점이 있다. PE를 RNP가 아닌 플라스미드 DNA 형태로 진핵세포에 도입할 수도 있으나, 이 경우 플라스미드 조각이 유전체에 삽입될 수 있다. 특히, 식물세포 유전자 교정의 경우 RNP 방식은 DNA 방식과는 달리 GMO 규제를 받지 않을 가능성이 있다.
상기 캐리어는 예를 들어, 세포 투과성 펩타이드(CPP), 나노입자, 또는 중합체를 포함할 수 있으나, 이에 제한되는 것은 아니다. CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩타이드이다. 카고는 (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA를 포함할 수 있다. 상기 (1)의 프라임 에디터 단백질 또는 이를 코딩하는 핵산은 공유 결합을 통한 화학적 결합 또는 비-공유 상호작용을 통해 조립될 수 있다. 상기 (2) 프라임 에디팅 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드는 CPP와 복합체화되어, 축합된 양으로 하전된 입자를 형성한다.
상기 나노입자와 관련하여, 본 발명에 따른 조성물은 고분자 나노입자, 금속 나노입자, 금속/무기 나노입자 또는 지질 나노입자를 통해 전달될 수 있다. 상기 고분자 나노입자는 예를 들어, 롤링 써클 증폭에 의해 합성된 DNA nanoclew, 실 유사 DNA 나노입자일 수 있다. DNA nanoclew, 실 유사 DNA 나노입자에 (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA를 로딩하고, 엔도좀 탈출능을 향상시키기 위해 PEI를 코팅하였다. 이러한 복합체가 세포막에 결합하여, 내재화된 다음 엔도좀 탈출을 통해 핵으로 이동하여, (1) 및 (2)가 동시에 전달되도록 할 수 있다.
상기 금속 나노입자와 관련하여, (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA에 금입자를 연결시키고 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)와 복합체를 형성하여 세포에 전달할 수 있다. 상기 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)는 예를 들어, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2-{(2-aminoethyl)amino}-ethyl-aspartamide] (pAsp(DET)), poly(ethylene glycol) (PEG)와 poly(arginine)의 block co-polymer, PEG와 poly(lysine)의 block co-polymer, 또는 PEG와 poly{N-[N-(2-aminoethyl)-2-aminoethyl]aspartamide} (PEG-pAsp(DET))의 block co-polymer일 수 있다.
상기 금속/무기 나노입자와 관련하여, 예를 들어 ZIF-8 (zeolitic imidazolate framework-8)를 통해 (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA를 캡슐화할 수 있으며, 음으로 하전된 RNP를 양으로 하전된 nanoscale ZIF로 캡슐화할 수 있다. 효율적 엔도좀 탈출을 통해 목적하는 타겟 유전자의 발현을 변경시킬 수 있다.
음이온을 띠는(negatively charged) (1) 및 (2)를 코딩하는 DNA 또는 핵산은 양이온을 띠는(cationic) 물질들과 결합하여 나노입자 (nanoparticles)를 형성할 수 있고, 이는 세포로 수용체 매개 엔도사이토시스 (receptor-mediated endocytosis) 혹은 파고사이토시스 (phagocytosis) 등을 통해 침투할 수 있다. (1) 및 (2)의 RNP 복합체가 양이온성 중합체에 결합될 수 있다. 양이온성 중합체로 폴리알릴아민 (PAH); 폴리에틸렌이민 (PEI); 폴리(L-리신) (PLL); 폴리(L-아르기닌) (PLA); 폴리비닐아민 단일- 또는 공중합체; 폴리(비닐벤질-트리-C1-C4-알킬암모늄염); 지방족 또는 방향지방족 디할로겐화물 및 지방족 N,N,N',N'-테트라-C1-C4-알킬-알킬렌디아민의 중합체; 폴리(비닐피리딘) 또는 폴리(비닐피리디늄염); 폴리(N,N-디알릴-N,N-디-C1-C4-알킬-암모늄할로겐화물); 4차화된 디-C1-C4-알킬-아미노에틸 아크릴레이트 또는 메타크릴레이트의 단일- 또는 공중합체; 폴리쿠아드(POLYQUAD)™; 폴리아미노아미드 등이 포함될 수 있다.
양이온성 지질로 양이온성 리포솜 제제를 포함할 수 있다. 리포솜의 지질 이중층은 캡슐화된 핵산을 분해로부터 보호하며, 핵산에 결합할 수 있는 항체에 의한 특이적 중화를 방지할 수 있다. 엔도좀 성숙 동안 엔도좀 멤브레인과 리포좀이 융합되어, 양이온성 지질-핵산절단효소의 효율적인 엔도좀 탈출이 가능하다. 양이온성 지질로 폴리에틸렌이민, 폴리아미도아민 (PAMAM) 성화 수지상체, 리포펙틴 (DOTMA와 DOPE의 조합), 리포펙타제, 리포펙타민(LIPOFECTAMINE)® (예컨대 리포펙타민® 2000, 리포펙타민® 3000, 리포펙타민® RNAiMAX, 리포펙타민® LTX), 세인트-레드(SAINT-RED) (시노볼룩스 세라퓨틱스(Synvolux Therapeutics)사, 네덜란드 그로닝겐 소재), DOPE, 시토펙틴 (길레드 사이언시즈(Gilead Sciences) 사, 캘리포니아 포스터 시티 소재), 및 유펙틴 (JBL사, 캘리포니아 산 루이스 오비스포 소재)가 포함될 수 있다. 대표적인 양이온성 리포솜은 N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 클로라이드 (DOTMA), N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 메틸술페이트 (DOTAP), 3β-[N-(N',N'-디메틸아미노에탄)카르바모일]콜레스테롤 (DC-Chol), 2,3-디올레일옥시-N-[2(스페르민카르복스아미도)에틸]-N,N-디메틸-1-프로판아미늄 트리플루오로아세테이트 (DOSPA), 1,2-디미리스틸옥시프로필-3-디메틸-히드록시에틸 암모늄 브로마이드; 또는 디메틸디옥타데실암모늄 브로마이드 (DDAB)으로부터 제조될 수 있다.
지질 나노입자와 관련하여, 캐리어로 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀 제형은 주로 천연 인지질 및 지질, 예컨대 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 포스파티딜콜린 또는 모노시알로강글리오사이드 등을 포함할 수 있다. 경우에 따라서, 혈장 내 불안정성을 해소하기 위하여, 지질막에 콜레스테롤 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)을 추가할 수 있다. 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다.
본 발명은 다른 관점에서, 상기 조성물을 세포에 처리하는 단계를 포함하는 유전체 교정 방법에 관한 것이다.
상기 세포는 진핵 세포 (예컨대, 효모 등의 균류, 진핵 동물 및 /또는 진핵 식물 유래 세포 (예컨대, 배아세포, 줄기세포, 체세포, 생식세포 등) 등), 진핵 동물 (예컨대, 인간, 원숭이 둥의 영장류 개, 돼지, 소, 양, 염소, 마우스,래트 등), 또는 진핵 식물 (예컨대, 녹조류 등의 조류,옥수수, 콩,밀, 벼 등)일 수 있으나, 이에 제한되는 것은 아니다.
실시예
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1. Cas9, nCas9-D10A, nCas9-H840A를 이용한 표적 서열에 대한 절단
표적 서열의 정보와 Cas9, nCas9-D10A, nCas9-H840A를 in vitro 절단 처리하였을 때 예상되는 절단 위치와 (Red arrowhead: 절단 위치, Blue: PAM sequence) 이후 WGS (Whole Genome Sequencing)의 데이터를 IGV로 확인할 때 결과를 예상하고, 도 1a에 나타내었다.
HAP1 세포의 gDNA를 사용하여 Cas9 variants들을 37C에 16시간 동안 처리하고 WGS결과를 확인하였다. 도 1b에 따르면, Cas9, nCas9-D10A는 예상과 동일한 절단 형태를 보였지만, nCas9-H840A의 경우, 예상과는 달리 타겟 가닥에도 부분적 절단이 일어났다.
gDNA에서 진행한 절단 실험을 다시 확인하기 위하여 플라스미드를 사용한 in vitro 절단 실험을 진행하였다. Supercoiled 형태의 플라스미드는 양쪽 가닥이 절단되면 선형 (linear), 한쪽 가닥이 절단 되면 오픈 원형 (open circular)의 형태로 전기 영동에 의하여 크기가 분리된다. 6030bp크기의 플라스미드를 가지고 한쪽 가닥을 절단하는 Nt.BbvCI 효소와 양쪽 가닥을 절단하는 SpeI 효소를 사용하여 각각 오픈 원형 (open circular)과 선형 (linear) 형태의 비교군을 제작하였다. 이 후 Cas9, nCas9-D10A, nCas9-H840A를 처리하여 플라스미드의 형태를 관찰하였다. 도 1c에 따르면, Cas9에서는 대부분의 플라스미드가 양쪽 가닥이 잘려 선형 (linear) 형태로 남는 것을 확인 하였으며, nCas9-D10A를 처리하였을 때 대부분 한쪽 가닥이 절단되어 오픈 원형 (open circular) 형태로 남아있는 것을 확인하였다. 그러나 nCas9-H840A를 사용하였을 때 선형 (linear) 형태의 플라스미드가 nCas9-D10A를 처리한 때보다 더 많이 나타나는 것을 확인하였다. 이를 ImageJ software를 이용하여 밴드들의 강도 (intensity)를 측정하고 상대적 선형 밴드 강도 (linear band intensity)값을 얻은 결과, nCas9-D10A는 16.0%, nCas9-H840A는 43.3%로 각각 관찰되었다.
실시예 2. 삽입/결실 (indel : insertion and deletion) 효율 확인
SpCas9의 뉴클레아제 도메인 (nuclease domain)으로는 HNH 도메인과 RuvC 도메인이 존재하는데, 이들은 각각 타겟 DNA와 비타겟 DNA (non-target DNA)를 자른다. Cas9의 HNH 도메인 또는 RuvC 도메인에 변이를 도입하면 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈로 제작할 수 있다. Cas9 니케이즈는 주로 RuvC 도메인에 D10A 변이를 도입한 형태나 HNH 도메인에 H840A 또는 N863A 변이를 도입한 형태를 사용한다. 도 2a에서와 같이, HNH 도메인 내에서 DNA 절단에 관여하는 D839, H840, N854, N863 위치에 변이를 도입하여 완전하게 비타겟 가닥 (non-target strand) 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈를 만들고자 하였다.
세포 내에서 니케이즈 Cas9 (nCas9)에 의해 도입될 수 있는 원치 않는 indel (insertion and deletion) 효율을 확인하기 위하여, HEK293T 세포에 nCas9과 다양한 유전자를 타겟으로하는 sgRNA를 발현하는 플라스미드를 함께 전달하였다. 그 후 세포의 DNA를 분리하여 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 확인하였다. 도 2b에 따르면 기존에 주로 사용하던 형태인 HNHv1(Cas9-H840A)에 의해 0.035~15% (평균 2.5%)의 indel이 나타나는 것을 확인하였다. 이를 줄이기 위하여 Cas9 HNH 도메인 내에 D839A, H840A, N854A, N863A 조합의 변이를 갖는 Cas9 변이체를 제작하였고, 이를 사용한 결과 다양한 변이체(HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), HNHv14(H840A/N863A/D839A/N854A)) 에서 원치 않는 indel 효율이 평균 1% 이하로 감소하는 것을 확인할 수 있었다.
앞선 실험에서 원치 않는 indel 효율의 감소한 Cas9 변이체가 1) Cas9이 한쪽 가닥만을 정확하게 자르는 니케이즈 형태가 되어서 인지, 혹은 2) Cas9 자체의 활성을 잃고 양쪽 가닥을 모두 못 자르는 효소적으로 불활성인 Cas9 (catalytically dead Cas9) 형태가 되어서 인지를 확인하기 위하여 이중 니킹 (double nicking) 실험(서로 다른 strand를 자르는 두 개의 sgRNA를 사용한 실험)을 진행하였다. 만약 1)의 경우라면 sgRNA-A나 sgRNA-1을 각각 처리하였을 때에는 indel 이 관찰되지 않고, sgRNA-A와 sgRNA-1을 동시에 처리한 경우에는 양쪽가닥(DNA double strand break)이 잘리게 되어 indel이 관찰되게 될 것이다. 만약 2)의 경우라면, sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 indel이 관찰되지 않을 것이다. 도 2c에 따르면, 이를 실험적으로 2개의 타겟 사이트 (target site)에 대해서 확인해본 결과, HNHv7, HNHv11, HNHv12, HNHv14는 sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 1% 이하의 indel이 관찰되어 Cas9의 활성을 거의 잃은 효소적으로 불활성인 Cas9 (catalytically dead Cas9)임을 확인할 수 있었다. 반면, HNHv5, HNHv9, HNHv13의 경우, 각각의 sgRNA-A나 sgRNA-1만 처리했을 때에는 1% 이하의 indel이 관찰되지만 sgRNA-A와 sgRNA-1을 동시에 처리한 경우 1% 이상의 indel이 관찰되어, 한쪽 가닥을 자르는 Cas9 니케이즈 형태임을 확인할 수 있었다.
실시예 3. in vitro 시험에서 절단 패턴 (cleavage pattern) 변화 결과 확인
nCas9-H840A와 nCas9-H840A/N863A를 각각 분리된 HAP1 세포의 gDNA에 처리하여 WGS을 통해 절단 패턴의 변화를 관찰하였다. 도 3a에 따르면, 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)를 타겟하여 확인해 본 결과, nCas9-H840A는 모두 일부 이중 가닥 (partial double strand) 절단을 일으키는 반면, nCas9-H840A/N863A를 처리하였을 때 원하는 비타겟 가닥(non-target strand)에서만 절단이 일어나는 패턴의 변화를 확인 할 수 있었다.
다이게놈 시퀀싱 (Digenome sequencing)을 통한 전체 게놈 (whole genome)에서의 패턴 변화를 확인하였다. 다이게놈 시퀀싱 (Digenome sequencing)은 전체 유전자에서 이중 가닥 절단 (double strand break)을 찾아낼 수 있는 방법 중 하나이다. 이를 통해 전체 유전자에서 나타나는 이중 가닥 절단 의 패턴을 비교하여 circos plot을 통해 나타내었다. 도 3b에 따르면, 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)에 nCas9-H840A를 처리하였을 때, 표적 사이트와 오프 타겟 (off-target) 사이트에 이중 가닥 절단들이 관찰 되었다. 반면 nCas9-H840A/N863A를 처리하였을 때, 표적 사이트에서 이중 가닥 절단을 확인 할 수 없었고, 표적사이트를 제외한 오프 타겟 사이트들에서도 이중 가닥 절단이 사라지거나 그 비율이 현저히 줄어드는 것을 확인 할 수 있었다. 이를 통해 in vitro 실험 결과에서도 도 1과 마찬가지로 Cas0-H840A/N863A은 DNA의 한쪽 가닥만 자를 수 있는 니케이즈 (nickase) Cas9 형태임을 확인하였다.
실시예 4. 유전자 교정 및 indel 효율 확인
nCas9과 MMLV 역전사효소로 구성된 PE (Prime Editor)를 도입하고자 하는 돌연변이를 유도할 수 있는 pegRNA와 함께 세포에 전달하고, DNA를 targeted deep-sequencing 방법으로 분석하여, 그 결과를 도 4에 나타내었다.
도 4a 및 도 4b에 따르면, (a) 의도한 유전자 교정의 효율(correct editing)와 (b) 의도치 않은 indel 효율 (unwanted indel activity)을 측정하였다. (c, d) (a)/(b)에 대하여 정규화 (normalization) 하지 않은 NGS 데이터값을 나타내었다.
나타낸 값은 모두 기존 형태인 PEv1(PE-H840A)의 값을 1로 두어 normalization 하였고, 의도한 유전자 교정의 효율이 1보다 높으면 분홍색, 1보다 낮으면 초록색 / 의도치 않은 indel 효율이 1보다 높으면 빨간색, 1보다 낮으면 파란색으로 표시하였다.
(a, c) 도 1에서 사용했던 Cas9 변이체 형태를 그대로 활용하여 PE 형태로 제작하여 실험하였을 때, 기존의 PE-HNHv1(PE2-H840A)와 비교하여 PE-HNHv2, PE-HNHv3, PE-HNHv5, PE-HNHv6, PE-HNHv8, PE-HNHv10의 경우, 정확한 편집 (correct editing) 효율이 유지되는 것을 볼 수 있다. (의도한 교정 효율은 감소하지 않는 것이 좋으므로 도 4a의 값이 초록색이 아니여야 한다.)
(b, d) PE-HNHv1에 의한 도입되는 의도치 않은 indel 효율이 PE-HNHv5, PE-HNHv7, PE-HNHv9, PE-HNHv11, PE-HNHv12, PE-HNHv13, PE-HNHv14를 사용하면 절반 이하로 줄어드는 것을 확인할 수 있다. (의도치 않은 indel의 효율은 감소하는 것이 좋으므로 도 4b의 값이 파란색일수록 좋다.)
이를 통해 HNH 도메인에 변이를 도입한 PE의 HNH 도메인 변이체들 중 PE-HNHv5 (PE2-H840A/N863A)를 사용하면 기존 형태인 PE-HNHv1(PE2-H840A) 보다 원치 않는 indel의 발생 빈도를 줄어들고, 원하는 유전체 교정 효율은 유지함을 확인하였다. 또한, Cas9 뉴클레아제 형태 (기존에 있던 H840A 변이를 없앤 형태)로 구성된 PE2-Cas9-WT를 이용했을 때에도 평균 13.0%의 원하는 유전체 교정 효율을 얻을 수 있었고, PE의 효율이 아주 낮은 타겟에서는 간혹 Cas9 뉴클레아제를 사용했을 때 정확한 교정 (correct editing) 효율이 향상되는 것을 확인할 수 있었다 (도 4a. 에서 PE-Cas9-WT 부분에서 관찰되는 분홍색).
실시예 5. 결실 변이 포함 Cas9 변이체를 통한 유전자 교정 및 indel 효율 확인
추가 아미노산 잔기 결실을 포함하는 Cas9 변이체를 통한 유전자 교정 및 indel 효율을 확인하였다.
의도치 않은 indel 돌연변이를 더 줄이기 위하여 Cas9의 HNH 도메인의 일부를 삭제한 후 다양한 길이의 링커 (아미노산 서열: AS, GGGGS, GGGGSGGGGS) 로 연결시킨 HNH 결실 변이 (HNH deletion variant : HNHΔ1-12) 들을 제작하였다 (도 5a).
Cas9에 HNH 결실을 도입한 다양한 HNH 결실 변이 (HNHΔ1~12)들에 도입되는 indel 효율을 세가지 서로 다른 타겟 사이트 (target site)에서 측정하였다. 도 5b에 따르면, 기존의 Cas9-H840A, 그리고 앞선 실험에서 발견한 Cas9-HNHv5 (Cas9-H840A/N863A)보다 Cas9-HNHΔ1~12는 훨씬 더 낮은 효율로 indel을 도입함을 확인하였다.
다양한 HNH deletion variant (HNHΔ1~12)를 사용하여 PE 변형체를 제작해보았고, 이를 세포에 처리한 후 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 의도한 유전체 교정 효율을 측정하였다. 도 5c에 따르면, 기존 PE 또는 PE-HNHv5와 비교하여 PE-HNHΔ4~9 형태에서 비슷하거나 절반 정도의 효율로 원하는 교정 효율이 잘 일어남을 확인하였다.
PE-HNH 결실 변이 (HNHΔ1~12)들에 의해 도입될 수 있는 원치 않는 indel의 빈도를 측정하였다. 도 5d에 따르면, PE-HNHΔ4~9 형태에서는 의도치 않은 indel이 확연히 줄어드는 것을 확인하였다. 그리고 이는 앞선 HNH 포인트 뮤테이션 변이체 (point mutation variant : HNHv1~14)를 사용했을 때 보다도 개선됨을 확인하였다. 이를 통해 Cas9의 792~897 아미노산 부분 또는 786~885 아미노산 부분이 없는 PE를 사용하면 원치 않는 indel의 도입은 줄이고 의도했던 유전자 교정을 잘 일으킬 수 있음을 확인하였다. 결과적으로Cas9 서열의 100 아미노산 정도가 삭제되어도 PE로의 유전자 교정 기능을 잘 수행할 수 있으며, Cas9 및 PE의 단백질의 크기 또한 더 작아지는 이점이 있다.
이상으로 본 발명의 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.
전자파일 첨부하였음.

Claims (21)

  1. 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체 또는 이를 코딩하는 핵산.
  2. 제1항에 있어서, 다음으로 구성된 군에서 선택되는 하나 이상의 변이를 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산:
    서열번호 1의 서열 중 D839이 알라닌으로 치환;
    서열번호 1의 서열 중 H840이 알라닌으로 치환;
    서열번호 1의 서열 중 N854가 알라닌으로 치환; 및
    서열번호 1의 서열 중 N863이 알라닌으로 치환.
  3. 제1항에 있어서, 서열번호 2 내지 15로 구성된 군에서 선택되는 서열을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산.
  4. 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산:
    서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;
    서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;
    서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및
    서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
  5. 제4항에 있어서, 서열번호 16 내지 19로 구성된 군에서 선택되는 서열을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산.
  6. (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및
    (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물.
  7. 제6항에 있어서, 상기 뉴클레아제는 Cas9인 조성물.
  8. 제6항에 있어서, 상기 뉴클레아제 변이체는 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 조성물.
  9. 제6항에 있어서, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 변이를 포함하는, 조성물:
    서열번호 1의 서열 중 D839이 알라닌으로 치환;
    서열번호 1의 서열 중 H840이 알라닌으로 치환;
    서열번호 1의 서열 중 N854가 알라닌으로 치환; 및
    서열번호 1의 서열 중 N863이 알라닌으로 치환.
  10. 제6항에 있어서, 서열번호 2 내지 15로 구성된 군에서 선택되는 서열을 포함하는 조성물.
  11. 제6항에 있어서, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는, 조성물:
    서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;
    서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;
    서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및
    서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
  12. 제11항에 있어서, 서열번호 16 내지 19로 구성된 군에서 선택되는 서열을 포함하는 조성물.
  13. 제11항에 있어서, 펩타이드 링커를 추가로 포함하는 조성물.
  14. 제13항에 있어서, 상기 링커는 (AnS)m (n, m은 각각 1 내지 10), (GS)n, (GGS)n, (GSGGS)n 또는 (GnS)m (n, m은 각각 1 내지 10)인 조성물.
  15. 제6항에 있어서, 상기 뉴클레아제 또는 이의 변이체와 역전사 효소는 개별 또는 융합단백질 형태로 포함되는, 조성물.
  16. 제6항에 있어서, 상기 역전사 효소는 M-MLV (Moloney Murine Leukemia Virus) 유래인, 조성물.
  17. 제6항에 있어서, 상기 역전사 효소는 서열번호 29의 서열을 포함하는, 조성물.
  18. 제6항에 있어서, 상기 프라임 에디터 단백질 및 프라임 에디팅 가이드 RNA가 조립된 RNP (ribonucleoprotein)를 포함하는, 조성물.
  19. 제6항에 있어서, 상기 프라임 에디터 단백질을 코딩하는 핵산 및 프라임 에디팅 가이드 RNA를 코딩하는 핵산을 모두 또는 별개로 포함하는 벡터를 포함하는 조성물.
  20. 제6항에 있어서, 상기 프라임 에디터 단백질 및 프라임 에디팅 가이드 RNA를 코딩하는 핵산을 포함하는 벡터를 포함하는 조성물.
  21. 제6항 내지 제20항 중 어느 한 항의 조성물을 세포에 처리하는 단계를 포함하는 유전체 교정 방법.
PCT/KR2021/005031 2020-04-21 2021-04-21 Cas9 또는 cas9 변이체를 이용한 유전체 교정 WO2021215827A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20200048124 2020-04-21
KR10-2020-0048124 2020-04-21

Publications (1)

Publication Number Publication Date
WO2021215827A1 true WO2021215827A1 (ko) 2021-10-28

Family

ID=78269445

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/005031 WO2021215827A1 (ko) 2020-04-21 2021-04-21 Cas9 또는 cas9 변이체를 이용한 유전체 교정

Country Status (1)

Country Link
WO (1) WO2021215827A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117720672A (zh) * 2024-02-07 2024-03-19 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160097338A (ko) * 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 뉴클레오티드 반복 장애에서의 crispr-cas 시스템의 조성물 및 방법 및 용도
US9512446B1 (en) * 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160097338A (ko) * 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 뉴클레오티드 반복 장애에서의 crispr-cas 시스템의 조성물 및 방법 및 용도
US9512446B1 (en) * 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANZALONE ANDREW V.; RANDOLPH PEYTON B.; DAVIS JESSIE R.; SOUSA ALEXANDER A.; KOBLAN LUKE W.; LEVY JONATHAN M.; CHEN PETER J.; WILS: "Search-and-replace genome editing without double-strand breaks or donor DNA", NATURE, NATURE PUBLISHING GROUP UK, LONDON, vol. 576, no. 7785, 21 October 2019 (2019-10-21), London, pages 149 - 157, XP036953141, ISSN: 0028-0836, DOI: 10.1038/s41586-019-1711-4 *
DATABASE PROTEIN 14 August 2016 (2016-08-14), "Cas9 [Cloning vector Cas9/gRNA]", XP055494798, retrieved from NCBI Database accession no. ANZ03364.1 *
SAMUEL H. STERNBERG, BENJAMIN LAFRANCE, MATIAS KAPLAN, JENNIFER A. DOUDNA: "Conformational control of DNA target cleavage by CRISPR?Cas9", NATURE, NATURE PUBLISHING GROUP UK, LONDON, vol. 527, no. 7576, 28 October 2015 (2015-10-28), London, pages 110 - 113, XP055381059, ISSN: 0028-0836, DOI: 10.1038/nature15544 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117720672A (zh) * 2024-02-07 2024-03-19 深锐(天津)生物医学有限公司 先导编辑系统及其应用
CN117720672B (zh) * 2024-02-07 2024-04-30 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Similar Documents

Publication Publication Date Title
US20230159913A1 (en) Targeted base editing of the ush2a gene
EP3237615B2 (en) Crispr having or associated with destabilization domains
EP3230451B1 (en) Protected guide rnas (pgrnas)
EP2121004B1 (en) Obligate heterodimer meganucleases and uses thereof
JP2021500863A (ja) ゲノム編集用のポリヌクレオチド、組成物および方法
CA2915842A1 (en) Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
WO2017136520A1 (en) Mitochondrial genome editing and regulation
WO2016094872A1 (en) Dead guides for crispr transcription factors
WO2015089351A1 (en) Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
US20240043851A1 (en) Non-toxic cas9 enzyme and application thereof
WO2019126589A1 (en) Micelles for complexation and delivery of proteins and nucleic acids
JP2002509697A (ja) ポリヌクレオチドおよびポリペプチド配列を生成するための方法
US20240124897A1 (en) Compositions and Methods Comprising a TTR Guide RNA and a Polynucleotide Encoding an RNA-Guided DNA Binding Agent
FR2731014A1 (fr) Molecules d'adn, preparation et utilisation en therapie genique
WO2021215827A1 (ko) Cas9 또는 cas9 변이체를 이용한 유전체 교정
JP2022547533A (ja) 細胞受容体の妨害を通じてasfv感染症を阻止する方法
WO2022071745A1 (ko) Hiv 역전사효소 및 cas9 또는 이의 변이체를 이용한 프라임 에디팅
WO2021215897A1 (ko) Cas9 또는 cas9 변이체를 이용한 유전체 교정
KR20200011899A (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
WO2023182858A1 (ko) 식물세포 소기관 dna의 아데닌을 구아닌으로 염기 교정하는 방법
WO2024063538A1 (ko) 식물세포 소기관 dna의 염기 교정
WO2020193696A1 (en) Methods and products for a safe and efficient transduction of gene editing components
US20240100184A1 (en) Methods of precise genome editing by in situ cut and paste (icap)
AU2022334454A1 (en) Genome editing compositions and methods for treatment of retinopathy
CN117431235A (zh) CRISPR-Cas系统及其应用

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21792743

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21792743

Country of ref document: EP

Kind code of ref document: A1