WO2022124839A1 - 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 rna 및 이의 용도 - Google Patents

온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 rna 및 이의 용도 Download PDF

Info

Publication number
WO2022124839A1
WO2022124839A1 PCT/KR2021/018693 KR2021018693W WO2022124839A1 WO 2022124839 A1 WO2022124839 A1 WO 2022124839A1 KR 2021018693 W KR2021018693 W KR 2021018693W WO 2022124839 A1 WO2022124839 A1 WO 2022124839A1
Authority
WO
WIPO (PCT)
Prior art keywords
nucleotide sequence
guide rna
translocation
seq
protospacer
Prior art date
Application number
PCT/KR2021/018693
Other languages
English (en)
French (fr)
Inventor
성영훈
정연주
김지헌
이근호
유현
Original Assignee
재단법인 아산사회복지재단
울산대학교 산학협력단
주식회사 모비스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 아산사회복지재단, 울산대학교 산학협력단, 주식회사 모비스 filed Critical 재단법인 아산사회복지재단
Publication of WO2022124839A1 publication Critical patent/WO2022124839A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Definitions

  • the present invention relates to a guide RNA in which on-target activity is maintained and off-target activity is reduced, and to a use thereof, and specifically, to a guide RNA comprising a single mismatch with respect to an off-target gene region.
  • a guide RNA comprising one or two intentional mismatches with respect to the target gene region and the off-target gene region, respectively, and a method for preparing the same, a method of improving the accuracy of a CRISPR system using the guide RNA,
  • Provided are a composition for preventing, treating, or diagnosing a disease caused by a point mutation comprising the guide RNA, a gene targeting method using the guide RNA, and a gene editing method.
  • the CRISPR-Cas system consists of a guide RNA having a sequence complementary to a target gene or nucleic acid and a CRISPR enzyme, which is an enzyme that cuts the target gene or nucleic acid, and the guide RNA and the CRISPR enzyme are CRISPR A complex is formed, and a target gene or nucleic acid is cleaved or modified by the formed CRISPR complex.
  • the non-targeting gene or nucleic acid may partially interact with the guide RNA by including a sequence that is partially complementary to the guide RNA, and the CRISPP complex cleaves the gene, that is, the unwanted gene or nucleic acid by this interaction. or transform it. Such an effect is called an off-target effect.
  • a guide RNA with a small off-target effect that is, select a target with a small off-target effect
  • modify it is considered to be an important part to regulate the activity (or efficiency) and specificity of the CRISPR enzyme.
  • the present inventors hypothesized that, when a single nucleotide substitution is intentionally introduced into the guide RNA, it is possible to reduce the off-target activity of the guide RNA without affecting the on-target activity ( FIG. 1 ). , This hypothesis was verified through experiments, and the present invention was completed by preparing a novel guide RNA in which on-target activity was maintained and off-target activity was reduced.
  • Patent Document 1 Republic of Korea Patent Publication No. 10-2016-0058703
  • Non-Patent Document 1 Bioinformatics, 34, 2018, i757-i765
  • an object of the present invention is to provide a guide RNA in which only the off-target activity is reduced while maintaining the on-target activity, and a method for preparing the same.
  • Another object of the present invention is to provide a method for improving the accuracy of the CRISPR system using the above-described guide RNA.
  • Another object of the present invention is to provide a composition for editing a gene comprising the guide RNA described above.
  • Another object of the present invention is to provide a pharmaceutical composition, method and use for preventing or treating a disease or AIDS caused by point mutation using the above-described guide RNA.
  • Another object of the present invention is to provide a composition, method and use for diagnosing a disease caused by a point mutation using the guide RNA described above.
  • Another object of the present invention is to provide a gene targeting method and a gene editing method using the above-described guide RNA.
  • the present invention provides a guide RNA comprising a nucleotide sequence complementary to a target gene region, wherein the nucleotide sequence comprises the following characteristics:
  • ii) comprises an intentional one or two mismatches to the target genomic region and the off-target genomic region
  • the original one mismatch and the intentional one or two mismatches are introduced at different positions.
  • the original one mismatch and the intentional one or two mismatches are, respectively, from positions +1 to + + from the protospacer-adjacent motif of the nucleotide sequence of the guide RNA. It may be introduced at different positions among the 20 positions.
  • the original one mismatch and the intentional one or two mismatches are, respectively, +10 positions from the protospacer-adjacent motif of the nucleotide sequence of the guide RNA and It can be introduced at either or both of the +18 positions.
  • the target gene may be CCR5, and the off-target gene may be CCR2.
  • the guide RNA comprises any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 1 to 19, and in each nucleotide sequence, from the protospacer-adjacent motif to + An intentional mismatch may be introduced at any one or two of positions 20, and the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID NOs: 1 to 19.
  • the guide RNA comprises:
  • nucleotide sequence of SEQ ID NO: 4 comprising the nucleotide sequence of SEQ ID NO: 4, wherein an intentional mismatch is introduced by inducing a transition or translocation mutation in any one or two of positions +1 and +3 to +20 from the protospacer-adjacent motif;
  • An intentional mismatch comprising the nucleotide sequence of SEQ ID NO: 5 by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +14 and +16 to +20 from the protospacer-adjacent motif introduced;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutation comprising the nucleotide sequence of SEQ ID NO: 10, in any one or two of positions +2 to +20 from the protospacer-adjacent motif;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutation in any one or two of positions +1 to +19 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 11;
  • nucleotide sequence of SEQ ID NO: 16 comprising the nucleotide sequence of SEQ ID NO: 16, wherein an intentional mismatch is introduced by inducing a translocation or translocation mutation in any one or two of positions +1 to +18 and +20 from the protospacer-adjacent motif;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +20 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 17;
  • An intentional mismatch can be introduced by inducing a translocation or translocation mutation in any one or two of positions +1 to +19 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 19;
  • the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID Nos: 1 to 19.
  • the guide RNA includes any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 1 to 19, and in each nucleotide sequence, +10 positions and +18 from the protospacer-adjacent motif An intentional mismatch may be introduced by inducing a translocation or translocation mutation at any one or two positions, and the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID NOs: 1 to 19.
  • the guide RNA may include any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 20 to 95.
  • the guide RNA may include any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 96 to 125.
  • the target gene may be a gene including a point mutation
  • the off-target gene may be a wild-type gene
  • the target gene is a gene comprising a KRAS G12D, G12C or G12V point mutation
  • the off-target gene may be a wild-type KRAS gene
  • the guide RNA comprises any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 413 to 416, and in each nucleotide sequence, from the protospacer-adjacent motif to + An intentional mismatch may be introduced at any one or two of position 20, wherein the nucleotide sequence of SEQ ID NOs: 413 to 416 excludes the protospacer-adjacent motif sequence.
  • the guide RNA comprises:
  • an intentional mismatch is introduced by inducing a translocation or translocation mutation in any one or two of positions +2 to +20 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 413;
  • An intentional mismatch comprising the nucleotide sequence of SEQ ID NO: 414 by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +6 and +8 to +20 from the protospacer-adjacent motif introduced;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutagenesis in any one or two of positions +2 to +20 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 415; or
  • An intentional mismatch comprising the nucleotide sequence of SEQ ID NO: 416 by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +6 and +8 to +20 from the protospacer-adjacent motif can be introduced;
  • the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID Nos: 413 to 416.
  • the guide RNA comprises any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 413 to 416, and in each nucleotide sequence, +10 positions and + An intentional mismatch may be introduced by inducing a translocation or translocation mutagenesis at any one or two of positions 18, and the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID NOs: 413 to 416.
  • the guide RNA may include any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 427 to 438.
  • the guide RNA maintains 50% or more of the on-target activity of the wild-type guide RNA and exhibits reduced off-target activity or off-target activity compared to the wild-type guide RNA may not indicate
  • the present invention also provides a method for preparing a guide RNA comprising the steps of:
  • the original one mismatch and the one or two intentional mismatch are introduced at different positions.
  • the RNA prepared by the above method maintains 50% or more of the on-target activity of the wild-type guide RNA, and exhibits reduced off-target activity compared to the wild-type guide RNA, or off- It may not show target activity.
  • the present invention also provides a method for improving the accuracy of the CRISPR system using the above-described guide RNA.
  • the present invention provides a composition for editing a gene, comprising the guide RNA described above.
  • the present invention also provides a use for preventing or treating a disease caused by point mutation or acquired immunodeficiency using the above-described guide RNA.
  • the present invention provides a pharmaceutical composition for preventing or treating a disease or AIDS caused by point mutation, comprising the guide RNA described above.
  • it provides a method for preventing or treating a disease caused by point mutation or acquired immunodeficiency syndrome, comprising administering a composition comprising the above-described guide RNA to an individual in need thereof.
  • Another object is to provide the use of the guide RNA described above for the preparation of a medicament for the prevention or treatment of a disease caused by point mutations or acquired immunodeficiency syndrome.
  • the present invention also provides a use for diagnosing diseases caused by point mutations using the guide RNA described above.
  • the present invention provides a composition for diagnosing diseases caused by point mutations, including the guide RNA described above.
  • kits for diagnosing a disease caused by a point mutation comprising the above-described guide RNA and Cas9 polypeptide or a polynucleotide encoding the same.
  • the disease caused by the point mutation may be cancer or metabolic liver disease, but is not limited thereto.
  • the present invention provides a gene targeting method and/or a gene editing method using the above-described guide RNA.
  • the guide RNA according to the present invention has the advantage of being used together with wild-type Cas9 showing high activity, which has already been proven, and prevents, treats, or treats diseases including AIDS, hereditary diseases caused by point mutations, and cancer. It can be widely used for diagnosis, etc.
  • FIG. 1 shows a schematic diagram of the effect of a single deliberately generated mismatch in the spacer region of a guide RNA on its activity at on-target and off-target sites.
  • the model guide RNA (WT) has an off-target site with a mismatch at position 10 (light green) and simultaneously exhibits potent on-target and off-target activity (blue and red lines, respectively). If a single nucleotide substitution (peach square) is introduced into the spacer region, the guide RNA will have two mismatches in the off-target region. It is expected that it will be possible to develop an active guide RNA with minimal off-target activity (asterisk) by systematically analyzing the effect of a single mismatch on activity at on-target and off-target sites.
  • WT model guide RNA
  • a is the location of 19 guide RNAs specific for the human CCR5 gene (yellow arrow) and the human CCR2 gene Indicate the corresponding off-target positions (gray arrows). Off-target sites differ by a single nucleotide. The direction of the arrow indicates whether the target sequence is derived from the forward strand or the reverse strand of the gene. Genotyping Primer pairs and guide RNAs are matched by color.
  • B shows the results of a T7 endonuclease I (T7E1) assay that measures the on-target and off-target activities of guide RNA targeting the human CCR5 gene (M: size marker, NT: untreated).
  • a is a comparison of the CCR5-RG1 target sequence and its off-target sequence CCR2-RG1.
  • the original mismatch in position 16 is marked in red.
  • B shows the results of a T7E1 assay measuring on-target and off-target activities of CCR5-RG1 mutants containing intentional mismatches.
  • M size marker
  • NT untreated
  • EV ball vector
  • WT wild type
  • Figure 4 shows the effect of intentional mismatch on the on-target and off-target activity of CCR5-RG12
  • a is a comparison of the CCR5-RG12 target sequence and its off-target sequence CCR2-RG12.
  • the original mismatch in position 10 is marked in red.
  • B shows the results of a T7E1 assay measuring on-target and off-target activities of CCR5-RG12 mutants containing intentional mismatches.
  • intentional mutations were each introduced by changing the original nucleotide to one of three other nucleotides, but the original mismatch at position 10 was not altered (NT: untreated, WT: wild-type).
  • FIG. 6 shows the T7E1 assay results of wild-type CCR5-RG3 and some of its mutants (10A, 10T, 10C, 18A, 18T and 18C).
  • Figure 10a shows the wild-type KRAS sequence and the point mutation sequence of KRAS G12D and KRAS G12V
  • b is the T7E1 assay result of wild-type KRAS-G12D-RG1 and KRAS-G12D-RG2 in BXPC3 cell line and HPAFII cell line, respectively.
  • c shows the T7E1 assay results of KRAS-G12V-RG1 and KRAS-G12V-RG2.
  • 11A shows two guide RNAs (KRAS G12D-RG1 and KRAS G12D-RG2) design strategy that targets the wild-type KRAS nucleotide sequence off-target and on-targets a nucleotide sequence containing a KRAS G12D point mutation, and a design strategy thereof The sequences are shown, b shows the T7E1 assay results of wild-type KRAS-G12D-RG1 and its variants (10A, 10G, 10C, 18A, 18G and 18C) in BxPC3 and HPAFII cell lines, respectively, and c shows the BxPC3 and HPAFII cell lines. shows the T7E1 assay results of wild-type KRAS-G12D-RG2 and its variants (10A, 10T, 10G, 18T, 18G and 18C), respectively.
  • FIG. 12A shows the results of genotyping of three types of pancreatic cancer cell lines (BxPC3, HPAFII and Panc-1), and b is a Panc-1 cell line with wild-type KRAS-G12D-RG2 and mutant KRAS-G12D-RG2-10A. shows the results of the T7E1 assay, and c is the KRAS protein and The difference in expression of the KRAS-G12D mutant protein is shown by Western blot, and d is the wild-type KRAS-G12D-RG2 and its mutant KRAS-G12D-RG2- in three types of pancreatic cancer cell lines (BxPC3, HPAFII and Panc-1). It is the result of confirming the cell growth according to the treatment of 10A.
  • the present inventors hypothesized that, when a single nucleotide substitution is intentionally introduced into the guide RNA, it will be possible to reduce only the off-target activity of the guide RNA without causing serious degradation of the on-target activity ( 1), a solution to the above-mentioned problem was sought by proving this hypothesis.
  • a first aspect of the present invention relates to a guide RNA comprising a nucleotide sequence complementary to a target gene region, wherein the nucleotide sequence comprises the following characteristics:
  • ii) comprises an intentional one or two mismatches to the target genomic region and the off-target genomic region
  • the original one mismatch and the intentional one or two mismatches are introduced at different positions.
  • guide RNA refers to RNA specific for a target gene or target nucleic acid, and may be coupled to a CRISPR enzyme to guide the CRISPR enzyme to the target gene or target nucleic acid.
  • the guide RNA may be composed of CRISPR RNA (crRNA) comprising a nucleotide sequence complementary to a target gene or target nucleic acid sequence and trans-activating CRISPR RNA (tracrRNA) binding to a CRISPR enzyme, wherein the crRNA is a target gene or and a guide sequence, which is a portion complementary to a target nucleic acid sequence.
  • the guide sequence serves to recognize a target gene or target nucleic acid sequence.
  • the guide RNA of the present invention may be a single guide RNA (sgRNA) generated by fusion of essential parts of crRNA and tracrRNA or a dual RNA (dual RNA) in which crRNA and tracrRNA are present separately.
  • sgRNA single guide RNA
  • dual RNA dual RNA
  • the term “on-target” refers to a sequence or location of a target gene or target nucleic acid to which a guide RNA is complementarily bound
  • the term “off-target” refers to a guide RNA refers to the sequence or position of a gene or nucleic acid in which, although undesirable, gene scissors activity occurs by partially complementary binding.
  • mismatch refers to occurrence of inappropriate base pairing in which a non-complementary sequence exists in a complementary binding between DNA or between DNA and RNA bases.
  • the term "original one mismatch” refers to a mismatch caused by the presence of one nucleotide difference in the nucleotide sequence of the off-target gene region compared to the on-target gene region. Meaning, the guide RNA containing only one mismatch originally binds completely complementary to the on-target gene region, but partially complementary binds to the off-target gene region by one nucleotide difference. Since the guide RNA containing only one original mismatch is completely complementary to the on-target gene region, it is a wild-type guide RNA in which no mismatch is introduced for the on-target gene region.
  • the term “intentional one or two mismatches” refers to one or two mismatches artificially introduced unlike one original mismatch.
  • Guide RNAs containing intentional one or two mismatches have partially complementary binding with a difference of one or two nucleotides in common to both the on-target gene region and the off-target gene region.
  • the original one mismatch and the intentional one or two mismatches exist at different positions
  • the guide RNA containing the original one mismatch and the intentional one or two mismatches is the on-target gene region.
  • the original one mismatch and the intentional one or two mismatches each exist in the spacer region of the nucleotide sequence of the guide RNA, preferably a protospacer-adjacent motif. ) from +1 to +20, but at different positions. More preferably, one or two intentional mismatches may be introduced at any one or two of positions +10 and +18 from a protospacer-adjacent motif.
  • the present inventors extracted 19 target sequences from the open reading frame of human CCR5 having an off-target site in the highly homologous CCR2 gene that differs by one nucleotide, Their specific sequences are shown in Table 5. Among them, five guide RNAs, ie, RG1-3, 7 and 12, showed high activity in the on-target and off-target sites of human Jurkat T cells, as shown in FIG. 2B and Table 5.
  • the present inventors investigated the effect of intentional mismatch in CCR5-RG12, as shown in Fig. 4a, where there is an original mismatch at position 10 (+16 position from PAM). As shown in FIG. 5 , it was confirmed that the off-target activity of wild-type CCR5-RG12 was very strong at 40.4% through deep sequencing. Next, 57 translocation and translocation mutants were generated and on-target and off-target activities were measured using the T7E1 assay (FIG. 4B and Table 7).
  • the original one mismatch and the intentional one or two mismatches each exist in a spacer region of the nucleotide sequence of the guide RNA, more preferably a protospacer-adjacent motif (protospacer-adjacent). motif) at any one or two of the +10 and +18 positions.
  • a protospacer-adjacent motif protospacer-adjacent motif
  • Example 4 the present inventors confirmed the on-target and off-target activities according to the location of the intentional mismatch, and as a result, the protospacer-adjacent motif at the +10 position and +18 It was confirmed that the on-target activity was maintained but the off-target activity was greatly reduced when intentional mismatches were introduced at either or both positions ( FIGS. 6 to 8 ). Accordingly, various guide RNAs prepared by introducing intentional mismatches at the +10 and +18 positions cause point mutations with the wild-type gene as off-target and the point mutant gene as on-target during gene editing treatment. It can be applied as an effective treatment for various genetic diseases.
  • the guide RNA provided in an embodiment of the present invention is, for example, a) CCR5 as a target gene and CCR2 as an off-target gene; b) an EGFR gene, which is a point mutation causing lung cancer, as a target gene, and a wild-type EGFR gene as an off-target gene; c) using the ATP7B gene as a target gene and the wild-type ATP7B gene as an off-target gene; Alternatively, d) a KRAS gene that causes a point mutation to cause pancreatic cancer, colon cancer or lung cancer may be a target gene, and a wild-type KRAS gene may be an off-target gene, but is not limited thereto.
  • the guide RNA includes any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 1 to 19, wherein in each nucleotide sequence, the protospacer- An intentional mismatch may be introduced at any one or two of positions +1 to +20 from the adjacent motif, and the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID NOs: 1 to 19.
  • the intentional mismatch may be introduced by inducing a transition mutation or a transversion mutation.
  • the specific nucleotide sequence of a guide RNA in which the target gene is CCR5 and the off-target gene is CCR2 comprises the nucleotide sequence of SEQ ID NO: 1, wherein the protospacer-adjacent motif is at positions +1 to +15 and +17 positions. an intentional mismatch is introduced by causing a translocation or translocation mutation at any one or two of positions to +20;
  • nucleotide sequence of SEQ ID NO: 4 comprising the nucleotide sequence of SEQ ID NO: 4, wherein an intentional mismatch is introduced by inducing a transition or translocation mutation in any one or two of positions +1 and +3 to +20 from the protospacer-adjacent motif;
  • An intentional mismatch comprising the nucleotide sequence of SEQ ID NO: 5 by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +14 and +16 to +20 from the protospacer-adjacent motif introduced;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutation comprising the nucleotide sequence of SEQ ID NO: 10, in any one or two of positions +2 to +20 from the protospacer-adjacent motif;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutation in any one or two of positions +1 to +19 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 11;
  • nucleotide sequence of SEQ ID NO: 16 comprising the nucleotide sequence of SEQ ID NO: 16, wherein an intentional mismatch is introduced by inducing a translocation or translocation mutation in any one or two of positions +1 to +18 and +20 from the protospacer-adjacent motif;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +20 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 17;
  • An intentional mismatch can be introduced by inducing a translocation or translocation mutation in any one or two of positions +1 to +19 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 19;
  • the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID Nos: 1 to 19.
  • the guide RNA may include any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 20 to 95.
  • the specific nucleotide sequence of the guide RNA in which the target gene is CCR5 and the off-target gene is CCR2 includes any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 1 to 19, but in each nucleotide sequence, a protospacer-adjacent motif An intentional mismatch may be introduced by inducing a translocation or translocation mutation at any one or two of positions +10 and +18 from do.
  • the guide RNA may include any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 96 to 125.
  • the target gene of the guide RNA of the present invention is a KRAS gene comprising a point mutation, for example, a KRAS G12D, G12C or G12V point mutation
  • the off-target gene is a wild-type KRAS gene
  • the guide RNA is SEQ ID NO: 413 to Any one nucleotide sequence selected from the group consisting of 416, wherein an intentional mismatch may be introduced at any one or two of positions +1 to +20 from the protospacer-adjacent motif in each nucleotide sequence, wherein The protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID NOs: 413-416.
  • the specific nucleotide sequence of a guide RNA in which the target gene is a KRAS gene comprising a KRAS G12D, G12C or G12V point mutation and the off-target gene is a wild-type KRAS gene is:
  • an intentional mismatch is introduced by inducing a translocation or translocation mutation in any one or two of positions +2 to +20 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 413;
  • An intentional mismatch comprising the nucleotide sequence of SEQ ID NO: 414 by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +6 and +8 to +20 from the protospacer-adjacent motif introduced;
  • an intentional mismatch is introduced by inducing a translocation or translocation mutagenesis in any one or two of positions +2 to +20 from the protospacer-adjacent motif, comprising the nucleotide sequence of SEQ ID NO: 415; or
  • An intentional mismatch comprising the nucleotide sequence of SEQ ID NO: 416 by inducing a translocation or translocation mutagenesis at any one or two of positions +1 to +6 and +8 to +20 from the protospacer-adjacent motif can be introduced;
  • the protospacer-adjacent motif sequence is excluded from the nucleotide sequence of SEQ ID Nos: 413 to 416.
  • the target gene is a KRAS gene comprising a KRAS G12D, G12C or G12V point mutation
  • the specific nucleotide sequence of the guide RNA in which the off-target gene is a wild-type KRAS gene is any one selected from the group consisting of SEQ ID NOs: 413-416
  • An intentional mismatch can be introduced by inducing a translocation or translocation mutation in either or both of positions +10 and +18 from the protospacer-adjacent motif in each nucleotide sequence, including the nucleotide sequence, wherein the SEQ ID NO: In the nucleotide sequence of 413-416, the protospacer-adjacent motif sequence is excluded.
  • the guide RNA may include any one nucleotide sequence selected from the group consisting of SEQ ID NOs: 427 to 438.
  • the guide RNA of the present invention retains 50%, 60%, 70%, 80%, or 90% or more, preferably 70% or more, of the on-target activity of the wild-type guide RNA, compared to the wild-type guide RNA It may exhibit reduced off-target activity or no off-target activity.
  • a second aspect of the present invention relates to a method for preparing a guide RNA comprising the steps of:
  • the original one mismatch and the one or two intentional mismatch are introduced at different positions.
  • the guide RNA prepared by the method of the present invention maintains 50% or more of the on-target activity of the wild-type guide RNA, and exhibits reduced off-target activity or no off-target activity compared to the wild-type guide RNA.
  • a third aspect of the present invention relates to a method for improving the accuracy of a CRISPR system using the aforementioned guide RNA.
  • Target-specific gene scissors refer to a nuclease capable of recognizing and cutting a specific position of a nucleic acid (DNA or RNA) on a target genome (target or target).
  • the target-specific gene scissors is also used as a concept including other elements necessary for a specific nuclease to exhibit a desired function.
  • the nuclease may include a nuclease in which a domain for recognizing a specific target sequence on a genome (part) and a domain for cleaving (part) are fused.
  • a nuclease capable of recognizing and cleaving a specific position of a nucleic acid (DNA or RNA) on the genome may be used.
  • CRISPR-Cas system includes all elements involved in inducing expression or activity thereof, including guide RNA and sequences encoding CRISPR enzymes.
  • the CRISPR-Cas system may be a vector system including a guide RNA and a sequence encoding a CRISPR enzyme.
  • operably linked refers to nucleic acid sequences functionally linked such that the sequences exert a desired function.
  • a coding sequence for a gene of interest eg, a selectable marker
  • linkages between coding sequences such that they can be controlled by the same linking promoter and/or regulatory region; Such linkages between coding sequences may also be referred to as being linked in frame or in the same coding frame.
  • operably linked also refers to a linkage of a functional, but non-coding sequence, such as a self-replicating sequence or origin of replication. Such sequences are in operative linkage if they are capable of performing a normal function, eg, allowing replication, propagation and/or isolation of a vector comprising said sequence in a host cell.
  • the "CRISPR-Cas system” of the present invention includes all elements involved in inducing expression or activity thereof, including a guide RNA sequence and a CRISPR enzyme protein or polypeptide, and the CRISPR-Cas system includes guide RNA and CRISPR It may be a ribonucleoprotein (RNP) system in which the enzyme forms a complex.
  • RNP ribonucleoprotein
  • the RNP is a protein-RNA complex, and refers to the form of a complex formed by the interaction between RNA and RNA-binding protein.
  • the CRISPR enzyme is a nucleic acid or polypeptide (or protein) including a sequence encoding the CRISPR enzyme, and typically Type II CRISPR enzyme or Type V CRISPR enzyme is widely used.
  • Type II CRISPR enzymes include Cas9, which includes Actinobacteria (, Actinomyces naeslundii) Cas9, Aquificae Cas9, Bacteroidetes Cas 9, Chlamydiae Cas9, Chloroflexi Cas9, Cyanobacteria Cas9, Elusimicrobia Cas9, Fibrobacteres Cas9, Firmicutes Cas9 (e.g. pyogenes Cas9; Streptococcus thermophilus Cas9; It may be Cas9 derived from various microorganisms, such as Cas9.
  • Actinobacteria Actinomyces naeslundii
  • Aquificae Cas9 Bacteroidetes Cas 9, Chlamydiae Cas9, Chloroflexi Cas9, Cyanobacteria Cas9, Elusimicrobia Cas9, Fibrobacteres Cas9, Firmicutes
  • Cas9 is an enzyme that binds to a guide RNA and cuts or modifies the sequence or position of a target gene or nucleic acid, an HNH domain capable of cleaving a nucleic acid strand to which the guide RNA is complementary, a guide RNA and It may be composed of a RuvC domain capable of cleaving a non-complementary nucleic acid strand, a REC domain that recognizes a target, and a PI domain that recognizes PAM. Specific structural properties of Cas9 are described in Hiroshi Nishimasu et al. (2014) Cell 156:935-949] can be referred to.
  • the Type V CRISPR enzyme includes Cpfl, and the Cpfl is Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Paludibacter, List, Corynebacter, Carnobacterium, from Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus.
  • the Cpfl has a similar RuvC domain corresponding to the RuvC domain of Cas9, and lacks the HNH domain of Cas9, and contains a Nuc domain instead, a REC domain recognizing a target, a WED domain, and a PI domain recognizing a PAM. can be configured. Specific structural properties of Cpfl are described in Takashi Yamano et al. (2016) Cell 165:949-962].
  • the CRISPR enzyme may recognize a protospacer adjacent motif (PAM) in a gene or nucleic acid sequence, and the PAM may vary depending on the type and/or origin of the CRISPR enzyme.
  • PAM protospacer adjacent motif
  • PAM may be 5'-NGG-3'
  • the PAM when the CRISPR enzyme is FnCpfl, the PAM may be 5'TTN-3', and when the CRISPR enzyme is AsCpfl or LbCpfl, the PAM may be 5'-TTTN-3', wherein N is A, ⁇ , G or C; or A, U, G or C.
  • CRISPR enzyme may be obtained from a known database such as GenBank of the National Center for Biotechnology Information (NCBI), but is not limited thereto.
  • a fourth aspect of the present invention relates to a composition for editing a gene comprising the guide RNA described above.
  • the gene editing composition of the present invention may further include a nuclease capable of recognizing and cleaving a specific position of a nucleic acid (genomic DNA) on the genome, and the description thereof is the same as described above, so the description thereof will be omitted. do.
  • the gene editing composition of the present invention may further include a Cas9 polypeptide or a polynucleotide encoding the same.
  • the composition for gene editing of the present invention can be particularly effectively applied to gene editing therapy.
  • About 50% of pathogenic mutations found in patients are point mutations, and the gene editing composition of the present invention provides gene editing treatment for diseases caused by point mutations. It becomes on-target, and the wild-type gene becomes off-target and can be used as a strategy to preserve the wild-type sequence, thereby enhancing the therapeutic effect.
  • a fifth aspect of the present invention provides the use of the aforementioned guide RNA for preventing or treating diseases caused by point mutations and/or for diagnosing diseases caused by point mutations.
  • the present invention provides a pharmaceutical composition for preventing or treating a disease or AIDS caused by point mutation, comprising the guide RNA described above.
  • prevention refers to any action that suppresses or delays the onset of diseases or AIDS caused by point mutations by administration of the pharmaceutical composition.
  • treatment refers to any action that improves or advantageously changes the symptoms of a disease or AIDS caused by point mutations by administration of the pharmaceutical composition.
  • the pharmaceutical composition may be used for a method for preventing or treating a disease or AIDS caused by point mutation, and specifically, the prevention or treatment method is a disease caused by point mutation or acquired immunodeficiency syndrome. Or it may include the step of administering to a subject expected to develop.
  • the term “administration” means introducing the composition to a subject by an appropriate method.
  • mammals including humans may be, but is not limited thereto.
  • composition of the present invention is administered in a pharmaceutically effective amount.
  • pharmaceutically effective amount means an amount sufficient to treat a disease with a reasonable benefit/risk ratio applicable to medical treatment, and the effective dose level is determined by the type and severity of the subject, age, sex, drug activity, sensitivity to drugs, administration time, administration route and excretion rate, duration of treatment, factors including concomitant drugs, and other factors well known in the medical field.
  • the composition may be administered at a dose of 0.01 to 500 mg/kg per day, specifically 10 to 100 mg/kg as an active ingredient, and the administration may be administered once or divided several times a day.
  • the pharmaceutical composition of the present invention may include the composition of the present invention in a weight percentage of 0.001 to 50% based on the total weight of the composition.
  • composition of the present invention may be administered as an individual therapeutic agent or in combination with other therapeutic agents, and may be administered sequentially or simultaneously with conventional therapeutic agents. and may be administered single or multiple. Taking all of the above factors into consideration, it is important to administer an amount that can obtain the maximum effect with a minimum amount without side effects, which can be easily determined by those skilled in the art.
  • the pharmaceutical composition for the prevention or treatment of diseases or AIDS caused by point mutations of the present invention may further include a pharmaceutically acceptable carrier, excipient or diluent in addition to the active ingredients described above.
  • the carrier, excipient and diluent include lactose, dextrose, sucrose, sorbitol, mannitol, xylitol, erythritol, maltitol, starch, gum acacia, alginate, gelatin, calcium phosphate, calcium silicate, cellulose, methyl cellulose, microcrystalline cellulose, polyvinyl pyrrolidone, water, methylhydroxybenzoate, propylhydroxybenzoate, talc, magnesium stearate and mineral oil.
  • the pharmaceutical composition of the present invention can be formulated in the form of oral dosage forms such as powders, granules, tablets, capsules, suspensions, emulsions, syrups, aerosols, etc., external preparations, suppositories, or sterile injection solutions according to conventional methods, respectively. have. Specifically, in the case of formulation, it can be prepared using a diluent or excipient such as a filler, a weight agent, a binder, a wetting agent, a disintegrant, and a surfactant commonly used.
  • Solid preparations for oral administration include, but are not limited to, tablets, pills, powders, granules, capsules, and the like.
  • Such a solid preparation may be prepared by mixing at least one or more excipients, for example, starch, calcium carbonate, sucrose, lactose, gelatin, and the like.
  • excipients for example, starch, calcium carbonate, sucrose, lactose, gelatin, and the like.
  • lubricants such as magnesium stearate and talc may also be used.
  • It can be prepared by adding various excipients, for example, wetting agents, sweetening agents, fragrances, preservatives, and the like, in addition to liquids for oral use and liquid paraffin.
  • Formulations for parenteral administration include sterile aqueous solutions, non-aqueous solutions, suspensions, emulsions, lyophilized formulations and suppositories.
  • non-aqueous solvent and suspending agent propylene glycol, polyethylene glycol, vegetable oils such as olive oil, injectable esters such as ethyl oleate, and the like can be used.
  • base of the suppository Witepsol, Macrogol, Tween 61, cacao butter, laurin fat, glycerogelatin, etc. can be used.
  • the pharmaceutical composition of the present invention may be administered orally or parenterally (eg, intravenously, subcutaneously, intraperitoneally or topically) according to a desired method, and the dosage may vary depending on the condition and weight of the patient, and the disease. Although it varies depending on the degree, drug form, administration route and time, it may be appropriately selected by those skilled in the art.
  • composition of the present invention may be combined with other anticancer drugs, radiation therapy, and surgery, and may be appropriately selected and combined by those skilled in the art.
  • Another object is to provide the use of the guide RNA described above for the preparation of a medicament for the prevention or treatment of a disease caused by point mutations or acquired immunodeficiency syndrome.
  • the present invention provides a composition for diagnosing a disease caused by point mutation, comprising the guide RNA described above.
  • kits for diagnosing a disease caused by a point mutation comprising the above-described guide RNA and Cas9 polypeptide or a polynucleotide encoding the same.
  • diagnosis refers to ascertaining the presence or characteristics of pathophysiology. Diagnosis in the present invention is to confirm the onset, progress or prognosis of a disease caused by a point mutation.
  • the CRISPR-Cas system using the guide RNA of the present invention can be used for diagnosis of various diseases caused by point mutations by combining with various known detection techniques.
  • Known detection techniques include, but are not limited to, Lateral Flow Assay (LFA), chromaticity analysis, electroanalysis, electrochemical sensor, fluorescence detection, and microfluidic platform.
  • the diagnostic composition may be combined with a fluorescent substance for molecular imaging in order to diagnose a disease caused by a point mutation through an image.
  • the fluorescent substance for molecular imaging refers to any material that generates fluorescence, preferably emitting red or near-infrared fluorescence, and more preferably a fluorescent substance having high quantum yield, but is not limited thereto. .
  • the fluorescent substance for molecular imaging is preferably a fluorescent substance capable of binding to the diagnostic composition, a fluorescent protein, or other imaging material, but is not limited thereto.
  • the phosphor is preferably fluorescein, BODYPY, tetramethylrhodamine, Alexa, cyanine, allopicocyanine, or a derivative thereof, but is not limited thereto. do not lose
  • the fluorescent protein is preferably, but not limited to, Dronpa protein, a fluorescent gene (EGFP), a red fluorescent protein (DsRFP), Cy5.5, which is a cyanine fluorescent substance exhibiting near-infrared fluorescence, or other fluorescent proteins.
  • imaging materials are preferably iron oxide, radioactive isotopes, etc., but are not limited thereto, and may be applied to imaging equipment such as MR and PET.
  • the present invention also provides a method for diagnosing a disease caused by point mutation, comprising administering the diagnostic composition according to the present invention to isolated eukaryotic cells or individuals.
  • the disease caused by the point mutation is cancer (eg, pancreatic cancer, colorectal cancer, lung cancer, etc.) or hereditary metabolic liver disease (eg, Wilson's disease) may be, but is not limited thereto, and all related diseases known to be caused by point mutations may be targeted regardless of the gene type.
  • cancer eg, pancreatic cancer, colorectal cancer, lung cancer, etc.
  • hereditary metabolic liver disease eg, Wilson's disease
  • the fifth aspect of the present invention relates to a composition for preventing or treating AIDS caused by point mutation, comprising the guide RNA described above.
  • the etiology of Acquired Immune Deficiency Syndrome is infection by HIV (Human Immunodeficiency Virus).
  • HIV Human Immunodeficiency Virus
  • the CCR5 gene is known as the receptor for HIV, and HIV enters the T cell through the receptor CCR5 (the name of the receptor and the name of the gene that produces it).
  • CCR2 is not an HIV receptor, its nucleotide sequence is very similar, so that a guide RNA designed to target CCR5 may have an off-target effect on the nucleotide sequence of CCR2, which exhibits a single nucleotide sequence mismatch.
  • the guide RNA having the CCR5 gene as the on-target gene of the present invention has no or very little effect on the off-target belonging to the CCR2 gene, so it can be safely used for preventing or treating AIDS.
  • composition for preventing or treating acquired immunodeficiency of the present invention may further include a nuclease capable of recognizing and cleaving a specific position of a nucleic acid (DNA) on the genome, and the description thereof is the same as described above, omit the description.
  • DNA nucleic acid
  • a sixth aspect of the present invention relates to a gene targeting method and a correction method using the above-described guide RNA.
  • composition for gene editing may be used, and each method is performed by administering to an isolated eukaryotic cell or individual.
  • a 23-nt CRISPR-Cas9 target sequence was extracted from the coding region of the human CCR5 genomic DNA sequence (NG_012637.1). Each 23-nt sequence contained a 20-nt target sequence and a common protospacer adjacent motif (PAM) sequence (NGG). Except for the 'GG' part of PAM, a set of 21-nt sequences from CCR5 was denoted as S_CCR5. Each sequence was then annotated with s CCR5 ⁇ S CCR5 . Similarly, a set of 21-nt sequences from the coding region of the human CCR2 genomic DNA sequence (NG_021428.1) was designated S_CCR2.
  • PAM protospacer adjacent motif
  • the oligomers used to clone the CCR5-specific guide RNA (Table 1), the CCR5-RG1 variant (Table 2) and the CCR5-RG12 variant (Table 3) were obtained from Cosmogenetech Inc. (Seoul, Korea) was commissioned and synthesized, and specific sequences are shown in Tables 1 to 3, respectively.
  • the product is described in Sanjana, NE, Shalem, O., and Zhang, F. Nat Methods. 11 , 783-784 (2014), into lentiCRISPR v2 (Addgene plasmid #52961).
  • Oligomers used to construct CCR5-RG12 mutants guide RNA name forward SEQ ID NO: reverse SEQ ID NO: CCR5 -RG12-1A caccgGGTGTCGAAATGAGAAGAAA 202 aaacTTTCTTCTCATTTCGACACCc 203 CCR5 -RG12-1T caccgGGTGTCGAAATGAGAAGAAT 204 aaacATTCTTCTCATTTCGACACCc 205 CCR5 -RG12-1C caccgGGTGTCGAAATGAGAAGAAC 206 aaacGTTCTTCTCATTTCGACACCc 207 CCR5 -RG12-2T caccgGGTGTCGAAATGAGAAGATG 208 aaacCATCTTCTCATTTCGACACCc 209 CCR5 -RG12-2G caccgGGTGTCGAAATGAGAAGAGG 210 aaacCCTCTTCTCATTTCGACACCc 211 CCR5 -RG12-2C caccgGG
  • Infectious lentiviruses are described in Devkota, S. et al. Int. J. Biochem. Cell Biol. 44 , 1887-1896 (2012), and used to infect human Jurkat T cells (Cho, YS et al. PLoS One. 11 , e0161899 (2016)). After selecting infected cells by treatment with puromycin (Sigma, St. Louis, MO, USA), a genomic DNA sample was prepared. The T7E1 assay was then performed using T7 endonuclease 1 (New England Biolabs, Ipswich, MA, USA), and the results were described in Sung, YH et al. Genome Res.
  • PCR primer pairs for T7E1 assay gene target guide RNAs Primer name forward SEQ ID NO: reverse SEQ ID NO: size (bp) CCR5 RG1-6 CCR5-F1 /CCR5-R1 GACAGGGAAGCTAGCAGCAA 316 TTCCTGGGAGAGACGCAAAC 317 693 RG7-10 CCR5-F3 /CCR5-R3 ATGTGAAGCAAATCGCAGCC 318 TCCCGAGTAGCAGATGACCA 319 578 RG11-19 CCR5-F7/CCR5-R7 TAAAAGCCAGGACGGTCACC 320 CCACTTGAGTCCGTGTCCACA 321 665 CCR2 RG1-6 CCR2-F1 /CCR2-R1 TTCAGGGAGATGGCTGCAAG 322 CAGAAGCAAACACAGCCACC 323 695 RG7-10 CCR2-F3 /CCR2-R3 TTTTGTGGGCAACATGCTGG 324 CTTCTCCCCAACGA
  • the present inventors extracted 19 target sequences from the open reading frame of human CCR5 having an off-target site in the highly homologous CCR2 gene that differs by one nucleotide.
  • five guide RNAs ie, RG1-3, 7 and 12, exhibited high activity in the on-target and off-target sites of human Jurkat T cells, as shown in FIG. 2B and Table 6 .
  • On-Target (+PAM) SEQ ID NO: for the CCR2 gene.
  • Off-target (+PAM) SEQ ID NO: T7E1 ( CCR5 ) T7E1 ( CCR2 )
  • T7E1 ( CCR2 ) One CCAG T GAGTAGAGCGGAGGC AGG
  • CCR5-RG1 variant Guide RNA name order SEQ ID NO: CCR5-RG1-1T CCAGTGAGTA GAGCGGAGGT 20 CCR5-RG1-2A CCAGTGAGTA GAGCGGAGAC 21 CCR5-RG1-3A CCAGTGAGTA GAGCGGAAGC 22 CCR5-RG1-4G CCAGTGAGTA GAGCGGGGGC 23 CCR5-RG1-5A CCAGTGAGTA GAGCGAAGGC 24 CCR5-RG1-6A CCAGTGAGTA GAGCAGAGGC 25 CCR5-RG1-7T CCAGTGAGTA GAGTGGAGGC 26 CCR5-RG1-8A CCAGTGAGTA GAACGGAGGC 27 CCR5-RG1-9G CCAGTGAGTA GGGCGGAGGC 28 CCR5-RG1-10A CCAGTGAGTA AAGCGGAGGC 29 CCR5-RG1-11G CCAGTGAGTG GAGCGGAGGC 30 CCR5-RG1-12C CCAGTGAGCA GAGCGGAGGC
  • CCR5-RG12 variant Guide RNA name order SEQ ID NO: CCR5-RG12-1A GGTGTCGAAATGAGAAGAAA 39 CCR5-RG12-1C GGTGTCGAAATGAGAAGAAC 40 CCR5-RG12-1T GGTGTCGAAATGAGAAGAAT 41 CCR5-RG12-2G GGTGTCGAAATGAGAAGAGG 42 CCR5-RG12-2C GGTGTCGAAATGAGAAGACG 43 CCR5-RG12-2T GGTGTCGAAATGAGAAGATG 44 CCR5-RG12-3G GGTGTCGAAATGAGAAGGAG 45 CCR5-RG12-3C GGTGTCGAAATGAGAAGCAG 46 CCR5-RG12-3T GGTGTCGAAATGAGAAGTAG 47 CCR5-RG12-4A GGTGTCGAAATGAGAAAAAG 48 CCR5-RG12-4C GGTGTCGAAATGAGAACAAG 49 CCR5-RG12-4T GGTGTCGAAATGAGAATAAG
  • the on-target and off-target efficiencies ranged from no activity (-) to the strongest. It is shown in Table 9 by arbitrarily classified by activity (+++).
  • T7E1 assay and deep sequencing were performed in the same manner as in Example 2-1.
  • Table 10 shows the PCR primers used in the T7E1 assay for RG2, RG3 and RG7 and their variants.
  • CCR5-RG3-10A and CCR5-RG3-18A on-target activity with intentional mismatches added to positions 10 and 18 were maintained at 68% and 37.4%, respectively, and CCR2-RG3-10A and CCR2-RG3-18A off -Target activity was significantly reduced to 0.8% and 2.2%, respectively.
  • CCR5-RG7 variant Guide RNA name order SEQ ID NO: CCR5-RG7-10A GGTACCTATCAATTGTCAGG 102 CCR5-RG7-10T GGTACCTATCTATTGTCAGG 103 CCR5-RG7-10C GGTACCTATCCATTGTCAGG 104 CCR5-RG7-18A GGAACCTATCGATTGTCAGG 105 CCR5-RG7-18G GGGACCTATCGATTGTCAGG 106 CCR5-RG7-18C GGCACCTATCGATTGTCAGG 107 CCR5-RG7-10C-18A GGAACCTATCCATTGTCAGG 108 CCR5-RG7-10C-18G GGGACCTATCCATTGTCAGG 109 CCR5-RG7-10C-18C GGCACCTATCCATTGTCAGG 110
  • CCR5-RG7-10C and CCR5-RG7-18A on-target activities with intentional mismatches added to positions 10 and 18 were maintained at 62.8% and 77.4%, respectively, and CCR2-RG7-10C and CCR2-RG7-18A off -Target activity was significantly reduced to 1.9% and 1.6%, respectively.
  • CCR5-RG2 variant Guide RNA name order SEQ ID NO: CCR5-RG2-10T AACACCAGTGTGTAGAGCGG 111 CCR5-RG2-10G AACACCAGTGGGTAGAGCGG 112 CCR5-RG2-10C AACACCAGTGCGTAGAGCGG 113 CCR5-RG2-18A AAAACCAGTGAGTAGAGCGG 114 CCR5-RG2-18T AATACCAGTGAGTAGAGCGG 115 CCR5-RG2-18G AAGACCAGTGAGTAGAGCGG 116 CCR5-RG2-10T-18A AAAACCAGTGTGTAGAGCGG 117 CCR5-RG2-10T-18T AATACCAGTGTGTAGAGCGG 118 CCR5-RG2-10T-18G AAGACCAGTGTGTAGAGCGG 119 CCR5-RG2-10G-18A AAAACCAGTGGGTAGAGCGG 120 CCR5-RG2-10G-18T AATACCAGTGGGTAGAGCGG 121 CCR5-RG2-10G-18G A
  • the present inventors designed guide RNAs that on-target KRAS G12D and G12V, which are the main causes of pancreatic cancer, and when intentional mismatches were added at positions 10 and 18, wild-type genes and their nucleotide sequences and mutant genes and An additional experiment was conducted to verify that the nucleotide sequence can be differentiated to indicate the ability to specifically cut mutations.
  • FIG. 10a shows the wild-type KRAS base sequence and the point mutant base sequence of KRAS G12D and KRAS G12V.
  • KRAS G12D and KRAS The specific sequences of the oligomers used to clone the G12V-specific guide RNA are shown in Table 18.
  • RG1 SEQ ID NO: RG2 SEQ ID NO: BXPC3 wild type CTTGTGGTAGTTGGAGCTGG TGG 411 GTAGTTGGAGCTGGTGGCGT AGG 412 HPAFII NM_004985: c.35G>A, p.G12D CTTGTGGTAGTTGGAGCTG a TGG 413 GTAGTTGGAGCTG a TGGCGT AGG 414 CFPAC NM_004985: c.35G>T, p.G12V CTTGTGGTAGTTGGAGCTG t TGG 415 GTAGTTGGAGCTG t TGGCGT AGG 416
  • the gene editing activity for a wild-type KRAS cell line (off-target) and a cell line having KRAS-G12D and G12V point mutations (on-target) was measured by T7E1 assay in the same manner as in Example 2-1. It was confirmed by performing.
  • the PCR primers used in the T7E1 assay are shown in Table 19.
  • PCR primer pairs for T7E1 assay gene target sgRNAs Primer name forward SEQ ID NO: reverse SEQ ID NO: Size (bp) KRAS G12D, G12V KrasG12 TTTTCTTAAGCGTCGATGGAGGA 425 TCTACCCTCTCACGAAACTCTGA 426 614
  • wild-type KRAS-G12D-RG1 and KRAS-G12D-RG2 guide RNAs exhibit gene editing activity in both wild-type and mutant sequences, off-target and on-target It was confirmed to have all the activities.
  • wild-type KRAS-G12V-RG1 and KRAS-G12V-RG2 guide RNAs do not have a scissoring activity in the wild-type nucleotide sequence and exhibit a mutant nucleotide sequence. It was confirmed to have no activity and only on-target activity.
  • KRAS G12D-RG1 and KRAS G12D-RG2 two guide RNAs targeting the KRAS wild-type sequence and KRAS G12D point mutation, KRAS
  • BxPC3 off-target
  • HPAFII on-target
  • pancreatic cancer cell line having a KRAS G12D point mutation sequence respectively.
  • the gene scissors activity was confirmed by performing the T7E1 assay in the same manner as in Example 2-1, and the PCR primers used in the T7E1 assay are shown in Table 19.
  • KRAS G12D-RG1 exhibited gene editing activity for both wild-type and mutant sequences, and it was confirmed that it had both off-target and on-target activities.
  • the gene scissors activity disappeared in BxPC3 having a wild-type nucleotide sequence, and in HPAFII having a point mutation sequence, in the remaining five species except for one G12D-RG1-10C. It was confirmed that the gene scissors worked, so that the off-target activity disappeared and only the on-target activity was obtained.
  • KRAS G12D-RG2 exhibited gene editing activity for both wild-type and mutant sequences, and it was confirmed that it had both off-target and on-target activities.
  • the gene editing activity is lowered in BxPC3 having a wild-type nucleotide sequence, and in HPAFII having a point mutation sequence, the gene editing activity is maintained, so off-target activity is reduced and on - It was confirmed that the target activity is maintained. It was confirmed that there was no difference in gene scissors activity when intentional mismatch was added at position 18. It is expected that this problem could be solved by matching the position 10 mismatch variant to the position 18 mismatch.
  • Example 4 Reporting that knockout of the KRAS gene reduces tumor growth [MD Muzumdar et al. Survival of pancreatic cancer cells lacking KRAS function. Natcomm. 2017 Oct 23;8(1):1090.], it was confirmed whether the guide RNA designed in Example 4 could exhibit the same results.
  • KRAS-G12D which maintains on-target activity for a gene having a point mutation nucleotide sequence and has the lowest off-target activity for a gene having a wild-type nucleotide sequence -RG2-10A was used, and BxPC3, HPAFII and Panc-1 were used for pancreatic cancer cell lines.
  • BxPC3 is homozygous for the wild-type KRAS gene
  • HPAFII is homozygous for the KRAS-G12D mutant gene
  • Panc-1 was identified as heterozygous for the KRAS-G12D mutant gene.
  • the transgenic activity of KRAS-G12D-RG2 and KRAS-G12D-RG2-10A in the Panc-1 cell line was confirmed by performing a T7E1 assay in the same manner as in Example 2-1.
  • the Panc-1 cell line had a wild-type KRAS base sequence and a mutant base sequence, and as shown in FIG.
  • KRAS-G12D-RG2 and KRAS-G12D-RG2-10A guide RNAs were used to determine the expression difference between KRAS protein and KRAS-G12D protein in three types of pancreatic cancer cell lines.
  • three types of cell lines were infected with a lentivirus capable of expressing EV (empty vector), KRAS-G12D-RG2 or KRAS-G12D-RG2-10A guide RNA, followed by puromycin selection. A stable cell line was obtained.
  • a lentivirus capable of expressing EV empty vector
  • KRAS-G12D-RG2 or KRAS-G12D-RG2-10A guide RNA followed by puromycin selection.
  • a stable cell line was obtained.
  • As a result of confirming the expression level of KRAS and KRAS-G12D mutant proteins by Western blot as shown in FIG.
  • HPAFII cell line having the KRAS mutant sequence homozygous genotype when EV was treated, a cell growth pattern similar to that of BxPC3-EV cells was shown, and when KRAS-G12D-RG2 was treated, cell growth was similar to that of BxPC3-KRAS-G12D-RG2. was significantly reduced.
  • KRAS-G12D-RG2-10A KRAS protein expression was maintained and KRAS-G12D mutant protein expression was significantly reduced, so cell growth was reduced compared to HPAFII-EV cells, but HPAFII in which KRAS gene was completely knocked out - It was confirmed that cell growth was higher than that of KRAS-G12D-RG2.
  • the KRAS-G12D-RG2-10A guide RNA differentiates the wild-type sequence from the mutant sequence, and knocks out only the KRAS-G12D mutant protein so that it is not completely expressed while allowing the KRAS protein to be expressed, thereby selectively promoting cell growth. proved to be different.
  • a guide RNA capable of reducing off-target activity while maintaining on-target activity using intentional mismatches added to positions 10 and 18 can be selected, and wild-type sequence and The result was proved that guide RNA capable of knocking out only the mutant part by distinguishing the mutant base sequence can be selected. Therefore, by using the guide RNA preparation method according to the present invention, a mutant target guide RNA having a reduced off-target activity while maintaining high on-target activity is selected, and a target having a point mutation, which is one of the causes of cancer It is expected that it can be used to correct genes.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Immunology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Virology (AREA)
  • Epidemiology (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • AIDS & HIV (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 RNA 및 이의 용도에 관한 것으로, 구체적으로, 오프-타겟 유전자 영역에 대해 원래 (original) 하나의 미스매치를 포함하고, 타겟 유전자 영역 및 오프-타겟 유전자 영역에 대해 의도적인 (intentional) 하나 또는 두 개의 미스매치를 포함하되, 이때, 의도적인 하나 또는 두 개의 미스매치는 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +10 위치 및 +18 위치 중 하나 또는 두 개에 도입되는 가이드 RNA 및 이의 제조방법, 상기 가이드 RNA를 이용한 CRISPR 시스템의 정확도를 향상시키는 방법, 유전질환 및 암 발생의 원인이 되는 점 돌연변이(point mutation)를 야생형 유전자 및 염기서열로부터 구분하거나 후천성면역결핍증의 타겟 유전자인 CCR5를 고도의 상동성 CCR2 유전자로부터 구분할 수 있는 가이드 RNA를 포함하여 질병을 예방, 치료 또는 진단하기 위한 조성물, 상기 가이드 RNA를 이용한 유전자 표적 방법 및 유전자 교정 방법을 제공한다.

Description

온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 RNA 및 이의 용도
본 발명은 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 RNA 및 이의 용도에 관한 것으로, 구체적으로, 오프-타겟 유전자 영역에 대해 원래 (original) 하나의 미스매치를 포함하는 가이드 RNA를 수정하여, 타겟 유전자 영역 및 오프-타겟 유전자 영역에 대해 각각 의도적인 (intentional) 하나 또는 두 개의 미스매치를 포함하는 가이드 RNA 및 이의 제조방법, 상기 가이드 RNA를 이용한 CRISPR 시스템의 정확도를 향상시키는 방법, 상기 가이드 RNA를 포함하는 점 돌연변이 (point mutation)로 야기되는 질환의 예방, 치료 또는 진단용 조성물, 상기 가이드 RNA를 이용한 유전자 표적 방법 및 유전자 교정 방법을 제공한다.
CRISPR-Cas 시스템은 타겟하는 유전자 또는 핵산에 상보적인 서열을 갖는 가이드 (guide) RNA와 상기 타겟하는 유전자 또는 핵산을 절단하는 효소인 CRISPR 효소(enzyme)로 구성되고, 상기 가이드 RNA와 CRISPR 효소는 CRISPR 복합체(complex)를 형성하며, 상기 형성된 CRISPR 복합체에 의해 타겟하는 유전자 또는 핵산을 절단 또는 변형시킨다.
하지만, 상기와 같은 타겟하는 유전자 또는 핵산을 변형시키는 효과와 더불어 타겟하지 않는 유전자 또는 핵산을 변형시키는 문제가 아직까지 해결되지 않고 있다.
상기 타겟하지 않는 유전자 또는 핵산은 가이드 RNA와 일부 상보적인 서열을 포함함으로써 상기 가이드 RNA와 부분적인 상호작용이 가능하고, 이러한 상호작용에 의해 CRISPP 복합체가 해당 유전자, 즉, 원하지 않는 유전자 또는 핵산을 절단 또는 변형시키게 된다. 이러한 효과를 오프-타겟(off-target) 효과라고 한다.
그러므로, CRISPR-Cas 시스템을 이용하여 타겟하는 유전자 또는 핵산을 변형시키는 효율을 증대하기 위해 온-타겟(on-target) 효과를 높이거나, 또는 원하지 않은 유전자 또는 핵산의 변형으로 초래될 수 있는 유전적 결함 등의 문제점을 해결하기 위해 CRISPR-Cas 시스템의 오프-타겟(off-target) 효과를 감소 또는 제거하는 것이 중요하다. 또한 상기와 같은 CRISPR-Cas 시스템의 오프-타겟 효과를 감소시킴에 따라 타겟하는 유전자 또는 핵산을 정확하게 변형시킬 수 있는 정확성 및 특이성을 함께 기대할 수 있다.
이러한 CRISPR-Cas 시스템의 오프-타겟 효과를 감소 또는 제거하거나 CRISPR-Cas 시스템의 정확성 및 특이성 향상을 위해서, 오프-타겟 효과가 적은 가이드 RNA 선정(즉, 오프-타겟 효과가 적은 타겟 선정) 또는 변형 및 CRISPR 효소의 활성(또는 효율)과 특이성을 조절하는 것이 중요한 부분으로 여겨지고 있다.
한편, CRISPR 효소 중 Type II CRISPR 효소인 Cas9은 일반적으로 단일 미스매치를 허용할 수 있으며, 바람직하지 않은 오프-타겟 효과는 다중 미스매치 (multiple mismatches)에 따라 급격하게 감소된다. 이에 따라, 본 발명자들은 단일 뉴클레오타이드 치환이 가이드 RNA에 의도적으로 도입되는 경우, 온-타겟에 대한 활성에 영향을 미치지 않으면서 가이드 RNA의 오프-타겟 활성을 감소시킬 수 있을 것으로 가정하였으며 (도 1), 이러한 가설을 실험을 통해 입증하여 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된, 신규한 가이드 RNA를 제조함으로써 본 발명을 완성하였다.
[선행기술문헌]
[특허문헌]
(특허문헌 1) 대한민국 공개특허 제10-2016-0058703호
[비특허문헌]
(비특허문헌 1)Bioinformatics, 34, 2018, i757-i765
따라서, 본 발명의 목적은 온-타겟 활성을 유지하면서 오프-타겟에 대한 활성만 감소된 가이드 RNA 및 이의 제조방법을 제공하는 것이다.
본 발명의 다른 목적은 전술한 가이드 RNA를 이용한 CRISPR 시스템의 정확도를 향상시키는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 전술한 가이드 RNA를 포함하는 유전자 교정용 조성물을 제공하는 것이다.
본 발명의 다른 목적은 전술한 가이드 RNA를 이용하여 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증을 예방 또는 치료하기 위한 약학 조성물, 방법 및 용도를 제공하는 것이다.
본 발명의 또 다른 목적은 전술한 가이드 RNA를 이용하여 점 돌연변이로 야기되는 질환을 진단하기 위한 조성물, 방법 및 용도를 제공하는 것이다.
본 발명의 또 다른 목적은 전술한 가이드 RNA를 이용한 유전자 표적 방법 및 유전자 교정 방법을 제공하는 것이다.
상술한 과제를 해결하기 위해, 본 발명은 타겟 유전자 영역에 상보적인 뉴클레오타이드 서열을 포함하는 가이드 RNA로서, 상기 뉴클레오타이드 서열이 다음의 특징을 포함하는 가이드 RNA를 제공한다:
i) 오프-타겟 유전자 영역에 대해 원래 (original) 하나의 미스매치를 포함하고;
ii) 타겟 유전자 영역 및 오프-타겟 유전자 영역에 대해 의도적인 (intentional) 하나 또는 두 개의 미스매치를 포함하며;
상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 서로 상이한 위치에 도입된다.
본 발명의 바람직한 일실시예에 따르면, 상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 각각 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +1 위치 내지 +20 위치 중 서로 상이한 위치에 도입될 수 있다.
본 발명의 바람직한 다른 일실시예에 따르면, 상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 각각 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 도입될 수 있다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 타겟 유전자는 CCR5이고, 상기 오프-타겟 유전자는 CCR2일 수 있다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 가이드 RNA는 서열번호 1 내지 19로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 바람직한 다른 일실시예에 따르면, 상기 가이드 RNA는:
서열번호 1의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +15 위치 및 +17 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 2의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +11 위치 및 +13 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 3의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +8 위치 및 +10 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 4의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 및 +3 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 5의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +14 위치 및 +16 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 6의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 7의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +15 위치 및 +17 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 8의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +12 위치 및 +14 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 9의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +4 위치 및 +6 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 10의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 11의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +19 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 12의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +9 위치 및 +11 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 13의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 14의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +9 위치 및 +11 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 15의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 16의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +18 위치 및 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 17의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 18의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +18 위치 및 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나; 또는
서열번호 19의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +19 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고;
상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 바람직한 다른 일실시예에 따르면, 상기 가이드 RNA는 서열번호 1 내지 19로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 가이드 RNA는 서열번호 20 내지 95로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함할 수 있다.
본 발명의 바람직한 다른 일실시예에 따르면, 상기 가이드 RNA는 서열번호 96 내지 125로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함할 수 있다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 타겟 유전자는 점 돌연변이 (point mutation)를 포함하는 유전자이고, 상기 오프-타겟 유전자는 야생형 유전자일 수 있다.
본 발명의 바람직한 다른 일실시예에 따르면, 상기 타겟 유전자는 KRAS G12D, G12C 또는 G12V 점 돌연변이를 포함하는 유전자이고, 상기 오프-타겟 유전자는 야생형 KRAS 유전자일 수 있다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 가이드 RNA는 서열번호 413 내지 416로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 바람직한 다른 일실시예에 따르면, 상기 가이드 RNA는:
서열번호 413의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 414의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +6 위치 및 +8 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 415의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나; 또는
서열번호 416의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +6 위치 및 +8 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고;
상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 가이드 RNA는 서열번호 413 내지 416로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 바람직한 일실시예에 따르면, 상기 가이드 RNA는 서열번호 427 내지 438로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함할 수 있다.
본 발명의 바람직한 또 다른 일실시예에 따르면, 상기 가이드 RNA는 야생형 가이드 RNA의 온-타겟 활성의 50% 이상을 유지하고, 야생형 가이드 RNA에 비해 감소된 오프-타겟 활성을 나타내거나 오프-타겟 활성을 나타내지 않을 수 있다.
본 발명은 또한, 다음의 단계를 포함하는 가이드 RNA의 제조방법을 제공한다:
(a) 타겟 유전자 영역에 상보적인 뉴클레오타이드 서열을 포함하되, 오프-타겟 유전자 영역에 대해서는 원래 (original) 하나의 미스매치를 포함하는 가이드 RNA를 선별하는 단계; 및
(b) 선별된 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치를 도입하는 단계,
이때, 상기 원래 하나의 미스매치와 상기 하나 또는 두 개의 의도적인 미스매치는 서로 상이한 위치에 도입됨.
본 발명의 바람직한 일실시예에 따르면, 상기 방법으로부터 제조된 RNA는 야생형 가이드 RNA의 온-타겟 활성의 50% 이상을 유지하고, 야생형 가이드 RNA에 비해 감소된 오프-타겟 활성을 나타내거나, 오프-타겟 활성을 나타내지 않을 수 있다.
본 발명은 또한, 전술한 가이드 RNA를 이용한 CRISPR 시스템의 정확도를 향상시키는 방법을 제공한다.
추가로, 본 발명은 전술한 가이드 RNA를 포함하는, 유전자 교정용 조성물을 제공한다.
본 발명은 또한, 전술한 가이드 RNA를 이용한, 점 돌연변이 (point mutation)로 야기되는 질환 또는 후천성면역결핍증의 예방 또는 치료 용도를 제공한다.
이와 관련하여, 본 발명은 전술한 가이드 RNA를 포함하는, 점 돌연변이 (point mutation)로 야기되는 질환 또는 후천성면역결핍증의 예방 또는 치료용 약학 조성물을 제공한다.
다르게는, 전술한 가이드 RNA를 포함하는 조성물을 이를 필요로 하는 개체에게 투여하는 것을 포함하는, 점 돌연변이로 야기되는 질환 또는 후천선면역결핍증의 예방 또는 치료 방법을 제공한다.
다르게는, 점 돌연변이로 야기되는 질환 또는 후천선면역결핍증의 예방 또는 치료용 약제의 제조를 위한, 전술한 가이드 RNA의 용도를 제공하는 것이다.
본 발명은 또한, 전술한 가이드 RNA를 이용한, 점 돌연변이로 야기되는 질환의 진단 용도를 제공한다.
이와 관련하여, 본 발명은 전술한 가이드 RNA를 포함하는, 점 돌연변이로 야기되는 질환의 진단용 조성물을 제공한다.
다르게는, 전술한 가이드 RNA 및 Cas9폴리펩타이드 또는 이를 코딩하는 폴리뉴클레오타이드를 포함하는, 점 돌연변이로 야기되는 질환의 진단용 키트를 제공한다.
다르게는, 전술한 가이드 RNA를 이용한 CRISPR-Cas 시스템으로 점 돌연변이로 야기되는 질환을 진단하는 방법을 제공한다.
본 발명의 바람직한 일실시예에 따르면, 상기 점 돌연변이로 야기되는 질환은 암 또는 유전대사성 간질환일 수 있으나, 이에 제한되는 것은 아니다.
추가로, 본 발명은 전술한 가이드 RNA를 이용한 유전자 표적 방법 및/또는 유전자 교정 방법을 제공한다.
CRISPR-Cas9의 정확도를 올리기 위해 높은 정확도의 Cas9을 개발하려는 다양한 시도가 있었으나, 막대한 노력에 비해 다양한 단점들이 존재하며, 아직까지 널리 사용되고 있지 않다. 이러한 관점에서, 본 발명에 따른 가이드 RNA는 이미 검증된 높은 활성을 나타내는 야생형 Cas9와 함께 사용된다는 장점을 가지며, 후천성면역결핍증, 점 돌연변이로 야기되는 유전성 질환 및 암을 포함하는 질환의 예방, 치료 또는 진단 등에 폭넓게 활용될 수 있다.
도 1은 가이드 RNA의 스페이서 영역에서 의도적으로 생성된 단일 미스매치가 온-타겟 및 오프-타겟 부위에서 이의 활성에 미치는 영향에 대한 개략도를 나타낸다. 모델 가이드 RNA (WT)는 위치 10 (밝은 녹색)에서 미스매치가 있는 오프-타겟 부위를 가지며 동시에 강력한 온-타겟 및 오프-타겟 활성 (각각 파란선 및 붉은선)을 나타낸다. 만일 단일 뉴클레오타이드 치환 (복숭아색 사각형)이 스페이서 영역으로 도입되면, 가이드 RNA는 오프-타겟 부위는 두 개의 미스매치를 가질 것이다. 이는 온-타겟 및 오프-타겟 부위에서의 활성에 대한 단일 미스매치의 효과를 체계적으로 분석함으로써 최소한의 오프-타겟 활성 (별표)을 갖는 활성 가이드 RNA를 개발할 수 있을 것으로 예상된다.
도 2는 인간 CCR5 유전자의 오픈 리딩 프레임을 타겟하는 가이드 RNA의 온-타겟 및 오프-타겟 활성을 나타낸 것으로, a는 인간 CCR5 유전자에 특이적인 19개의 가이드 RNA의 위치 (노란색 화살표) 및 인간 CCR2 유전자에서 상응하는 오프-타겟 위치 (회색 화살표)를 나타낸다. 오프-타겟 부위는 단일 뉴클레오타이드만큼 상이하다. 화살표의 방향은 타겟 서열이 유전자의 정방향 가닥으로부터 유래되었는지 또는 역방향 가닥으로부터 유래되었는지를 나타낸다. 유전형 분석 (genotyping) 프라이머 쌍과 가이드 RNA는 색상별로 매치된다. B는 인간 CCR5 유전자를 타겟하는 가이드 RNA의 온-타겟 및 오프-타겟 활성을 측정하는 T7 엔도뉴클레아제 I (T7E1) 어세이 결과를 나타낸다 (M: 사이즈 마커, NT: 처리되지 않음).
도 3은 의도적 미스매치가 CCR5-RG1의 온-타겟 및 오프-타겟 활성에 미치는 영향을 나타낸 것으로, a는 CCR5-RG1 타겟 서열 및 이의 오프-타겟 서열 CCR2-RG1을 비교한 것이다. 위치 16의 원래 미스매치는 붉은색으로 표시되었다. B는 의도적인 미스매치를 포함하는 CCR5-RG1 변이체의 온-타겟 및 오프-타겟 활성을 측정하는 T7E1 어세이 결과를 나타낸다. 이 실험에서, 전이 돌연변이 (transition mutation) (예를 들어, A↔G and C↔T)만 테스트 하였으나, 위치 16의 원래 미스매치는 바뀌지 않았다 (M: 사이즈 마커, NT: 처리되지 않음, EV: 공 벡터, WT: 야생형).
도 4는 의도적 미스매치가 CCR5-RG12의 온-타겟 및 오프-타겟 활성에 미치는 영향을 나타낸 것으로, a는 CCR5-RG12 타겟 서열 및 이의 오프-타겟 서열 CCR2-RG12을 비교한 것이다. 위치 10의 원래 미스매치는 붉은색으로 표시되었다. B는 의도적인 미스매치를 포함하는 CCR5-RG12 변이체의 온-타겟 및 오프-타겟 활성을 측정하는 T7E1 어세이 결과를 나타낸다. 이 실험에서, 의도적 돌연변이는 각각 원래 뉴클레오타이드를 3개의 다른 뉴클레오타이드 중 하나로 변경함으로써 도입되었으나, 위치 10에서의 원래 미스매치는 바뀌지 않았다 (NT: 처리되지 않음, WT: 야생형).
도 5는 야생형 CCR5-RG1 및 이의 변이체 일부 (4G, 6A, 7T 및 10A)와 야생형 CCR2-RG12 및 이의 변이체 일부 (2G, 3C, 12G 및 13T)의 T7E1 어세이 결과 및 딥 시퀀싱 결과를 동시에 나타낸 것이다.
도 6은 야생형 CCR5-RG3 및 이의 변이체 일부 (10A, 10T, 10C, 18A, 18T 및 18C)의 T7E1 어세이 결과를 나타낸 것이다.
도 7은 야생형 CCR5-RG7 및 이의 변이체 일부 (10A, 10T, 10C, 18A, 18T 및 18C)의 T7E1 어세이 결과를 나타낸 것이다.
도 8은 야생형 CCR5-RG2 및 이의 변이체 일부 (10T, 10G, 10C, 18A, 18T, 18G, 10G-18A, 10G-18T, 10G-18G)의 T7E1 어세이 결과를 나타낸 것이다.
도 9는 야생형 CCR5-RG3 및 이의 변이체 일부 (10A 및 18A), CCR5-RG7 및 이의 변이체 일부 (10C 및 18A), 그리고 CCR5-RG2 및 이의 변이체 일부 (10G 및 10G-18A)의 T7E1 어세이 결과 및 딥 시퀀싱 결과를 동시에 나타낸 것이다.
도 10의 a는 야생형 KRAS 염기서열과 KRAS G12D 와 KRAS G12V의 점 돌연변이 염기서열을 나타낸 것이고, b는 BXPC3 세포주 및 HPAFII 세포주에서 각각 야생형 KRAS-G12D-RG1 및 KRAS-G12D-RG2의 T7E1 어세이 결과를 나타낸 것이며, c는 KRAS-G12V-RG1 및 KRAS-G12V-RG2의 T7E1 어세이 결과를 나타낸 것이다.
도 11의 a는 야생형 KRAS 염기서열을 오프-타겟으로 하고, KRAS G12D 점 돌연변이를 포함하는 염기서열을 온-타겟하는 2종의 가이드 RNA (KRAS G12D-RG1 및 KRAS G12D-RG2) 설계 전략 및 이의 서열을 나타낸 것이고, b는 BxPC3 및 HPAFII 세포주에서 각각 야생형 KRAS-G12D-RG1 및 이의 변이체 (10A, 10G, 10C, 18A, 18G 및 18C)의 T7E1 어세이 결과를 나타낸 것이며, c는 BxPC3 및 HPAFII 세포주에서 각각 야생형 KRAS-G12D-RG2 및 이의 변이체 (10A, 10T, 10G, 18T, 18G 및 18C)의 T7E1 어세이 결과를 나타낸 것이다.
도 12의 a는 3종류의 췌장암 세포주 (BxPC3, HPAFII 및 Panc-1)의 유전자형 분석 결과를 나타낸 것이고, b는 Panc-1 세포주에 야생형 KRAS-G12D-RG2 및 이의 변이체 KRAS-G12D-RG2-10A의 T7E1 어세이 결과를 나타낸 것이며, c는 3종류의 췌장암 세포주 (BxPC3, HPAFII 및 Panc-1)에서 각각 야생형 KRAS-G12D-RG2 및 이의 변이체 KRAS-G12D-RG2-10A의 처리에 따른 KRAS 단백질 및 KRAS-G12D 돌연변이 단백질의 발현 차이를 웨스턴 블랏으로 확인한 결과를 나타낸 것이며, d는 3종류의 췌장암 세포주 (BxPC3, HPAFII 및 Panc-1)에서 야생형 KRAS-G12D-RG2 및 이의 변이체 KRAS-G12D-RG2-10A의 처리에 따른 세포 성장을 확인한 결과이다.
상술한 바와 같이, 본 발명자들은 단일 뉴클레오타이드 치환이 가이드 RNA에 의도적으로 도입되는 경우, 온-타겟에 대한 심각한 활성 저하를 유발하지 않으면서 가이드 RNA의 오프-타겟 활성만을 감소시킬 수 있을 것으로 가정하였으며 (도 1), 이러한 가설을 입증함으로써 상술한 문제의 해결방안을 모색하였다.
따라서, 본 발명의 제1 측면은 타겟 유전자 영역에 상보적인 뉴클레오타이드 서열을 포함하는 가이드 RNA로서, 상기 뉴클레오타이드 서열이 다음의 특징을 포함하는 가이드 RNA에 관한 것이다:
i) 오프-타겟 유전자 영역에 대해 원래 (original) 하나의 미스매치를 포함하고;
ii) 타겟 유전자 영역 및 오프-타겟 유전자 영역에 대해 의도적인 (intentional) 하나 또는 두 개의 미스매치를 포함하며;
상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 서로 상이한 위치에 도입된다.
본 발명에서 용어 "가이드 RNA"는 타겟 유전자 또는 타겟 핵산에 특이적인 RNA를 의미하며, CRISPR 효소와 결합하여 CRISPR 효소를 타겟 유전자 또는 타겟 핵산으로 인도할 수 있다.
상기 가이드 RNA는 타겟 유전자 또는 타겟 핵산 서열에 상보적인 뉴클레오타이드 서열을 포함하는 CRISPR RNA (crRNA) 및 CRISPR 효소와 결합하는 trans-activating CRISPR RNA (tracrRNA)로 구성될 수 있으며, 이때 상기 crRNA는 타겟 유전자 또는 타겟 핵산 서열과 상보적인 결합을 하는 부분인 가이드 서열 (guide sequence)을 포함한다. 상기 가이드 서열은 타겟 유전자 또는 타겟 핵산 서열을 인지하는 역할을 한다.
본 발명의 가이드 RNA는 crRNA 및 tracrRNA의 필수적 부분의 융합에 의해 생성된 단일 가이드 RNA (sgRNA) 또는 crRNA 및 tracrRNA가 각각 따로 존재하는 이중 RNA (dual RNA)일 수 있다.
본 발명에서 용어 "온-타겟 (on-target)"은 가이드 RNA가 상보적으로 결합하는 타겟 유전자 또는 타겟 핵산의 서열 또는 위치를 의미하며, 용어 "오프-타겟 (off-target)"은 가이드 RNA가 부분적으로 상보적인 결합을 함으로써, 목적하지 않지만 유전자 가위의 활성이 발생하는 유전자 또는 핵산의 서열 또는 위치를 의미한다.
본 발명에서 용어 "미스매치 (mismatch)"는 DNA 간 또는 DNA와 RNA 염기 간에 상보적인 결합에서 비상보적인 서열이 존재하는 부적정 염기쌍이 발생하는 것을 의미한다.
본 발명의 가이드 RNA에 있어서, 용어 "원래 (original) 하나의 미스매치"는 온-타겟 유전자 영역과 비교하였을 때 오프-타겟 유전자 영역의 뉴클레오타이드 서열에 하나의 뉴클레오타이드 차이가 존재하여 발생되는 미스매치를 의미하며, 원래 (original) 하나의 미스매치만을 포함하는 가이드 RNA는 온-타겟 유전자 영역에 완전히 상보적으로 결합하지만, 오프-타겟 유전자 영역에는 하나의 뉴클레오타이드 차이로 부분적으로 상보적인 결합을 한다. 원래 (original) 하나의 미스매치만을 포함하는 가이드 RNA는 온-타겟 유전자 영역에 완전히 상보적으로 결합하므로, 온-타겟 유전자 영역에 대해서는 미스매치가 도입되지 않은 야생형 가이드 RNA이다.
본 발명의 가이드 RNA에 있어서, 용어 "의도적인 (intentional) 하나 또는 두 개의 미스매치"는 원래 하나의 미스매치와 달리 인공적으로 도입된 하나 또는 두 개의 미스매치를 의미한다. 의도적인 하나 또는 두 개의 미스매치를 포함하는 가이드 RNA는 온-타겟 유전자 영역과 오프-타겟 유전자 영역 둘 다에 대해 공통적으로 하나 또는 두 개의 뉴클레오타이드 차이로 부분적으로 상보적인 결합을 한다.
결과적으로, 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 서로 상이한 위치에 존재하며, 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치를 포함하는 가이드 RNA는 온-타겟 유전자 영역에 대해서는 하나 또는 두 개의 뉴클레오타이드 차이로 부분적으로 상보적인 결합을 하고, 오프-타겟 유전자 영역에 대해서는 두 개 또는 세 개의 뉴클레오타이드 차이로 부분적으로 상보적인 결합을 한다.
본 발명의 가이드 RNA에 있어서, 상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 각각 가이드 RNA의 뉴클레오타이드 서열의 스페이서 영역에 존재하며, 바람직하게는 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +1 위치 내지 +20 위치 중 어느 하나 이상에 존재할 수 있지만, 서로 상이한 위치에 존재한다. 보다 바람직하게는 상기 의도적인 하나 또는 두 개의 미스매치는 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 도입될 수 있다.
본 발명자들은 도 2의 a에 나타난 바와 같이, 하나의 뉴클레오티드가 상이한 고도의 상동성 CCR2 유전자에서 오프-타겟 부위를 갖는 인간 CCR5의 오픈 리딩 프레임 (open reading frame)으로부터 19개의 타겟 서열을 추출하였고, 이들의 구체적인 서열은 표 5에 나타냈다. 이들 중 5개의 가이드 RNA, 즉 RG1-3, 7 및 12는 도 2의 b 및 표 5에서 확인되는 바와 같이 인간 Jurkat T 세포의 온-타겟 및 오프-타겟 부위에 높은 활성을 나타냈다.
가이드 RNA의 온-타겟 및 오프-타겟 활성에 대한 의도적 미스매치의 영향을 조사하기 위해, 도 3의 a에 나타난 바와 같이 위치 16 (PAM으로부터 +16 위치)에서 하나의 미스매치를 포함하는 야생형 버전인 CCR5-RG1에 대해 일련의 전이 돌연변이를 생성하였다. 도 3의 b 및 표 6에서 확인되는 바와 같이 추가의 돌연변이 도입은 의도적인 미스매치의 위치에 따라 상이한 정도로 CCR5-RG1의 오프-타겟 활성을 일관되게 억제하였다. 도 1에 나타난 바와 같이 타겟화된 딥 시퀀싱을 통해 야생형 CCR5-RG1의 온-타겟 및 오프 타겟 활성이 각각 76.5 % 및 8.6 %임을 확인하였다. 특히, 위치 4의 전이 돌연변이체 (4G)는 본래 타겟 부위 (55.5 %)에서 여전히 활성이었지만, 오프-타겟 활성은 1.5%로 현저하게 감소하였다.
또한, 본 발명자들은 CCR5-RG12에서도 의도적인 미스매치의 영향을 조사하였으며, 이는 도 4의 a에 나타난 바와 같이 위치 10 (PAM으로부터 +16 위치)에 원래 미스매치가 존재한다. 도 5에 나타나 바와 같이 딥 시퀀싱을 통해 야생형 CCR5-RG12의 오프-타겟 활성이 40.4%로 매우 강하다는 것을 확인하였다. 다음으로, 57개의 전이 돌연변이체 및 전좌 돌연변이체를 생성하였고 T7E1 어세이 (도 4의 b 및 표 7)를 이용하여 온-타겟 및 오프-타겟 활성을 측정하였다. 이 실험에서, 13개의 돌연변이 가이드 RNA (6개의 전이 돌연변이체: 2G, 6G, 12G, 13G, 19A 및 20A; 및 8개의 전좌 돌연변이체: 3C, 12C/T, 13T, 18A, 19C 및 20C/T)가 야생형 CCR5-RG12와 유사한 온-타겟 활성을 나타내었고, 6개의 돌연변이 가이드 RNA (2G, 3C, 12G/C, 13T 및 18A)에 대해서는 명백한 오프-타겟 활성이 검출되지 않았다 (도 4의 b 및 표 7). 특히, 위치 12 (12G)에서의 의도적인 미스매치는 오프-타겟 활성을 40.4 %에서 0.8 %로 감소시켰지만, 온-타겟 활성은 크게 손상시키지 않았으며 (야생형 CCR5-RG12의 온-타겟 활성 66.5% vs 12G의 온-타겟 활성 49.8%), 이는 의도적 미스매치가 가이드 RNA의 온-타겟 활성에 영향을 미치지 않으면서 바람직하지 않은 오프-타겟 활성만 효과적으로 제거할 수 있음을 시사한다.
본 발명의 가이드 RNA에 있어서, 상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 각각 가이드 RNA의 뉴클레오타이드 서열의 스페이서 영역에 존재하며, 보다 바람직하게는 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 도입될 수 있다.
본 발명자들은 실시예 4에 나타난 바와 같이, 의도적 미스매치의 위치에 따른 온-타겟 및 오프-타겟 활성을 확인하였고, 그 결과 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +10 위치 및 +18 위치 중 어느 하나 또는 둘 다에 의도적 미스매치를 도입하였을 때 온-타겟 활성은 유지되지만 오프-타겟 활성은 크게 줄어든다는 것을 확인하였다 (도 6 내지 8). 이에 따라, +10 위치 및 +18 위치에 의도적 미스매치를 도입하여 제조되는 다양한 가이드 RNA는 유전자 교정 치료 시 야생형 유전자는 오프-타겟으로 하고, 점 돌연변이 유전자는 온-타겟으로 하여, 점 돌연변이로 야기되는 다양한 유전 질환에 대한 효과적인 치료법으로 적용될 수 있다.
본 발명의 일실시예에서 제공되는 가이드 RNA는 예를 들어, a) CCR5를 타겟 유전자로 하고, CCR2를 오프-타겟 유전자로 하거나; b) 점 돌연변이가 발생하여 폐암을 유발하는 EGFR 유전자를 타겟 유전자로 하고, 야생형 EGFR 유전자를 오프-타겟 유전자로 하거나; c) 점 돌연변이가 발생하여 유전대사성 간질환인 윌슨병을 유발하는 ATP7B 유전자를 타겟 유전자로 하고, 야생형 ATP7B 유전자를 오프-타겟 유전자로 하거나; 또는 d) 점 돌연변이가 발생하여 췌장암, 대장암 또는 폐암을 유발하는 KRAS 유전자를 타겟 유전자로 하고, 야생형 KRAS 유전자를 오프-타겟 유전자로 할 수 있으나, 이로 한정되는 것은 아니다.
본 발명의 가이드 RNA의 타겟 유전자가 CCR5이고 오프-타겟 유전자가 CCR2인 경우, 상기 가이드 RNA는 서열번호 1 내지 19로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치가 도입된 것일 수 있고, 상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
본 발명의 가이드 RNA에 있어서, 의도적인 미스매치는 전이 돌연변이 (transition mutation) 또는 전좌 돌연변이 (transversion mutation)를 유발하여 도입된 것일 수 있다.
예를 들어, 타겟 유전자가 CCR5이고 오프-타겟 유전자가 CCR2인 가이드 RNA의 구체적인 뉴클레오타이드 서열은 서열번호 1의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +15 위치 및 +17 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 2의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +11 위치 및 +13 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 3의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +8 위치 및 +10 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 4의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 및 +3 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 5의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +14 위치 및 +16 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 6의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 7의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +15 위치 및 +17 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 8의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +12 위치 및 +14 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 9의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +4 위치 및 +6 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 10의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 11의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +19 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 12의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +9 위치 및 +11 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 13의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 14의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +9 위치 및 +11 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 15의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 16의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +18 위치 및 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 17의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 18의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +18 위치 및 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나; 또는
서열번호 19의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +19 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고;
상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
구체적으로, 이러한 가이드 RNA는 서열번호 20 내지 95로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함할 수 있다.
다른 예로, 타겟 유전자가 CCR5이고 오프-타겟 유전자가 CCR2인 가이드 RNA의 구체적인 뉴클레오타이드 서열은 서열번호 1 내지 19로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
구체적으로, 이러한 가이드 RNA는 서열번호 96 내지 125로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함할 수 있다.
본 발명의 가이드 RNA의 타겟 유전자가 점 돌연변이, 예를 들어, KRAS G12D, G12C 또는 G12V 점 돌연변이를 포함하는 KRAS 유전자이고, 오프-타겟 유전자가 야생형 KRAS 유전자인 경우, 상기 가이드 RNA는 서열번호 413 내지 416로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
예를 들어, 타겟 유전자가 KRAS G12D, G12C 또는 G12V 점 돌연변이를 포함하는 KRAS 유전자이고, 오프-타겟 유전자가 야생형 KRAS 유전자인 가이드 RNA의 구체적인 뉴클레오타이드 서열은:
서열번호 413의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 414의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +6 위치 및 +8 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
서열번호 415의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나; 또는
서열번호 416의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +6 위치 및 +8 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고;
상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
다른 예로, 타겟 유전자가 KRAS G12D, G12C 또는 G12V 점 돌연변이를 포함하는 KRAS 유전자이고, 오프-타겟 유전자가 야생형 KRAS 유전자인 가이드 RNA의 구체적인 뉴클레오타이드 서열은 서열번호 413 내지 416로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입될 수 있고, 상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외된다.
구체적으로, 이러한 가이드 RNA는 서열번호 427 내지 438로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함할 수 있다.
본 발명의 가이드 RNA는 야생형 가이드 RNA의 온-타겟 활성의 50%, 60%, 70%, 80%, 또는 90% 이상을 유지하고, 바람직하게는 70% 이상을 유지하고, 야생형 가이드 RNA에 비해 감소된 오프-타겟 활성을 나타내거나 오프-타겟 활성을 나타내지 않을 수 있다.
본 발명의 제2 측면은 다음의 단계를 포함하는 가이드 RNA의 제조방법에 관한 것이다:
(a) 타겟 유전자 영역에 상보적인 뉴클레오타이드 서열을 포함하되, 오프-타겟 유전자 영역에 대해서는 원래 (original) 하나의 미스매치를 포함하는 가이드 RNA를 선별하는 단계; 및
(b) 선별된 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치를 도입하는 단계,
이때, 상기 원래 하나의 미스매치와 상기 하나 또는 두 개의 의도적인 미스매치는 서로 상이한 위치에 도입됨.
본 발명의 제조방법으로부터 제조된 가이드 RNA는 야생형 가이드 RNA의 온-타겟 활성의 50% 이상을 유지하고, 야생형 가이드 RNA에 비해 감소된 오프-타겟 활성을 나타내거나, 오프-타겟 활성을 나타내지 않는다.
본 발명의 제조방법에 있어서, 각 단계에 언급된 용어에 대한 설명과 제조되는 가이드 RNA의 구성 및 효과는 전술한 바와 동일하므로, 그 기재를 생략한다.
본 발명의 제3 측면은 전술한 가이드 RNA를 이용한 CRISPR 시스템의 정확도를 향상시키는 방법에 관한 것이다.
타겟 특이적 유전자 가위는 목적(표적 또는 타겟)하는 유전체 상의 핵산(DNA 또는 RNA)의 특정 위치를 인식하여 절단할 수 있는 뉴클레아제를 의미한다. 본 발명에서 상기 타겟 특이적 유전자 가위는 특정 뉴클레아제가 목적하는 기능을 발휘할 수 있도록 필요한 다른 요소를 함께 포함하는 개념으로도 사용된다.
상기 뉴클레아제는 게놈 상의 특정 표적 서열을 인식하는 도메인 (부분)과 절단하는 도메인 (부분)이 융합된 뉴클레아제가 포함될 수 있다.
따라서, 본 발명의 CRISPR 시스템의 정확도를 향상시키는 방법에는 유전체 상의 핵산(DNA 또는 RNA)의 특정 위치를 인식하여 절단할 수 있는 뉴클레아제가 사용될 수 있다.
본 발명에서 용어 "CRISPR-Cas 시스템"은 가이드 RNA 및 CRISPR 효소를 코딩하는 서열을 포함하여 이의 발현 또는 활성 유도에 관여하는 모든 요소를 포함하는 것이다. 상기 CRISPR-Cas 시스템은 가이드 RNA 및 CRISPR 효소를 코딩하는 서 열을 포함하는 벡터 시스템(vector system)일 수 있다.
상기 벡터 시스템은 포함되는 구성요소들이 서로 작동적으로 연결된다. 용어 "작동적으로 연결된"은 서열이 목적하는 기능을 발휘하도록 핵산 서열이 기능적 연결된 것을 지칭한다. 예를 들면, 목적하는 유전자, 예를 들면, 선별가능한 마커에 대한 코딩 서열은, 연결된 프로모터 및/또는 조절 영역이 코딩 서열의 발현을 기능적으로 조절하는 경우, 이의 프로모터 및/또는 조절 서열과 작동적 연결 상태에 있다. 이는 또한 이들이 동일한 연결 프로모터 및/또는 조절 영역에 의해 조절될 수 있도록 코딩 서열 사이의 연결을 지칭하고; 코딩 서열 사이의 이러한 연결은 또한 프레임 또는 동일한 코딩프레임에서 연결되는 것으로 지칭될 수 있다. 용어 "작동적으로 연결된"은 또한 기능적, 그러나 비-코딩 서열, 예를 들면, 자가 증식 서열 또는 복제 기원의 연결을 지칭한다. 이러한 서열은, 이들이 정상 기능을 수행할 수 있는 경우, 예를 들면, 숙주세포에서 상기 서열을 포함하는 벡터의 복제, 증식 및/또는 분리를 가능하게 하는 경우, 작동적 연결 상태에 있다.
본 발명의 "CRISPR-Cas 시스템"은 가이드 RNA의 서열 및 CRISPR 효소의 단백질 또는 폴리펩타이드를 포함하여 이의 발현 또는 활성 유도에 관여하는 모든 요소를 포함하는 것으로서, 상기 CRISPR-Cas 시스템은 가이드 RNA 및 CRISPR 효소가 복합체(complex)를 형성하는 RNP(ribonucleoprotein) 시스템일 수 있다. 이때, 상기 RNP는 단백질-RNA 복합체로, RNA와 RNA-결합(binding) 단백질의 상호작용에 의해 형성되는 복합체의 형태를 의미한다.
상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 포함하는 핵산 또는 폴리펩타이드(또는 단백질)로, 대표적으로 Type II CRISPR 효소 또는 Type V CRISPR 효소가 많이 사용된다.
Type II CRISPR 효소으로는 Cas9이 있으며, Cas9은 Actinobacteria (, Actinomyces naeslundii) Cas9, Aquificae Cas9, Bacteroidetes Cas 9, Chlamydiae Cas9, Chloroflexi Cas9, Cyanobacteria Cas9, Elusimicrobia Cas9, Fibrobacteres Cas9, Firmicutes Cas9 (예를 들어, Streptococcus pyogenes Cas9, Streptococcus thermophilus Cas9, Listeria innocua Cas9, Streptococcus agalactiae Cas9, Streptococcus mutans Cas9 및 Enterococcus faecium Cas9), Fusobacteria Cas9, Proteobacteria (예를 들어, Neisseria meningitides, Campylobacter jejuni) Cas9, Spirochaetes (예를 들어, Treponema denticola) Cas9 등 다양한 미생물 유래의 Cas9일 수 있다.
"Cas9"은 가이드 RNA와 결합하여 타겟하는 유전자 또는 핵산의 서열 또는 위치를 절단 또는 변형시키는 효소로서, 가이드 RNA가 상보적인 결합을 하는 핵산가닥(strand)을 절단할 수 있는 HNH 도메인, 가이드 RNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 타겟을 인식하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성 될 수 있다. 구체적인 Cas9의 구조적 특성은 문헌 [Hiroshi Nishimasu et al. (2014) Cell 156:935-949]를 참고할 수 있다.
또한, 상기 Type V CRISPR 효소으로는 Cpfl이 있으며, 상기 Cpfl은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpfl일 수 있다.
상기 Cpfl은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟을 인식하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpfl의 구조적 특성은 문헌 [Takashi Yamano et al. (2016) Cell 165:949-962]를 참고할 수 있다.
상기 CRISPR 효소는 유전자 또는 핵산 서열 내에 프로토스페이서 인접 모티프 (PAM)를 인식할 수 있으며, 상기 PAM은 CRISPR 효소의 종류 또는/및 유래에 따라 다를 수 있다.
예를 들어, CRISPR 효소가 SpCas9인 경우 PAM은 5'-NGG-3'일 수 있고, StCas9인 경우 PAM은 5'-NNAGAAW-3'(W = A 또는 T)일 수 있고, NmCas9인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, CjCas9인 경우 PAM은 5'-NNNVRYAC-3' (V = G 또는 C 또는 A, R = A 또는 G, Y = C 또는 T)일 수 있으며, 이 때 상기 N은 A, Τ, G 또는 C; 또는 A, U, G 또는 C일 수 있다. 또한, CRISPR 효소가 FnCpfl인 경우 PAM은 5' TTN-3'일 수 있고, AsCpfl 또는 LbCpfl인 경우 PAM은 5'-TTTN-3'일 수 있으며, 이때 상기 N은 A, Τ, G 또는 C; 또는 A, U, G 또는 C일 수 있다.
상기 CRISPR 효소의 정보는 NCBI (National Center for Biotechnology Infomiation)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있으나, 이에 제한되지 않는다.
본 발명의 제4 측면은 전술한 가이드 RNA를 포함하는 유전자 교정용 조성물에 관한 것이다.
본 발명의 유전자 교정용 조성물은 유전체 상의 핵산(게놈 DNA)의 특정 위치를 인식하여 절단할 수 있는 뉴클레아제를 추가로 포함할 수 있으며, 이에 대한 설명은 전술한 바와 동일하므로, 그 기재를 생략한다.
예를 들어, 본 발명의 유전자 교정용 조성물은 Cas9 폴리펩타이드 또는 이를 코딩하는 폴리뉴클레오타이드를 추가로 포함할 수 있다.
본 발명의 유전자 교정용 조성물은, 특히 유전자 교정 치료에 효과적으로 적용될 수 있다. 환자에게서 발견되는 병원성 돌연변이 (pathogenic mutation)의 약 50% 가량이 점 돌연변이 (point mutation)이며, 본 발명의 유전자 교정용 조성물은 점 돌연변이로 야기되는 질환의 유전자 교정 치료 시, 점 돌연변이가 발생한 유전자는 온-타겟이 되고, 야생형 유전자는 오프-타겟이 되어 야생형 서열 (wild-type sequence)을 보존할 수 있는 전략으로 사용되어, 치료 효과를 증진시킬 수 있다.
이에 따라, 본 발명의 제5 측면은 전술한 가이드 RNA를 이용한, 점 돌연변이 (point mutation)로 야기되는 질환의 예방 또는 치료 용도 및/또는 점 돌연변이로 야기되는 질환의 진단 용도를 제공한다.
이와 관련하여, 본 발명은 전술한 가이드 RNA를 포함하는, 점 돌연변이 (point mutation)로 야기되는 질환 또는 후천성면역결핍증의 예방 또는 치료용 약학 조성물을 제공한다.
본 발명에서 사용되는 용어인 용어 "예방"은 상기 약학 조성물의 투여에 의해 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증을 억제하거나, 이의 발병을 지연시키는 모든 행위를 말한다. 상기 용어 "치료"는 상기 약학 조성물의 투여에 의해 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증의 증세가 호전되거 나 이롭게 변경하는 모든 행위를 말한다.
본 발명에서, 상기 약학 조성물은 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증의 예방 또는 치료방법에 이용될 수 있으며, 구체적으로 상기 예방 또는 치료방법은 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증이 발병되거나 또는 발병될 것으로 예상되는 개체에 투여하는 단계를 포함할 수 있다.
본 발명의 용어 "투여"란, 적절한 방법으로 개체에게 상기 조성물을 도입하는 것을 의미한다.
본 발명의 용어 "개체"란, 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증이 발병하였거나 발병할 수 있는 인간을 포함한 쥐, 생쥐, 가축 등의 모든 동물을 의미하고, 구체적인 예로, 인간을 포함한 포유동물일 수 있으나, 이에 제한되지 않는다.
본 발명의 조성물은 약학적으로 유효한 양으로 투여한다. 본 발명의 용어, "약학적으로 유효한 양"이란, 의학적 치료에 적용 가능한 합리적인 수혜/위험 비율로 질환을 치료하기에 충분한 양을 의미하며, 유효 용량 수준은 개체 종류 및 중증도, 연령, 성별, 약물의 활성, 약물에 대한 민감도, 투여 시간, 투여 경로 및 배출 비율, 치료 기간, 동시 사용되는 약물을 포함한 요소 및 기타 의학 분야에 잘 알려진 요소에 따라 결정될 수 있다. 예를 들면, 상기 조성물은 유효성분으로 1일 0.01 내지 500 mg/kg으로, 구체적으로 10 내지 100 mg/kg의 용량으로 투여할 수 있으며, 상기 투여는 하루에 한 번 또는 수회 나누어 투여할 수도 있다. 또한, 본 발명의 약학 조성물은 조성물 총 중량에 대하여 본 발명의 조성물을 0.001 내지 50% 중량 백분율로 포함할 수 있다.
본 발명의 조성물은 개별 치료제로 투여하거나 다른 치료제와 병용하여 투여될 수 있고 종래의 치료제와는 순차적 또는 동시에 투여될 수 있다. 그리고 단일 또는 다중 투여될 수 있다. 상기 요소를 모두 고려하여 부작용 없이 최소한의 양으로 최대 효과를 얻을 수 있는 양을 투여하는 것이 중요하며, 이는 당업자에 의해 용이하게 결정될 수 있다.
본 발명의 점 돌연변이로 야기되는 질환 또는 후천성면역결핍증의 예방 또는 치료용 약학 조성물은 상기 기재한 유효성분 이외에 약학적으로 허용 가능한 담체, 부형제 또는 희석제를 추가로 포함할 수 있다. 상기 담체, 부형제 및 희석제로는 락토즈, 덱스트로즈, 수크로스, 솔비톨, 만니톨, 자일리톨, 에리스리톨, 말티톨, 전분, 아카시아 고무, 알지네이트, 젤라틴, 칼슘 포스페이트, 칼슘 실리케이트, 셀룰로즈, 메틸 셀룰로즈, 미정질 셀룰로스, 폴리비닐 피롤리돈, 물, 메틸히드록시 벤조에이트, 프로필히드록시벤조에이트, 탈크, 마그네슘 스테아레이트 및 광물유를 들 수 있다.
본 발명의 상기 약학 조성물은 각각 통상의 방법에 따라 산제, 과립제, 정제, 캡슐제, 현탁액, 에멀젼, 시럽, 에어로졸 등의 경구형 제형, 외용제, 좌제 또는 멸균 주사용액의 형태로 제형화하여 사용할 수 있다. 구체적으로, 제형화할 경우 통상 사용하는 충진제, 중량제, 결합제, 습윤제, 붕해제, 계면활성제 등의 희석제 또는 부형제를 사용하여 조제될 수 있다. 경구투여를 위한 고형제제로는 정제, 환제, 산제, 과립제, 캡슐제 등을 포함하지만, 이에 제한되는 것은 아니다. 이러한 고형제제는 적어도 하나 이상의 부형제, 예를 들면, 전분, 칼슘 카보 네이트, 수크로오스, 락토오스, 젤라틴 등을 섞어 조제될 수 있다. 또한, 단순한 부형제 이외에 마그네슘 스테아레이트, 탈크 같은 윤활제 등도 사용될 수 있다. 경구를 위한 액상물, 리퀴드 파라핀 이외에 여러 가지 부형제, 예를 들면 습윤제, 감미제, 방향제, 보존제 등을 첨가하여 조제될 수 있다. 비경구 투여를 위한 제제는 멸균된 수용액, 비수성 용제, 현탁제, 유제, 동결건조 제제 및 좌제를 포함한다. 비수성 용제 및 현탁제로는 프로필렌 글리콜, 폴리에틸렌 글리콜, 올리브 오일과 같은 식물성 오일, 에틸올레이트와 같은 주사가능한 에스테르 등이 사용될 수 있다. 좌제의 기제로는 위텝솔, 마크로골, 트윈 61, 카카오지, 라우린지, 글리세로젤라틴 등이 사용될 수 있다.
본 발명의 상기 약학 조성물은 목적하는 방법에 따라 경구 투여하거나 비경구 투여(예를 들어, 정맥 내, 피하, 복강 내 또는 국소에 적용)할 수 있으며, 투여량은 환자의 상태 및 체중, 질병의 정도, 약물형태, 투여경로 및 시간에 따라 다르지만, 당업자에 의해 적절하게 선택될 수 있다.
본 발명의 상기 조성물은 기타 항암제, 방사선 치료, 외과적 수술과 병행될 수 있으며, 당업자에 의해 적절하게 선택 및 병행될 수 있다.
다르게는, 점 돌연변이로 야기되는 질환 또는 후천선면역결핍증의 예방 또는 치료용 약제의 제조를 위한, 전술한 가이드 RNA의 용도를 제공하는 것이다.
본 발명의 제4 측면과 관련하여, 본 발명은 전술한 가이드 RNA를 포함하는, 점 돌연변이로 야기되는 질환의 진단용 조성물을 제공한다.
다르게는, 전술한 가이드 RNA 및 Cas9폴리펩타이드 또는 이를 코딩하는 폴리뉴클레오타이드를 포함하는, 점 돌연변이로 야기되는 질환의 진단용 키트를 제공한다.
다르게는, 전술한 가이드 RNA를 이용한 CRISPR-Cas 시스템으로 점 돌연변이로 야기되는 질환을 진단하는 방법을 제공한다.
본 발명에서 사용된 용어 "진단"은 병태 생리의 존재 또는 특징을 확인하는 것을 의미한다. 본 발명에서의 진단은 점 돌연변이로 야기되는 질환의 발병 여부, 경과 또는 예후를 확인하는 것이다.
본 발명의 가이드 RNA를 이용한 CRISPR-Cas 시스템은 공지된 다양한 검출 기술과 결합하여, 점 돌연변이로 야기되는 다양한 질환의 진단에 활용될 수 있다. 공지된 검출 기술로는 측방유동분석법 (LFA, Lateral Flow Assay), 색도분석법, 전기분석법, 전기화학센서, 형광 검출법, 미세유체 플랫폼 등이 있으나, 이에 한정되지 않는다.
예를 들어, 상기 진단용 조성물은 영상을 통하여 점 돌연변이로 야기되는 질환을 진단하기 위하여 분자 영상용 형광체와 결합할 수 있다.
상기 분자 영상용 형광체는 형광을 발생시키는 모든 물질을 말하며, 적색이나 근적외선 (near-infrared)의 형광을 발광하는 것이 바람직하며, 양자 수득량 (quantaum yield)이 높은 형광체가 더욱 바람직하나 이에 한정되지 않는다.
상기 분자 영상용 형광체는 상기 진단용 조성물와 결합할 수 있는 형광체, 형광 단백질 또는 기타 영상용 물질이 바람직하나 이에 한정되지 않는다.
형광체는 플루오레신 (fluorescein), 보디피 (BODYPY), 테트라메틸로드아민 (Trtramethylrhodamine), 알렉사 (Alexa), 시아닌 (Cyanine), 알로피코시아닌 (allopicocyanine) 또는 이들의 유도체가 바람직하나 이에 한정되 지 않는다.
형광 단백질은 Dronpa 단백질, 형광 발색 유전자 (EGFP), 적색 형광 프로테인 (red fluorescent protein, DsRFP), 근적외선 형광을 나타내는 시아닌 형광체인 Cy5.5 또는 기타 형광 단백질이 바람직하나 이에 한정되지 않는다.
기타 영상용 물질은 산화철, 방사성 동위원소 등이 바람직하나 이에 한정되지 않으며, MR, PET과 같은 영상 장 비에 응용될 수 있다.
또한, 본 발명은 본 발명에 따른 진단용 조성물을 분리된 진핵 세포 또는 개체에 투여하는 단계를 포함하는, 점 돌연변이로 야기되는 질환의 진단 방법을 제공한다.
본 발명의 바람직한 일실시예에 따르면, 상기 점 돌연변이로 야기되는 질환은, 암 (예를 들어, 췌장암, 대장암, 폐암 등) 또는 유전대사성 간질환 (예를 들어, 윌슨병 (Wilson's disease))일 수 있으나, 이로 한정되는 것은 아니며, 유전자 종류에 관계없이 점 돌연변이로 인해 야기되는 것으로 공지된 모든 관련 질환이 대상이 될 수 있다.
다르게는, 본 발명의 제5 측면은 전술한 가이드 RNA를 포함하는, 점 돌연변이로 야기되는 후천성면역결핍증의 예방 또는 치료용 조성물에 관한 것이다.
후천성면역결핍증 (Acquired Immune Deficiency Syndrome: AIDS)의 병인은 HIV (Human Immunodeficiency Virus)에 의한 감염이다. CCR5 유전자는 HIV의 수용체로 알려져 있으며, HIV는 수용체인 CCR5 (수용체 이름이자 이를 생성하는 유전자의 이름)를 통해 T 세포 내부로 들어간다. CCR2는 HIV 수용체가 아니지만 염기서열이 매우 비슷하여 CCR5를 타겟으로 제작된 가이드 RNA가 단일 염기서열 미스매치를 나타내는 CCR2의 염기서열에 오프-타겟 효과를 나타낼 수 있다.
따라서, 본 발명의 CCR5 유전자를 온-타겟 유전자로 하는 가이드 RNA는 CCR2 유전자에 속한 오프-타겟에는 효과가 없거나 매우 적어서 보다 안전하게 후천성면역결핍증의 예방 또는 치료에 활용될 수 있다.
본 발명의 후천선면역결핍증 예방 또는 치료용 조성물은 유전체 상의 핵산(DNA)의 특정 위치를 인식하여 절단할 수 있는 뉴클레아제를 추가로 포함할 수 있으며, 이에 대한 설명은 전술한 바와 동일하므로, 그 기재를 생략한다.
본 발명의 제6 측면은 전술한 가이드 RNA를 이용한 유전자 표적 방법 및 교정 방법에 관한 것이다.
본 발명의 유전자 표적 방법 및 교정 방법을 수행하기 위해, 전술한 유전자 교정용 조성물이 사용될 수 있으며, 각 방법은 분리된 진핵세포 또는 개체에 투여함으로써 실행된다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
[실시예 1]
가이드 RNA의 설계 및 클로닝
인간 CCR5 유전체 DNA 서열 (NG_012637.1)의 코딩 영역으로부터 23-nt CRISPR-Cas9 타겟 서열을 추출하였다. 각 23-nt 서열은 20-nt 타겟 서열과 공통의 프로토스페이서 인접 모티프 (PAM) 서열 (NGG)을 포함하였다. PAM의 'GG'부분을 제외하고, CCR5로부터 21-nt 서열 세트를 S_CCR5로 표시하였다. 이어서, 각 서열에 sCCR5∈SCCR5로 주석을 달았다. 유사하게, 인간 CCR2 유전체 DNA 서열 (NG_021428.1)의 코딩 영역으로부터 21-nt 서열 세트를 S_CCR2로 표시하였다. CCR5와 SCCR2를 비교함으로써, CCR2 유전자에서 오프-타겟 부위에 하나의 미스매치를 포함하는 CCR5-특이적 가이드 RNA를 확인하였다. 모든 과정은 맞춤형으로 개발된 Python package pycrispr (native python3)를 포함하는 Python을 사용하여 자동화되었다.
CCR5-특이적 가이드 RNA (표 1), CCR5-RG1 변이체 (표 2) 및 CCR5-RG12 변이체 (표 3)를 클로닝하는데 사용된 올리고머는 Cosmogenetech Inc. (서울, 대한민국)에 의뢰하여 합성하였으며, 각각 표 1 내지 3에 구체적인 서열을 나타내었다. 생성물은 문헌 [Sanjana, N.E., Shalem, O., and Zhang, F. Nat Methods. 11, 783-784 (2014)]에 기재된 바와 같이 lentiCRISPR v2 (Addgene 플라스미드 #52961)에 클로닝되었다.
CCR5-특이적 가이드 RNA를 구성하는데 사용된 올리고머
가이드
RNA 명칭
정방향 서열번호 역방향 서열번호
CCR5-RG1 caccgCCTGCCTCCGCTCTACTCAC 126 aaacGTGAGTAGAGCGGAGGCAGGc 127
CCR5-RG2 caccgTACTCACTGGTGTTCATCTT 128 aaacAAGATGAACACCAGTGAGTAc 129
CCR5-RG3 caccgTGACATCTACCTGCTCAACC 130 aaacGGTTGAGCAGGTAGATGTCAc 131
CCR5-RG4 caccgCCTGACAATCGATAGGTACC 132 aaacGGTACCTATCGATTGTCAGGc 133
CCR5-RG5 caccgTGGTGACAAGTGTGATCACT 134 aaacAGTGATCACACTTGTCACCAc 135
CCR5-RG6 caccgGTCATGGTCATCTGCTACTC 136 aaacGAGTAGCAGATGACCATGACc 137
CCR5-RG7 caccgGGTGTCGAAATGAGAAGAAG 138 aaacCTTCTTCTCATTTCGACACCc 139
CCR5-RG8 caccgTGATTGTTTATTTTCTCTTC 140 aaacGAAGAGAAAATAAACAATCAc 141
CCR5-RG9 caccgCCTTCTCCTGAACACCTTCC 142 aaacGGAAGGTGTTCAGGAGAAGGc 143
CCR5-RG10 caccgAACACCTTCCAGGAATTCTT 144 aaacAAGAATTCCTGGAAGGTGTTc 145
CCR5-RG11 caccgATGCAGGTGACAGAGACTCT 146 aaacAGAGTCTCTGTCACCTGCATc 147
CCR5-RG12 caccgTGCAGGTGACAGAGACTCTT 148 aaacAAGAGTCTCTGTCACCTGCAc 149
CCR5-RG13 caccgCAGGCCAAAGAATTCCTGGA 150 aaacTCCAGGAATTCTTTGGCCTGc 151
CCR5-RG14 caccgGAGAAAATAAACAATCATGA 152 aaacTCATGATTGTTTATTTTCTCc 153
CCR5-RG15 caccgCCAGGTACCTATCGATTGTC 154 aaacGACAATCGATAGGTACCTGGc 155
CCR5-RG16 caccgGGTACCTATCGATTGTCAGG 156 aaacCCTGACAATCGATAGGTACCc 157
CCR5-RG17 caccgATGAACACCAGTGAGTAGAG 158 aaacCTCTACTCACTGGTGTTCATc 159
CCR5-RG18 caccgAACACCAGTGAGTAGAGCGG 160 aaacCCGCTCTACTCACTGGTGTTc 161
CCR5-RG19 caccgCCAGTGAGTAGAGCGGAGGC 162 aaacGCCTCCGCTCTACTCACTGGc 163
CCR5-RG1 변이체를 구성하는데 사용된 올리고머
가이드
RNA 명칭
정방향 서열번호 역방향 서열번호
CCR5-RG1-1T caccgCCAGTGAGTAGAGCGGAGGT 164 aaacACCTCCGCTCTACTCACTGGc 165
CCR5-RG1-2A caccgCCAGTGAGTAGAGCGGAGAC 166 aaacGTCTCCGCTCTACTCACTGGc 167
CCR5-RG1-3A caccgCCAGTGAGTAGAGCGGAAGC 168 aaacGCTTCCGCTCTACTCACTGGc 169
CCR5-RG1-4G caccgCCAGTGAGTAGAGCGGGGGC 170 aaacGCCCCCGCTCTACTCACTGGc 171
CCR5-RG1-5A caccgCCAGTGAGTAGAGCGAAGGC 172 aaacGCCTTCGCTCTACTCACTGGc 173
CCR5-RG1-6A caccgCCAGTGAGTAGAGCAGAGGC 174 aaacGCCTCTGCTCTACTCACTGGc 175
CCR5-RG1-7T caccgCCAGTGAGTAGAGTGGAGGC 176 aaacGCCTCCACTCTACTCACTGGc 177
CCR5-RG1-8A caccgCCAGTGAGTAGAACGGAGGC 178 aaacGCCTCCGTTCTACTCACTGGc 179
CCR5-RG1-9G caccgCCAGTGAGTAGGGCGGAGGC 180 aaacGCCTCCGCCCTACTCACTGGc 181
CCR5-RG1-10A caccgCCAGTGAGTAAAGCGGAGGC 182 aaacGCCTCCGCTTTACTCACTGGc 183
CCR5-RG1-11G caccgCCAGTGAGTGGAGCGGAGGC 184 aaacGCCTCCGCTCCACTCACTGGc 185
CCR5-RG1-12C caccgCCAGTGAGCAGAGCGGAGGC 186 aaacGCCTCCGCTCTGCTCACTGGc 187
CCR5-RG1-13A caccgCCAGTGAATAGAGCGGAGGC 188 aaacGCCTCCGCTCTATTCACTGGc 189
CCR5-RG1-14G caccgCCAGTGGGTAGAGCGGAGGC 190 aaacGCCTCCGCTCTACCCACTGGc 191
CCR5-RG1-15A caccgCCAGTAAGTAGAGCGGAGGC 192 aaacGCCTCCGCTCTACTTACTGGc 193
CCR5-RG1-17A caccgCCAATGAGTAGAGCGGAGGC 194 aaacGCCTCCGCTCTACTCATTGGc 195
CCR5-RG1-18G caccgCCGGTGAGTAGAGCGGAGGC 196 aaacGCCTCCGCTCTACTCACCGGc 197
CCR5-RG1-19T caccgCTAGTGAGTAGAGCGGAGGC 198 aaacGCCTCCGCTCTACTCACTAGc 199
CCR5-RG1-20T caccgTCAGTGAGTAGAGCGGAGGC 200 aaacGCCTCCGCTCTACTCACTGAc 201
CCR5-RG12 돌연변이체를 구성하는데 사용된 올리고머
가이드
RNA 명칭
정방향 서열번호 역방향 서열번호
CCR5-RG12-1A caccgGGTGTCGAAATGAGAAGAAA 202 aaacTTTCTTCTCATTTCGACACCc 203
CCR5-RG12-1T caccgGGTGTCGAAATGAGAAGAAT 204 aaacATTCTTCTCATTTCGACACCc 205
CCR5-RG12-1C caccgGGTGTCGAAATGAGAAGAAC 206 aaacGTTCTTCTCATTTCGACACCc 207
CCR5-RG12-2T caccgGGTGTCGAAATGAGAAGATG 208 aaacCATCTTCTCATTTCGACACCc 209
CCR5-RG12-2G caccgGGTGTCGAAATGAGAAGAGG 210 aaacCCTCTTCTCATTTCGACACCc 211
CCR5-RG12-2C caccgGGTGTCGAAATGAGAAGACG 212 aaacCGTCTTCTCATTTCGACACCc 213
CCR5-RG12-3T caccgGGTGTCGAAATGAGAAGTAG 214 aaacCTACTTCTCATTTCGACACCc 215
CCR5-RG12-3G caccgGGTGTCGAAATGAGAAGGAG 216 aaacCTCCTTCTCATTTCGACACCc 217
CCR5-RG12-3C caccgGGTGTCGAAATGAGAAGCAG 218 aaacCTGCTTCTCATTTCGACACCc 219
CCR5-RG12-4A caccgGGTGTCGAAATGAGAAAAAG 220 aaacCTTTTTCTCATTTCGACACCc 221
CCR5-RG12-4T caccgGGTGTCGAAATGAGAATAAG 222 aaacCTTATTCTCATTTCGACACCc 223
CCR5-RG12-4C caccgGGTGTCGAAATGAGAACAAG 224 aaacCTTGTTCTCATTTCGACACCc 225
CCR5-RG12-5T caccgGGTGTCGAAATGAGATGAAG 226 aaacCTTCATCTCATTTCGACACCc 227
CCR5-RG12-5G caccgGGTGTCGAAATGAGAGGAAG 228 aaacCTTCCTCTCATTTCGACACCc 229
CCR5-RG12-5C caccgGGTGTCGAAATGAGACGAAG 230 aaacCTTCGTCTCATTTCGACACCc 231
CCR5-RG12-6T caccgGGTGTCGAAATGAGTAGAAG 232 aaacCTTCTACTCATTTCGACACCc 233
CCR5-RG12-6G caccgGGTGTCGAAATGAGGAGAAG 234 aaacCTTCTCCTCATTTCGACACCc 235
CCR5-RG12-6C caccgGGTGTCGAAATGAGCAGAAG 236 aaacCTTCTGCTCATTTCGACACCc 237
CCR5-RG12-7A caccgGGTGTCGAAATGAAAAGAAG 238 aaacCTTCTTTTCATTTCGACACCc 239
CCR5-RG12-7T caccgGGTGTCGAAATGATAAGAAG 240 aaacCTTCTTATCATTTCGACACCc 241
CCR5-RG12-7C caccgGGTGTCGAAATGACAAGAAG 242 aaacCTTCTTGTCATTTCGACACCc 243
CCR5-RG12-8T caccgGGTGTCGAAATGTGAAGAAG 244 aaacCTTCTTCACATTTCGACACCc 245
CCR5-RG12-8G caccgGGTGTCGAAATGGGAAGAAG 246 aaacCTTCTTCCCATTTCGACACCc 247
CCR5-RG12-8C caccgGGTGTCGAAATGCGAAGAAG 248 aaacCTTCTTCGCATTTCGACACCc 249
CCR5-RG12-9A caccgGGTGTCGAAATAAGAAGAAG 250 aaacCTTCTTCTTATTTCGACACCc 251
CCR5-RG12-9T caccgGGTGTCGAAATTAGAAGAAG 252 aaacCTTCTTCTAATTTCGACACCc 253
CCR5-RG12-9C caccgGGTGTCGAAATCAGAAGAAG 254 aaacCTTCTTCTGATTTCGACACCc 255
CCR5-RG12-11T caccgGGTGTCGAATTGAGAAGAAG 256 aaacCTTCTTCTCAATTCGACACCc 257
CCR5-RG12-11G caccgGGTGTCGAAGTGAGAAGAAG 258 aaacCTTCTTCTCACTTCGACACCc 259
CCR5-RG12-11C caccgGGTGTCGAACTGAGAAGAAG 260 aaacCTTCTTCTCAGTTCGACACCc 261
CCR5-RG12-12T caccgGGTGTCGATATGAGAAGAAG 262 aaacCTTCTTCTCATATCGACACCc 263
CCR5-RG12-12G caccgGGTGTCGAGATGAGAAGAAG 264 aaacCTTCTTCTCATCTCGACACCc 265
CCR5-RG12-12C caccgGGTGTCGACATGAGAAGAAG 266 aaacCTTCTTCTCATGTCGACACCc 267
CCR5-RG12-13T caccgGGTGTCGTAATGAGAAGAAG 268 aaacCTTCTTCTCATTACGACACCc 269
CCR5-RG12-13G caccgGGTGTCGGAATGAGAAGAAG 270 aaacCTTCTTCTCATTCCGACACCc 271
CCR5-RG12-13C caccgGGTGTCGCAATGAGAAGAAG 272 aaacCTTCTTCTCATTGCGACACCc 273
CCR5-RG12-14T caccgGGTGTCAAAATGAGAAGAAG 274 aaacCTTCTTCTCATTTTGACACCc 275
CCR5-RG12-14G caccgGGTGTCTAAATGAGAAGAAG 276 aaacCTTCTTCTCATTTAGACACCc 277
CCR5-RG12-14C caccgGGTGTCCAAATGAGAAGAAG 278 aaacCTTCTTCTCATTTGGACACCc 279
CCR5-RG12-15A caccgGGTGTAGAAATGAGAAGAAG 280 aaacCTTCTTCTCATTTCTACACCc 281
CCR5-RG12-15T caccgGGTGTTGAAATGAGAAGAAG 282 aaacCTTCTTCTCATTTCAACACCc 283
CCR5-RG12-15C caccgGGTGTGGAAATGAGAAGAAG 284 aaacCTTCTTCTCATTTCCACACCc 285
CCR5-RG12-16A caccgGGTGACGAAATGAGAAGAAG 286 aaacCTTCTTCTCATTTCGTCACCc 287
CCR5-RG12-16T caccgGGTGGCGAAATGAGAAGAAG 288 aaacCTTCTTCTCATTTCGCCACCc 289
CCR5-RG12-16G caccgGGTGCCGAAATGAGAAGAAG 290 aaacCTTCTTCTCATTTCGGCACCc 291
CCR5-RG12-17A caccgGGTATCGAAATGAGAAGAAG 292 aaacCTTCTTCTCATTTCGATACCc 293
CCR5-RG12-17G caccgGGTTTCGAAATGAGAAGAAG 294 aaacCTTCTTCTCATTTCGAAACCc 295
CCR5-RG12-17C caccgGGTCTCGAAATGAGAAGAAG 296 aaacCTTCTTCTCATTTCGAGACCc 297
CCR5-RG12-18A caccgGGAGTCGAAATGAGAAGAAG 298 aaacCTTCTTCTCATTTCGACTCCc 299
CCR5-RG12-18T caccgGGGGTCGAAATGAGAAGAAG 300 aaacCTTCTTCTCATTTCGACCCCc 301
CCR5-RG12-18C caccgGGCGTCGAAATGAGAAGAAG 302 aaacCTTCTTCTCATTTCGACGCCc 303
CCR5-RG12-19A caccgGATGTCGAAATGAGAAGAAG 304 aaacCTTCTTCTCATTTCGACATCc 305
CCR5-RG12-19G caccgGTTGTCGAAATGAGAAGAAG 306 aaacCTTCTTCTCATTTCGACAACc 307
CCR5-RG12-19C caccgGCTGTCGAAATGAGAAGAAG 308 aaacCTTCTTCTCATTTCGACAGCc 309
CCR5-RG12-20A caccgAGTGTCGAAATGAGAAGAAG 310 aaacCTTCTTCTCATTTCGACACTc 311
CCR5-RG12-20T caccgTGTGTCGAAATGAGAAGAAG 312 aaacCTTCTTCTCATTTCGACACAc 313
CCR5-RG12-20C caccgCGTGTCGAAATGAGAAGAAG 314 aaacCTTCTTCTCATTTCGACACGc 315
[실시예 2]
가이드 RNA 타겟화 효율의 검증
2-1. T7E1 어세이 및 딥 시퀀싱 (Deep sequencing)
감염성 렌티바이러스는 문헌 [Devkota, S. et al. Int. J. Biochem. Cell Biol. 44, 1887-1896 (2012)]에 기재된 바와 같이 생산되었고, 인간 Jurkat T 세포 (문헌 [Cho, Y.S. et al. PLoS One. 11, e0161899 (2016)])를 감염시키는데 사용하였다. 퓨로마이신 (Sigma, St. Louis, MO, USA)을 처리하여 감염된 세포를 선별한 후, 유전체 DNA 샘플을 준비하였다. 그 다음 T7 엔도뉴클레아제 1 (New England Biolabs, Ipswich, MA, USA)을 사용하여 T7E1 어세이를 수행하였고, 결과를 문헌 [Sung, Y.H. et al. Genome Res. 24, 125-131 (2014)]에 기재된 바와 같이 아가로스 겔 전기영동으로 분석하였다. ToolGen (서울, 대한민국)에서 Ilumina Miseq 시스템을 사용하여 딥 시퀀싱 (Deep sequencing)을 수행하였다. T7E1 어세이에 사용된 PCR 프라이머는 표 4에 나타냈다.
T7E1 어세이에 대한 PCR 프라이머 쌍
유전자 타겟
가이드
RNAs
프라이머 명칭 정방향 서열번호 역방향 서열번호 크기 (bp)
CCR5 RG1-6 CCR5-F1
/CCR5-R1
GACAGGGAAGCTAGCAGCAA 316 TTCCTGGGAGAGACGCAAAC 317 693
RG7-10 CCR5-F3
/CCR5-R3
ATGTGAAGCAAATCGCAGCC 318 TCCCGAGTAGCAGATGACCA 319 578
RG11-19 CCR5-F7/CCR5-R7 TAAAAGCCAGGACGGTCACC 320 CCACTTGAGTCCGTGTCACA 321 665
CCR2 RG1-6 CCR2-F1
/CCR2-R1
TTCAGGGAGATGGCTGCAAG 322 CAGAAGCAAACACAGCCACC 323 695
RG7-10 CCR2-F3
/CCR2-R3
TTTTGTGGGCAACATGCTGG 324 CTTCTCCCCAACGAAGGCAT 325 766
RG11-19 CCR2-F4/CCR2-R6 TAAAAGCCAGGACGGTCACC 326 AAACCAGCCGAGACTTCCTG 327 634
2-2. CCR2 유전자에 대해 하나의 미스매치를 포함하는 CCR5 특이적 가이드 RNA의 온-타겟 및 오프-타겟 활성의 확인
본 발명자들은 도 2의 a에 나타난 바와 같이, 하나의 뉴클레오티드가 상이한 고도의 상동성 CCR2 유전자에서 오프-타겟 부위를 갖는 인간 CCR5의 오픈 리딩 프레임 (open reading frame)으로부터 19개의 타겟 서열을 추출하였다. 이들 중 5개의 가이드 RNA, 즉 RG1-3, 7 및 12는 도 2의 b 및 표 6에서 확인되는 바와 같이 인간 Jurkat T 세포의 온-타겟 및 오프-타겟 부위에 높은 활성을 나타냈다.
# CCR5 유전자에 대한
온-타겟 (+PAM)
서열번호 CCR2 유전자에대한
오프타겟(+PAM)
서열번호 T7E1
(CCR5)
T7E1
(CCR2)
1 CCAGTGAGTAGAGCGGAGGC AGG 1 CCAGcGAGTAGAGCGGAGGC AGG 328 +++ +++
2 AACACCAGTGAGTAGAGCGG AGG 2 AACACCAGcGAGTAGAGCGG AGG 329 +++ +++
3 ATGAACACCAGTGAGTAGAG CGG 3 ATGAACACCAGcGAGTAGAG CGG 330 +++ +++
4 CCTGCCTCCGCTCTACTCAC TGG 4 CCTGCCTCCGCTCTACTCgC TGG 331 +++ -
5 TACTCACTGGTGTTCATCTT TGG 5 TACTCgCTGGTGTTCATCTT TGG 332 ++ -
6 TGACATCTACCTGCTCAACC TGG 6 TGACATtTACCTGCTCAACC TGG 333 +++ -
7 GGTACCTATCGATTGTCAGG AGG 7 GGTAtCTATCGATTGTCAGG AGG 334 +++ +++
8 CCAGGTACCTATCGATTGTC AGG 8 CCAGGTAtCTATCGATTGTC AGG 335 ++ ++
9 CCTGACAATCGATAGGTACC TGG 9 CCTGACAATCGATAGaTACC TGG 336 +++ ++
10 TGGTGACAAGTGTGATCACT TGG 10 TGGTGACAAGTGTGATCACc TGG 337 +++ -
11 GTCATGGTCATCTGCTACTC GGG 11 aTCATGGTCATCTGCTACTC GGG 338 ++ +++
12 GGTGTCGAAATGAGAAGAAG AGG 12 GGTGTCGAAAcGAGAAGAAG AGG 339 +++ +++
13 GAGAAAATAAACAATCATGA TGG 13 GAGAAAgTAAACAATCATGA TGG 340 +++ +
14 TGATTGTTTATTTTCTCTTC TGG 14 TGATTGTTTAcTTTCTCTTC TGG 341 - -
15 CAGGCCAAAGAATTCCTGGA AGG 15 CAGGCCgAAGAATTCCTGGA AGG 342 +++ ++
16 CCTTCTCCTGAACACCTTCC AGG 16 CaTTCTCCTGAACACCTTCC AGG 343 - -
17 AACACCTTCCAGGAATTCTT TGG 17 AACACCTTCCAGGAATTCTT cGG 344 - -
18 ATGCAGGTGACAGAGACTCT TGG 18 AcGCAGGTGACAGAGACTCT TGG 345 +++ ++
19 TGCAGGTGACAGAGACTCTT GGG 19 cGCAGGTGACAGAGACTCTT GGG 346 +++ ++
2-3. 의도적 미스매치를 포함하는 CCR5-RG1 변이체의 온-타겟 및 오프-타겟 활성의 확인
가이드 RNA의 온-타겟 및 오프-타겟 활성에 대한 의도적 미스매치의 영향을 조사하기 위해, 도 3의 a에 나타난 바와 같이 위치 16 (PAM으로부터 +16 위치)에서 하나의 미스매치를 포함하는 야생형 버전인 CCR5-RG1에 대해 일련의 전이 돌연변이를 생성하였고, 이를 표 6에 나타냈다.
CCR5-RG1 변이체
가이드 RNA 명칭 서열 서열번호
CCR5-RG1-1T CCAGTGAGTA GAGCGGAGGT 20
CCR5-RG1-2A CCAGTGAGTA GAGCGGAGAC 21
CCR5-RG1-3A CCAGTGAGTA GAGCGGAAGC 22
CCR5-RG1-4G CCAGTGAGTA GAGCGGGGGC 23
CCR5-RG1-5A CCAGTGAGTA GAGCGAAGGC 24
CCR5-RG1-6A CCAGTGAGTA GAGCAGAGGC 25
CCR5-RG1-7T CCAGTGAGTA GAGTGGAGGC 26
CCR5-RG1-8A CCAGTGAGTA GAACGGAGGC 27
CCR5-RG1-9G CCAGTGAGTA GGGCGGAGGC 28
CCR5-RG1-10A CCAGTGAGTA AAGCGGAGGC 29
CCR5-RG1-11G CCAGTGAGTG GAGCGGAGGC 30
CCR5-RG1-12C CCAGTGAGCA GAGCGGAGGC 31
CCR5-RG1-13A CCAGTGAATA GAGCGGAGGC 32
CCR5-RG1-14G CCAGTGGGTA GAGCGGAGGC 33
CCR5-RG1-15A CCAGTAAGTA GAGCGGAGGC 34
CCR5-RG1-17A CCAATGAGTA GAGCGGAGGC 35
CCR5-RG1-18G CCGGTGAGTA GAGCGGAGGC 36
CCR5-RG1-19T CTAGTGAGTA GAGCGGAGGC 37
CCR5-RG1-20T TCAGTGAGTA GAGCGGAGGC 38
야생형 CCR5-RG1 및 의도적 미스매치를 포함하는 이의 변이체의 엔도뉴클레아제 활성을 측정하는 T7E1 어세이의 결과에 기초하여 온-타겟 및 오프-타겟 효율을 활성 없음 (-)부터 가장 강한 활성 (+++)까지 임의로 분류하여 표 7에 나타내었다.
도 3의 b 및 표 7에서 확인되는 바와 같이 추가의 돌연변이 도입은 의도적인 미스매치의 위치에 따라 상이한 정도로 CCR5-RG1의 오프-타겟 활성을 일관되게 억제하였다. 또한, 도 5에 나타난 바와 같이 타겟화된 딥 시퀀싱을 통해 야생형 CCR5-RG1의 온-타겟 및 오프 타겟 활성이 각각 76.5 % 및 8.6 %임을 확인하였다. 특히, 위치 4의 전이 돌연변이체 (4G)는 본래 타겟 부위 (55.5 %)에서 여전히 활성이었지만, 오프-타겟 활성은 1.5%로 현저하게 감소하였다.
Figure PCTKR2021018693-appb-img-000001
*: 가이드 RNA와 CCR5 및 CCR2 유전자 사이의 원래 미스매치.
2-4. 의도적 미스매치를 포함하는 CCR5-RG12 변이체의 온-타겟 및 오프-타겟 활성의 확인
본 발명자들은 CCR5-RG12에서도 의도적인 미스매치의 영향을 조사하였으며, 이는 도 4의 a에 나타난 바와 같이 위치 10 (PAM으로부터 +10 위치)에 원래 미스매치가 존재한다. 도 5에 나타나 바와 같이 딥 시퀀싱을 통해 야생형 CCR5-RG12의 오프-타겟 활성이 40.4%로 매우 강하다는 것을 확인하였다.
다음으로, 57개의 전이 돌연변이체 및 전좌 돌연변이체를 생성하였고, 이를 표 8에 나타내었다. T7e1 어세이 (도 4의 b 및 표 9)를 이용하여 57개의 변이체에 대한 온-타겟 및 오프-타겟 활성을 측정하였다.
CCR5-RG12 변이체
가이드 RNA 명칭 서열 서열번호
CCR5-RG12-1A GGTGTCGAAATGAGAAGAAA 39
CCR5-RG12-1C GGTGTCGAAATGAGAAGAAC 40
CCR5-RG12-1T GGTGTCGAAATGAGAAGAAT 41
CCR5-RG12-2G GGTGTCGAAATGAGAAGAGG 42
CCR5-RG12-2C GGTGTCGAAATGAGAAGACG 43
CCR5-RG12-2T GGTGTCGAAATGAGAAGATG 44
CCR5-RG12-3G GGTGTCGAAATGAGAAGGAG 45
CCR5-RG12-3C GGTGTCGAAATGAGAAGCAG 46
CCR5-RG12-3T GGTGTCGAAATGAGAAGTAG 47
CCR5-RG12-4A GGTGTCGAAATGAGAAAAAG 48
CCR5-RG12-4C GGTGTCGAAATGAGAACAAG 49
CCR5-RG12-4T GGTGTCGAAATGAGAATAAG 50
CCR5-RG12-5G GGTGTCGAAATGAGAGGAAG 51
CCR5-RG12-5C GGTGTCGAAATGAGACGAAG 52
CCR5-RG12-5T GGTGTCGAAATGAGATGAAG 53
CCR5-RG12-6G GGTGTCGAAATGAGGAGAAG 54
CCR5-RG12-6C GGTGTCGAAATGAGCAGAAG 55
CCR5-RG12-6T GGTGTCGAAATGAGTAGAAG 56
CCR5-RG12-7A GGTGTCGAAATGAAAAGAAG 57
CCR5-RG12-7C GGTGTCGAAATGACAAGAAG 58
CCR5-RG12-7T GGTGTCGAAATGATAAGAAG 59
CCR5-RG12-8G GGTGTCGAAATGGGAAGAAG 60
CCR5-RG12-8C GGTGTCGAAATGCGAAGAAG 61
CCR5-RG12-8T GGTGTCGAAATGTGAAGAAG 62
CCR5-RG12-9A GGTGTCGAAATAAGAAGAAG 63
CCR5-RG12-9C GGTGTCGAAATCAGAAGAAG 64
CCR5-RG12-9T GGTGTCGAAATTAGAAGAAG 65
CCR5-RG12-11G GGTGTCGAAGTGAGAAGAAG 66
CCR5-RG12-11C GGTGTCGAACTGAGAAGAAG 67
CCR5-RG12-11T GGTGTCGAATTGAGAAGAAG 68
CCR5-RG12-12G GGTGTCGAGATGAGAAGAAG 69
CCR5-RG12-12C GGTGTCGACATGAGAAGAAG 70
CCR5-RG12-12T GGTGTCGATATGAGAAGAAG 71
CCR5-RG12-13G GGTGTCGAAATGAGAAGAAG 72
CCR5-RG12-13C GGTGTCGAAATGAGAAGAAG 73
CCR5-RG12-13T GGTGTCGAAATGAGAAGAAG 74
CCR5-RG12-14A GGTGTCAAAATGAGAAGAAG 75
CCR5-RG12-14C GGTGTCCAAATGAGAAGAAG 76
CCR5-RG12-14T GGTGTCTAAATGAGAAGAAG 77
CCR5-RG12-15A GGTGTAGAAATGAGAAGAAG 78
CCR5-RG12-15G GGTGTGGAAATGAGAAGAAG 79
CCR5-RG12-15T GGTGTTGAAATGAGAAGAAG 80
CCR5-RG12-16A GGTGACGAAATGAGAAGAAG 81
CCR5-RG12-16G GGTGGCGAAATGAGAAGAAG 82
CCR5-RG12-16C GGTGCCGAAATGAGAAGAAG 83
CCR5-RG12-17A GGTATCGAAATGAGAAGAAG 84
CCR5-RG12-17C GGTCTCGAAATGAGAAGAAG 85
CCR5-RG12-17T GGTTTCGAAATGAGAAGAAG 86
CCR5-RG12-18A GGAGTCGAAATGAGAAGAAG 87
CCR5-RG12-18G GGGGTCGAAATGAGAAGAAG 88
CCR5-RG12-18C GGCGTCGAAATGAGAAGAAG 89
CCR5-RG12-19A GATGTCGAAATGAGAAGAAG 90
CCR5-RG12-19C GCTGTCGAAATGAGAAGAAG 91
CCR5-RG12-19T GTTGTCGAAATGAGAAGAAG 92
CCR5-RG12-20A AGTGTCGAAATGAGAAGAAG 93
CCR5-RG12-20C CGTGTCGAAATGAGAAGAAG 94
CCR5-RG12-20T TGTGTCGAAATGAGAAGAAG 95
마찬가지로, 야생형 CCR5-RG12 및 의도적 미스매치를 포함하는 이의 변이체의 엔도뉴클레아제 활성을 측정하는 T7E1 어세이의 결과에 기초하여, 온-타겟 및 오프-타겟 효율을 활성 없음 (-)부터 가장 강한 활성 (+++)까지 임의로 분류하여 표 9에 나타내었다.
이 실험에서, 13개의 돌연변이 가이드 RNA (6개의 전이 돌연변이체: 2G, 6G, 12G, 13G, 19A 및 20A; 및 8개의 전좌 돌연변이체: 3C, 12C/T, 13T, 18A, 19C 및 20C/T)가 야생형 CCR5-RG12와 유사한 온-타겟 활성을 나타내었고, 6개의 돌연변이 가이드 RNA (2G, 3C, 12G/C, 13T 및 18A)에 대해서는 명백한 오프-타겟 활성이 검출되지 않았다 (도 4의 b 및 표 9). 특히, 위치 12 (12G)에서의 의도적인 미스매치는 오프-타겟 활성을 40.4 %에서 0.8 %로 감소시켰지만, 온-타겟 활성은 크게 손상시키지 않았으며 (야생형 CCR5-RG12의 온-타겟 활성 66.5% vs 12G의 온-타겟 활성 49.8%), 이는 의도적 미스매치가 가이드 RNA의 온-타겟 활성에 영향을 미치지 않으면서 바람직하지 않은 오프-타겟 활성만 효과적으로 제거할 수 있음을 시사한다.
Figure PCTKR2021018693-appb-img-000002
*: 가이드 RNA와 CCR5 및 CCR2 유전자 사이의 원래 미스매치. n.d. 측정되지 않음.
상기 실시예의 결과는 Cas9의 불충분한 정확도 (fidelity)가 하나의 뉴클레오티드 치환에 의해 생성된 의도적 미스매치에 의해 역설적으로 보상됨을 나타낸다. 점 돌연변이가 유전성 질환 및 암의 발생에 빈번하기 때문에, 본 발명의 가이드 RNA를 이용한 전략은 치료 유전자 편집, 특히 특유의 가이드 RNA가 필연적으로 야생형 및 돌연변이 서열을 모두 소화시키는 경우에 신뢰할 수 있는 돌파구를 제공한다.
[실시예 3]
의도적 미스매치의 위치에 따른 온-타겟 및 오프-타겟 활성의 확인 및 검증
상기 실시예의 결과들은 온-타겟에 대한 효과는 최소화하면서 오프-타겟에 대한 활성을 줄일 수 있는 의도적인 미스매치의 추가가 가능하다는 것을 증명하였으나, 미스매치 특이적인 위치를 특정하지는 못했다. 따라서, 본 실시예에서는 그러한 위치를 찾기 위해 다음과 같은 실험을 진행하였다.
가이드 RNA의 스페이서 서열 중에 PAM에 가까운 부분들에 미스매치가 존재할 경우 Cas9의 엔도뉴클레아제 활성 (endonuclease activity)이 현저히 줄어든다는 것은 잘 알려진 사실이므로(Nat Biotechnol. 2013 Mar;31(3):233-9.;  Nat Biotechnol. 2013 Sep;31(9):827-32.), 이 부위를 제외하고 상기 표 7과 9를 비교하였을 때, 위치 10과 위치 18에 미스매치를 인위적으로 집어넣었을 경우, 높은 온-타겟에 비해 매우 낮은 오프-타겟 효과가 나타난다는 것을 확인하였다. 따라서, 해당 두 위치에 추가되는 미스매치가 가이드 RNA의 정확도 (fidelity)에 큰 영향을 줄 것이라고 여겨진다.
상기 가설을 검증하기 위해, 표 5에서 온-타겟 및 오프-타겟에 대한 효과에 큰 차이가 없었던 타겟 가이드 RNA RG3, RG7 및 RG2에서 위치 10 또는 18에 의도적인 미스매치를 추가하여 변이체를 생성하고 이들의 온-타겟 및 오프-타겟 활성을 추가로 확인하였다.
3-1. T7E1 어세이 및 딥 시퀀싱 (Deep sequencing)
실시예 2-1과 동일한 방법으로 T7E1 어세이 및 딥 시퀀싱 (Deep sequencing)을 수행하였다. 표 10은 RG2, RG3 및 RG7과 이들의 변이체들에 대한 T7E1 어세이에 사용된 PCR 프라이머를 나타낸다.
유전자 타겟
가이드 RNAs
프라이머 정방향 서열번호 역방향 서열번호 Size (bp)
CCR5 RG2,3,7 CCR5-F1/CCR5-R1 GACAGGGAAGCTAGCAGCAA 407 TTCCTGGGAGAGACGCAAAC 408 693
CCR2 RG2,3,7 CCR2-F1/CCR2-R1 TTCAGGGAGATGGCTGCAAG 409 CAGAAGCAAACACAGCCACC 410 695
3-2. 위치 10 및/또는 18에 의도적 미스매치를 포함하는 CCR5-RG3 변이체의 온-타겟 및 오프-타겟 활성의 확인
상기 가설을 검증하기 위해서 추가적인 실험을 진행했다. 도 6의 a에 나타난 바와 같이 RG3는 위치 9에 원래 미스매치가 있으나, 표 5에서 확인된 바와 같이 온-타겟 및 오프-타겟에 대한 효과에는 큰 차이가 없었다. 따라서, CCR5-RG3에서 위치 10 또는 18에 의도적인 미스매치를 추가하여 변이체를 생성하고 이들의 온-타겟 및 오프-타겟 활성을 추가로 확인하였다. 도 6의 b와 같이 위치 10과 위치 18에 의도적인 미스매치를 추가한 결과, 모든 경우에 있어서 오프-타겟 활성이 거의 관찰되지 않았다. 또한, 도 9에 나타난 바와 같이 타겟화된 딥 시퀀싱을 통해 야생형 CCR5-RG3 온-타겟 및 CCR2-RG3 오프-타겟 활성이 각각 99.7% 및 90.1%로 매우 강하다는 것을 확인하였다. 위치 10과 위치 18에 의도적인 미스매치를 추가한 CCR5-RG3-10A 및 CCR5-RG3-18A 온타겟 활성은 각각 68% 및 37.4%를 유지하였고, CCR2-RG3-10A 및 CCR2-RG3-18A 오프-타겟 활성은 각각 0.8% 및 2.2%로 현저하게 감소하였다.
CCR5-RG3의 6종의 변이체 및 이들 가이드 RNA의 클로닝에 사용된 올리고머들은 각각 표 11 및 표 12에 나타내었다.
가이드 RNA 명칭 서열 서열번호
CCR5-RG3-10A ATGAACACCAATGAGTAGAG 96
CCR5-RG3-10T ATGAACACCATTGAGTAGAG 97
CCR5-RG3-10C ATGAACACCACTGAGTAGAG 98
CCR5-RG3-18A ATAAACACCAGTGAGTAGAG 99
CCR5-RG3-18T ATTAACACCAGTGAGTAGAG 100
CCR5-RG3-18C ATCAACACCAGTGAGTAGAG 101
CCR5-RG3 변이체를 구성하는데 사용된 올리고머
가이드
RNA 명칭
정방향 서열번호 역방향 서열번호
CCR5-RG3-10A caccgATGAACACCAATGAGTAGAG 347 aaacCTCTACTCATTGGTGTTCATc 348
CCR5-RG3-10T caccgATGAACACCATTGAGTAGAG 349 aaacCTCTACTCAATGGTGTTCATc 350
CCR5-RG3-10C caccgATGAACACCACTGAGTAGAG 351 aaacCTCTACTCAGTGGTGTTCATc 352
CCR5-RG3-18A caccgATAAACACCAGTGAGTAGAG 353 aaacCTCTACTCACTGGTGTTTATc 354
CCR5-RG3-18T caccgATTAACACCAGTGAGTAGAG 355 aaacCTCTACTCACTGGTGTTAATc 356
CCR5-RG3-18C caccgATCAACACCAGTGAGTAGAG 357 aaacCTCTACTCACTGGTGTTGATc 358
3-3. 위치 10 및/또는 18에 의도적 미스매치를 포함하는 CCR5-RG7 변이체의 온-타겟 및 오프-타겟 활성의 확인
도 7의 a에 나타난 바와 같이 RG7은 위치 16에 미스매치가 존재하지만, 표 5에서 확인된 바와 같이 온-타겟 및 오프-타겟에 대한 효과에는 큰 차이가 없었다. 따라서, CCR5-RG7에서 위치 10 및/또는 18에 의도적인 미스매치를 추가하여 변이체를 생성하고 이들의 온-타겟 및 오프-타겟 활성을 추가로 확인하였다. CCR5-RG7의 9종의 변이체 및 이들 가이드 RNA의 클로닝에 사용된 올리고머들은 각각 표 13 및 표 14에 나타내었다.
CCR5-RG7 변이체
가이드 RNA 명칭 서열 서열번호
CCR5-RG7-10A GGTACCTATCAATTGTCAGG 102
CCR5-RG7-10T GGTACCTATCTATTGTCAGG 103
CCR5-RG7-10C GGTACCTATCCATTGTCAGG 104
CCR5-RG7-18A GGAACCTATCGATTGTCAGG 105
CCR5-RG7-18G GGGACCTATCGATTGTCAGG 106
CCR5-RG7-18C GGCACCTATCGATTGTCAGG 107
CCR5-RG7-10C-18A GGAACCTATCCATTGTCAGG 108
CCR5-RG7-10C-18G GGGACCTATCCATTGTCAGG 109
CCR5-RG7-10C-18C GGCACCTATCCATTGTCAGG 110
CCR5-RG7 변이체를 구성하는데 사용된 올리고머
가이드 RNA 명칭 정방향 서열번호 역방향 서열번호
CCR5-RG7-10A caccgGGTACCTATCAATTGTCAGG 359 aaacCCTGACAATTGATAGGTACCc 360
CCR5-RG7-10T caccgGGTACCTATCTATTGTCAGG 361 aaacCCTGACAATAGATAGGTACCc 362
CCR5-RG7-10C caccgGGTACCTATCCATTGTCAGG 363 aaacCCTGACAATGGATAGGTACCc 364
CCR5-RG7-18A caccgGGAACCTATCGATTGTCAGG 365 aaacCCTGACAATCGATAGGTTCCc 366
CCR5-RG7-18G caccgGGGACCTATCGATTGTCAGG 367 aaacCCTGACAATCGATAGGTCCCc 368
CCR5-RG7-18C caccgGGCACCTATCGATTGTCAGG 369 aaacCCTGACAATCGATAGGTGCCc 370
CCR5-RG7-10C-18A caccgGGAACCTATCCATTGTCAGG 371 aaacCCTGACAATGGATAGGTTCCc 372
CCR5-RG7-10C-18G caccgGGGACCTATCCATTGTCAGG 373 aaacCCTGACAATGGATAGGTCCCc 374
CCR5-RG7-10C-18C caccgGGCACCTATCCATTGTCAGG 375 aaacCCTGACAATGGATAGGTGCCc 376
도 7의 b와 같이 위치 10과 위치 18에 의도적인 미스매치를 추가한 결과, 10A, 10T 및 18C의 경우 온-타겟 및 오프-타겟에 대한 활성이 대부분 사라졌고, 10C, 18A 및 18G의 경우 온-타겟은 야생형과 거의 같은 수준의 활성을 가지고 있으나, 오프-타겟에 대한 활성이 대부분 사라지는 것을 확인할 수 있었다. 또한, 도 9에 나타난 바와 같이 타겟화된 딥 시퀀싱을 통해 야생형 CCR5-RG7 온-타겟 및 CCR2-RG7 오프-타겟 활성이 각각 87.1% 및 68.9%로 강하다는 것을 확인하였다. 위치 10과 위치 18에 의도적인 미스매치를 추가한 CCR5-RG7-10C 및 CCR5-RG7-18A 온타겟 활성은 각각 62.8% 및 77.4%를 유지하였고, CCR2-RG7-10C 및 CCR2-RG7-18A 오프-타겟 활성은 각각 1.9% 및 1.6%로 현저하게 감소하였다.
3-4. 위치 10 및/또는 18에 의도적 미스매치를 포함하는 CCR5-RG2 변이체의 온-타겟 및 오프-타겟 활성의 확인
도 8의 a에 나타난 바와 같이 RG2는 위치 12에 미스매치가 존재하지만, 표 5에서 확인된 바와 같이 온-타겟 및 오프-타겟에 대한 활성이 동일한 수준으로 나타났다. 따라서, CCR5-RG2에서 위치 10 및/또는 18에 의도적인 미스매치를 추가하여 변이체를 생성하고 이들의 온-타겟 및 오프-타겟 활성을 추가로 확인하였다. CCR5-RG2의 15종의 변이체 및 이들 가이드 RNA의 클로닝에 사용된 올리고머들은 각각 표 15 및 표 16에 나타내었다.
CCR5-RG2 변이체
가이드 RNA 명칭 서열 서열번호
CCR5-RG2-10T AACACCAGTGTGTAGAGCGG 111
CCR5-RG2-10G AACACCAGTGGGTAGAGCGG 112
CCR5-RG2-10C AACACCAGTGCGTAGAGCGG 113
CCR5-RG2-18A AAAACCAGTGAGTAGAGCGG 114
CCR5-RG2-18T AATACCAGTGAGTAGAGCGG 115
CCR5-RG2-18G AAGACCAGTGAGTAGAGCGG 116
CCR5-RG2-10T-18A AAAACCAGTGTGTAGAGCGG 117
CCR5-RG2-10T-18T AATACCAGTGTGTAGAGCGG 118
CCR5-RG2-10T-18G AAGACCAGTGTGTAGAGCGG 119
CCR5-RG2-10G-18A AAAACCAGTGGGTAGAGCGG 120
CCR5-RG2-10G-18T AATACCAGTGGGTAGAGCGG 121
CCR5-RG2-10G-18G AAGACCAGTGGGTAGAGCGG 122
CCR5-RG2-10C-18A AAAACCAGTGCGTAGAGCGG 123
CCR5-RG2-10C-18T AATACCAGTGCGTAGAGCGG 124
CCR5-RG2-10C-18G AAGACCAGTGCGTAGAGCGG 125
CCR5-RG2 변이체를 구성하는데 사용된 올리고머
가이드 RNA 명칭 정방향 서열번호 역방향 서열번호
CCR5-RG2-10T caccgAACACCAGTGTGTAGAGCGG 377 aaacCCGCTCTACACACTGGTGTTc 378
CCR5-RG2-10G caccgAACACCAGTGGGTAGAGCGG 379 aaacCCGCTCTACCCACTGGTGTTc 380
CCR5-RG2-10C caccgTGACATCTACCTGCTCAACC 381 aaacGGTTGAGCAGGTAGATGTCAc 382
CCR5-RG2-18A caccgCCTGACAATCGATAGGTACC 383 aaacGGTACCTATCGATTGTCAGGc 384
CCR5-RG2-18T caccgTGGTGACAAGTGTGATCACT 385 aaacAGTGATCACACTTGTCACCAc 386
CCR5-RG2-18G caccgGTCATGGTCATCTGCTACTC 387 aaacGAGTAGCAGATGACCATGACc 388
CCR5-RG2-10T-18A caccgAAAACCAGTGTGTAGAGCGG 389 aaacCCGCTCTACACACTGGTTTTc 390
CCR5-RG2-10T-18T caccgAATACCAGTGTGTAGAGCGG 391 aaacCCGCTCTACACACTGGTATTc 392
CCR5-RG2-10T-18G caccgAAGACCAGTGTGTAGAGCGG 393 aaacCCGCTCTACACACTGGTCTTc 394
CCR5-RG2-10G-18A caccgAAAACCAGTGGGTAGAGCGG 395 aaacCCGCTCTACCCACTGGTTTTc 396
CCR5-RG2-10G-18T caccgAATACCAGTGGGTAGAGCGG 397 aaacCCGCTCTACCCACTGGTATTc 398
CCR5-RG2-10G-18G caccgAAGACCAGTGGGTAGAGCGG 399 aaacCCGCTCTACCCACTGGTCTTc 400
CCR5-RG2-10C-18A caccgAAAACCAGTGCGTAGAGCGG 401 aaacCCGCTCTACGCACTGGTTTTc 402
CCR5-RG2-10C-18T caccgAATACCAGTGCGTAGAGCGG 403 aaacCCGCTCTACGCACTGGTATTc 404
CCR5-RG2-10C-18G caccgAAGACCAGTGCGTAGAGCGG 405 aaacCCGCTCTACGCACTGGTCTTc 406
도 8의 b와 같이 위치 10과 위치 18에 의도적인 미스매치를 추가한 결과, 위치 10의 미스매치에서는 온-타겟 및 오프-타겟에 모두 활성 변화가 없었다. 또한, 위치 18에서는 모두 온-타겟 활성은 변화가 없었고, 18A와 18T의 경우 오프-타겟에 대한 활성이 존재하기는 하지만, 상당히 낮아졌다는 것을 확인할 수 있었다. 이에 도 8의 c와 같이, 위치 18 변이체들에 10G 미스매치를 추가하였다. 그 결과, 도 8의 c에서 확인되는 바와 같이, 10G/18A 미스매치의 경우 여전히 높은 온-타겟 활성을 유지하면서 10G와 18A 각각의 미스매치에 비해 오프-타겟 활성이 현저히 줄어들었다. 또한, 도 9에 나타난 바와 같이 타겟화된 딥 시퀀싱을 통해 야생형 CCR5-RG2 온-타겟 및 CCR2-RG2 오프-타겟 활성이 각각 78.9% 및 93.1%로 매우 강하다는 것을 확인하였다. 위치 10에 의도적인 미스매치를 추가한 CCR5-RG2-10G 온-타겟 및 CCR2-RG2-10G 오프-타겟 활성은 각각 92.5% 및 91.4%로 모두 활성 변화가 없었다. 그러나, 위치 10의 인위적 미스매치에 위치 18의 인위적 미스매치 중 하나를 추가하였을 때, CCR5-RG2-10G/18A 온-타겟 활성은 51.5%로 유지하면서, CCR2-RG2-10G/18A 오프-타겟 활성은 및 5.7%를 나타내어, 10G와 18A 각각의 미스매치에 비해 오프-타겟 활성이 현저히 감소하였다. 상기와 같은 결과를 통해, 위치 10과 위치 18에 추가되는 미스매치는 온-타겟 활성을 유지하면서 오프-타겟 활성을 현저하게 감소시키는 효과를 나타냄을 증명하였다.
결론적으로, 위치 10과 위치 18에 추가되는 미스매치는 온-타겟 활성을 유지하면서 오프-타겟 활성을 크게 줄이는 효과를 나타냄을 증명하였다.
[실시예 4]
점 돌연변이를 포함하는 KRAS 유전자에 대한 유전자가위 활성 확인
상기 실시예들을 통해 검증된 결과를 토대로, 암 발생의 원인이 되는 점 돌연변이 (point mutation)를 야생형 유전자 및 염기서열로부터 구분이 가능함을 증명하기 위해 KRAS 유전자를 타겟으로 선정하여 가이드 RNA를 설계 및 클로닝하였다. KRAS 유전자의 점 돌연변이는 췌장, 대장, 폐암에서 주로 발견되며, KRAS G12D, G12C, G12V 돌연변이가 높은 비율로 나타나는 것으로 알려져 있다. 본 발명자들은 췌장암에서 주요 발병 원인인 KRAS G12D와 G12V를 온-타겟으로 하는 가이드 RNA를 설계하고, 위치 10과 위치 18에 의도적인 미스매치를 추가하였을 때, 야생형 유전자 및 이의 염기서열과 돌연변이 유전자 및 이의 염기서열을 구분하여 돌연변이를 특이적으로 자르는 선별 능력을 나타낼 수 있는지 검증하기 위해 추가 실험을 진행하였다.
도 10의 a는 야생형 KRAS 염기서열과 KRAS G12D 및 KRAS G12V의 점 돌연변이 염기서열을 나타낸다. 야생형 KRAS 염기서열을 가지는 췌장암 세포주 BxPC3에 매치되는 가이드 RNA, KRAS G12D 점 돌연변이 염기서열을 가지는 췌장암 세포주 HPAFII에 매치되는 가이드 RNA 및 KRAS G12V 점 돌연변이 염기서열을 가지는 췌장암 세포주 CFPAC에 매치되는 가이드 RNA를 표 17과 같이 설계하였다. KRAS G12D 및 KRAS G12V 특이적 가이드 RNA를 클로닝하는데 사용된 올리고머의 구체적인 서열은 표 18에 나타내었다.
세포주 KRAS 유전자형 Spacer + PAM
RG1 서열번호 RG2 서열번호
BXPC3 야생형 CTTGTGGTAGTTGGAGCTGG TGG 411 GTAGTTGGAGCTGGTGGCGT AGG 412
HPAFII NM_004985: c.35G>A, p.G12D CTTGTGGTAGTTGGAGCTGa TGG 413 GTAGTTGGAGCTGaTGGCGT AGG 414
CFPAC NM_004985: c.35G>T, p.G12V CTTGTGGTAGTTGGAGCTGt TGG 415 GTAGTTGGAGCTGtTGGCGT AGG 416
KRAS 돌연변이 특이적 가이드 RNA를 구성하는데 사용된 올리고머
sgRNA 명칭 정방향 서열번호 역방향 서열번호
KRAS-G12D-RG1 CACCgCTTGTGGTAGTTGGAGCTGa 417 AAACtCAGCTCCAACTACCACAAGc 418
KRAS-G12D-RG2 CACCgGTAGTTGGAGCTGaTGGCGT 419 AAACACGCCAtCAGCTCCAACTACc 420
KRAS-G12V-RG1 CACCgCTTGTGGTAGTTGGAGCTGt 421 AAACaCAGCTCCAACTACCACAAGc 422
KRAS-G12V-RG2 CACCgGTAGTTGGAGCTGtTGGCGT 423 AAACACGCCAaCAGCTCCAACTACc 424
상기 설계된 가이드 RNA를 이용하여 야생형 KRAS 세포주 (오프-타겟)와 KRAS-G12D 및 G12V 점 돌연변이를 가지는 세포주 (온-타겟)에 대한 유전자가위 활성은 실시예 2-1과 동일한 방법으로 T7E1 어세이를 수행하여 확인하였다. T7E1 어세이에 사용된 PCR 프라이머는 표 19에 나타내었다.
T7E1 어세이에 대한 PCR 프라이머 쌍
유전자 타겟
sgRNAs
프라이머 명칭 정방향 서열번호 역방향 서열번호 Size (bp)
KRAS G12D, G12V KrasG12 TTTTCTTAAGCGTCGATGGAGGA 425 TCTACCCTCTCACGAAACTCTGA 426 614
그 결과, 도 10의 b에서 확인되는 바와 같이, 야생형 KRAS-G12D-RG1 및 KRAS-G12D-RG2 가이드 RNA는 야생형 염기서열과 돌연변이 염기서열 모두에 유전자가위 활성을 나타내어, 오프-타겟 및 온-타겟 활성을 모두 가지는 것으로 확인이 되었다. 반면, 도 10의 c에서 확인되는 바와 같이, 야생형 KRAS-G12V-RG1 및 KRAS-G12V-RG2 가이드 RNA는 야생형 염기서열에서는 유전자가위 활성이 없고, 돌연변이 염기서열에서는 유전자가위 활성을 나타내어, 오프-타겟 활성이 없고 온-타겟 활성만을 가지는 것으로 확인되었다. 결과적으로, KRAS-G12V에 대해서는 가이드 RNA는 야생형 염기서열과 돌연변이 염기서열을 구분하여 자를 수 있는 적합한 가이드 RNA를 찾을 수 있었다. 그러나, KRAS-G12D의 가이드 RNA는 야생형 염기서열과 돌연변이 염기서열을 구분할 수 없었기 때문에, 위치 10과 위치 18에 의도적인 미스매치를 추가하여 오프-타겟 활성을 감소시키고자 하였다.
도 11의 a에 나타난 바와 같이, KRAS 야생형 염기서열과 KRAS G12D 점 돌연변이를 타겟하는 가이드 RNA 2개 KRAS G12D-RG1 및 KRAS G12D-RG2의 위치 10과 위치 18에 의도적인 미스매치를 추가하여, KRAS 야생형 염기서열을 가지는 췌장암 세포주인 BxPC3 (오프-타겟)와 KRAS G12D 점 돌연변이 염기서열을 가지는 췌장암 세포주인 HPAFII (온-타겟)에 대해 각각 유전자가위 활성을 확인하였다.
6종의 KRAS G12D-RG1 변이체와 6종의 KRAS G12D-RG2 변이체 및 이를 클로닝하는데 사용된 올리고머의 구체적인 서열은 각각 표 20 및 21에 나타내었다.
가이드 RNA 명칭 서열 서열번호
KRAS-G12D-RG1-10A CTTGTGGTAGATGGAGCTGa 427
KRAS-G12D-RG1-10C CTTGTGGTAGCTGGAGCTGa 428
KRAS-G12D-RG1-10G CTTGTGGTAGGTGGAGCTGa 429
KRAS-G12D-RG1-18A CTAGTGGTAGTTGGAGCTGa 430
KRAS-G12D-RG1-18C CTCGTGGTAGTTGGAGCTGa 431
KRAS-G12D-RG1-18G CTGGTGGTAGTTGGAGCTGa 432
KRAS-G12D-RG2-10A GTAGTTGGAGATGaTGGCGT 433
KRAS-G12D-RG2-10T GTAGTTGGAGTTGaTGGCGT 434
KRAS-G12D-RG2-10G GTAGTTGGAGGTGaTGGCGT 435
KRAS-G12D-RG2-18T GTTGTTGGAGCTGaTGGCGT 436
KRAS-G12D-RG2-18G GTGGTTGGAGCTGaTGGCGT 437
KRAS-G12D-RG2-18C GTCGTTGGAGCTGaTGGCGT 438
sgRNA 명칭 정방향 서열번호 역방향 서열번호
KRAS-G12D-RG1-10A CACCGCTTGTGGTAGATGGAGCTGa 439 AAACtCAGCTCCATCTACCACAAGc 440
KRAS-G12D-RG1-10C CACCGCTTGTGGTAGCTGGAGCTGa 441 AAACtCAGCTCCAGCTACCACAAGc 442
KRAS-G12D-RG1-10G CACCGCTTGTGGTAGGTGGAGCTGa 443 AAACtCAGCTCCACCTACCACAAGc 444
KRAS-G12D-RG1-18A CACCGCTAGTGGTAGTTGGAGCTGa 445 AAACtCAGCTCCAACTACCACTAGc 446
KRAS-G12D-RG1-18C CACCGCTCGTGGTAGTTGGAGCTGa 447 AAACtCAGCTCCAACTACCACGAGc 448
KRAS-G12D-RG1-18G CACCGCTGGTGGTAGTTGGAGCTGa 449 AAACtCAGCTCCAACTACCACCAGc 450
KRAS-G12D-RG2-10A CACCGGTAGTTGGAGATGaTGGCGT 451 AAACACGCCAtCATCTCCAACTACc 452
KRAS-G12D-RG2-10T CACCGGTAGTTGGAGTTGaTGGCGT 453 AAACACGCCAtCAACTCCAACTACc 454
KRAS-G12D-RG2-10G CACCGGTAGTTGGAGGTGaTGGCGT 455 AAACACGCCAtCACCTCCAACTACc 456
KRAS-G12D-RG2-18T CACCGGTTGTTGGAGCTGaTGGCGT 457 AAACACGCCAtCAGCTCCAACAACc 458
KRAS-G12D-RG2-18G CACCGGTGGTTGGAGCTGaTGGCGT 459 AAACACGCCAtCAGCTCCAACCACc 460
KRAS-G12D-RG2-18C CACCGGTCGTTGGAGCTGaTGGCGT 461 AAACACGCCAtCAGCTCCAACGACc 462
유전자가위 활성은 실시예 2-1과 동일한 방법으로 T7E1 어세이를 수행하여 확인하였으며, T7E1 어세이에 사용된 PCR 프라이머는 표 19와 같다.
도 11의 b에 나타난 바와 같이, KRAS G12D-RG1은 야생형 염기서열과 돌연변이 염기서열에 대해 모두 유전자가위 활성을 나타내어, 오프-타겟 및 온-타겟 활성을 모두 가지는 것으로 확인이 되었다. 반면, 위치 10과 위치 18에 의도적인 미스매치를 추가한 경우, 야생형 염기서열을 가지는 BxPC3에서는 유전자가위 활성이 사라지고, 점 돌연변이 서열을 가지는 HPAFII에서는 G12D-RG1-10C 1종을 제외한 나머지 5종에서 유전자 가위가 작동하여, 오프-타겟 활성이 사라지고 온-타겟 활성만을 가지는 것으로 확인되었다.
또한, 도 11의 c에 나타난 바와 같이, KRAS G12D-RG2은 야생형 염기서열과 돌연변이 염기서열에 대해 모두 유전자가위 활성을 나타내어, 오프-타겟 및 온-타겟 활성을 모두 가지는 것으로 확인이 되었다. 반면, 위치 10에 의도적인 미스매치를 추가한 경우, 야생형 염기서열을 가지는 BxPC3에서는 유전자가위 활성이 낮아지고, 점 돌연변이 서열을 가지는 HPAFII에서는 유전자가위 활성을 유지하여, 오프-타겟 활성이 감소되고 온-타겟 활성은 유지되는 것을 확인하였다. 위치 18에 의도적인 미스매치를 추가한 경우에는 유전자가위 활성에 차이가 없는 것을 확인하였다. 이러한 문제는 위치 18 미스매치에 위치 10 미스매치 변이체를 매치하여 해결할 수 있을 것으로 예상이 된다.
[실시예 5]
가이드 RNA를 이용한 종양 세포 성장 억제 효과 확인
KRAS 유전자를 넉아웃 (knockout) 시키면 종양 성장이 줄어든다는 것을 보고한 문헌 [MD Muzumdar et al. Survival of pancreatic cancer cells lacking KRAS function. Natcomm. 2017 Oct 23;8(1):1090.]을 토대로, 상기 실시예 4에서 설계된 가이드 RNA도 동일한 결과를 나타낼 수 있는지 확인하였다.
본 실시예에서는 도 11의 c에서 확인된 결과에 따라, 점 돌연변이 염기서열을 가지는 유전자에 대한 온-타겟 활성을 유지하고, 야생형 염기서열을 가지는 유전자에 대한 오프-타겟 활성이 가장 낮은 KRAS-G12D-RG2-10A를 사용하였고, 췌장암 세포주는 BxPC3, HPAFII 및 Panc-1을 사용하였다.
도 12의 a는 3가지 종류의 췌장암 세포주에 대한 유전자형 분석 결과를 보여준다. BxPC3는 야생형 KRAS 유전자에 동형 (homozygous)이고, HPAFII는 KRAS-G12D 돌연변이 유전자에 동형 (homozygous)이다. Panc-1은 KRAS-G12D 돌연변이 유전자에 이형 (heterozygous)으로 확인되었다.
Panc-1 세포주에 대해 KRAS-G12D-RG2 및 KRAS-G12D-RG2-10A의 유전자가위 활성을 실시예 2-1과 동일한 방법으로 T7E1 어세이를 수행하여 확인하였다. Panc-1 세포주는 야생형 KRAS 염기서열과 돌연변이 염기서열을 가지고 있어, 도 12의 b에 나타난 바와 같이 각각을 타겟하는 유전자가위 활성을 확인할 수 있었다.
BxPC3, HPAFII 및 Panc-1 세포주에서 KRAS-G12D-RG2와 KRAS-G12D-RG2-10A의 유전자가위 활성을 T7E1 어세이로 확인한 후, 실제로 단백질 발현에도 차이가 있는지 확인하기 위해 웨스턴 블랏을 진행하였다. SDS 시료 준비와 웨스턴 블랏 분석은 기존에 문헌 [Sung et al., Pierce1, a novel p53 target gene contributing to the ultraviolet-induced DNA damage response. Cancer Res. 2010 Dec 15;70(24):10454-63.]에 보고한 바와 같이 수행하였다. 사용된 항체 정보는 다음과 같다: Kras (cell signaling #8955), Kras-G12D Mut (cell signaling #14429), β-actin (santa cruz #SC-47778).
3종류의 췌장암 세포주에 KRAS-G12D-RG2 및 KRAS-G12D-RG2-10A 가이드 RNA를 이용하여 KRAS 단백질과 KRAS-G12D 단백질의 발현 차이를 확인하였다. 먼저, 3종류의 세포주에 EV (empty vector), KRAS-G12D-RG2 또는 KRAS-G12D-RG2-10A 가이드 RNA를 발현시킬 수 있는 렌티바이러스를 감염시킨 후, 퓨로마이신 선별 (puromycin selection)을 진행하여 안정한 세포주를 확보하였다. KRAS 및 KRAS-G12D 돌연변이 단백질 발현 정도를 웨스턴 블랏으로 확인한 결과, 도 12c에서 확인되는 바와 같이, 야생형 KRAS 염기서열 및 돌연변이 염기서열에서 모두 높은 유전자가위 활성을 보였던 KRAS-G12D-RG2가 처리된 경우, BxPC3 세포주와 HPAFII 세포주에서 모두 KRAS 단백질과 KRAS-G12D 돌연변이 단백질이 발현되지 않는 것을 알 수 있었다. 또한, Panc-1 세포주에서는 KRAS-G12D-RG2이 처리된 경우, KRAS 단백질이 발현하지만, EV 샘플에 비해 현저하게 발현이 감소되었고, KRAS-G12D 돌연변이 단백질은 발현되지 않는 것을 확인하였다. 의도적인 미스매치로 위치 10을 A로 변경한 KRAS-G12D-RG2-10A를 처리한 경우, 3종류의 세포주에서 모두 KRAS 단백질은 발현되면서, KRAS-G12D 돌연변이 단백질은 발현되지 않거나 현저하게 발현이 감소하는 것을 확인할 수 있었다. 상기 웨스턴 블랏 결과를 통해, KRAS-G12D-RG2-10A 가이드 RNA가 돌연변이 염기서열만 선택적으로 넉아웃시킬 수 있다는 것을 다시 한번 증명하였다.
추가적으로, 문헌 [MD Muzumdar et al. Survival of pancreatic cancer cells lacking KRAS function. Natcomm. 2017 Oct 23;8(1):1090.]에 보고된 바와 같이, 종양 성장도 감소하는지 확인하기 위해 CPDL (cumulative population doubling level)을 비교하였다.
도 12의 d에 나타난 바와 같이, 야생형 KRAS 염기서열 동형 유전자형을 가지는 BxPC3 세포주에서는 EV와 KRAS-G12D-RG2-10A가 처리된 경우, KRAS 단백질 발현이 유지되기 때문에 세포 성장에 차이가 없는 반면, KRAS-G12D-RG2가 처리된 경우 KRAS 유전자가 완전히 넉아웃 되었기 때문에 세포 성장이 현저하게 감소하는 것을 확인할 수 있었다.
KRAS 돌연변이 염기서열 동형 유전자형을 가지는 HPAFII 세포주에서는 EV가 처리된 경우 BxPC3-EV 세포와 비슷한 세포 성장 패턴을 보였고, KRAS-G12D-RG2가 처리된 경우 BxPC3-KRAS-G12D-RG2 결과와 유사하게 세포 성장이 현저하게 감소하였다. KRAS-G12D-RG2-10A가 처리된 경우 KRAS 단백질 발현이 유지되고, KRAS-G12D 돌연변이 단백질 발현이 현저하게 감소하였기 때문에, HPAFII-EV 세포 보다는 세포 성장이 감소하였으나, KRAS 유전자가 완전히 넉아웃된 HPAFII-KRAS-G12D-RG2 보다는 세포 성장이 높은 것을 확인할 수 있었다.
KRAS 돌연변이 염기서열 이형 유전형을 가지는 Panc-1 세포주에 EV를 처리하는 경우 상기 2종의 세포주 보다 더 높은 세포 성장을 나타내었고, KRAS-G12D-RG2를 처리하는 경우 상기 2종의 세포주에서 확인 것과 다르게 세포 성장을 유지하였다. 이러한 결과는 KRAS 단백질이 완전하게 넉아웃 되지 않고 발현을 유지하고 있었기 때문에, 세포 성장이 감소하지 않는 것으로 판단할 수 있다. KRAS-G12D-RG2-10A를 처리한 경우에도, KRAS 단백질이 발현을 유지하고 있기 때문에 세포 성장을 유지하고 있는 결과를 확인할 수 있었고, HPAFII-KRAS-G12D-RG2 보다 높은 세포 성장 결과를 확인할 수 있었다. 이를 통해, KRAS-G12D-RG2-10A 가이드 RNA는 야생형 염기서열과 돌연변이 염기서열을 구분하여, KRAS 단백질은 발현하도록 하면서 KRAS-G12D 돌연변이 단백질만 완전하게 발현되지 않도록 넉아웃 시킴으로써, 세포 성장이 선택적으로 달라진다는 것을 증명하였다.
결론적으로, 추가적인 실험에서 위치 10과 위치 18에 추가되는 의도적인 미스매치를 이용하여 온-타겟 활성을 유지하면서, 오프-타겟 활성을 감소시킬 수 있는 가이드 RNA를 선별할 수 있고, 야생형 염기서열과 돌연변이 염기서열을 구분하여 돌연변이 부분만 넉아웃시킬 수 있는 가이드 RNA를 선별할 수 있다는 결과를 증명하였다. 따라서, 본 발명에 따른 가이드 RNA 제조방법을 이용하여, 높은 온-타겟 활성을 유지하면서 감소된 오프-타겟 활성을 갖는, 돌연변이 타겟 가이드 RNA를 선별하여 암 발생의 원인 중 하나인 점 돌연변이를 가지는 타겟 유전자를 교정하는데 이용할 수 있을 것으로 예상된다.

Claims (25)

  1. 타겟 유전자 영역에 상보적인 뉴클레오타이드 서열을 포함하는 가이드 RNA로서, 상기 뉴클레오타이드 서열은
    i) 오프-타겟 유전자 영역에 대해 원래 (original) 하나의 미스매치를 포함하고;
    ii) 타겟 유전자 영역 및 오프-타겟 유전자 영역에 대해 의도적인 (intentional) 하나 또는 두 개의 미스매치를 포함하며;
    상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 서로 상이한 위치에 도입되는, 가이드 RNA.
  2. 제1항에 있어서, 상기 원래 하나의 미스매치와 의도적인 하나 또는 두 개의 미스매치는 각각 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +1 위치 내지 +20 위치 중 서로 상이한 위치에 도입되는, 가이드 RNA.
  3. 제2항에 있어서, 상기 의도적인 하나 또는 두 개의 미스매치는 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프 (protospacer-adjacent motif)로부터 +1 위치 및 +18 위치 중 하나 또는 두 개에 도입되는, 가이드 RNA.
  4. 제1항에 있어서, 상기 타겟 유전자는 CCR5이고, 상기 오프-타겟 유전자는 CCR2인, 가이드 RNA.
  5. 제4항에 있어서, 서열번호 1 내지 19로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치가 도입되고, 상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외되는, 가이드 RNA.
  6. 제5항에 있어서,
    서열번호 1의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +15 위치 및 +17 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 2의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +11 위치 및 +13 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 3의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +8 위치 및 +10 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 4의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 및 +3 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 5의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +14 위치 및 +16 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 6의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 7의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +15 위치 및 +17 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 8의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +12 위치 및 +14 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 9의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +4 위치 및 +6 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 10의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 11의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +19 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 12의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +9 위치 및 +11 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 13의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 14의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +9 위치 및 +11 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 15의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +13 위치 및 +15 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 16의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +18 위치 및 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 17의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 18의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +18 위치 및 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나; 또는
    서열번호 19의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +19 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되고;
    상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외되는, 가이드 RNA.
  7. 제4항에 있어서, 서열번호 1 내지 19로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되고, 상기 서열번호 1 내지 19의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외되는, 가이드 RNA.
  8. 제6항에 있어서, 서열번호 20 내지 95로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하는, 가이드 RNA.
  9. 제7항에 있어서, 서열번호 96 내지 125로 이루어진 군으로부터 선택되는 어느 하나의 뉴클레오타이드 서열을 포함하는, 가이드 RNA.
  10. 제1항에 있어서, 상기 타겟 유전자는 점 돌연변이 (point mutation)를 포함하는 유전자이고, 상기 오프-타겟 유전자는 야생형 유전자인, 가이드 RNA.
  11. 제10항에 있어서, 상기 타겟 유전자는 KRAS G12D, G12C 또는 G12V 점 돌연변이를 포함하는 유전자이고, 상기 오프-타겟 유전자는 야생형 KRAS 유전자인, 가이드 RNA.
  12. 제11항에 있어서, 서열번호 413 내지 416로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치가 도입되고, 상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외되는 가이드 RNA.
  13. 제12항에 있어서,
    서열번호 413의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 414의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +6 위치 및 +8 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나;
    서열번호 415의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +2 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되거나; 또는
    서열번호 416의 뉴클레오타이드 서열을 포함하되, 프로토스페이서-인접 모티프로부터 +1 위치 내지 +6 위치 및 +8 위치 내지 +20 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되고;
    상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외되는, 가이드 RNA.
  14. 제13항에 있어서, 서열번호 413 내지 416로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하되, 각 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프로부터 +10 위치 및 +18 위치 중 어느 하나 또는 두 개에 전이 또는 전좌 돌연변이를 유발하여 의도적인 미스매치가 도입되고, 상기 서열번호 413 내지 416의 뉴클레오타이드 서열에서 프로토스페이서-인접 모티프 서열은 제외되는, 가이드 RNA.
  15. 제14항에 있어서, 서열번호 427 내지 438로 이루어진 군으로부터 선택된 어느 하나의 뉴클레오타이드 서열을 포함하는, 가이드 RNA.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 가이드 RNA는 야생형 가이드 RNA의 온-타겟 활성의 50% 이상을 유지하고, 야생형 가이드 RNA에 비해 감소된 오프-타겟 활성을 나타내거나 오프-타겟 활성이 없는, 가이드 RNA.
  17. (a) 타겟 유전자 영역에 상보적인 뉴클레오타이드 서열을 포함하되, 오프-타겟 유전자 영역에 대해서는 원래 (original) 하나의 미스매치를 포함하는 가이드 RNA를 선별하는 단계; 및
    (b) 선별된 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프로부터 +1 위치 내지 +20 위치 중 어느 하나 또는 두 개에 의도적인 미스매치를 도입하는 단계를 포함하며,
    이때, 상기 원래 하나의 미스매치와 상기 하나 또는 두 개의 의도적인 미스매치는 서로 상이한 위치에 도입되는, 가이드 RNA의 제조방법.
  18. 제17항에 있어서, 상기 단계 (b)의 의도적 미스매치는 선별된 가이드 RNA의 뉴클레오타이드 서열의 프로토스페이서-인접 모티프로부터 +10 위치 내지 +18 위치 중 하나 또는 두 개에 도입되는, 가이드 RNA의 제조방법.
  19. 제17항에 있어서, 상기 방법으로부터 제조된 RNA는 야생형 가이드 RNA의 온-타겟 활성의 50% 이상을 유지하고, 야생형 가이드 RNA에 비해 감소된 오프-타겟 활성을 나타내거나, 오프-타겟 활성이 없는, 가이드 RNA의 제조방법.
  20. 제1항 내지 제15항 중 어느 한 항의 가이드 RNA를 이용한 CRISPR 시스템의 정확도를 향상시키는 방법.
  21. 제1항 내지 제15항 중 어느 한 항의 가이드 RNA를 포함하는, 유전자 교정용 조성물.
  22. 제1항 내지 제15항 중 어느 한 항의 가이드 RNA를 포함하는, 점 돌연변이 (point mutation)로 야기되는 질환 또는 후천성면역결핍증의 예방 또는 치료용 약학 조성물.
  23. 제1항 내지 제15항 중 어느 한 항의 가이드 RNA를 포함하는, 점 돌연변이 (point mutation)로 야기되는 질환의 진단용 조성물.
  24. 제1항 내지 제15항 중 어느 한 항의 가이드 RNA를 이용한 유전자 표적 방법.
  25. 제1항 내지 제15항 중 어느 한 항의 가이드 RNA를 이용한 유전자 교정 방법.
PCT/KR2021/018693 2020-12-09 2021-12-09 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 rna 및 이의 용도 WO2022124839A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0171716 2020-12-09
KR20200171716 2020-12-09

Publications (1)

Publication Number Publication Date
WO2022124839A1 true WO2022124839A1 (ko) 2022-06-16

Family

ID=81974560

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/018693 WO2022124839A1 (ko) 2020-12-09 2021-12-09 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 rna 및 이의 용도

Country Status (2)

Country Link
KR (1) KR20220081949A (ko)
WO (1) WO2022124839A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023205844A1 (en) * 2022-04-26 2023-11-02 Peter Maccallum Cancer Institute Nucleic acids and uses thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101446A (ko) * 2012-10-23 2015-09-03 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
KR101828933B1 (ko) * 2014-11-14 2018-02-14 기초과학연구원 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법
WO2018071892A1 (en) * 2016-10-14 2018-04-19 Joung J Keith Epigenetically regulated site-specific nucleases
KR20190008548A (ko) * 2016-06-15 2019-01-24 주식회사 툴젠 온타겟 및 오프타겟의 다중 타겟 시스템을 이용하는, 표적 특이적 유전자 가위 스크리닝 방법 및 이의 용도
KR102117016B1 (ko) * 2017-12-14 2020-05-29 단국대학교 산학협력단 Crispr 시스템 기능 향상 방법 및 그의 이용

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101446A (ko) * 2012-10-23 2015-09-03 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
KR101828933B1 (ko) * 2014-11-14 2018-02-14 기초과학연구원 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법
KR20190008548A (ko) * 2016-06-15 2019-01-24 주식회사 툴젠 온타겟 및 오프타겟의 다중 타겟 시스템을 이용하는, 표적 특이적 유전자 가위 스크리닝 방법 및 이의 용도
WO2018071892A1 (en) * 2016-10-14 2018-04-19 Joung J Keith Epigenetically regulated site-specific nucleases
KR102117016B1 (ko) * 2017-12-14 2020-05-29 단국대학교 산학협력단 Crispr 시스템 기능 향상 방법 및 그의 이용

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LEE HO JOUNG, KIM HYUN JU, LEE SANG JUN: "CRISPR-Cas9-mediated pinpoint microbial genome editing aided by target-mismatched sgRNAs", GENOME RESEARCH, vol. 30, no. 5, 1 May 2020 (2020-05-01), US , pages 768 - 775, XP055941332, ISSN: 1088-9051, DOI: 10.1101/gr.257493.119 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023205844A1 (en) * 2022-04-26 2023-11-02 Peter Maccallum Cancer Institute Nucleic acids and uses thereof

Also Published As

Publication number Publication date
KR20220081949A (ko) 2022-06-16

Similar Documents

Publication Publication Date Title
WO2016076672A1 (ko) 유전체에서 유전자 가위의 비표적 위치를 검출하는 방법
WO2016021973A1 (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
WO2015183025A1 (ko) 표적 특이적 뉴클레아제를 이용한 표적 dna의 민감한 검출 방법
EP2912175A1 (en) Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
WO2022124839A1 (ko) 온-타겟 활성이 유지되고 오프-타겟 활성이 감소된 가이드 rna 및 이의 용도
WO2017188797A1 (ko) In vivo에서 rna-가이드 뉴클레아제의 활성을 고처리량 방식으로 평가하는 방법
WO2019117660A2 (ko) Crispr 시스템 기능 향상 방법 및 그의 이용
WO2018231018A2 (ko) 간에서 목적하는 단백질 발현하기 위한 플랫폼
WO2017003267A1 (ko) 항바이러스 활성 효능을 가지는 펩티드 및 이를 포함하는 조성물
WO2019143201A1 (ko) 재조합 백시니아 바이러스 및 이를 포함하는 약학 조성물
WO2022097844A1 (ko) 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법
WO2020022802A1 (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
WO2017007241A1 (ko) Parp 및 탄키라제 동시 저해제에 대한 감수성 결정 방법
WO2019151771A1 (ko) Pd-l1 결합력이 증대된 pd-1 변이체
WO2023282688A1 (ko) 산화스트레스 저항성을 갖는 중간엽 줄기세포, 이의 제조방법 및 용도
WO2020214003A1 (ko) B형 간염 바이러스의 증식을 억제하는 조성물 및 이의 방법
WO2021034101A1 (ko) 신규 인터페론 람다 변이체 및 이의 제조방법
WO2021145700A1 (ko) 저산소 환경 하에서 높은 적응력을 가지는 세포 및 이의 용도
WO2024058589A1 (ko) 유전자 가위 넉-인을 이용하여 제조한 키메릭 항원 수용체 세포 및 이의 용도
WO2023172116A1 (ko) 듀센 근이영양증 치료를 위한 유전자 편집 시스템 및 이를 이용한 질병 치료 방법
WO2021080400A1 (ko) 미나리 유래 폴리펩티드 및 상기 폴리펩티드를 포함하는 약학적 조성물
WO2020071641A1 (ko) Tsp1 단백질 억제제를 유효성분으로 함유하는 파브리 병의 예방 또는 치료용 약학적 조성물
WO2023106839A1 (ko) Il-12를 발현하는 재조합 백시니아 바이러스 및 이의 용도
WO2022158898A1 (ko) Francisella novicida cas9 모듈 기반의 역전사 효소를 사용한 유전체 치환 및 삽입 기술
WO2022240143A1 (ko) 발암성 돌연변이 유전자 검출용 가이드 rna 내지 이의 용도

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21903884

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21903884

Country of ref document: EP

Kind code of ref document: A1