WO2022075808A1 - Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도 - Google Patents

Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도 Download PDF

Info

Publication number
WO2022075808A1
WO2022075808A1 PCT/KR2021/013898 KR2021013898W WO2022075808A1 WO 2022075808 A1 WO2022075808 A1 WO 2022075808A1 KR 2021013898 W KR2021013898 W KR 2021013898W WO 2022075808 A1 WO2022075808 A1 WO 2022075808A1
Authority
WO
WIPO (PCT)
Prior art keywords
seq
sequence
region
engineered
cas12f1
Prior art date
Application number
PCT/KR2021/013898
Other languages
English (en)
French (fr)
Inventor
김용삼
김도연
Original Assignee
주식회사 진코어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 진코어 filed Critical 주식회사 진코어
Priority to EP21878058.3A priority Critical patent/EP4227408A1/en
Priority to AU2021357283A priority patent/AU2021357283A1/en
Priority to CA3198422A priority patent/CA3198422A1/en
Priority to CN202180082801.5A priority patent/CN116568803A/zh
Priority to JP2023521510A priority patent/JP2023545079A/ja
Priority to US18/030,418 priority patent/US20230374500A1/en
Publication of WO2022075808A1 publication Critical patent/WO2022075808A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/53Methods for regulating/modulating their activity reducing unwanted side-effects

Definitions

  • Disclosed herein is a technology for the field of using the CRISPR/Cas system, particularly the CRISPR/Cas12f1 system, for gene editing.
  • the CRISPR/Cas12f1 system is a CRISPR/Cas system classified as Class 2, Type V.
  • the CRISPR/Cas14a system a CRISPR/Cas system derived from archaebacteria for the first time, was revealed.
  • the CRISPR/Cas14 system was classified as a CRISPR/Cas12f system.
  • the CRISPR/Cas12f1 system belongs to the V-F1 system, which is a subtype of one of the CRISPR/Cas systems classified as Class 2 and Type V, and includes the CRISPR/Cas14a system having Cas14a as an effector protein.
  • the CRISPR/Cas12f1 system is characterized in that the size of the effector protein is significantly smaller than that of the CRISPR/Cas9 system.
  • the CRISPR/Cas12f1 system particularly CRISPR/ The Cas14a system has the ability to cut single-stranded DNA, but has no or extremely low cutting activity for double-stranded DNA, limiting its application to gene editing technology.
  • An object of the present specification is to provide an engineered CRISPR/Cas12f1 complex with increased gene editing efficiency.
  • An object of the present specification is to provide an engineered CRISPR/Cas12f1 system with increased gene editing efficiency.
  • An object of the present specification is to provide a gene editing method using the engineered CRISPR/Cas12f1 system.
  • the present specification provides an engineered guide RNA for the CRISPR/Cas12f1 system, comprising:
  • the engineered guide RNA is connected in order from the 5' end to the 3' end, the engineered scaffold region, the spacer, and the U-rich tail,
  • the spacer includes 10 or more and 50 or less nucleotides, and has a sequence complementary to a target sequence
  • the sequence of the U-rich tail is expressed as (U a N) b U c , wherein N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G), a, b, c are integers, a is 1 or more and 5 or less, b is 0 or more, c is 1 or more and 10 or less,
  • the sequence of the engineered scaffold region is characterized in that it differs from 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 7),
  • the sequence of the engineered scaffold region consists of the following sequences linked in order from the 5' end to the 3' end:
  • the present specification provides an engineered guide RNA for the CRISPR/Cas12f1 system, comprising:
  • the engineered guide RNA is connected in order from the 5' end to the 3' end, the engineered scaffold region, the spacer, and the U-rich tail,
  • the spacer includes 10 or more and 50 or less nucleotides, and has a sequence complementary to a target sequence
  • the sequence of the U-rich tail is expressed as (U a N) b U c , wherein N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G) , wherein a, b, and c are integers, a is 1 or more and 5 or less, b is 0 or more, and c is 1 or more and 10 or less,
  • the sequence of the engineered scaffold region consists of the following sequences linked in order from the 5' end to the 3' end:
  • the present specification provides an engineered guide RNA for a CRISPR/Cas12f1 system comprising:
  • the spacer includes 10 or more and 50 or less nucleotides, and has a sequence complementary to the target sequence
  • the sequence of the U-rich tail is expressed as (U a N) b U c , wherein N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G), a, b, c are integers, a is 1 or more and 5 or less, b is 0 or more, c is 1 or more and 10 or less,
  • the engineered scaffold regions include:
  • the 3' end of the engineered crRNA repeat sequence portion is connected to the 5' end of the spacer
  • the sequence of the engineered tracrRNA is the same as 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUU-3' (SEQ ID NO: 1) and the same as 5' (SEQ ID NO: 1), except that the engineered crRNA sequence is identical to 5' (SEQ ID NO: 1) characterized.
  • the present specification provides an engineered CRISPR/Cas12f1 complex comprising:
  • the engineered guide RNA contains:
  • the engineered guide RNA is connected in order from the 5' end to the 3' end, the engineered scaffold region, the spacer, and the U-rich tail,
  • the spacer comprises 10 or more and 50 or less nucleotides and has a sequence complementary to the target sequence
  • the sequence of the U-rich tail is expressed as (U a N) b U c , wherein N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G), a, b, c are integers, a is 1 or more and 5 or less, b is 0 or more, c is 1 or more and 10 or less,
  • the sequence of the engineered scaffold region is characterized in that it differs from 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 7),
  • the sequence of the engineered scaffold region consists of the following sequences linked in order from the 5' end to the 3' end:
  • the present specification provides a vector capable of expressing each component of the CRISPR/Cas12f1 system, comprising:
  • a first sequence comprising a nucleic acid sequence encoding a Cas12f1 protein
  • a second sequence comprising a nucleic acid sequence encoding the engineered guide RNA
  • the engineered guide RNA contains:
  • the engineered scaffold region, spacer, and U-rich tail are connected in order from the 5' end to the 3' end direction,
  • the spacer includes 10 or more and 50 or less nucleotides, and has a sequence complementary to a target sequence
  • the sequence of the U-rich tail is expressed as (U a N) b U c , wherein N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G), a, b, c are integers, a is 1 or more and 5 or less, b is 0 or more, c is 1 or more and 10 or less,
  • the sequence of the engineered scaffold region is characterized in that it differs from 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 7),
  • the sequence of the engineered scaffold region consists of the following sequences linked in order from the 5' end to the 3' end:
  • a method of editing a target nucleic acid in a cell or a method of targeting a target nucleic acid comprising:
  • the CRISPR/Cas12f1 complex may be formed in the cell
  • the engineered guide RNA is connected in order from the 5' end to the 3' end, the engineered scaffold region, the spacer, and the U-rich tail,
  • the spacer includes 10 or more and 50 or less nucleotides, and has a sequence complementary to a target sequence
  • the sequence of the U-rich tail is expressed as (U a N) b U c , wherein N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G), a, b, c are integers, a is 1 or more and 5 or less, b is 0 or more, c is 1 or more and 10 or less,
  • the sequence of the engineered scaffold region is characterized in that it differs from 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 7),
  • the sequence of the engineered scaffold region consists of the following sequences linked in order from the 5' end to the 3' end:
  • the present specification provides the use of engineered Cas12f1 guide RNA for gene editing.
  • FIG. 1 is a schematic diagram illustrating an engineered Cas12f1 guide RNA disclosed herein.
  • Example 2 is a graph showing the average indel efficiency for Examples 1.1.1 to Example 1.1.3 targeting DY2 among the examples disclosed in Experimental Example 2.
  • Example 3 is a graph showing the average indel efficiency for Examples 1.1.4 to Example 1.1.6 targeting DY2 among the examples disclosed in Experimental Example 2;
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 4 is a graph showing the average indel efficiency for Examples 1.1.7 to Example 1.1.9 targeting DY2 among the examples disclosed in Experimental Example 2;
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 5 is a graph showing the average indel efficiency for Examples 1.1.10 to Example 1.1.13 targeting DY2 among the examples disclosed in Experimental Example 2;
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 6 is a graph showing the average value of indel efficiency for Examples 1.2.1 to Example 1.2.3 targeting DY10 among the examples disclosed in Experimental Example 2;
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 7 is a graph showing the average value of indel efficiency for Examples 1.2.4 to Example 1.2.6 targeting DY10 among the examples disclosed in Experimental Example 2.
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 8 is a graph showing the average value of indel efficiency for Examples 1.2.7 to Example 1.2.9 targeting DY10 among the examples disclosed in Experimental Example 2;
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 9 is a graph showing average values of indel efficiencies for Examples 1.2.10 to Example 1.2.13 targeting DY10 among the examples disclosed in Experimental Example 2;
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 10 is a graph showing average values of indel efficiencies for Examples 1.3.1 to Example 1.3.3 targeting Intergenic22 among the Examples disclosed in Experimental Example 2.
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 11 is a graph showing average values of indel efficiencies for Examples 1.3.4 to Example 1.3.6 targeting Intergenic22 among the Examples disclosed in Experimental Example 2.
  • Ex is an abbreviation for Example
  • Comp is an abbreviation for Comparative Example
  • Control is a negative control.
  • Example 12 is a graph showing average values of indel efficiencies for Examples 1.3.7 to Example 1.3.9 targeting Intergenic22 among the Examples disclosed in Experimental Example 2.
  • Example 13 is a graph showing average values of indel efficiencies for Examples 1.3.10 to Example 1.3.13 targeting Intergenic22 among the Examples disclosed in Experimental Example 2.
  • FIG. 14 is a graph showing Indel efficiency of Comparative Example 1.1.1 targeting DY2, and Control among the Examples disclosed in Experimental Example 2.
  • FIG. 14 is a graph showing Indel efficiency of Comparative Example 1.1.1 targeting DY2, and Control among the Examples disclosed in Experimental Example 2.
  • FIG. 15 is a graph showing Indel efficiency of Comparative Example 1.2.1 targeting DY10, and Control among the Examples disclosed in Experimental Example 2.
  • FIG. 15 is a graph showing Indel efficiency of Comparative Example 1.2.1 targeting DY10, and Control among the Examples disclosed in Experimental Example 2.
  • Example 16 is a graph showing the average indel efficiency for Examples 2.1.1 to Example 2.1.7 targeting DY2 among the examples disclosed in Experimental Example 3.1. In this case, Ex is an abbreviation for Example.
  • Example 17 is a graph showing the average indel efficiency for Examples 2.1.8 to 2.1.15 targeting DY2 among the examples disclosed in Experimental Example 3.1. In this case, Ex is an abbreviation for Example.
  • Example 18 is a graph showing the average value of indel efficiency for Examples 2.2.1 to Example 2.2.7 targeting DY10 among the examples disclosed in Experimental Example 3.1. In this case, Ex is an abbreviation for Example.
  • Example 19 is a graph showing the average value of indel efficiency for Examples 2.2.8 to Example 2.2.15 targeting DY10 among the examples disclosed in Experimental Example 3.1. In this case, Ex is an abbreviation for Example.
  • Example 20 is a graph showing average values of indel efficiency for Examples 3.1.1 to 3.1.6 targeting DY2 among the examples disclosed in Experimental Example 3.2. In this case, Ex is an abbreviation for Example.
  • Example 21 is a graph showing average values of indel efficiencies for Examples 3.1.7 to Example 3.1.12 targeting DY2 among the examples disclosed in Experimental Example 3.2. In this case, Ex is an abbreviation for Example.
  • Example 22 is a graph showing average values of indel efficiencies for Examples 3.2.1 to 3.2.6 targeting DY10 among the examples disclosed in Experimental Example 3.2. In this case, Ex is an abbreviation for Example.
  • Example 23 is a graph showing the average value of indel efficiency for Examples 3.2.7 to Example 3.2.12 targeting DY10 among the examples disclosed in Experimental Example 3.2. In this case, Ex is an abbreviation for Example.
  • Example 24 is a graph showing the average indel efficiency for each example disclosed in Experimental Example 4.1. The average values of indel efficiencies for Examples 4.4.1 to 4.4.4 targeting FUS are shown, respectively. In this case, Ex is an abbreviation for Example.
  • Example 25 is a graph showing the average indel efficiency for each example disclosed in Experimental Example 4.1. The average values of indel efficiencies for Examples 4.5.1 to 4.5.2 targeting GAK are shown, respectively. In this case, Ex is an abbreviation for Example.
  • Example 26 is a graph showing the average indel efficiency for each example disclosed in Experimental Example 4.1. The average values of indel efficiencies for Example 4.6.1 targeting MLH are shown respectively. In this case, Ex is an abbreviation for Example.
  • the term “about” refers to 30, 25, 20, 25, 10, 9, 8, 7 to a reference amount, level, value, number, frequency, percent, dimension, size, amount, weight or length. , means an amount, level, value, number, frequency, percent, dimension, size, amount, weight or length varying by as much as 6, 5, 4, 3, 2 or 1%.
  • the symbols A, T, C, G, and U are interpreted as meanings understood by those of ordinary skill in the art. It may be properly interpreted as a base, a nucleoside, or a nucleotide on DNA or RNA according to context and technology.
  • each nucleoside is It is interpreted to mean a nucleotide comprising
  • operably linked means that, in gene expression, a particular construct is linked to another construct so that it functions in an intended manner.
  • a promoter sequence when operably linked with a coding sequence, it is meant that the promoter is linked so as to affect the transcription and/or expression of the coding sequence in a cell.
  • the term includes all meanings that those of ordinary skill in the art can understand, and may be appropriately interpreted according to the context.
  • target gene or target nucleic acid
  • target gene or “target nucleic acids” basically means a gene or nucleic acid in a cell that is a target of gene editing.
  • the target gene or target nucleic acid may be used interchangeably, and may refer to the same target.
  • the target gene or target nucleic acid may refer to both a unique gene or nucleic acid possessed by a target cell, or an externally-derived gene or nucleic acid, unless otherwise specified, and is not particularly limited as long as it can be the subject of editing.
  • the target gene or target nucleic acid may include a target sequence or a region adjacent to the target sequence.
  • the target gene or target nucleic acid may be single-stranded DNA, double-stranded DNA, and/or RNA.
  • the term includes all meanings that those of ordinary skill in the art can understand, and may be appropriately interpreted according to the context.
  • target sequence or “recognition sequence” refers to a specific sequence recognized by the CRISPR/Cas complex to cleave a target gene or target nucleic acid.
  • the target sequence may be appropriately selected depending on the purpose.
  • the "target sequence” may be a sequence included in the above-described target gene or target nucleic acid, and refers to a sequence having complementarity with a spacer sequence included in the guide RNA provided herein or an engineered guide RNA. .
  • the spacer sequence is determined in consideration of the sequence of the target gene or target nucleic acid and the PAM sequence recognized by the effector protein of the CRISPR/Cas system.
  • the target sequence may refer only to a specific strand complementary to the guide RNA of the CRISPR/Cas complex, and may refer to the entire target double strand including the specific strand portion, which may depend on the context. interpreted appropriately.
  • the term includes all meanings that those of ordinary skill in the art can understand, and may be appropriately interpreted according to the context.
  • vector refers to any material capable of transporting genetic material into a cell.
  • a vector can be, but is not limited to, a DNA molecule comprising the genetic material of interest, for example, a nucleic acid encoding an effector protein of the CRISPR/Cas system, and/or a nucleic acid encoding a guide RNA.
  • the term includes all meanings that those of ordinary skill in the art can understand, and may be appropriately interpreted according to the context.
  • the term “occurred in nature” means an object that is not artificially modified and is found in the natural world, and is used to distinguish it from an “engineered object” that has been artificially deformed.
  • the "genes, nucleic acids, DNA, RNA, etc. found in nature” are used as a concept encompassing all of wild type (wild type, original form) and mature form (active form) genes, nucleic acids, DNA, and RNA.
  • the term includes all other meanings that can be understood by those skilled in the art, and should be appropriately interpreted according to the context.
  • engineered is a term used to distinguish substances, molecules, etc. having a composition already existing in nature, and means that artificial modifications are applied to the substances, molecules, and the like.
  • engineered guide RNA it refers to a guide RNA in which an artificial change is applied to the composition of a guide RNA existing in nature.
  • the term includes all meanings that those of ordinary skill in the art can understand, and may be appropriately interpreted according to the context.
  • NLS refers to a peptide of a certain length that acts as a kind of "tag” attached to a protein to be transported when a substance outside the cell nucleus is transported into the nucleus by nuclear transport action, or its means sequence.
  • the NLS is the NLS of the SV40 virus large T-antigen having the amino acid sequence PKKKRKV (SEQ ID NO: 278); NLS from nucleoplasmin (eg, nucleoplasmin bipartite NLS having the sequence KRPAATKKAGQAKKKK (SEQ ID NO: 279)); c-myc NLS having the amino acid sequence PAAKRVKLD (SEQ ID NO: 280) or RQRRNELKRSP (SEQ ID NO: 281); hRNPA1 M9 NLS having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 282); sequence RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 283) of the IBB domain from importin-alpha; sequences VSRKRPRP (SEQ ID NO: 284) and PPKKARED (SEQ ID NO: 285) of myoma T protein
  • NES refers to a peptide of a certain length that acts as a kind of "tag” attached to a protein to be transported when a material inside the cell nucleus is transported to the outside of the nucleus by nuclear transport, or its means sequence.
  • NES includes all meanings that those of ordinary skill in the art can understand, and may be appropriately interpreted according to the context.
  • the term "tag” refers collectively to a functional domain added to facilitate transport, tracking, and/or separation and purification of peptides or proteins.
  • the tag includes a histidine (His) tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag, and a tag protein such as a thioredoxin (Trx) tag, a green fluorescent protein (GFP), yellow fluorescent protein (YFP), cyan fluorescent protein (CFP), blue fluorescent protein (BFP), autofluorescent proteins such as HcRED, DsRed, and glutathione-S-transferase (GST), horseradish ( horseradish) peroxidase (HRP), chloramphenicol acetyltransferase (CAT) beta-galactosidase, beta-glucuronidase, reporter genes such as luciferase, but are not limited thereto.
  • His his
  • the CRISPR/Cas12f system belongs to the V-F subtype of the type V CRISPR/Cas system, which is further divided into V-F1 to V-F3 variants.
  • the CRISPR/Cas12f system is one of the effector proteins named Cas14 in a previous study (Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2016)), Cas14a, Cas14b, and Cas14c variants.
  • CRISPR/Cas14 systems comprising Among them, the CRISPR/Cas14a system including the Cas14a effector protein is classified as the CRISPR/Cas12f1 system (Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)). Recent previous studies (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021), Xiao et al., Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease, bioRxiv (2020)), etc. have revealed the structure of the CRISPR/Cas12f1 complex, which will be briefly described below.
  • the Cas12f1 protein is divided into an amino-terminal domain (NTD) and a carboxy-terminal domin (CTD), and has a structure in which the two domains are connected through a linker loop.
  • the NTD consists of wedge (WED), recognition (REC), and zinc finger (ZF) domains, and the CTD consists of another ZF domain and a RuvC domain.
  • the structure of the Cas12f1 protein dimer can be largely divided into a REC lobe and a nuclease lobe.
  • the REC lobe comprises: a WED domain, a ZF domain, and a REC domain of one Cas12f1 protein constituting a dimer; It is composed of a WED domain, a ZF domain, and a REC domain of another Cas12f1 protein constituting a dimer.
  • the nuclease lobe comprises: a RuvC domain and a TNB domain of one Cas12f1 protein constituting a dimer; It is composed of the RuvC domain and the TNB domain of the other Cas12f1 protein constituting the dimer. All or part of each domain of the Cas12f1 protein recognizes a specific part of the scaffold region of the Cas12f1 guide RNA, respectively, and forms a CRISPR/Cas12f1 complex.
  • the Cas12f1 guide RNA can be largely functionally divided into a spacer and a scaffold region.
  • the scaffold region consists of five stems (named Stem 1 to Stem 5) and one pseudoknot (PK).
  • Cas12f1 guide RNA found in nature is divided into tracrRNA and crRNA, and it is well known to those skilled in the art that the crRNA can be further divided into a crRNA repeat sequence part and a spacer.
  • the portion of the Cas12f1 guide RNA that interacts with the Cas12f1 protein is collectively referred to as a scaffold region.
  • the scaffold region is a region including tracrRNA and a portion of crRNA, and functions to interact with Cas12f1 protein. A detailed description thereof will be provided in the corresponding paragraph below.
  • the Cas12f1 guide RNA comprises two structures in which a part of tracrRNA (tracrRNA anti-repeat) and a part of crRNA repeat (crRNA repeat) are complementary to form a duplex. Named as tracrRNA anti-repeat (R:AR) moiety.
  • the Stem 5 (R:AR2), and PK (R:AR1) form this crRNA repeat-tracrRNA anti-repeat duplex structure.
  • the Stem 1 part, Stem 2 part, and Stem 5 (R:AR2) part of the Cas12f1 guide RNA do not interact with the Cas12f1 dimer, and this is called a disordered region.
  • a vector having a nucleotide sequence encoding each component of the CRISPR/Cas system is introduced into a cell, and each component of the CRISPR/Cas system is expressed in the cell. This is widely used.
  • the components of the vector that allow the CRISPR/Cas system to be expressed in cells will be described.
  • the sequence of the vector may include one or more of nucleic acids encoding each component of the CRISPR/Cas system.
  • the sequence of the vector includes a guide RNA included in the CRISPR/Cas system to be expressed, and/or a nucleic acid encoding a Cas protein.
  • the nucleotide sequence of the vector is a nucleic acid encoding a wild-type guide RNA and a wild-type Cas protein, as well as a Cas12f1 guide RNA engineered according to the purpose and a nucleic acid encoding a codon-optimized Cas protein or an engineered Cas protein.
  • the nucleic acid sequence encoding each component may be a DNA sequence.
  • the vector In order to express the component in a cell, the vector must contain one or more regulatory/control elements.
  • the regulatory/control elements include promoter, enhancer, intron, polyadenylation signal, Kozak consensus sequence, Internal Ribosome Entry Site (IRES), splice acceptor, 2A sequence and / or may include a replication origin, but is not limited thereto.
  • the replication origin may be an f1 origin of replication, an SV40 origin of replication, a pMB1 origin of replication, an adeno origin of replication, an AAV origin of replication, and/or a BBV origin of replication, but is not limited thereto.
  • a promoter sequence In order to express the expression target of the vector in a cell, a promoter sequence must be operatively linked to a sequence encoding each component so that a transcription factor can be activated in the cell.
  • the promoter sequence may be designed differently depending on the corresponding transcription factor or expression environment, and is not limited as long as it can properly express the components of the CRISPR/Cas system in a cell.
  • the promoter sequence may be a promoter that promotes the activity of RNA polymerase (eg, RNA Pol I, Pol II, or Pol III).
  • the promoter is SV40 early promoter, mouse mammary tumor virus long terminal repeat (LTR) promoter, adenovirus major late promoter (Ad MLP), herpes simplex virus (HSV) promoter, such as CMV immediate early promoter region (CMVIE) cytomegalovirus (CMV) promoter, rous sarcoma virus (RSV) promoter, human U6 small nuclear promoter (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 promoter (e.g., Xia et al. , Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 promoter (H1), and 7SK, but is not limited thereto.
  • CMVIE CMV immediate early promoter region
  • CMV cytomegalovirus
  • RSV rous sarcoma virus
  • U6 small nuclear promoter U6 small nuclear promoter
  • H1 promoter H1 promoter
  • 7SK human H1
  • a sequence inducing termination of the transcriptional activity of the transcription factor is referred to as a termination signal.
  • the termination signal may vary depending on the type of promoter sequence. For example, when the promoter is a U6 or H1 promoter, the promoter recognizes a thymidine continuation sequence (eg, a TTTTTT (T6) sequence) as a termination signal.
  • a thymidine continuation sequence eg, a TTTTTT (T6) sequence
  • the vector may contain a nucleic acid sequence encoding an additional expression element to be expressed by those skilled in the art other than the wild-type CRISPR/Cas system construct, and/or the engineered CRISPR/Cas system, if necessary.
  • the additional expression element may be, but is not limited to, one of the tags described in the "Tags" section.
  • the additional expression element is a selection gene for selection, for example, a herbicide resistance gene such as glyphosate, glufosinate ammonium or phosphinothricin, ampicillin (ampicillin), kanamycin (kanamycin), G418, bleomycin (Bleomycin), hygromycin (hygromycin), may be an antibiotic resistance gene such as chloramphenicol (chloramphenicol), but is not limited thereto.
  • a herbicide resistance gene such as glyphosate, glufosinate ammonium or phosphinothricin, ampicillin (ampicillin), kanamycin (kanamycin), G418, bleomycin (Bleomycin), hygromycin (hygromycin)
  • an antibiotic resistance gene such as chloramphenicol (chloramphenicol), but is not limited thereto.
  • the expression vector may be designed in the form of a linear or circular vector.
  • Cas12f1 protein is a dimer in the CRISPR / Cas12f1 system. was revealed for the fact that it forms , and the structure of guide RNAs.
  • the present specification provides an engineered Cas12f1 guide RNA for increasing the intracellular gene editing activity of the CRISPR/Cas12f1 system by overcoming the limitations of the prior art.
  • the engineered Cas12f1 guide RNA has a new structure added to the guide RNA found in nature, and a part of its structure has been modified.
  • the engineered Cas12f1 guide RNA is characterized in that it includes a new U-rich tail at the 3' end.
  • the engineered Cas12f1 guide RNA is characterized in that at least a portion of the scaffold region that interacts with the Cas12f1 protein is modified.
  • the engineered Cas12f1 guide RNA may include an engineered scaffold region, a spacer, and a U-rich tail.
  • the engineered scaffold region is characterized in that it is different from the scaffold region of guide RNA found in nature.
  • the engineered Cas12f1 guide RNA provided herein is characterized by adding a U-rich tail to the guide RNA found in nature.
  • the U-rich tail is located at the 3'-end portion of the engineered Cas12f1 guide RNA, and is a portion richly containing uridine.
  • the engineered Cas12f1 guide RNA may include a U-rich tail rich in uridine at the 3' end portion.
  • the sequence of the U-rich tail may be expressed as (U a N) b U c .
  • N is one of A, U, C, or G, wherein a, b, and c are integers, wherein a is 1 or more and 5 or less, b is 0 or more and 2 or less, and c is 1 or more and 10 or less.
  • the engineered Cas12f1 guide RNA provided herein is characterized in that a part of its scaffold region is modified compared to the guide RNA found in nature.
  • the scaffold region is a region containing tracrRNA and a portion of crRNA, and functions to interact with the Cas12f1 protein. The scaffold region will be described in more detail below.
  • the engineered Cas12f1 guide RNA may include an engineered scaffold region.
  • the engineered scaffold region is a modified scaffold region of guide RNA found in nature. Therefore, the engineered scaffold region has a different sequence from the scaffold region of guide RNA found in nature.
  • the engineered scaffold region may be one in which some regions of the scaffold region of guide RNA found in nature have been removed.
  • the engineered scaffold region may have one or more nucleotides removed from a specific portion included in the scaffold region of a guide RNA found in nature.
  • the engineered Cas12f1 guide RNA provided herein is used in the CRISPR/Cas12f1 system
  • the gene editing activity in the cell is dramatically improved compared to when the guide RNA found in nature is used.
  • the present inventors have revealed in detail what structure to add to the guide RNA found in nature or what kind of modification to add to the scaffold region to improve gene editing efficiency through experiments.
  • the engineered Cas12f1 guide RNA it is possible to edit genes with high efficiency in cells by overcoming the limitations of the prior art.
  • the engineered Cas12f1 guide RNA has a length equal to or shorter than that of a guide RNA found in nature, so it has high application potential in the field of gene editing technology.
  • the engineered Cas12f1 guide RNA of the present application allows the advantage of the CRISPR/Cas12f1 system (eg, the advantage of very small size) to be fully utilized in gene editing technology.
  • the engineered Cas12f1 guide RNA provided herein can be used for gene editing and/or gene therapy together with Cas12f1 protein.
  • the engineered Cas12f1 guide RNA can be used for preparing a composition for gene editing.
  • the present specification provides a U-rich tail that can be introduced to improve gene editing efficiency of the CRISPR/Cas12f1 system.
  • the U-rich tail sequence is characterized in that it is linked to the 3' end of the crRNA spacer among the engineered Cas12f1 guide RNAs, and increases the cleavage efficiency of the CRISPR/Cas12f1 system using the engineered Cas12f1 guide RNA for the target nucleic acid. plays a role
  • the U-rich tail sequence basically includes at least one uridine.
  • the U-rich tail sequence may further include additional nucleotides other than uridine according to the actual use environment and expression environment (eg, eukaryotic cell or prokaryotic cell internal environment) of the engineered CRISPR/Cas12f1 system.
  • the U-rich tail sequence may be a U-rich tail sequence disclosed in the PCT/KR2020/014961 application.
  • U-rich tail sequence in the present specification, it should be understood to include both the contents and experimental results of the U-rich tail sequence disclosed in the PCT/KR2020/014961 application, and the contents of the application are entirely incorporated herein by reference.
  • the U-rich tail may enrich for one or more uridine sequences.
  • the present inventors have found that the gene editing efficiency of the CRISPR/Cas12f1 complex is improved when the U-rich tail sequence is introduced into the CRISPR/Cas12f1 system through experiments. Accordingly, the U-rich tail sequence provided herein includes a sequence in which one or more uridine is continuous.
  • the U-rich tail sequence is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 , 14, 15, 16, 17, 18, 19, or 20 uridines may comprise a contiguous sequence.
  • the U-rich tail sequence provided herein is a 'modified free containing at least one ribonucleoside (A, C, G) other than uridine every time 1 to 5 uridine is repeated. Dean repeat sequence'.
  • the modified uridine sequence is particularly useful when designing vectors expressing engineered crRNAs.
  • the U-rich tail sequence may include a sequence in which one or more UV, UUV, UUUV, UUUUV, and/or UUUUUV is repeated.
  • V is one of adenosine (A), cytidine (C), and guanosine (G).
  • the U-rich tail sequence may be expressed as (U a N) b U c .
  • N is one of adenosine (A), uridine (U), cytidine (C), and guanosine (G).
  • a, b, and c are integers, a is 1 or more and 5 or less, and b is 0 or more.
  • b may be 0 or more and 2 or less.
  • c may be 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10.
  • c may be an integer within the two numerical ranges selected in the previous sentence. For example, c may be 1 or more and 6 or less.
  • sequence of the U-rich tail is 5'-U-3', 5'-UU-3', 5'-UUU-3', 5'-UUUU-3', 5'-UUUUU- 3', 5'-UUUUUUU-3', 5'-UUURUUU-3', 5'-UUURUUUU-3' (SEQ ID NO: 646), 5'-UUUURU-3', 5'-UUUURUU-3', 5' -UUUURUU-3', 5'-UUUURUUUU-3', 5'-UUUURUUUU-3', 5'-UUUURUUUU-3' (SEQ ID NO: 647), or 5'-UUUUURUUUUUUUU-3' (SEQ ID NO: 648).
  • sequence of the U-rich tail is 5'-U-3', 5'-UU-3', 5'-UUU-3', 5'-UUUU-3', 5'-UUUUU- 3', 5'-UUUUUU-3', 5'-UUUAUUU-3', 5'-UUUAUUUU-3' (SEQ ID NO: 254), 5'-UUUUUAU-3', 5'-UUUUAUU-3', 5' -UUUUAUUU-3', 5'-UUUUAUUUU-3', 5'-UUUUAUUUUU-3' (SEQ ID NO: 255), 5'-UUUUUUUUUUU-3' (SEQ ID NO: 256), 5'-UUUGUU-3', 5' -UUUGUUUGUUUU-3' (SEQ ID NO: 257), 5'-UUUUGUU-3', 5' -UUU
  • sequence of the U-rich tail may be 5'-UUUUUU-3', 5'-UUUUAUUUUUU-3' (SEQ ID NO: 256), or 5'-UUUUUGUUUUUUU-3' (SEQ ID NO: 259).
  • sequence of the U-rich tail may be 5'-UUUUUAUUUU-3'.
  • Cas12f1 guide RNA found in nature is divided into tracrRNA and crRNA, and it is well known to those skilled in the art that the crRNA can be further divided into a crRNA repeat sequence portion and a spacer.
  • the portion of the Cas12f1 guide RNA that interacts with the Cas12f1 protein is collectively referred to as a scaffold region.
  • the scaffold region includes tracrRNA and a portion of crRNA, and may not refer to a single molecule of RNA.
  • the scaffold region may be further subdivided into a first region, a second region, a third region, a fourth region, a fifth region, and a sixth region. If the subdivided region is described in terms of tracrRNA and crRNA, the first to fourth regions are included in tracrRNA, and the fifth to sixth regions are crRNA, specifically crRNA repeat sequence.
  • n-th region or “n-th region found in nature” (n is an integer greater than or equal to 1 and less than or equal to 6) described below basically refers to each part of the Cas12f1 guide RNA found in nature.
  • the "nth region” refers to the structure of a guide RNA transcribed in a prokaryotic cell, and/or a structure of a guide RNA actually operating in a prokaryotic system (in an activated form, not a transcribed form in a prokaryotic cell).
  • Each region may be referred to in correspondence with .
  • the region corresponding to the above classification criteria in the engineered Cas12f1 guide RNA is generally described as “modified n-th region” to “n-th region of engineered scaffold region”.
  • n-th region included in the engineered scaffold region
  • the term “n-th region” may be used interchangeably.
  • the target referred to by the "n-th region” eg, whether it is a region included in an engineered Cas12f1 guide RNA or a region included in a guide RNA found in nature
  • tracrRNA When used as "tracrRNA” or “crRNA” in the present specification, it includes all meanings recognizable to those skilled in the art of CRISPR/Cas. This is generally used as a term to refer to each molecule of dual guide RNA found in nature, but it can also be used to refer to each corresponding portion of a single guide RNA in which the tracrRNA and crRNA are linked by a linker. Unless otherwise specified, when only tracrRNA and crRNA are described, they mean tracrRNA and crRNA constituting the CRISPR/Cas12f1 system.
  • the sequence of tracrRNA may be a 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3' (SEQ ID NO: 1) or 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2).
  • the tracrRNA comprises a first region, a second region, a third region, and a fourth region. In one embodiment, the tracrRNA is one in which the first region, the second region, the third region, and the fourth region are sequentially linked from the 5' end to the 3' end.
  • the sequence of crRNA comprises a crRNA repeat sequence and a spacer sequence.
  • the crRNA repeat sequence may be 5'-GAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 3) or 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 4).
  • the crRNA repeat sequence comprises a fifth region and a sixth region.
  • the spacer sequence may vary depending on the target sequence, and generally comprises 10 to 50 nucleotides.
  • the crRNA is one in which a fifth region, a sixth region, and a spacer are sequentially linked in a direction from the 5' end to the 3' end.
  • the scaffold region When used herein as a “scaffold region”, it refers to the rest of the guide RNAs found in nature except for the spacer. Specifically, the scaffold region includes tracrRNA, and a portion of crRNA. Specifically, a portion of the crRNA may be a portion of a crRNA repeat sequence.
  • the scaffold region is generally known as a portion capable of interacting with a Cas protein. In the present specification, the scaffold region is divided into first to sixth regions, and each region will be described in more detail below.
  • first region refers to a region including the 5' end of tracrRNA.
  • the first region may include nucleotides forming a stem structure in the CRISPR/Cas12f1 complex, and may include nucleotides adjacent thereto.
  • the first region includes a Stem 1 moiety (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)).
  • the first region may include one or more nucleotides adjacent to the Stem 1 portion.
  • the first region comprises a disordered region in the CRISPR/Cas12f1 complex that does not interact with the Cas12f1 protein.
  • the first region may mean from the 1st nucleotide to the 11th nucleotide from the 5' end of the tracrRNA represented by SEQ ID NO: 1 or 2.
  • the sequence of the first region may be 5'-CUUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 10).
  • second region When used herein as a "second region", it refers to a region located in the 3'-end direction of the first region in tracrRNA.
  • the second region may include nucleotides forming a stem structure in the CRISPR/Cas12f1 complex, and may include nucleotides adjacent thereto.
  • the stem structure is different from the stem included in the first region.
  • the second region includes a Stem 2 moiety (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)).
  • the second region may include one or more nucleotides adjacent to the Stem 2 portion.
  • the second region may include one or more nucleotides that interact with the RuvC domain of one Cas12f1 protein forming a dimer and/or the RuvC domain of another Cas12f1 protein forming a dimer in the CRISPR/Cas12f1 complex.
  • the second region comprises a disordered region in the CRISPR/Cas12f1 complex that does not interact with the Cas12f1 protein.
  • the second region may mean from the 22nd nucleotide to the 72nd nucleotide from the 5' end of the tracrRNA represented by SEQ ID NO: 1 or 2.
  • the sequence of the second region may be 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3' (SEQ ID NO: 11).
  • third region refers to a region located at the 3' end of the second region in tracrRNA.
  • the third region may include nucleotides forming a stem structure in the CRISPR/Cas12f1 complex and nucleotides forming a complementary bond with some nucleotides included in crRNA, and may include nucleotides adjacent thereto.
  • the third region is a Stem 4 portion (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) and Stem 3-PK (R:AR-1) portion It includes a nucleotide belonging to the heavy tracrRNA (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)).
  • the third region may include one or more nucleotides adjacent to nucleotides belonging to tracrRNA among the Stem 4 portion and/or the Stem 3-PK (R:AR-1) portion.
  • the third region includes one or more nucleotides that interact with the WED domain of one Cas12f1 protein forming a dimer, and/or the RuvC domain in the CRISPR/Cas12f1 complex.
  • the nucleotide may be a nucleotide belonging to tracrRNA in the Stem 3-PK (R:AR-1) portion.
  • the third region includes one or more nucleotides that interact with the RuvC domain of one Cas12f1 protein forming a dimer and/or the REC domain of another Cas12f1 protein forming a dimer in the CRISPR/Cas12f1 complex.
  • the nucleotide may be a nucleotide included in the Stem 4 portion.
  • the third region comprises one or more nucleotides complementary to one or more nucleotides included in the sixth region of the crRNA.
  • the third region may mean from the 73rd nucleotide to the 127th nucleotide from the 5' end of the tracrRNA represented by SEQ ID NO: 1 or 2.
  • the sequence of the third region may be 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3' (SEQ ID NO: 12).
  • the fourth region refers to a region located in the 3'-end direction of the third region of tracrRNA.
  • the fourth region may include nucleotides capable of forming a complementary bond with some nucleotides included in crRNA in the CRISPR/Cas12f1 complex, and may include nucleotides adjacent thereto.
  • the fourth region includes a nucleotide belonging to tracrRNA in Stem 5 (R:AR-2) (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) ).
  • the fourth region may include one or more nucleotides adjacent to a nucleotide belonging to tracrRNA in Stem 5 (R:AR-2).
  • the fourth region may include one or more nucleotides that interact with the WED domain and/or the ZF domain of one Cas12f1 protein constituting a dimer in the CRISPR/Cas12f1 complex.
  • the nucleotide may be a nucleotide belonging to tracrRNA in Stem 5 (R:AR-2).
  • the fourth region may include one or more nucleotides complementary to one or more nucleotides included in the fifth region of the crRNA.
  • the fourth region includes a disordered region that does not interact with the Cas12f1 protein in the CRISPR/Cas12f1 complex.
  • the fourth region may mean from the 128th nucleotide to the 140th nucleotide from the 5' end of the tracrRNA represented by SEQ ID NO: 1. In one embodiment, the fourth region may mean from the 128th nucleotide to the 162th nucleotide from the 5' end of the tracrRNA represented by SEQ ID NO:2.
  • sequence of the fourth region may be 5'-AACAAAUUCAUUU-3' (SEQ ID NO: 13) or 5'-AACAAAUUCAUUUUUCCUCUCCCAAUUCUGCACAA-3' (SEQ ID NO: 14).
  • the fifth region When used herein as a "fifth region”, it refers to a region including the crRNA 5' end.
  • the fifth region includes nucleotides that form a complementary bond with one or more nucleotides of the fourth region in the CRISPR/Cas12f1 complex, and may include any nucleotides adjacent thereto.
  • the fifth region includes a nucleotide belonging to crRNA in the Stem 5 (R:AR-2) portion (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021) )).
  • the fifth region may include one or more arbitrary nucleotides adjacent to nucleotides belonging to crRNA in the Stem 5 (R:AR-2) portion.
  • the fifth region may include one or more nucleotides that interact with the WED domain, the REC domain, and/or the ZF domain of one Cas12f1 protein constituting a dimer in the CRISPR/Cas12f1 complex.
  • the nucleotide may be a nucleotide belonging to crRNA in Stem 5 (R:AR-2).
  • the fifth region may include one or more nucleotides complementary to one or more nucleotides included in the fourth region.
  • the fifth region comprises a disordered region in the CRISPR/Cas12f1 complex that does not interact with the Cas12f1 protein.
  • the fifth region may mean from the 1st nucleotide to the 10th nucleotide from the 5' end of the crRNA represented by SEQ ID NO: 3. In one embodiment, the fifth region may mean from the 1st nucleotide to the 30th nucleotide from the 5' end of the crRNA represented by SEQ ID NO: 4. In one embodiment, the sequence of the fifth region may be 5'-GAAUGAAGGA-3' (SEQ ID NO: 15) or 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGA-3' (SEQ ID NO: 16).
  • sixth region refers to a region located in the 3'-end direction of the fifth region in crRNA.
  • the sixth region includes nucleotides that form a complementary bond with one or more nucleotides of the third region in the CRISPR/Cas12f1 complex, and may include any nucleotides adjacent thereto.
  • the sixth region includes a nucleotide belonging to crRNA in the PK (R:AR-1) portion (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021) ).
  • the sixth region may include one or more arbitrary nucleotides adjacent to nucleotides belonging to crRNA in the PK (R:AR-1) portion.
  • the sixth region includes one or more nucleotides that interact with the WED domain, ZF domain and/or RuvC domain of one Cas12f1 protein constituting a dimer in the CRISPR/Cas12f1 complex.
  • the nucleotide may be a nucleotide belonging to crRNA in the Stem 3-PK (R:AR-1) portion.
  • the sixth region may mean from the 11th nucleotide to the 17th nucleotide from the 5' end of the crRNA represented by SEQ ID NO: 3. In one embodiment, the sixth region may mean from the 31st nucleotide to the 37th nucleotide from the 5' end of the crRNA represented by SEQ ID NO: 4. In one embodiment, the sequence of the sixth region may be 5'-AUGCAAC-3'.
  • spacer refers to one or more nucleotides that hybridize with a portion of a target sequence in the CRISPR/Cas12f1 system.
  • the spacer refers to 10 to 50 consecutive nucleotides near the 3' end of the crRNA of the guide RNA in the CRISPR/Cas12f1 system.
  • the spacer is designed to correspond to the target sequence of the target nucleic acid to be edited using the CRISPR/Cas12f1 system. In other words, the spacer may have various sequences depending on the target sequence of the target nucleic acid.
  • an engineered scaffold region that can be introduced to improve gene editing efficiency of the CRISPR/Cas12f1 system.
  • the engineered scaffold region synergizes with the above-described U-rich tail to improve the gene editing efficiency of the CRISPR/Cas12f1 system using the engineered Cas12f1 guide RNA.
  • the engineered scaffold region is characterized in that it has a sequence and/or structure different from that of the scaffold region of Cas12f1 guide RNA found in nature (hereinafter, scaffold region found in nature) at one or more locations. .
  • the function of the engineered scaffold region is the same as or similar to that of the scaffold region found in nature.
  • the engineered scaffold region has the function of interacting with the Cas12f1 protein dimer of the CRISPR/Cas12f1 complex.
  • the engineered scaffold region comprises a region corresponding to each portion of the scaffold region found in nature.
  • the engineered scaffold region includes a first region, a second region, a third region, a fourth region, a fifth region, and a sixth region, which is the first region contained in the scaffold region found in nature.
  • Each of the first to sixth areas corresponds to each other.
  • the engineered scaffold region may not include a region corresponding to the first region and/or the second region among scaffold regions found in nature.
  • the engineered Cas12f1 guide RNA provided herein may be a single guide RNA molecule. Accordingly, the engineered scaffold region provided herein may be one in which one or more of each region is modified, and additionally, the 3' end of the tracrRNA fourth region and the 5' end of the crRNA fifth region may be linked through a linker.
  • the engineered scaffold region is one or more modified in a scaffold region found in nature, and the 3' end of the fourth region and the 5' end of the fifth region are linked through a linker.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region provided herein may be a first region modified from a scaffold region found in nature.
  • the engineered scaffold region may include a 'modified first region'.
  • the modified first region has one or more nucleotides removed from the first region of the scaffold region found in nature.
  • the removed nucleotide is a nucleotide selected from the region forming the Stem structure in the CRISPR/Cas12f1 complex.
  • the engineered scaffold region included in the engineered Cas12f1 guide RNA may have one or more nucleotides removed from the first region found in nature, compared to the scaffold region found in nature, Optionally, portions other than the first region may also be deformed.
  • the removed nucleotide may be a nucleotide included in a portion forming a stem structure in the CRISPR/Cas12f1 complex among the first regions found in nature.
  • the removed nucleotide is Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) in the first region found in nature.
  • the removed nucleotide may be a nucleotide that does not interact with the Cas12f1 protein in the CRISPR/Cas12f1 complex among the first regions found in nature.
  • the modified first region is characterized in that it comprises a 5'-A-3' sequence in the 3'-terminal direction.
  • the engineered scaffold region may be one in which the first region among scaffold regions found in nature has been removed. In other words, the engineered scaffold region may not include a region corresponding to the first region among scaffold regions found in nature.
  • the first region of the engineered scaffold region may have one or more nucleotides removed from the first region of the scaffold region found in nature.
  • the modified first region of the engineered scaffold region may have 1 to 20 nucleotides removed from the 5' end of the first region of the scaffold region found in nature.
  • the modified first region is 1, 2, 3, 4, 5, 6, 7, 8 at the 5' end of the first region of the scaffold region found in nature. 5, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 consecutive nucleotides may be removed.
  • the modified first region may be one in which consecutive nucleotides within two numerical ranges selected in the immediately preceding sentence have been removed from the 5' end of the first region of a scaffold region found in nature. For example, 1 to 3 consecutive nucleotides at the 5' end of the first region of the scaffold region found in nature may be removed.
  • the modified first region comprises at least one nucleotide, which may be 5'-A-3'.
  • the engineered scaffold region provided herein may be one in which the first region among scaffold regions found in nature has been removed.
  • the engineered scaffold region may not include a region corresponding to the first region of the scaffold region found in nature.
  • the sequence of the modified first region is 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA -3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3' (SEQ ID NO: 17), 5 '-AAAGUGGAGAA-3' (SEQ ID NO: 18), 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 19), 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 20), 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 21) , 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 22), 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 23), 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 24),
  • sequence of the engineered scaffold region in which the first region is modified may comprise:
  • sequence of the engineered scaffold region in which the first region is modified may comprise:
  • sequence of the engineered scaffold region in which the first region is modified may comprise:
  • the sequence of the engineered scaffold region in which the first region is modified is in the 5' to 3' terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the first region is the sequence of the engineered strain scaffold region is 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3 '(SEQ ID NO: 168), 5'-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 169), 5'-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUC
  • sequence of the engineered scaffold region from which the first region has been removed may comprise:
  • sequence of the engineered scaffold region from which the first region has been removed may comprise:
  • sequence of the engineered scaffold region from which the first region has been removed may comprise:
  • the sequence of the engineered scaffold region from which the first region has been removed is in the 5' to 3' terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • sequence of the engineered scaffold region from which the first region has been removed may be 5'CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 487).
  • the engineered scaffold region included in the engineered guide RNA provided herein may be a modified second region from the scaffold region found in nature.
  • the engineered scaffold region may include a 'modified second region'.
  • the modified second region has one or more nucleotides removed from the second region of the scaffold region found in nature.
  • the removed nucleotide is a nucleotide selected from the region forming the Stem structure in the CRISPR/Cas12f1 complex.
  • the engineered scaffold region included in the engineered Cas12f1 guide RNA may have one or more nucleotides removed from the second region found in nature, compared to the scaffold region found in nature, Optionally, portions other than the second region may also be deformed.
  • the removal of the nucleotide may occur in a portion forming a stem structure among the second region found in the natural world, and the nucleotide may be removed in a complementary pair unit.
  • the removed nucleotide may be a nucleotide included in a portion forming a stem structure in the CRISPR/Cas12f1 complex among the second region found in nature.
  • the removed nucleotide is Stem 2 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) in the second region found in nature. It may be a nucleotide belonging to In one embodiment, the removed nucleotide may be a nucleotide that does not interact with the Cas12f1 protein in the CRISPR/Cas12f1 complex among the second regions found in nature.
  • the modified second region is characterized in that it has a 5'-G-3' sequence in the 3'-terminal direction.
  • the engineered scaffold region may be one in which the second region among the scaffold regions found in nature is removed. In other words, the engineered scaffold region may not include a region corresponding to the second region among scaffold regions found in nature.
  • Second region modification 1 some nucleotides removed
  • the second region of the engineered scaffold region may have one or more nucleotides removed from the second region of the scaffold region found in nature.
  • the modified second region of the engineered scaffold region is 1, 2, 3, 4, 5, consecutively or discontinuously in the second region of the scaffold region found in nature. 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 , 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 nucleotides may be removed, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50 or 51 nucleotides.
  • the modified second region is the second region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 11, the 1st to 22nd nucleotides from the 5' end, and/or the 27th to One or more nucleotides of the 51st nucleotide may be removed.
  • the modified second region is the second region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 11, the 1st to 22nd nucleotides from the 5' end, and/or the 27th to One or more nucleotides among the 51st nucleotides may be removed and the 23rd to 26th nucleotides may be substituted with another.
  • the modified second region is 1, 2 of the 1st to 22nd nucleotides from the 5' end, based on the sequence of SEQ ID NO: 11, in the second region of the scaffold region found in nature; 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 , 20, 21, or 22 consecutive nucleotides may be removed.
  • the modified second region is one, two of the 27th to the 51st nucleotides from the 5' end, based on the sequence of SEQ ID NO: 11, in the second region of the scaffold region found in nature; 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 , 20, 21, 22, 23, 24, or 25 consecutive nucleotides may be removed.
  • the sequence of the modified second region is characterized in that it comprises at least 5'-G-3'.
  • the modification of the second region may be one in which one or more pairs of nucleotides complementary to each other included in the portion forming the stem structure are removed.
  • the modified second region is, in the second region of the scaffold region found in nature, 1st to 22nd nucleotides, and 27th to 50th nucleotides from the 5' end, based on the sequence of SEQ ID NO: 11 Among nucleotides, one or more pairs of nucleotides forming a complementary pair in the CRISPR/Cas12f1 complex may be removed.
  • the modified second region is, in the second region of the scaffold region found in nature, 1st to 22nd nucleotides, and 27th to 50th nucleotides from the 5' end, based on the sequence of SEQ ID NO: 11 Among nucleotides, one or more pairs of nucleotides forming a complementary pair and/or one or more nucleotides not forming a complementary pair may be removed from the CRISPR/Cas12f1 complex.
  • the modified second region is, in the second region of the scaffold region found in nature, 1st to 22nd nucleotides, and 27th to 50th nucleotides from the 5' end, based on the sequence of SEQ ID NO: 11 Among the nucleotides, one or more pairs of nucleotides forming a complementary pair in the CRISPR/Cas12f1 complex and/or one or more pairs of mismatched nucleotides may be removed.
  • the engineered scaffold region provided herein may be one in which the second region among scaffold regions found in nature has been removed.
  • the engineered scaffold region may have no region corresponding to the second region of the scaffold region found in nature.
  • the sequence of the modified second region is 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG -3' (SEQ ID NO: 342), 5'-CCGUUAGGUGG-3' (SEQ ID NO: 343), 5'-CCGCUUAGGGUGG-3' (SEQ ID NO: 344), 5'-CCGCUUUAGAGGUGG-3' (SEQ ID NO: 345), 5' -CCGCUUUUAGAAGGUGG-3' (SEQ ID NO: 346), 5'-CCGCUUCUUAGGAAGGUGG-3' (SEQ ID NO: 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3' (SEQ ID NO: 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3' (SEQ ID NO: 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3' (SEQ ID NO
  • sequence of the engineered scaffold region in which the second region is modified may comprise:
  • sequence of the engineered scaffold region in which the second region is modified may comprise:
  • sequence of the engineered scaffold region in which the second region is modified may comprise:
  • the sequence of the engineered scaffold region in which the second region is modified is 5' to 3', SEQ ID NO: 10, 5'-G-3', 5'-UUAGG-3', 5 '-CUUAGGG-3', 5'-CUUAGUGG-3', and a sequence selected from the group consisting of SEQ ID NOs: 342 to 362, SEQ ID NO: 12, SEQ ID NO: 13, linker, SEQ ID NO: 15, and 5'-AUGCAAC-3' may be connected.
  • the linker may be 5'-GAAA-3'.
  • the sequence of the second region is deformed engineered scaffold region is 5'-CUUCACUGAUAAAGUGGAGAAGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3 '(SEQ ID NO: 408), 5'-CUUCACUGAUAAAGUGGAGAAUUAGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 409), 5'-CUUCACUGAUAAAGUGGAGAACUUAGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC- 3 '(SEQ ID NO: 410), 5'-CUUCACUGAUAAAGUGGAGAACU
  • sequence of the engineered scaffold region with the second region removed may comprise:
  • sequence of the engineered scaffold region with the second region removed may comprise:
  • sequence of the engineered scaffold region with the second region removed may comprise:
  • sequence of the engineered scaffold region from which the second region has been removed is 5' to 3', SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 13, linkers, SEQ ID NO: 15, and 5' -AUGCAAC-3' may be connected.
  • the linker may be 5'-GAAA-3'.
  • sequence of the engineered scaffold region with the second region removed may be 5'-CUUCACUGAUAAAGUGGAGAAGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 380).
  • the engineered scaffold region included in the engineered guide RNA provided herein may be a modified third region from the scaffold region found in nature.
  • the engineered scaffold region may include a modified third region.
  • the modified third region has one or more nucleotides removed from the third region of the scaffold region found in nature.
  • the removed nucleotide is a nucleotide selected from the region forming the Stem structure in the CRISPR/Cas12f1 complex.
  • the engineered scaffold region included in the engineered Cas12f1 guide RNA may include one in which one or more nucleotides included in the third region among scaffold regions found in nature have been removed.
  • the removal of the nucleotide may occur in a portion forming a stem structure among the third region found in nature, and the nucleotide may be removed in units of a base pair.
  • the removed nucleotide may be a nucleotide included in a portion forming a stem structure in the CRISPR/Cas12f1 complex among the third region found in nature.
  • the removed nucleotide is Stem 4 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) in the third region found in nature. It may be a nucleotide belonging to
  • the modified third region is characterized in that it has 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3', 5'-UUCG-3', and 5'-CUCGA-3' sequences.
  • the third region of the engineered scaffold region may have one or more nucleotides removed from the third region of the scaffold region found in nature.
  • the modified third region of the engineered scaffold region is 1, 2, 3, 4, 5 consecutively or discontinuously in the third region of the scaffold region found in nature. , 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 or 20 nucleotides have been removed.
  • the modified third region is, in the third region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 12, 27 to 36 nucleotides from the 5' end, and/or 41 to 50 At least one nucleotide among the second nucleotides may be removed.
  • the modified second region is 1, 2, 3 of the 27th to 36th nucleotides from the 5' end, based on the sequence of SEQ ID NO: 12, in the second region of the scaffold region found in nature. Dogs, 4, 5, 6, 7, 8, 9, or 10 consecutive nucleotides may be removed. In one embodiment, the modified second region is 1, 2, 3 of the 41st to 50th nucleotides from the 5' end, based on the sequence of SEQ ID NO: 12, in the second region of the scaffold region found in nature. Dogs, 4, 5, 6, 7, 8, 9, or 10 consecutive nucleotides may be removed.
  • the modification of the third region may be one in which one or more pairs of nucleotides complementary to each other included in the portion forming the stem structure are removed.
  • the modified third region is, in the third region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 12, the 27th to 36th nucleotides from the 5' end, and the 41st to the 50th nucleotides In the CRISPR/Cas12f1 complex, one or more pairs of complementary nucleotides may be removed.
  • the modified third region is, in the third region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 12, the 27th to 36th nucleotides from the 5' end, and the 41st to the 50th nucleotides In the CRISPR/Cas12f1 complex, one or more nucleotides forming a complementary pair and/or one or more nucleotides not forming a complementary pair may be removed.
  • the modified third region is, in the third region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 12, the 27th to 36th nucleotides from the 5' end, and the 41st to the 50th nucleotides In the CRISPR/Cas12f1 complex, one or more pairs of complementary nucleotides and/or one or more pairs of mismatched nucleotides may be removed.
  • the sequence of the modified third region is 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(SEQ ID NO: 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGGAUCUUUUUCGAAAGUAAACCUCUCGAAGCUACCGAAAGUAAACCUCUGAAGCUACGAAAGUAAACCUCUCGAAGGA-3'(SEQ ID NO: 434) 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3' (SEQ ID NO: 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3' (SEQ ID NO: 438), 5'-GCUGUAGCAUGCAGCUAGCUAGCUAG AAGCAGCUAGCUAG ' (SEQ ID NO: 438), 5'-GCUGUCUAACCCUUGGAUCAG
  • sequence of the engineered scaffold region in which the third region is modified may comprise:
  • sequence of the engineered scaffold region in which the third region is modified may comprise:
  • sequence of the engineered scaffold region in which the third region is modified may comprise:
  • the sequence of the engineered scaffold region in which the second region is modified is from the 5' end to the 3' end direction, from the group consisting of SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 434-447
  • the selected sequence, a linker, SEQ ID NO: 15, and 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the third region is the sequence of the engineered strain scaffold region is 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3 '(SEQ ID NO: 462), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 463), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAG
  • the engineered scaffold region provided herein may be a modified region of the fourth and fifth regions from the scaffold region found in nature.
  • the fourth region and the fifth region are regions corresponding to a part of tracrRNA and a part of crRNA, respectively, and include parts that hybridize to each other in the CRISPR/Cas12f1 complex to form a stem, so the parts are modified and engineered together
  • a scaffold region can be constructed.
  • the engineered scaffold region may include a modified fourth region and/or a modified fifth region.
  • the modified fourth region is characterized in that one or more nucleotides have been removed from the fourth region of the scaffold region found in nature.
  • the modified fifth region is characterized in that one or more nucleotides have been removed from the fifth region of the scaffold region found in nature.
  • the engineered scaffold region included in the engineered Cas12f1 guide RNA may have one or more nucleotides removed from the fourth region and/or the fifth region among scaffold regions found in nature.
  • the modified fourth region has a 5'-AACAAA-3' sequence in the 5'-terminal direction. In one embodiment, the modified fifth region has a 5'-GGA-3' sequence in the 3'-terminal direction.
  • the fourth region of the engineered scaffold region may have one or more nucleotides removed from the fourth region among scaffold regions found in nature.
  • the fifth region of the engineered scaffold region may have one or more nucleotides removed from the fifth region among scaffold regions found in nature.
  • the modified fourth region of the engineered scaffold region is 1, 2, 3, 4, 5, consecutively or discontinuously in the fourth region of the scaffold region found in nature; 6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22 , 23, 24, 25, 26, 27 or 28 nucleotides may be removed.
  • the modified fourth region is one in which one or more nucleotides among the 7th to 13th nucleotides from the 5' end have been removed from the fourth region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 13 can In one embodiment, the modified fourth region is one in which one or more nucleotides among the 7th to 34th nucleotides from the 5' end have been removed from the fourth region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 14 can
  • sequence of the modified fourth region is characterized in that it comprises at least 5'-AACAAA-3'.
  • the modified fifth region of the engineered scaffold region may have 1 to 7 nucleotides removed from the fifth region of the scaffold region found in nature. In one embodiment, the modified fifth region of the engineered scaffold region is 1, 2, 3, 4, 5, consecutively or discontinuously in the fifth region of the scaffold region found in nature. 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 , 23, 24, 25, 26 or 27 nucleotides may be removed.
  • the modified fifth region is one in which one or more nucleotides among the 1st to 7th nucleotides from the 5' end have been removed from the fifth region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 15 can In one embodiment, the modified fifth region is one in which one or more nucleotides among the 1st to 27th nucleotides from the 5' end have been removed from the fifth region of the scaffold region found in nature, based on the sequence of SEQ ID NO: 16.
  • the sequence of the modified fifth region comprises at least 5'-GGA-3'.
  • the fourth region and the fifth region complement each other in the CRISPR/Cas12 complex to form a stem. Since the above-described modification of the fourth region and the fifth region targets one or more nucleotides constituting the stem, the modification of the fourth region and the fifth region is to remove the nucleotides constituting the stem as a complementary pair.
  • the modified fourth region and the fifth region are, in the fourth region and the fifth region of the scaffold region found in nature, based on SEQ ID NO: 13, the 7th to 13th nucleotides, and SEQ ID NO: 15 Based on the sequence, one or more pairs of nucleotides forming a complementary pair in the CRISPR/Cas12f1 complex among the 1st to 7th nucleotides may be removed.
  • the modified fourth region and the fifth region are, in the fourth region and the fifth region of the scaffold region found in nature, based on SEQ ID NO: 13, the 7th to 13th nucleotides, and SEQ ID NO: 15 Based on the sequence, one or more nucleotides forming a complementary pair and/or one or more nucleotides not forming a complementary pair in the CRISPR/Cas12f1 complex among the 1st to 7th nucleotides may be removed.
  • the modified fourth region and the fifth region are, in the fourth region and the fifth region of the scaffold region found in nature, based on SEQ ID NO: 13, the 7th to 13th nucleotides, and SEQ ID NO: 15 Based on the sequence, one or more pairs of nucleotides forming a complementary pair in the CRISPR/Cas12f1 complex and/or one or more pairs of mismatched nucleotides among the 1st to 7th nucleotides may be removed.
  • the modified fourth region and the fifth region are, in the fourth region and fifth region of the scaffold region found in nature, based on SEQ ID NO: 14, the 7th to 34th nucleotides, and SEQ ID NO: Based on the 16th sequence, one or more pairs of nucleotides forming a complementary pair in the CRISPR/Cas12f1 complex among the 1st to 27th nucleotides may be removed.
  • the modified fourth region and the fifth region are, in the fourth region and fifth region of the scaffold region found in nature, based on SEQ ID NO: 14, the 7th to 34th nucleotides, and SEQ ID NO: Based on the 16th sequence, one or more nucleotides forming a complementary pair and/or one or more nucleotides not forming a complementary pair in the CRISPR/Cas12f1 complex among the 1st to 27th nucleotides may be removed.
  • the modified fourth region and the fifth region are, in the fourth region and fifth region of the scaffold region found in nature, based on SEQ ID NO: 14, the 7th to 34th nucleotides, and SEQ ID NO: Based on the 16 sequence, one or more pairs of complementary nucleotides and/or one or more pairs of mismatched nucleotides in the CRISPR/Cas12f1 complex among the 1st to 27th nucleotides may be removed.
  • the sequence of the modified fourth region is 5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAAUUCA It may be selected from the group consisting of -3' (SEQ ID NO: 67), 5'-AACAAAUUCAU-3' (SEQ ID NO: 68), and 5'-AACAAAUUCAUU-3' (SEQ ID NO: 69).
  • the sequence of the modified fourth region is 5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAAUUCA -3' (SEQ ID NO: 67), 5'-AACAAAUUCAU-3' (SEQ ID NO: 68), 5'-AACAAAUUCAUU-3' (SEQ ID NO: 69), 5'-AACAAAUUCAUUU-3' (SEQ ID NO: 70), 5' -AACAAAUUCAUUUU-3' (SEQ ID NO: 71), 5'-AACAAAUUCAUUUUU-3' (SEQ ID NO: 72), 5'-AACAAAUUCAUUUUUC-3' (SEQ ID NO: 73), 5'-AACAAAUUCAUUUUUCC-3' (SEQ ID NO: 74), 5'-AACAAAUUCAUUUUUCCU-3' (SEQ ID NO: 67), 5
  • the sequence of the modified fifth region is 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA It may be selected from -3', 5'-AUGAAGGA-3', and 5'-AAUGAAGGA-3'.
  • the sequence of the modified fifth region is 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA -3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 5'-GAAUGAAGGA-3' (SEQ ID NO: 91), 5'-CGAAUGAAGGA-3' (SEQ ID NO: 92), 5'-ACGAAUGAAGGA -3' (SEQ ID NO: 93), 5'-GACGAAUGAAGGA-3' (SEQ ID NO: 94), 5'-AGACGAAUGAAGGA-3' (SEQ ID NO: 95), 5'-UAGACGAAUGAAGGA-3' (SEQ ID NO: 96), 5' -AUAGACGAAUGAAGGA-3' (SEQ ID NO: 97), 5'-AAUAGACGAAUGAAGGA-3' (SEQ ID NO: 98), 5'-GAAUAGACGA
  • sequence of the engineered scaffold region in which the fourth region and the fifth region are modified may comprise:
  • sequence of the engineered scaffold region in which the fourth region and the fifth region are modified may comprise:
  • sequence of the engineered scaffold region in which the fourth region and the fifth region are modified may comprise:
  • the sequence of the engineered scaffold region in which the fourth region and the fifth region are modified is from the 5' end to the 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the fourth region and the fifth region the sequence of the engineered strain scaffold region is 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3 '(SEQ ID NO: 200), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUGAAAAGGAAUGCAAC-3' (SEQ ID NO: 201), 5 '-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAAAAAUGCA
  • the sixth region is a region including nucleotides belonging to crRNA among the PK (R:AR-1) regions. As described above, the sixth region includes one or more nucleotides that interact with the WED domain, the ZF domain and/or the RuvC domain of one Cas12f1 protein constituting a dimer in the CRISPR/Cas12f1 complex.
  • the sixth region of the engineered scaffold may be the same as the sixth region of the scaffold found in nature, or may be modified within the extent that the function of the sixth region is not impaired.
  • the engineered scaffold region included in the engineered Cas12f1 guide RNA provided herein may be a combination of one or more modifications for each region described above with a scaffold region found in nature.
  • the engineered scaffold region may include a deformed first region and a deformed second region.
  • the engineered scaffold region may include a deformed second region, and the first region may be removed.
  • the engineered scaffold region may include a deformed first region, and the second region may be removed.
  • the engineered scaffold region may have the first region and the second region removed.
  • the engineered scaffold region may include a deformed first region and a modified third region.
  • the engineered scaffold region may include a modified third region, and the first region may be removed.
  • the engineered scaffold region may include a first region that is modified, a fourth region that is modified several times, and a fifth region that is modified.
  • the engineered scaffold region may include a deformed fourth region and a fifth region, and the first region may be removed.
  • the engineered scaffold region may include a modified second region and a modified third region.
  • the engineered scaffold region may include a modified third region, and the second region may be removed.
  • the engineered scaffold region may include a modified second region and a deformed fourth region and a fifth region.
  • the engineered scaffold region may include a deformed fourth region and a fifth region, and the second region may be removed.
  • the engineered scaffold region may include a modified third region and a modified fourth region and a fifth region.
  • the engineered scaffold region may include a first deformed region, a second deformed region, and a third deformed region.
  • the engineered scaffold region may include a deformed second region and a deformed third region, and the first region may be removed.
  • the engineered scaffold region may include a deformed first region and a deformed third region, and the second region may be removed.
  • the engineered scaffold region may include a modified third region, and the first region and the second region may be removed.
  • the engineered scaffold region may include a first deformed region, a second deformed region, and a fourth and fifth deformed region.
  • the engineered scaffold region may include a deformed second region, a deformed fourth region, and a fifth region, and the first region may be removed.
  • the engineered scaffold region may include a deformed first region, a deformed fourth region, and a fifth region, and the second region may be removed.
  • the engineered scaffold region may include a deformed fourth region and a fifth region, and the first region and the second region may be removed.
  • the engineered scaffold region may include a first deformed region, a third deformed region, and a fourth and fifth deformed region.
  • the engineered scaffold region may include a modified third region, a deformed fourth region, and a fifth region, and the first region may be removed.
  • the engineered scaffold region may include a second modified region, a third modified region, and a fourth and fifth modified region.
  • the engineered scaffold region may include a modified third region, a deformed fourth region, and a fifth region, and the second region may be removed.
  • the engineered scaffold region may include a first deformed region, a second deformed region, a third deformed region, and a fourth and fifth deformed region.
  • the engineered scaffold region may include a second deformed region, a deformed third region, and a fourth and fifth deformed region, in which the first region is removed.
  • the engineered scaffold region may include a deformed first region, a deformed third region, and a deformed fourth region and a fifth region, and the second region may be removed.
  • the engineered scaffold region may include a modified third region, a deformed fourth region, and a fifth region, and the first region and the second region may be removed.
  • the deformed region is the same as described in the section on deformation of each region described above.
  • the engineered scaffold region comprises a first deformed region and a second deformed region.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the engineered scaffold sequence in which the first region and the second region are modified may comprise:
  • the engineered scaffold sequence in which the first region and the second region are modified may comprise:
  • the sequence of the engineered scaffold region in which the first region and the second region are modified is 5' to 3' terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • sequence of the engineered scaffold region in which the first region and the second region are modified may be 5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 207).
  • the engineered scaffold region includes a deformed second region, and the first region is removed.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the engineered scaffold sequence with the second region modified and the first region removed may comprise:
  • the engineered scaffold sequence in which the second region is modified and the first region is removed is in the 5' to 3' terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region includes a deformed first region and the second region is removed.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the first region is modified and the second region is removed may comprise:
  • the engineered scaffold sequence in which the first region is modified and the second region is removed is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region has a first region and a second region removed. In this case, the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature. In this case, the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence from which the first region and the second region have been removed may comprise:
  • the engineered scaffold sequence in which the first region and the second region are removed is 5' to 3' terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region comprises a first modified region and a third modified region.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold sequence in which the first region and the third region are modified may comprise:
  • the engineered scaffold sequence in which the first region and the third region are modified is from the 5' end to the 3' end
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region includes a modified third region and the first region is removed.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold region with the third region deformed and the first region removed may comprise:
  • the engineered scaffold region in which the third region is modified and the first region is removed is in a 5'-to 3'-end direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region comprises a deformed first region, and a deformed fourth region and a fifth region.
  • the modified first region includes all of the modifications described in the paragraph "Engineered scaffold region 1 - first region deformation”.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold sequence in which the first region and the fourth and fifth regions are modified may comprise:
  • the engineered scaffold sequence in which the first region and the fourth and fifth regions are modified may comprise:
  • the sequence of the engineered scaffold region in which the first region and the fourth region and the fifth region are modified is in the 5′ to 3′ terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • sequence of the engineered scaffold region in which the first region and the fourth region and the fifth region are modified may be 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3' (SEQ ID NO: 208).
  • the engineered scaffold region includes a deformed fourth region and a fifth region, wherein the first region is removed.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the fourth and fifth regions are modified and the first region is removed may comprise:
  • the engineered scaffold sequence in which the fourth region and the fifth region are modified and the first region is removed is in the direction from the 5' end to the 3' end
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region comprises a second modified region and a third modified region.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold sequence in which the second region and the third region are modified may comprise:
  • the engineered scaffold sequence in which the second region and the third region are modified is from the 5' end to the 3' end
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region includes a modified third region, and the second region is removed.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold region with the third region deformed and the second region removed may comprise:
  • the engineered scaffold region in which the third region is modified and the second region is removed is in the 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region comprises a modified second region and a modified fourth region and a fifth region.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold sequence in which the second region and the fourth and fifth regions are modified may comprise:
  • the engineered scaffold sequence in which the second region and the fourth and fifth regions are modified may comprise:
  • the sequence of the engineered scaffold region in which the second region and the fourth region and the fifth region are modified is in the 5′ to 3′ terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • sequence of the engineered scaffold region in which the second and fourth and fifth regions are modified may be 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3' (SEQ ID NO:209).
  • the engineered scaffold region includes a modified fourth region and a fifth region, and the second region is removed.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence with the fourth and fifth regions modified and the second region removed may comprise:
  • the engineered scaffold sequence in which the fourth region and the fifth region are modified and the first region is removed is in the direction from the 5' end to the 3' end
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region comprises a modified third region and a modified fourth region and a fifth region.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold sequence in which the third region and the fourth and fifth regions are modified may comprise:
  • the sequence of the engineered scaffold region in which the third region and the fourth region and the fifth region are modified is in the 5′ to 3′ terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region comprises a first modified region, a second modified region, and a third modified region.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold sequence in which the first region, the second region, and the third region are modified may comprise:
  • the engineered scaffold sequence in which the first region, the second region, and the third region are modified is 5' to 3' end
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region includes a second deformed region and a third deformed region, wherein the first region is removed.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the second region and the third region have been modified and the first region removed may comprise:
  • the engineered scaffold sequence in which the second region and the third region have been modified and the first region removed is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region includes a deformed first region and a deformed third region, wherein the second region is removed.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the first region and the third region have been modified and the second region removed may comprise:
  • the engineered scaffold sequence in which the first region and the third region are modified and the second region is removed is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region includes a modified third region, wherein the first region and the second region are removed.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the third region is modified and the first region and the second region are removed may comprise:
  • the engineered scaffold sequence in which the third region is modified and the first region and the second region are removed is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the linker may be 5'-GAAA-3'.
  • the engineered scaffold region comprises a first deformed region, a second deformed region, and a fourth and fifth deformed region.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold sequence in which the first region, the second region, and the fourth and fifth regions are modified may comprise:
  • the engineered scaffold sequence in which the first region, the second region, and the fourth and fifth regions are modified may comprise:
  • the sequence of the engineered scaffold region in which the first region, the second region and the fourth region and the fifth region are modified is in the 5′ to 3′ terminal direction
  • 5'-AUGCAAC-3' may be linked.
  • sequence of the engineered scaffold region in which the first region, the second region and the fourth and fifth regions are modified may be 5'-ACCGCUUCACUUAGAGUGAAGGUGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3' (SEQ ID NO:210).
  • the engineered scaffold region includes a second deformed region, a deformed fourth region, and a fifth region, wherein the first region is removed.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the second region and the fourth and fifth regions have been modified and the first region removed may comprise:
  • the engineered scaffold sequence in which the second region, and the fourth and fifth regions are modified, and the first region is removed is in the 5′ to 3′ direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region includes a deformed first region, a deformed fourth region, and a fifth region, wherein the second region is removed.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the first region, the fourth region and the fifth region are modified and the second region is removed may comprise:
  • the engineered scaffold sequence in which the first region, the fourth region, and the fifth region are modified and the second region is removed is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region includes a deformed fourth region and a fifth region, wherein the first region and the second region are removed.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence with the fourth and fifth regions modified and the first and second regions removed may comprise:
  • the engineered scaffold sequence in which the fourth region and the fifth region are modified and the first region and the second region are removed is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region comprises a first deformed region, a third deformed region and a fourth and fifth deformed region.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold sequence in which the first region, the third region, and the fourth and fifth regions are modified may comprise:
  • the engineered scaffold sequence in which the first region, the third region, and the fourth region and the fifth region are modified is 5' to 3' end direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region includes a modified third region, and a deformed fourth region and a fifth region, wherein the first region is removed.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the third region and the fourth and fifth regions have been modified and the first region removed may comprise:
  • the engineered scaffold sequence in which the third region, and the fourth and fifth regions are modified, and the first region is removed is in the 5′ to 3′ direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region comprises a second modified region, a third modified region, and a fourth and fifth modified region.
  • the modified first region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold sequence in which the second region, the third region, and the fourth and fifth regions are modified may comprise:
  • the engineered scaffold sequence in which the second region, the third region, and the fourth and fifth regions are modified in a 5'-to- 3'-end direction in which the second region, the third region, and the fourth and fifth regions are modified in a 5'-to- 3'-end direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region includes a modified third region, and modified fourth and fifth regions, wherein the second region is removed.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth region and the fifth region include all of the modifications described in the paragraph “Engineered scaffold region 3 - fourth region and fifth region deformation”.
  • the engineered scaffold region does not include a region corresponding to the second region of the scaffold region found in nature.
  • the engineered scaffold sequence in which the third region and the fourth and fifth regions have been modified and the second region removed may comprise:
  • the engineered scaffold sequence in which the third region, and the fourth and fifth regions are modified, and the second region is removed is in the 5′ to 3′ direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region comprises a first deformed region, a second deformed region, a third deformed region, and a fourth and fifth deformed region.
  • the deformed first region includes all of the modifications described in the paragraph “Engineered scaffold region 1 - first region deformation”.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold sequence in which the first region, the second region, the third region, and the fourth and fifth regions are modified may comprise:
  • the engineered scaffold sequence in which the first region, the second region, the third region, and the fourth region and the fifth region are modified is in the 5′ to 3′ direction
  • 5'-AUGCAAC-3' may be linked.
  • the engineered scaffold region includes a second deformed region, a third deformed region, and a deformed fourth region and a fifth region, wherein the first region is removed.
  • the modified second region includes all of the modifications described in the paragraph “Engineered scaffold region 2 - second region deformation”.
  • the modified third region includes all of the modifications described in the paragraph “Engineered scaffold region 3 - third region deformation”.
  • the modified fourth and fifth regions include all of the modifications described in the paragraph “Engineered scaffold region 4—fourth region and fifth region variant”.
  • the engineered scaffold region does not include a region corresponding to the first region of the scaffold region found in nature.
  • the engineered scaffold sequence with the second region, the third region, and the fourth and fifth regions modified and the first region removed may comprise:
  • the engineered scaffold sequence in which the second region, the third region, and the fourth region and the fifth region are modified and the first region is removed is 5′ to 3′ end direction

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)

Abstract

본 명세서에서는 종래 기술의 한계점을 극복하여, CRISPR/Cas12f1 시스템의 세포 내 유전자 편집 활성을 높이기 위한, 엔지니어링 된 Cas12f1 가이드 RNA를 제공한다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA에 새로운 구성을 추가하고, 또한 그 구조 일부를 변형한 것이다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 그 구성의 3'말단에 새로운 구성인 U-rich tail을 포함하는 것을 특징으로 한다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 그 구성 중 Cas12f1 단백질과 상호작용하는 역할을 하는 스캐폴드 영역의 적어도 일부가 변형된 것을 특징으로 한다.

Description

CRISPR/CAS12F1 시스템 효율화를 위한 U-RICH TAIL을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도
[관련출원]
본 출원은, 2020년10월 8일자로 출원된 대한민국 특허출원 제10-2020-0129937호 및 2021년 4월 16일자로 출원된 대한민국 특허출원 제10-2021-0050093호에 대한 우선권을 주장하고, 이들 출원 각각의 내용은 그 전체가 참조에 의해 본 명세서에 포함된다.
[기술 분야]
본 명세서에서는 CRISPR/Cas 시스템, 특히 CRISPR/Cas12f1 시스템을 유전자 편집에 사용하는 분야에 대한 기술을 개시한다.
CRISPR/Cas12f1 시스템은 Class 2, Type V로 분류되는 CRISPR/Cas 시스템이다. 선행연구(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 최초로 고균 유래의 CRISPR/Cas 시스템인 CRISPR/Cas14a 시스템에 대해 밝혀졌다. 그 후 후속 연구(Karvelis et al., Nucleic Acids Research, Vol. 48, No. 9 5017 (2020))에서 상기 CRISPR/Cas14 시스템을 CRISPR/Cas12f 시스템으로 분류하였다. CRISPR/Cas12f1 시스템은 상기 Class 2, Type V로 분류되는 CRISPR/Cas 시스템 중 하나의 Subtype인 V-F1 시스템에 속하며, 이는 Cas14a를 이펙터 단백질(effector protein)로 가지는 CRISPR/Cas14a 시스템을 포함한다. 상기 CRISPR/Cas12f1 시스템은 CRISPR/Cas9 시스템에 비하여 이펙터 단백질의 크기가 현저히 작다는 특징이 있다. 다만, 선행 연구(Harington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018), US 2020/0190494 A1)에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템, 특히 CRISPR/Cas14a 시스템은 단일가닥 DNA의 절단 능력은 보이나, 이중가닥 DNA에 대해서는 절단 활성이 없거나, 극히 낮아 유전자 편집 기술에 응용하는 데 한계가 있었다.
최근 선행문헌(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에서는 CRISPR/Cas12f1 시스템에서 Cas12f1 단백질이 이량체(dimer)를 형성한다는 사실, 및 가이드 RNA의 구조에 대해 밝혔다. 상기 선행문헌에 의해 가이드 RNA 부분 중 Cas12f1 단백질과 직접적으로 상호작용하지 않는, 이른바 disordered region이 있다는 것이 밝혀졌으며, 또 다른 선행문헌(Xiao et al., Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease, bioRxiv (2020))에서는 상기 disordered region 부분을 제거하고 in vitro에서 이중가닥 DNA 절단 효율을 살핀 바 있다.
하지만, 상기 선행 연구들은 세포 내 유전자 편집 활성(예를 들어, indel 발생 효율)을 보이거나, 이를 높이는 방안에 대한 연구는 아니며, disordered region을 제거한 실험은 있지만, 오히려 절단 활성이 낮아지는 것으로 보고하였다. 더욱이, 상기 연구에서 수행한 실험은 in vitro에서 진행한 실험으로, 세포 내 유전자 편집 활성을 나타내거나, 효율을 높이기 위한 변형이 무엇인지 밝히는데는 실패하였다.
본 명세서에서는 CRISPR/Cas12f1 시스템에 사용되어 유전자 편집 효율을 증가시킬 수 있는 엔지니어링 된 Cas12f1 가이드 RNA를 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된, 유전자 편집 효율을 증가시킬 수 있는 엔지니어링 된 스캐폴드 영역 및 U-rich tail을 제공하고자 한다.
본 명세서에서는 유전자 편집 효율이 증가된 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공하고자 한다.
본 명세서에서는 유전자 편집 효율이 증가된 엔지니어링 된 CRISPR/Cas12f1 시스템을 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas12f1 시스템의 각 구성요소를 암호화하는 핵산을 가지는 벡터를 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas12f1 시스템을 사용한 유전자 편집 방법을 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas12f1 시스템의 용도를 제공하고자 한다.
일 실시예로, 본 명세서에서는 다음을 포함하는, CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA를 제공한다:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 이상 10 이하이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
일 실시예로, 본 명세서에서는 다음을 포함하는, CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA를 제공한다:
엔지니어링 된 스캐폴드;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이며, c는 1 이상 10 이하이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475)로 표현되는 제1 서열;
5'-UUCG-3'로 표현되는 제2 서열;
5'-CUCGA-3'로 표현되는 제3 서열;
5'-AACAAA-3'로 표현되는 제4 서열;
링커;
5'-GGA-3'로 표현되는 제5 서열; 및
5'-AUGCAAC-3'로 표현되는 제6 서열.
일 실시예로, 본 명세서에서는 다음을 포함하는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA를 제공한다:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 이상 10 이하이고,
상기 엔지니어링 된 스캐폴드 영역은 다음을 포함함:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제1 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제2 서열,
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 제3 서열,
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 및 5'-AACAAAUUCAUUU-3'(서열번호 13)로 이루어진 군에서 선택된 제4 서열이 연결된 엔지니어링 된 tracrRNA; 및
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 및 5'-GAAUGAAGGA-3'(서열번호 15)으로 이루어진 군에서 선택된 제5 서열, 및
5'-AUGCAAC-3'로 표현되는 제6 서열이 연결된 엔지니어링 된 crRNA 반복 서열 부분,
이때, 상기 엔지니어링 된 crRNA 반복 서열 부분의 3'말단은 상기 스페이서의 5'말단과 연결 되어 있고,
상기 엔지니어링 된 tracrRNA의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 1)와 동일하고, 상기 엔지니어링 된 crRNA 반복 서열은 5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3)과 동일한 경우를 포함하지 않는 것을 특징으로 한다.
일 실시예로, 본 명세서에서는 다음을 포함하는, 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공한다:
Cas12f1 단백질; 및
엔지니어링 된 가이드 RNA,
이때, 상기 엔지니어링 된 가이드 RNA는 다음을 포함함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 상기 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 이상 10 이하이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
일 실시예로, 본 명세서에서는 다음을 포함하는, CRISPR/Cas12f1 시스템의 각 구성요소를 발현할 수 있는 벡터를 제공한다:
Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열;
상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열; 및
상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열,
이때, 상기 엔지니어링 된 가이드 RNA는 다음을 포함함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
여기서, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 이상 10 이하이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
일 실시예로, 본 명세서에서는 다음을 포함하는, 세포 내에서 표적 핵산을 편집하는 방법 또는 표적 핵산을 타겟팅하는 방법을 제공한다:
Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 가이드 RNA 또는 이름 암호화하는 핵산을 세포 내로 도입하는 것,
이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
이로 인해 상기 표적 핵산이 CRISPR/Cas12f1 복합체에 의해 편집되거나 또는 타겟팅될 수 있고,
상기 엔지니어링 된 가이드 RNA는 다음을 포함하는 것을 특징으로 함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 이상 10 이하이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
일 실시예로, 본 명세서에서는 엔지니어링 된 Cas12f1 가이드 RNA의 유전자 편집 용도를 제공한다.
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역 및 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는 CRISPR/Cas12f1 시스템을 유전자 편집에 사용하는 경우, 자연계에서 발견되는 CRISPR/Cas12f1 시스템을 사용할 때와 비교해 높은 유전자 편집 효율을 나타낸다.
도 1은 본 명세서에서 개시하는 엔지니어링 된 Cas12f1 가이드 RNA를 예시적으로 나타낸 모식도이다.
도 2는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Example 1.1.1 내지 Example 1.1.3에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 3은 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Example 1.1.4 내지 Example 1.1.6에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 4는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Example 1.1.7 내지 Example 1.1.9에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 5는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Example 1.1.10 내지 Example 1.1.13에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 6은 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Example 1.2.1 내지 Example 1.2.3에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 7은 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Example 1.2.4 내지 Example 1.2.6에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 8은 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Example 1.2.7 내지 Example 1.2.9에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 9는 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Example 1.2.10 내지 Example 1.2.13에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 10은 실험예 2에 개시된 실시예 중, Intergenic22를 표적으로 하는 Example 1.3.1 내지 Example 1.3.3에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 11은 실험예 2에 개시된 실시예 중, Intergenic22를 표적으로 하는 Example 1.3.4 내지 Example 1.3.6에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 12는 실험예 2에 개시된 실시예 중, Intergenic22를 표적으로 하는 Example 1.3.7 내지 Example 1.3.9에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 13은 실험예 2에 개시된 실시예 중, Intergenic22를 표적으로 하는 Example 1.3.10 내지 Example 1.3.13에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex 는 Example, Comp는 Comparative Example을 나타내는 약어이며, Control은 음성 대조군을 나타낸다.
도 14는 실험예 2에 개시된 실시예 중, DY2를 표적으로 하는 Comparative Example 1.1.1, 및 Control의 Indel 효율을 나타낸 그래프이다.
도 15는 실험예 2에 개시된 실시예 중, DY10을 표적으로 하는 Comparative Example 1.2.1, 및 Control의 Indel 효율을 나타낸 그래프이다.
도 16은 실험예 3.1에 개시된 실시예 중 DY2를 표적으로 하는 Example 2.1.1 내지 Example 2.1.7에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 17은 실험예 3.1에 개시된 실시예 중 DY2를 표적으로 하는 Example 2.1.8 내지 Example 2.1.15에 대한 평균 indel 효율을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 18은 실험예 3.1에 개시된 실시예 중, DY10을 표적으로 하는 Example 2.2.1 내지 Example 2.2.7에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 19는 실험예 3.1에 개시된 실시예 중, DY10을 표적으로 하는 Example 2.2.8 내지 Example 2.2.15에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 20은 실험예 3.2에 개시된 실시예 중 DY2를 표적으로 하는 Example 3.1.1 내지 Example 3.1.6에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 21은 실험예 3.2에 개시된 실시예 중 DY2를 표적으로 하는 Example 3.1.7 내지 Example 3.1.12에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 22는 실험예 3.2에 개시된 실시예 중, DY10을 표적으로 하는 Example 3.2.1 내지 Example 3.2.6에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 23은 실험예 3.2에 개시된 실시예 중, DY10을 표적으로 하는 Example 3.2.7 내지 Example 3.2.12에 대한 indel 효율의 평균값을 나타낸 그래프이다. 이때, Ex는 Example을 나타내는 약어이다.
도 24는 실험예 4.1에 개시된 각각의 실시예에 대한 평균 indel 효율을 나타낸 그래프이다. FUS를 표적으로 하는 Example 4.4.1 내지 Example 4.4.4에 대한 indel 효율의 평균값이 각각 도시되어 있다. 이때, Ex는 Example을 나타내는 약어이다.
도 25는 실험예 4.1에 개시된 각각의 실시예에 대한 평균 indel 효율을 나타낸 그래프이다. GAK를 표적으로 하는 Example 4.5.1 내지 Example 4.5.2에 대한 indel 효율의 평균값이 각각 도시되어 있다. 이때, Ex는 Example을 나타내는 약어이다.
도 26은 실험예 4.1에 개시된 각각의 실시예에 대한 평균 indel 효율을 나타낸 그래프이다. MLH를 표적으로 하는 Example 4.6.1에 대한 indel 효율의 평균값이 각각 도시되어 있다. 이때, Ex는 Example을 나타내는 약어이다.
도 27은 실험예 5의 Large scale validation 실험 결과를 나타낸 것이다.
도 28은 실험예 6의 in vitro cleavage assay 결과를 나타낸 것이다.
용어의 정의
본 명세서에서 사용되는 "약"이라는 용어는 참조 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1% 정도로 변하는 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다.
A,T,C,G, 및 U
본 명세서에서 사용되는 A, T, C, G 및 U 기호는 당업계 통상의 기술자가 이해하는 의미로 해석된다. 문맥 및 기술에 따라 DNA 또는 RNA 상에서 염기, 뉴클레오사이드 또는 뉴클레오타이드로 적절히 해석될 수 있다. 예를 들어, 염기를 의미하는 경우는 각각 아데닌(A), 티민(T), 시토신(C), 구아닌(G) 또는 우라실(U) 자체로 해석될 수 있고, 뉴클레오사이드를 의미하는 경우는 각각 아데노신(A), 티미딘(T), 시티딘(C), 구아노신(G) 또는 유리딘(U)으로 해석될 수 있으며, 서열에서 뉴클레오타이드를 의미하는 경우는 상기 각각의 뉴클레오사이드를 포함하는 뉴클레오타이드를 의미하는 것으로 해석된다.
작동 가능하게 연결된(operably linked)
본 명세서에서 사용되는 "작동 가능하게 연결된"이라는 용어는 유전자 발현에 있어서, 특정 구성이 다른 구성과 연결되어 의도된 방식대로 기능할 수 있도록 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 암호화 서열과 작동 가능하게 연결되었다고 할 때, 상기 프로모터가 상기 암호화 서열의 세포 내에서의 전사 및/또는 발현에 영향을 미칠 수 있도록 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 유전자 또는 표적 핵산
본 명세서에서 사용되는 "표적 유전자(target gene)" 또는 "표적 핵산(target nucleic acids)"은 기본적으로, 유전자 편집의 대상이 되는 세포 내 유전자 또는 핵산을 의미한다. 상기 표적 유전자 또는 표적 핵산은 혼용되어 사용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 상기 표적 유전자 또는 표적 핵산은 달리 기재되지 않은 한, 대상 세포가 가진 고유한 유전자 또는 핵산, 혹은 외부 유래의 유전자 또는 핵산 모두를 의미할 수 있으며, 편집의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 유전자 또는 표적 핵산은 표적 서열 또는 표적 서열의 인접 부위를 포함할 수 있다. 상기 표적 유전자 또는 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열 또는 인식 서열
본 명세서에서 사용되는 "표적 서열(target sequence)" 또는 "인식 서열(recognition sequence)"은 CRISPR/Cas 복합체가 표적 유전자 또는 표적 핵산을 절단하기 위해 인식하는 특정 서열을 의미한다. 상기 표적 서열은 그 목적에 따라 적절히 선택될 수 있다. 구체적으로, "표적 서열"은 상기 전술한 표적 유전자 또는 표적 핵산 내에 포함된 서열일 수 있고, 본 명세서에서 제공하는 가이드 RNA, 또는 엔지니어링 된 가이드 RNA에 포함된 스페이서 서열과 상보성을 가지는 서열을 의미한다. 일반적으로, 상기 스페이서 서열은 표적 유전자 또는 표적 핵산의 서열 및 CRISPR/Cas 시스템의 이펙터 단백질이 인식하는 PAM 서열을 고려하여 결정된다. 본 명세서에서, 상기 표적 서열은 CRISPR/Cas 복합체의 가이드 RNA와 상보적으로 결합하는 특정 가닥만을 지칭할 수 있으며, 상기 특정 가닥 부분을 포함하는 표적 이중 가닥 전체를 지칭할 수도 있으며, 이는 문맥에 따라 적절히 해석된다. 또한, 상기 용어는 당업계 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
벡터
본 명세서에서 사용되는 "벡터"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어 CRISPR/Cas 시스템의 이펙터 단백질을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
자연계에서 발견되는
본 명세서에서 "자연계에서 발견되는(occurred in nature)" 이라는 용어는, 자연계에서 발견되는, 인위적으로 변형되지 않은 대상을 의미하며, 인위적인 변형이 가해진 "엔지니어링 된 대상"과 구분하기 위해 사용된다. 상기 "자연계에서 발견되는" 유전자, 핵산, DNA, RNA 등은 야생형(wild type, original form) 및 mature form (active form)의 유전자, 핵산, DNA, RNA를 모두 포괄하는 개념으로 사용된다. 상기 용어는 그 외 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석되어야 한다.
엔지니어링 된
본 명세서에서 사용되는 "엔지니어링 된(engineered)"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 가이드 RNA"의 경우, 자연계에 존재하는 가이드 RNA의 구성에 인위적인 변경이 가해진 가이드 RNA를 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS(Nuclear Localization Sequence, or Signal)
본 명세서에서 "NLS"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 구체적으로, 상기 NLS는 아미노산 서열 PKKKRKV(서열번호 278)을 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 279)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 280) 또는 RQRRNELKRSP(서열번호 281)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 282)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 283); 마이오 마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 284) 및 PPKKARED(서열번호 285); 인간 p53의 서열 PQPKKKPL(서열번호 286); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 287); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 288) 및 PKQKKRK(서열번호 289); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 290); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 291); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 292); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 293)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
NES(Nuclear Export Sequence, or Signal)
본 명세서에서 "NES"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 내부의 물질을 핵 외부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NES"라는 용어는 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
태그
본 명세서에서 "태그"라 함은, 펩타이드, 또는 단백질의 수송, 추적 및/또는 분리정제를 쉽게 하기 위하여 부가되는 기능적 도메인을 통틀어 일컫는다. 구체적으로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형광 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 자가형광 단백질, 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 유전자를 포함하나, 이에 제한되는 것은 아니다. 본 명세서에서 사용되는 "태그"라는 용어는 통상의 기술자가 이해할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
배경기술 - CRISPR/Cas12f1 복합체의 구조
CRISPR/Cas12f 시스템
CRISPR/Cas12f 시스템은 type V CRISPR/Cas 시스템 중 V-F 서브타입에 속하고, 이는 다시 V-F1 내지 V-F3의 베리언트로 나뉜다. CRISPR/Cas12f 시스템은 선행연구(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중, Cas14a, Cas14b, 및 Cas14c 변이체를 포함하는 CRISPR/Cas14 시스템을 포함한다. 이 중, Cas14a 이펙터 단백질을 포함하는 CRISPR/Cas14a 시스템은 CRISPR/Cas12f1 시스템으로 분류된다(Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)). 최근 선행 연구(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021), Xiao et al., Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease, bioRxiv (2020)) 등을 통해 상기 CRISPR/Cas12f1 복합체의 구조가 밝혀진 바, 이하 이에 대해 간략히 서술한다.
CRISPR/Cas12f1 복합체의 구조
CRISPR/Cas12f1 복합체 내에서, Cas12f1 단백질은 두 개의 분자가 이량체 형태로 가이드 RNA와 결합하여 복합체를 이루고 있음이 밝혀졌다. 상기 Cas12f1 단백질은 amino-terminal domain (NTD) 및 carboxy-terminal domin(CTD)로 나뉘며, 상기 두 도메인이 링커 루프(linker loop)를 통해 연결되어 있는 구조이다. 상기 NTD는 wedge (WED), recognition (REC), 및 zinc finger (ZF) 도메인으로 구성되며, 상기 CTD는 또 다른 ZF 도메인 및 RuvC 도메인으로 구성된다. Cas12f1 단백질 이량체의 구조는 크게 REC 로브(REC lobe) 및 nuclease 로브(NUC lobe)로 나눌 수 있다. 상기 REC 로브는, 이량체를 구성하는 하나의 Cas12f1 단백질의 WED 도메인, ZF 도메인, 및 REC 도메인과; 이량체를 구성하는 다른 하나의 Cas12f1 단백질의 WED 도메인, ZF 도메인, 및 REC 도메인으로 구성된다. 상기 nuclease 로브는, 이량체를 구성하는 하나의 Cas12f1 단백질의 RuvC 도메인 및 TNB 도메인과; 이량체를 구성하는 다른 하나의 Cas12f1 단백질의 RuvC 도메인 및 TNB 도메인으로 구성된다. 상기 Cas12f1 단백질의 각 도메인의 전부 또는 일부는 각각 Cas12f1 가이드 RNA의 스캐폴드 영역의 특정 부분을 인식하며, CRISPR/Cas12f1 복합체를 이룬다.
Cas12f1 가이드 RNA의 구조
본 명세서에서, Cas12f1 가이드 RNA는 크게 기능적으로 스페이서, 및 스캐폴드 영역으로 나눌 수 있다. 상기 스캐폴드 영역은 다섯개의 Stem (Stem 1 내지 Stem 5로 명명) 및 하나의 pseudoknot (PK)로 구성된다.
통상적으로, 자연계에서 발견되는 Cas12f1 가이드 RNA는 tracrRNA 및 crRNA로 나뉘며, 상기 crRNA는 다시 crRNA 반복 서열 부분 및 스페이서로 나눌 수 있다는 것이 통상의 기술자에게 잘 알려져 있다. 상기 기준과는 별개로, 본 명세서에서는 상기 Cas12f1 가이드 RNA 중 Cas12f1 단백질과 상호작용하는 부분을 통틀어 스캐폴드 영역이라 지칭한다. 상기 스캐폴드 영역은 tracrRNA 및 crRNA의 일부를 포함하는 영역으로, Cas12f1 단백질과 상호작용하는 기능을 한다. 이에 대한 구체적인 설명은 이하 해당 단락에서 기술한다.
상기 Cas12f1 가이드 RNA는 tracrRNA의 일부(tracrRNA anti-repeat), 및 crRNA 반복 부분(crRNA repeat)의 일부가 상보적으로 결합하여 듀플렉스(duplex)를 이루고 있는 구조를 2개 포함하며, 이를 편의상 crRNA repeat-tracrRNA anti-repeat(R:AR) 부분으로 명명한다. 상기 Stem 5(R:AR2), 및 PK(R:AR1)는 이러한 crRNA repeat-tracrRNA anti-repeat 듀플렉스 구조를 이루고 있다. CRISPR/Cas12f1 복합체에서, 상기 Cas12f1 가이드 RNA 중 Stem 1 부분, Stem 2 중 일부, 및 Stem 5(R:AR2) 부분은 상기 Cas12f1 이량체와 상호작용하지 않는 부분임이 밝혀졌으며, 이를 disordered region이라 한다.
배경기술 - CRISPR/Cas 시스템 발현 벡터 설계
벡터 설계 개괄
CRISPR/Cas 시스템을 유전자 편집에 사용하기 위해서, 상기 CRISPR/Cas 시스템의 각 구성을 암호화하는 뉴클레오타이드 서열을 가지는 벡터를 세포 내에 도입시켜, 세포 내에서 상기 CRISPR/Cas 시스템의 각 구성이 발현되도록 하는 방법이 널리 이용되고 있다. 이하, CRISPR/Cas 시스템이 세포 내에서 발현되도록 하는 벡터의 구성 요소에 대해 설명한다.
CRISPR/Cas 시스템 구성 요소를 암호화하는 핵산
상기 벡터의 목적은 CRISPR/Cas 시스템 각 구성요소를 세포 내에서 발현되도록 하는 것이므로, 상기 벡터의 서열은 CRISPR/Cas 시스템의 각 구성요소를 암호화하는 핵산 중 하나 이상을 포함할 수 있다. 구체적으로, 상기 벡터의 서열은 발현하고자 하는 CRISPR/Cas 시스템에 포함된 가이드 RNA, 및/또는 Cas 단백질을 암호화하는 핵산을 포함한다. 이때, 상기 벡터의 뉴클레오티드 서열은 야생형의 가이드 RNA 및 야생형의 Cas 단백질을 암호화하는 핵산뿐 아니라 그 목적에 따라 엔지니어링 된 Cas12f1 가이드 RNA 및 코돈 최적화된 Cas 단백질을 암호화하는 핵산 또는 엔지니어링 된 Cas 단백질을 암호화하는 핵산을 포함할 수 있다. 이때, 상기 각 구성요소를 암호화하는 핵산 서열은 DNA 서열일 수 있다.
조절/제어 요소
상기 구성요소를 세포 내에서 발현시키기 위해서, 상기 벡터는 하나 이상의 조절/제어 요소를 포함해야 한다. 구체적으로, 상기 조절/제어 구성요소는 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)을 포함할 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
프로모터
상기 벡터의 발현 대상을 세포 내에서 발현시키려면, 각 구성 요소를 암호화하는 서열에 프로모터 서열을 작동적으로 연결시켜 세포 내에서 전사 인자가 활성화될 수 있도록 해야 한다. 상기 프로모터 서열은 대응하는 전사 인자, 또는 발현 환경에 따라 달리 설계할 수 있으며, CRISPR/Cas 시스템의 구성 요소를 세포 내에서 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 상기 프로모터 서열은 RNA 중합효소(예를 들어,RNA Pol I, Pol II, 또는 Pol III)의 활성을 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1), 및 7SK 중 하나 일 수 있으나, 이에 제한되는 것은 아니다.
종결 신호
상기 전사 인자의 전사 활동의 종결을 유도하는 서열을 종결 신호라고 일컫는다. 상기 종결 신호는, 프로모터 서열의 종류에 따라 달라질 수 있다. 예를 들어, 상기 프로모터가 U6, 또는 H1 프로모터일 경우, 상기 프로모터는 티미딘 연속 서열(예를 들어, TTTTTT (T6) 서열)을 종결 신호로 인식한다.
부가 발현 요소
상기 벡터는 야생형의 CRISPR/Cas 시스템 구성, 및/또는 엔지니어링 된 CRISPR/Cas 시스템 외 통상의 기술자가 필요에 의해 발현시키고자 하는 부가 발현 요소를 암호화하는 핵산 서열을 포함하고 있을 수 있다. 예를 들어, 상기 부가 발현 요소는, "태그" 단락에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 선별을 위한 selection 유전자, 예를 들어, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저항성 유전자, 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin), 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
발현 벡터의 형태
상기 발현 벡터는 선형, 또는 원형 벡터 형태로 설계될 수 있다.
종래 기술의 한계점
CRISPR/Cas12f1 시스템은 상대적으로 크기가 작기 때문에, 유전자 편집 기술에 적용하기 매력적인 시스템으로, 최초로 보고된 이후(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018)), 이에 대한 몇몇 연구가 진행되고 있다 (Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018), US 2020/0190494 A1). 하지만, 세포(예를 들어, 진핵 세포) 내에서 유전자 편집 활성이 나타나지 않거나, 지나치게 낮아 이를 활용하는 데 걸림돌이 되고 있다.
계속된 연구로 최근 선행문헌(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에서는 CRISPR/Cas12f1 시스템에서 Cas12f1 단백질이 이량체(dimer)를 형성한다는 사실, 및 가이드 RNA의 구조에 대해 밝혀졌다. 상기 선행문헌에 의해 가이드 RNA 부분 중 Cas12f1 단백질과 직접적으로 상호작용하지 않는, 이른바 disordered region이 있다는 것이 밝혀졌으며, 또 다른 선행문헌(Xiao et al., Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease, bioRxiv (2020))에서는 상기 disordered region 부분을 제거하고 in vitro에서 이중가닥 DNA 절단 효율을 살핀 바 있다. 하지만, 상기 선행 연구들은 세포 내 유전자 편집 활성(예를 들어, indel 발생 효율)을 보이거나, 이를 높이는 방안에 대한 연구는 아니며, disordered region을 제거한 실험은 있지만, 오히려 절단 활성이 낮아지는 것으로 보고하고 있다. 더욱이, 상기 연구에서의 실험은 in vitro에서 진행한 실험으로, 세포 내 유전자 편집 활성을 나타내거나, 효율을 높이기 위한 변형이 무엇인지 밝히는데는 실패하였다.
따라서 여전히, CRISPR/Cas12f1 시스템의 세포 내 유전자 편집 활성을 높이는 것이 중요한 과제로 남아 있다.
엔지니어링 된 Cas12f1 가이드 RNA의 특징
엔지니어링 된 Cas12f1 가이드 RNA 개괄
본 명세서에서는 종래 기술의 한계점을 극복하여, CRISPR/Cas12f1 시스템의 세포 내 유전자 편집 활성을 높이기 위한, 엔지니어링 된 Cas12f1 가이드 RNA를 제공한다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA에 새로운 구성을 추가하고, 또한 그 구조 일부를 변형한 것이다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 3'말단에 새로운 구성인 U-rich tail을 포함하는 것을 특징으로 한다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 Cas12f1 단백질과 상호작용하는 역할을 하는 스캐폴드 영역의 적어도 일부가 변형된 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함할 수 있다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역과는 다른 것을 특징으로 한다.
엔지니어링 된 Cas12f1 가이드 RNA의 특징 1 - U-rich tail 포함
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA에 U-rich tail이 추가된 것을 특징으로 한다. 상기 U-rich tail은 상기 엔지니어링 된 Cas12f1 가이드 RNA의 3'말단 부분에 위치하며, 유리딘이 풍부하게 포함된 부분이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 3'말단 부분에 유리딘이 풍부하게 포함된 U-rich tail을 포함할 수 있다. 일 구현예로, 상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 A, U, C, 또는 G 중 하나이고, 상기 a, b, c는 정수이며, 상기 a는 1 이상 5 이하이고, b는 0 이상 2 이하이며, c는 1 이상 10 이하일 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA의 특징 2 - 스캐폴드 영역(scaffold region) 중 하나 이상의 부분(part)이 변형됨
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA와 비교하여, 그 스캐폴드 영역의 일부가 변형된 것을 특징으로 한다. 스캐폴드 영역은 tracrRNA 및 crRNA의 일부를 포함하는 영역으로, Cas12f1 단백질과 상호작용하는 기능을 한다. 상기 스캐폴드 영역에 대해서는 이하 더 자세히 설명할 것이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역을 포함할 수 있다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역이 변형된 것이다. 따라서, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역과는 상이한 서열을 가진다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역 중 일부 영역이 제거된 것일 수 있다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 가이드 RNA의 스캐폴드 영역에 포함된 특정 부분에서, 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA의 효과
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA를 CRISPR/Cas12f1 시스템에 사용하는 경우, 자연계에서 발견되는 가이드 RNA를 사용하는 경우에 비해 세포 내에서 유전자 편집 활성이 극적으로 향상되는 효과가 나타난다. 본 발명자들은 실험을 통해, 자연계에서 발견되는 가이드 RNA에 어떤 구성을 추가해야 하는지, 혹은 그 스캐폴드 영역에 어떤 변형을 가해야 유전자 편집 효율이 향상되는지 상세하게 밝혔다. 상기 엔지니어링 된 Cas12f1 가이드 RNA를 사용하면, 전술한 종래 기술의 한계점을 극복하여 세포 내에서 높은 효율로 유전자를 편집할 수 있다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 자연계에서 발견되는 가이드 RNA와 길이가 동등하거나, 더 짧은 길이를 가져 유전자 편집 기술 분야에서 응용 가능성이 높다. 본 출원의 엔지니어링 된 Cas12f1 가이드 RNA는 CRISPR/Cas12f1 시스템의 장점 (예를 들어, 크기가 매우 작다는 장점)을 충분히 유전자 편집 기술에 활용할 수 있게 한다.
엔지니어링 된 Cas12f1 가이드 RNA의 용도
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 Cas12f1 단백질과 함께 유전자 편집 및/또는 유전자 치료제 용도로 사용될 수 있다. 또한, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 유전자 편집용 조성물을 제조하기 위한 용도로 사용할 수 있다.
U-rich tail
U-rich tail 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위해 도입할 수 있는 U-rich tail을 제공한다. 상기 U-rich tail 서열은 엔지니어링 된 Cas12f1 가이드 RNA 중 crRNA의 스페이서의 3'말단에 연결되어 있는 것을 특징으로 하며, 엔지니어링 된 Cas12f1 가이드 RNA가 사용된 CRISPR/Cas12f1 시스템의 표적 핵산에 대한 절단 효율을 높이는 역할을 한다. 상기 U-rich tail 서열은 기본적으로 하나 이상의 유리딘을 포함한다. 상기 U-rich tail 서열은 엔지니어링 된 CRISPR/Cas12f1 시스템의 실제 사용 환경 및 발현 환경(예를 들어, 진핵 세포 또는 원핵 세포 내부 환경)에 따라 유리딘 외 추가적인 뉴클레오타이드를 더 포함할 수 있다.
상기 U-rich tail 서열은 PCT/KR2020/014961출원에 개시된 U-rich tail 서열일 수 있다. 이하 본 명세서에서 U-rich tail 서열을 지칭할 때, PCT/KR2020/014961출원에 개시된 상기 U-rich tail 서열에 대한 내용 및 실험 결과를 모두 포함하는 것으로 이해해야 하고, 상기 출원의 내용은 그 전체가 참조에 의해 본 명세서에 포함된다.
U-rich tail 서열 구조 1 - 유리딘 연속 서열
U-rich tail 서열을 설계하는 데 있어서, U-rich tail은 유리딘이 하나 이상 연속된 서열을 풍부하게 포함할 수 있다. 본 발명자들은 실험을 통해 U-rich tail 서열을 CRISPR/Cas12f1 시스템에 도입한 경우, 상기 CRISPR/Cas12f1 복합체의 유전자 편집 효율이 향상되는 것을 발견했다. 따라서, 본 명세서에서 제공하는 U-rich tail 서열은 유리딘이 하나 이상 연속된 서열을 포함한다.
일 구현예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다.
U-rich tail 서열 구조 2 - 변형된 유리딘 연속 서열
본 명세서에서 제공하는 U-rich tail 서열은 유리딘이 1개 내지 5개 반복될 때마다, 유리딘이 아닌 다른 리보뉴클레오사이드(A, C, G)가 적어도 하나 이상 포함된 '변형된 유리딘 반복 서열'을 포함할 수 있다. 상기 변형된 유리딘 연속 서열은 특히 엔지니어링 된 crRNA를 발현하는 벡터를 설계할 때 유용하다.
일 구현예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다.
U-rich tail 서열 - 구현예
일 구현예로, 상기 U-rich tail 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하이며, b는 0 이상이다. 일 구현예로, 상기 b는 0 이상 2 이하일 수 있다. 일 구현예로, 상기 c는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10일 수 있다. 일 구현예로, 상기 c는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 c는 1 이상 6 이하일 수 있다.
U-rich tail 서열 예시
일 구현예로, 상기 U-rich tail의 서열은 5'-U-3', 5'-UU-3', 5'-UUU-3', 5'-UUUU-3', 5'-UUUUU-3', 5'-UUUUUU-3', 5'-UUURUUU-3', 5'-UUURUUURUUU-3'(서열번호 646), 5'-UUUURU-3', 5'-UUUURUU-3', 5'-UUUURUUU-3', 5'-UUUURUUUU-3', 5'-UUUURUUUUU-3'(서열번호 647), 또는 5'-UUUURUUUUUU-3'(서열번호 648)일 수 있다. 일 구현예로, 상기 U-rich tail의 서열은 5'-U-3', 5'-UU-3', 5'-UUU-3', 5'-UUUU-3', 5'-UUUUU-3', 5'-UUUUUU-3', 5'-UUUAUUU-3', 5'-UUUAUUUAUUU-3'(서열번호 254), 5'-UUUUAU-3', 5'-UUUUAUU-3', 5'-UUUUAUUU-3', 5'-UUUUAUUUU-3', 5'-UUUUAUUUUU-3'(서열번호 255), 5'-UUUUAUUUUUU-3'(서열번호 256), 5'-UUUGUUU-3', 5'-UUUGUUUGUUU-3'(서열번호 257), 5'-UUUUGU-3', 5'-UUUUGUU-3', 5'-UUUUGUUU-3', 5'-UUUUGUUUU-3', 5'-UUUUGUUUUU-3'(서열번호 258), 또는 5'-UUUUGUUUUUU-3'(서열번호 259)일 수 있다.
일 구현예로, 상기 U-rich tail의 서열은 5'-UUUUUU-3', 5'-UUUUAUUUUUU-3'(서열번호 256), 또는 5'-UUUUGUUUUUU-3'(서열번호 259) 일 수 있다. 일 구현예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다.
용어의 설명 - Cas12f1 가이드 RNA의 부분을 지칭하는 용어
Cas12f1 가이드 RNA의 부분 - 개괄
자연계에서 발견되는 Cas12f1 가이드 RNA는 tracrRNA 및 crRNA로 나뉘며, 상기 crRNA는 다시 crRNA 반복 서열 부분 및 스페이서로 나눌 수 있다는 것이 통상의 기술자에게 잘 알려져 있다.
상기 기준과는 별개로, 본 명세서에서는 상기 Cas12f1 가이드 RNA 중 Cas12f1 단백질과 상호작용하는 부분을 통틀어 스캐폴드 영역이라 지칭한다. 상기 스캐폴드 영역은 tracrRNA 및 crRNA의 일부를 포함하며, 한 분자의 RNA를 지칭하는 것은 아닐 수 있다. 도 1을 참조하면, 상기 스캐폴드 영역은 다시 제1 영역, 제2 영역, 제3 영역, 제4 영역, 제5 영역, 및 제6 영역으로 세분화될 수 있다. 상기 세분화된 영역을 tracrRNA, crRNA 관점에서 서술하면, 상기 제1 영역 내지 제4 영역은 tracrRNA에 포함되고, 상기 제5 영역 내지 상기 제6 영역은 crRNA, 구체적으로 crRNA 반복 서열 부분에 포함된다.
이하 서술되는 "제n 영역", 또는 "자연계에서 발견되는 제n 영역" (n은 1 이상 6이하의 정수)은 기본적으로 자연계에서 발견되는 Cas12f1 가이드 RNA의 각 부분을 지칭한다. 구체적으로, 상기 "제 n 영역"은 원핵세포 내에서 전사된 가이드 RNA의 구조, 및/또는 원핵세포 시스템에서 실제 작동하는 가이드 RNA(원핵세포 내에서 전사된 형태가 아닌, 활성화된 형태)의 구조에 대응하여 각 영역을 지칭할 수 있다. 엔지니어링 된 Cas12f1 가이드 RNA 내 상기 분류 기준과 대응되는 영역은 일반적으로 "변형된 제n 영역" 내지 "엔지니어링 된 스캐폴드 영역의 제n 영역"으로 서술된다.
다만, 엔지니어링 된 스캐폴드 영역에 포함된 제n 영역일지라도, 달리 변형되지 않아 자연계에서 발견되는 제n 영역과 동일한 경우가 있을 수 있는데, 그 때에 한해 "제n 영역"이라는 용어는 혼용될 수 있다. 이때, 상기 "제n 영역"이 지칭하는 대상(예를 들어, 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 영역인지, 자연계에서 발견되는 가이드 RNA에 포함된 영역인지 여부)은 문맥에 따라 적절히 해석되어야 한다.
tracrRNA, crRNA
본 명세서에서 "tracrRNA", "crRNA"라고 쓰는 경우, CRISPR/Cas 기술 분야에서 통상의 기술자가 인식할 수 있는 의미를 모두 포함한다. 이는, 자연계에서 발견되는 듀얼 가이드 RNA의 각 분자를 지칭하는 용어로 사용되는 것이 일반적이지만, 상기 tracrRNA 및 crRNA를 링커로 연결한 싱글 가이드 RNA의 각 해당 부분을 지칭하는데도 사용될 수 있다. 달리 서술하지 않는 한, tracrRNA 및 crRNA라고만 기재하는 경우 CRISPR/Cas12f1 시스템을 구성하는 tracrRNA 및 crRNA를 의미한다.
일 구현예로, tracrRNA의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3' (서열번호 1) 또는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3' (서열번호 2)일 수 있다. 일 구현예로, 상기 tracrRNA는 제1 영역, 제2 영역, 제3 영역, 및 제4 영역을 포함한다. 일 구현예로, 상기 tracrRNA는 5'말단에서 3'말단 방향으로, 제1 영역, 제2 영역, 제3 영역, 및 제4 영역이 순서대로 연결된 것이다.
일 구현예로, crRNA의 서열은 crRNA 반복 서열 및 스페이서 서열을 포함한다. 이때, 상기 crRNA 반복 서열은 5'-GAAUGAAGGAAUGCAAC-3' (서열번호 3) 또는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3' (서열번호 4일) 수 있다. 상기 crRNA 반복 서열은 제5 영역, 및 제6 영역을 포함한다. 상기 스페이서 서열은 표적 서열에 따라 달라질 수 있으며, 일반적으로 10 내지 50개의 뉴클레오타이드를 포함한다. 일 구현예로, 상기 crRNA는 5'말단에서 3'말단 방향으로, 제5 영역, 제6 영역, 및 스페이서가 순서대로 연결된 것이다.
스캐폴드 영역 - 개괄
본 명세서에서 "스캐폴드 영역"이라고 쓰는 경우, 자연계에서 발견되는 가이드 RNA의 부분 중 스페이서를 제외한 나머지 부분을 통틀어 지칭한다. 구체적으로, 상기 스캐폴드 영역은 tracrRNA, 및 crRNA의 일부를 포함한다. 구체적으로, 상기 crRNA의 일부는 crRNA 반복 서열 부분일 수 있다. 상기 스캐폴드 영역은 일반적으로 Cas 단백질과 상호작용할 수 있는 부분으로 알려져있다. 본 명세서에서는 상기 스캐폴드 영역을 제1 영역 내지 제6 영역으로 나누어 서술하며, 각 영역에 대해서는 이하 더 자세히 설명한다.
스캐폴드 영역 1 - 제1 영역
본 명세서에서 "제1 영역"이라고 쓰는 경우, tracrRNA의 5'말단을 포함하는 영역을 지칭한다. 상기 제1 영역은 CRISPR/Cas12f1 복합체 내에서 Stem 구조를 형성하는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제1 영역은 Stem 1 부분(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))을 포함한다. 상기 제1 영역은 상기 Stem 1 부분과 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제1 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제1 영역은, 서열번호 1 또는 2로 표현되는 tracrRNA의 5'말단으로부터 1번째 뉴클레오타이드부터 11번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제1 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3' (서열번호 10)일 수 있다.
스캐폴드 영역 2 - 제2 영역
본 명세서에서 "제2 영역"이라고 쓰는 경우, tracrRNA 내 상기 제1 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제2 영역은 CRISPR/Cas12f1 복합체 내에서 Stem 구조를 형성하는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다. 이때, 상기 Stem 구조는 상기 제1 영역에 포함된 Stem과는 다른 것이다.
상기 제2 영역은 Stem 2 부분(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))을 포함한다. 상기 제2 영역은 상기 Stem 2 부분과 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제2 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 RuvC 도메인, 및/또는 이량체 이루는 다른 하나의 Cas12f1 단백질의 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 상기 제2 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제2 영역은 서열번호 1 또는 2로 표현되는 tracrRNA의 5'말단으로부터 22번째 뉴클레오타이드부터 72번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제2 영역의 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3' (서열번호 11일) 수 있다.
스캐폴드 영역 3 - 제3 영역
본 명세서에서 "제3 영역"이라고 쓰는 경우, tracrRNA 내 상기 제2 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제3 영역은 CRISPR/Cas12f1 복합체 내에서 Stem 구조를 형성하는 뉴클레오타이드, 및 crRNA에 포함된 일부 뉴클레오타이드와 상보적인 결합을 형성하고 있는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제3 영역은 Stem 4 부분(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)) 및 Stem 3-PK (R:AR-1) 부분 중 tracrRNA에 속한 뉴클레오타이드(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 포함한다. 상기 제3 영역은 상기 Stem 4 부분 및/또는 Stem 3-PK (R:AR-1) 부분 중 tracrRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제3 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, 및/또는 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 뉴클레오타이드는 Stem 3-PK (R:AR-1) 부분 중 tracrRNA에 속한 뉴클레오타이드일 수 있다.
상기 제3 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 RuvC 도메인 및/또는 이량체를 이루는 다른 하나의 Cas12f1 단백질의 REC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 뉴클레오타이드는 Stem 4 부분에 포함된 뉴클레오타이드일 수 있다.
상기 제3 영역은 crRNA의 제6 영역에 포함된 하나 이상의 뉴클레오타이드와 상보적으로 결합하는 하나 이상의 뉴클레오타이드를 포함한다.
일 구현예로, 상기 제3 영역은 서열번호 1 또는 2로 표현되는 tracrRNA의 5'말단으로부터 73번째 뉴클레오타이드부터 127번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제3 영역의 서열은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3' (서열번호 12일) 수 있다.
스캐폴드 영역 4 - 제4 영역
본 명세서에서 "제4 영역"이라고 쓰는 경우, tracrRNA의 제3 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제4 영역은 CRISPR/Cas12f1 복합체 내에서 crRNA에 포함된 일부 뉴클레오타이드와 상보적인 결합을 형성할 수 있는 뉴클레오타이드를 포함하고, 이와 인접한 뉴클레오타이드를 포함할 수 있다.
상기 제4 영역은 Stem 5 (R:AR-2) 중 tracrRNA에 속한 뉴클레오타이드를 포함한다(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)). 상기 제4 영역은 상기 Stem 5 (R:AR-2) 중 tracrRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 뉴클레오타이드를 포함할 수 있다.
상기 제4 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, 및/또는 ZF 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때 상기 뉴클레오타이드는 Stem 5 (R:AR-2) 중 tracrRNA에 속한 뉴클레오타이드일 수 있다.
상기 제4 영역은 crRNA의 제5 영역에 포함된 하나 이상의 뉴클레오타이드와 상보적으로 결합하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 상기 제4 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제4 영역은 서열번호 1으로 표현되는 tracrRNA의 5'말단으로부터 128번째 뉴클레오타이드부터 140번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제4 영역은 서열번호 2으로 표현되는 tracrRNA의 5'말단으로부터 128번째 뉴클레오타이드부터 162번째 뉴클레오타이드까지를 의미할 수 있다.
일 구현예로, 상기 제4 영역의 서열은 5'-AACAAAUUCAUUU-3' (서열번호 13) 또는 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3' (서열번호 14일) 수 있다.
스캐폴드 영역 5 - 제5 영역
본 명세서에서 "제5 영역"이라고 쓰는 경우, crRNA 5'말단을 포함하는 영역을 지칭한다. 상기 제5 영역은 CRISPR/Cas12f1 복합체 내에서 상기 제4 영역의 하나 이상의 뉴클레오타이드와 상보적인 결합을 형성하는 뉴클레오타이드를 포함하며, 이와 인접한 임의의 뉴클레오타이드를 포함할 수 있다.
상기 제5 영역은 Stem 5 (R:AR-2) 부분 중 crRNA에 속한 뉴클레오타이드를 포함한다(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)). 상기 제5 영역은 상기 Stem 5 (R:AR-2) 부분 중 crRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 임의의 뉴클레오타이드를 포함할 수 있다.
상기 제5 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, REC 도메인 및/또는 ZF 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때 상기 뉴클레오타이드는 Stem 5 (R:AR-2) 중 crRNA에 속한 뉴클레오타이드일 수 있다.
상기 제5 영역은 상기 제4 영역에 포함된 하나 이상의 뉴클레오타이드와 상보적으로 결합하는 하나 이상의 뉴클레오타이드를 포함할 수 있다. 상기 제5 영역은 CRISPR/Cas12f1 복합체에서, Cas12f1 단백질과 상호작용하지 않는 disordered region을 포함한다.
일 구현예로, 상기 제5 영역은 서열번호 3로 표현되는 crRNA의 5'말단으로부터 1번째 뉴클레오타이드부터 10번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제5 영역은 서열번호 4로 표현되는 crRNA의 5'말단으로부터 1번째 뉴클레오타이드부터 30번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제5 영역의 서열은 5'-GAAUGAAGGA-3' (서열번호 15) 또는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGA-3' (서열번호 16)일 수 있다.
스캐폴드 영역 6 - 제6 영역
본 명세서에서 "제6 영역"이라고 쓰는 경우, crRNA 내 상기 제5 영역의 3'말단 방향에 위치한 영역을 지칭한다. 상기 제6 영역은 CRISPR/Cas12f1 복합체 내에서 상기 제3 영역의 하나 이상의 뉴클레오타이드와 상보적인 결합을 형성하는 뉴클레오타이드를 포함하며, 이와 인접한 임의의 뉴클레오타이드를 포함할 수 있다.
상기 제6 영역은 PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드를 포함한다(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021)). 상기 제6 영역은 상기 PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드와 인접한 하나 이상의 임의의 뉴클레오타이드를 포함할 수 있다.
상기 제6 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, ZF 도메인 및/또는 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 뉴클레오타이드는 Stem 3-PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드일 수 있다.
일 구현예로, 상기 제6 영역은 서열번호 3로 표현되는 crRNA의 5'말단으로부터 11번째 뉴클레오타이드부터 17번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제6 영역은 서열번호 4로 표현되는 crRNA의 5'말단으로부터 31번째 뉴클레오타이드부터 37번째 뉴클레오타이드까지를 의미할 수 있다. 일 구현예로, 상기 제6 영역의 서열은 5'-AUGCAAC-3'일 수 있다.
스페이서
본 명세서에서 "스페이서"라 쓰는 경우, CRISPR/Cas12f1 시스템에서 표적 서열 부분과 혼성화되는 하나 이상의 뉴클레오타이드를 지칭한다. 상기 스페이서는, CRISPR/Cas12f1 시스템에서 가이드 RNA의 crRNA의 3'말단 부근의 10개 내지 50개의 연속된 뉴클레오타이드를 지칭한다. 상기 스페이서는 CRISPR/Cas12f1 시스템을 사용하여 편집하고자 하는 표적 핵산의 표적 서열에 대응하여 설계된다. 달리 표현하면, 상기 스페이서는 표적 핵산의 표적 서열에 따라 다양한 서열을 가질 수 있다.
엔지니어링 된 스캐폴드 영역 - 개괄
엔지니어링 된 스캐폴드 영역 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위해 도입할 수 있는 엔지니어링 된 스캐폴드 영역을 제공한다. 상기 엔지니어링 된 스캐폴드 영역은 전술한 U-rich tail과 시너지를 일으켜, 엔지니어링 된 Cas12f1 가이드 RNA가 사용된 CRISPR/Cas12f1 시스템의 유전자 편집 효율을 향상시킨다. 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 Cas12f1 가이드 RNA의 스캐폴드 영역(이하, 자연계에서 발견되는 스캐폴드 영역)에서 한 군데 이상이 변형되어, 이와는 다른 서열 및/또는 구조를 가지게 된 것이 특징이다.
이때, 상기 엔지니어링 된 스캐폴드 영역의 기능은 자연계에서 발견되는 스캐폴드 영역과 동일하거나, 유사한 기능을 가진다. 구체적으로, 상기 엔지니어링 된 스캐폴드 영역은 CRISPR/Cas12f1 복합체의 Cas12f1 단백질 이량체와 상호작용하는 기능을 가진다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 각 부분에 대응하는 영역을 포함한다. 구체적으로, 상기 엔지니어링 된 스캐폴드 영역은 제1 영역, 제2 영역, 제3 영역, 제4 영역, 제5 영역, 및 제6 영역을 포함하며, 이는 자연계에서 발견되는 스캐폴드 영역에 포함된 제1 영역 내지 제6 영역에 각각 대응된다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역 및/또는 제2 영역에 대응되는 영역을 포함하지 않을 수 있다.
싱글 가이드 RNA를 만들기 위한 변형
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA는 한 분자의 싱글 가이드 RNA일 수 있다. 따라서, 본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 각 영역 중 하나 이상이 변형된 것이고, 추가적으로 tracrRNA 제4 영역의 3'말단 및 crRNA 제5 영역의 5' 말단이 링커를 통해 연결된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 한 군데 이상이 변형되고, 상기 제4 영역의 3'말단 및 상기 제5 영역의 5'말단이 링커를 통해 연결된 것일 수 있다. 예를 들어, 상기 링커는 5'-GAAA-3'일 수 있다.
엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형
제1 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제1 영역이 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 '변형된 제1 영역'을 포함할 수 있다. 이때, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것이다. 이때, 상기 제거된 뉴클레오타이드는 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 영역에서 선택된 뉴클레오타이드이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역과 비교하여, 자연계에서 발견되는 제1 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있으며, 선택적으로, 상기 제1 영역 외 다른 부분도 변형된 것일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제1 영역 중 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 부분에 포함된 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제1 영역 중 Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제1 영역 중 CRISPR/Cas12f1 복합체에서 Cas12f1 단백질과 상호작용하지 않는 뉴클레오타이드일 수 있다.
일 구현예로, 상기 변형된 제1 영역은 3'말단 방향에 5'-A-3' 서열을 포함하는 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역이 제거된 것일 수 있다. 달리 표현해, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역과 대응되는 영역을 포함하지 않을 수 있다.
제1 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단의 1개 내지 20개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 연속된 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단에서, 바로 이전 문장에서 선택된 두 개의 수치범위 내 연속된 뉴클레오타이드가 제거된 것일 수 있다. 예를 들어, 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 5'말단의 1개 내지 3개의 연속된 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제1 영역은 적어도 하나의 뉴클레오타이드를 포함하며, 이는 5'-A-3'일 수 있다.
제1 영역 변형 내용 2 - 제1 영역 제거
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않을 수 있다.
제1 영역이 변형된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 상기 변형된 제1 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 및 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27)에서 선택된 것일 수 있다.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 119), 5'-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 120), 5'-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 121), 5'-AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 122), 5'-GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 123), 5'-GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 124), 5'-UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 125), 5'-GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 126), 5'-AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 127), 5'-AAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 128), 5'-AAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 129), 5'-UAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 130), 5'-AUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 131), 5'-GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 132), 5'-UGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 133), 5'-CUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 134), 5'-ACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 135), 5'-CACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 136), 5'-UCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 137), 및 5'-UUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 138)로 이루어진 군에서 선택된 서열; 및
5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3).
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 및 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 12, 및
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 및 서열번호 17 내지 27로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제1 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 168), 5'-AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 169), 5'-GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 170), 5'-AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 171), 5'-GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 172), 5'-GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 173), 5'-UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 174), 5'-GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 175), 5'-AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 176), 5'-AAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 177), 5'-AAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 178), 5'-UAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 179), 5'-AUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 180), 5'-GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 181), 5'-UGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 182), 5'-CUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 183), 5'-ACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 184), 5'-CACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 185), 5'-UCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 186), 및 5'-UUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 187)에서 선택된 서열일 수 있다.
제1 영역이 제거된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 379); 및
서열번호 3.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12, 및
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
서열번호 11,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 487)일 수 있다.
엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형
제2 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 돤 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제2 영역이 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 '변형된 제2 영역'을 포함할 수 있다. 이때, 상기 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것이다. 이때, 상기 제거된 뉴클레오타이드는 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 영역에서 선택된 뉴클레오타이드이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역과 비교하여, 자연계에서 발견되는 제2 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있으며, 선택적으로, 상기 제2 영역 외 다른 부분도 변형된 것일 수 있다. 일 구현예로, 상기 뉴클레오타이드의 제거는 상기 자연계에서 발견되는 제2 영역 중 Stem 구조를 형성하는 부분에서 일어난 것이고, 뉴클레오타이드가 상보적인 페어 단위로 제거된 것일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제2 영역 중 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 부분에 포함된 뉴클레오타이드일 수 있다.
일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제2 영역 중 Stem 2 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제2 영역 중 CRISPR/Cas12f1 복합체에서 Cas12f1 단백질과 상호작용하지 않는 뉴클레오타이드일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 3'말단 방향에 5'-G-3' 서열을 가지는 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역을 자연계에서 발견되는 스캐폴드 영역 중 제2 영역이 제거된 것일 수 있다. 달리 표현해, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제2 영역과 대응되는 영역을 포함하지 않을 수 있다.
제2 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 연속 또는 비연속적으로1개, 2개, 3개, 4개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개, 11 개, 12 개, 13 개, 14 개, 15 개, 16 개, 17 개, 18 개, 19 개, 20 개, 21 개, 22 개, 23 개, 24 개, 25 개, 26 개, 27 개, 28 개, 29 개, 30 개, 31 개, 32 개, 33 개, 34 개, 35 개, 36 개, 37 개, 38 개, 39 개, 40 개, 41 개, 42 개, 43 개, 44 개, 45 개, 46 개, 47 개, 48 개, 49 개, 50 개 또는 51개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및/또는 27번째 내지 51번째 뉴클레오타이드 중 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및/또는 27번째 내지 51번째 뉴클레오타이드 중 하나 이상의 뉴클레오타이드가 제거되고, 23번째 내지 26번째 뉴클레오타이드가 다른 것으로 치환된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 또는 22개의 연속된 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 27번째 내지 51번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 또는 25개의 연속된 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역의 서열은 적어도 5'-G-3'을 포함하는 것을 특징으로 한다.
제2 영역 변형 내용 2 - 상보적인 페어(complementary pair) 단위 제거
상기 제2 영역의 변형은 Stem 구조를 형성하는 부분에 포함된 서로 상보적인 결합을 하는 한 쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및 27번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및 27번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 상보적인 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 11 서열 기준으로, 5'말단으로부터 1번째 내지 22번째 뉴클레오타이드, 및 27번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
제2 영역 변형 내용 3 - 제2 영역 제거
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역 중 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역이 없는 것일 수 있다.
제2 영역이 변형된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 상기 변형된 제2 영역의 서열은 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361) 및 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362)로 이루어진 군에서 선택된 서열일 수 있다.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAAGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 381), 5'-CUUCACUGAUAAAGUGGAGAAUUAGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 382), 5'-CUUCACUGAUAAAGUGGAGAACUUAGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 383), 5'-CUUCACUGAUAAAGUGGAGAACUUAGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 384), 5'-CUUCACUGAUAAAGUGGAGAACCUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 385), 5'-CUUCACUGAUAAAGUGGAGAACCGUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 386), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUAGGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 387), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUAGAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 388), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 389), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCUUAGGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 390), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCAUUAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 391), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 392), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 393), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 394), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 395), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 396), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAUUAGCUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 397), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 398), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 399), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 400), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 401), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 402), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 403), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 404), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 405), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 406)로 이루어진 군에서 선택된 서열; 및
서열번호 3.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로, 서열번호 10, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열, 서열번호 12, 서열번호 13, 링커, 서열번호 15, 및 5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAAGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 408), 5'-CUUCACUGAUAAAGUGGAGAAUUAGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 409), 5'-CUUCACUGAUAAAGUGGAGAACUUAGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 410), 5'-CUUCACUGAUAAAGUGGAGAACUUAGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 411), 5'-CUUCACUGAUAAAGUGGAGAACCUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 412), 5'-CUUCACUGAUAAAGUGGAGAACCGUUAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 413), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUAGGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 414), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUAGAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 415), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 416), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCUUAGGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 417), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCAUUAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 418), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 419), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 420), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 421), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 422), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 423), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAUUAGCUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 424), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 425), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 426), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 427), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 428), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 429), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 430), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 431), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 432), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 433)로 이루어진 군에서 선택된 서열일 수 있다.
제2 영역이 제거된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAAGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호380); 및
서열번호 3.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12,
서열번호 14이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로, 서열번호 10, 서열번호 12, 서열번호 13, 링커, 서열번호 15, 및 5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAAGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 380)일 수 있다.
엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형
제3 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 돤 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제3 영역이 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함할 수 있다. 이때, 상기 변형된 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 하나 이상의 뉴클레오타이드가 제거된 것이다. 이때, 상기 제거된 뉴클레오타이드는 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 영역에서 선택된 뉴클레오타이드이다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역 중 제3 영역에 포함된 하나 이상의 뉴클레오타이드가 제거된 것을 포함할 수 있다. 일 구현예로, 상기 뉴클레오타이드의 제거는 상기 자연계에서 발견되는 제3 영역 중 Stem 구조를 형성하는 부분에서 일어난 것이고, 뉴클레오타이드가 베이스 페어 단위로 제거된 것일 수 있다. 일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제3 영역 중 CRISPR/Cas12f1 복합체에서 Stem 구조를 형성하는 부분에 포함된 뉴클레오타이드일 수 있다.
일 구현예로, 상기 제거된 뉴클레오타이드는 상기 자연계에서 발견되는 제3 영역 중 Stem 4 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3', 5'-UUCG-3', 및 5'-CUCGA-3' 서열을 가지는 것을 특징으로 한다.
제3 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 연속적으로 또는 비연속적으로1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및/또는 41번째 내지 50번째 뉴클레오타이드 중 적어도 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 연속된 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제2 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 41번째 내지 50번째 뉴클레오타이드 중 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 연속된 뉴클레오타이드가 제거된 것일 수 있다.
제3 영역 변형 내용 2 - 상보적인 페어 단위 제거
상기 제3 영역의 변형은 Stem 구조를 형성하는 부분에 포함된 서로 상보적인 결합을 하는 한 쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및 41번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및 41번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 상보적인 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제3 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서, 서열번호 12 서열 기준, 5'말단으로부터 27번째 내지 36번째 뉴클레오타이드, 및 41번째 내지 50번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
제3 영역이 변형된 엔지니어링 된 스캐폴드 서열 예시
일 구현예로, 상기 변형된 제3 영역의 서열은 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447)로 이루어진 군에서 선택된 서열일 수 있다.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 448), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 449), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 450), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 451), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 452), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 453), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGAAACAAAUUCAUUU-3'(서열번호 454), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGAAACAAAUUCAUUU-3'(서열번호 455), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGAAACAAAUUCAUUU-3'(서열번호 456), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGAAACAAAUUCAUUU-3'(서열번호 457), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGAAACAAAUUCAUUU-3'(서열번호 458), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGAAACAAAUUCAUUU-3'(서열번호 459), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGAAACAAAUUCAUUU-3'(서열번호 460)로 이루어진 군에서 선택된 서열; 및
서열번호 3.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 14가 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 16 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 링커, 서열번호 15, 및 5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제3 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 462), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 463), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 464), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 465), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 466), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 467), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 468), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 469), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 470), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 471), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 472), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 473), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 474)로 이루어진 군에서 선택된 서열일 수 있다.
엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형
제4 영역 및 제5 영역 변형 개괄
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역에서 제4 영역 및 제5 영역이 변형된 것일 수 있다. 상기 제4 영역 및 제5 영역은, 각각 tracrRNA의 일부 및 crRNA의 일부에 해당하는 영역으로, CRISPR/Cas12f1 복합체 내에서 서로 혼성화되어 Stem을 구성하는 부분을 포함하므로, 해당 부분이 같이 변형되어 엔지니어링 된 스캐폴드 영역을 구성할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및/또는 변형된 제5 영역을 포함할 수 있다.
변형된 제4 영역은 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서 하나 이상의 뉴클레오타이드가 제거된 것을 특징으로 한다. 변형된 제5 영역은 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서 하나 이상의 뉴클레오타이드가 제거된 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역 중 제4 영역 및/또는 제5 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역은 5'말단 방향에 5'-AACAAA-3' 서열을 가진다. 일 구현예로, 상기 변형된 제5 영역은 3'말단 방향에 5'-GGA-3' 서열을 가진다.
제4 영역 및 제5 영역 변형 내용 1 - 일부 뉴클레오타이드 제거
상기 엔지니어링 된 스캐폴드 영역의 제4 영역은 자연계에서 발견되는 스캐폴드 영역 중 제4 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 상기 엔지니어링 된 스캐폴드 영역의 제5 영역은 자연계에서 발견되는 스캐폴드 영역 중 제5 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제4 영역은 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서 연속 또는 비연속적으로1개,2 개,3 개,4 개,5 개,6 개,7 개,8 개,9 개,10 개,11 개,12 개,13 개,14 개,15 개,16 개,17 개,18 개,19 개,20 개,21 개,22 개,23 개,24 개,25 개,26 개,27 개 또는 28개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제4 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서, 서열번호 13 서열 기준, 5'말단으로부터 7번째 내지 13번째 뉴클레오타이드 중 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제4 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역에서, 서열번호 14 서열 기준, 5'말단으로부터 7번째 내지 34번째 뉴클레오타이드 중 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역의 서열은 적어도 5'-AACAAA-3'을 포함하는 것을 특징으로 한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제5 영역은 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서 1개 내지 7개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 변형된 제5 영역은 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서 연속 또는 비연속적으로 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개 또는 27개의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서, 서열번호 15 서열 기준, 5'말단으로부터 1번째 내지 7번째 뉴클레오타이드 중 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 일 구현예로, 상기 변형된 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제5 영역에서, 서열번호 16 서열 기준, 5'말단으로부터 1번째 내지 27번째 뉴클레오타이드 중 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제5 영역의 서열은 적어도 5'-GGA-3'을 포함하는 것을 특징으로 한다.
제4 영역 및 제5 영역 변형 내용 3 - 상보적인 페어 단위 제거
상기 제4 영역 및 제5 영역은 CRISPR/Cas12 복합체 내에서 서로 상보적으로 결합하여 Stem을 이루는 것으로 알려져 있다. 전술한 제4 영역 및 제5 영역의 변형은 이러한 Stem을 구성하는 하나 이상의 뉴클레오타이드를 대상으로 하므로, 상기 제4 영역 및 제5 영역의 변형은 Stem을 구성하는 뉴클레오타이드들을 상보적인 페어 단위로 제거하는 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 13 서열 기준, 7번째 내지 13번째 뉴클레오타이드 및, 서열번호 15 서열 기준, 1번째 내지 7번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 13 서열 기준, 7번째 내지 13번째 뉴클레오타이드 및, 서열번호 15 서열 기준, 1번째 내지 7번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 상보적인 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 13 서열 기준, 7번째 내지 13번째 뉴클레오타이드 및, 서열번호 15 서열 기준, 1번째 내지 7번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 14 서열 기준, 7번째 내지 34번째 뉴클레오타이드 및, 서열번호 16 서열 기준, 1번째 내지 27번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 14 서열 기준, 7번째 내지 34번째 뉴클레오타이드 및, 서열번호 16 서열 기준, 1번째 내지 27번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 상보적인 페어를 이루지 않는 1개 이상의 뉴클레오타이드가 제거된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역 및 제5 영역은 상기 자연계에서 발견되는 스캐폴드 영역의 제4 영역 및 제5 영역에서, 서열번호 14 서열 기준, 7번째 내지 34번째 뉴클레오타이드 및, 서열번호 16 서열 기준, 1번째 내지 27번째 뉴클레오타이드 중 CRISPR/Cas12f1 복합체에서 상보적인 페어를 이루는 1쌍 이상의 뉴클레오타이드 및/또는 미스매치인 1쌍 이상의 뉴클레오타이드가 제거된 것일 수 있다.
변형된 제4 영역 및 제5 영역 서열 예시
일 구현예로, 상기 변형된 제4 영역의 서열은 5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 및 5'-AACAAAUUCAUU-3'(서열번호 69)로 이루어진 군에서 선택된 것일 수 있다.
일 구현예로, 상기 변형된 제4 영역의 서열은 5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 5'-AACAAAUUCAUUU-3'(서열번호 70), 5'-AACAAAUUCAUUUU-3'(서열번호 71), 5'-AACAAAUUCAUUUUU-3'(서열번호 72), 5'-AACAAAUUCAUUUUUC-3'(서열번호 73), 5'-AACAAAUUCAUUUUUCC-3'(서열번호 74), 5'-AACAAAUUCAUUUUUCCU-3'(서열번호 75), 5'-AACAAAUUCAUUUUUCCUC-3'(서열번호 76), 5'-AACAAAUUCAUUUUUCCUCU-3'(서열번호 77), 5'-AACAAAUUCAUUUUUCCUCUC-3'(서열번호 78), 5'-AACAAAUUCAUUUUUCCUCUCC-3'(서열번호 79), 5'-AACAAAUUCAUUUUUCCUCUCCA-3'(서열번호 80), 5'-AACAAAUUCAUUUUUCCUCUCCAA-3'(서열번호 81), 5'-AACAAAUUCAUUUUUCCUCUCCAAU-3'(서열번호 82), 5'-AACAAAUUCAUUUUUCCUCUCCAAUU-3'(서열번호 83), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUC-3'(서열번호 84), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCU-3'(서열번호 85), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUG-3'(서열번호 86), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGC-3'(서열번호 87), 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCA-3'(서열번호 88), 5'-AAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC-3'(서열번호 89), 및 5'-AACAAAUUCAUUUUUCCUCUCCAAUUCUGCACA-3'(서열번호 90)로 이루어진 군에서 선택된 것일 수 있다.
일 구현예로, 상기 변형된 제5 영역의 서열은 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'에서 선택된 것일 수 있다.
일 구현예로, 상기 변형된 제5 영역의 서열은 5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 5'-GAAUGAAGGA-3'(서열번호 91), 5'-CGAAUGAAGGA-3'(서열번호 92), 5'-ACGAAUGAAGGA-3'(서열번호 93), 5'-GACGAAUGAAGGA-3'(서열번호 94), 5'-AGACGAAUGAAGGA-3'(서열번호 95), 5'-UAGACGAAUGAAGGA-3'(서열번호 96), 5'-AUAGACGAAUGAAGGA-3'(서열번호 97), 5'-AAUAGACGAAUGAAGGA-3'(서열번호 98), 5'-GAAUAGACGAAUGAAGGA-3'(서열번호 99), 5'-CGAAUAGACGAAUGAAGGA-3'(서열번호 100), 5'-CCGAAUAGACGAAUGAAGGA-3'(서열번호 101), 5'-CCCGAAUAGACGAAUGAAGGA-3'(서열번호 102), 5'-ACCCGAAUAGACGAAUGAAGGA-3'(서열번호 103), 5'-AACCCGAAUAGACGAAUGAAGGA-3'(서열번호 104), 5'-GAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 105), 5'-AGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 106), 5'-CAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 107), 5'-GCAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 108), 5'-UGCAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 109), 및 5'-UUGCAGAACCCGAAUAGACGAAUGAAGGA-3'(서열번호 110)로 이루어진 군에서 선택된 것일 수 있다.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3',서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 150), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAU-3'(서열번호 151), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUU-3'(서열번호 152), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUC-3'(서열번호 153), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCA-3'(서열번호 154), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAU-3'(서열번호 155), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUU-3'(서열번호 156)로 이루어진 군에서 선택된 서열; 및
5'-GGAAUGCAAC-3', 5'-AGGAAUGCAAC-3', 5'-AAGGAAUGCAAC-3', 5'-GAAGGAAUGCAAC-3', 5'-UGAAGGAAUGCAAC-3', 5'-AUGAAGGAAUGCAAC-3', 및 5'-AAUGAAGGAAUGCAAC-3'로 이루어진 군에서 선택된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 90으로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 서열번호 91 내지 110으로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 12, 및
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 및 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117)에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 200), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUGAAAAGGAAUGCAAC-3'(서열번호 201), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUGAAAAAGGAAUGCAAC-3'(서열번호 202), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGAAAGAAGGAAUGCAAC-3'(서열번호 203), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGAAAUGAAGGAAUGCAAC-3'(서열번호 204), 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUGAAAAUGAAGGAAUGCAAC-3'(서열번호 205), 및 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGAAAAAUGAAGGAAUGCAAC-3'(서열번호 206)로 이루어진 군에서 선택된 것일 수 있다.
엔지니어링 된 스캐폴드 영역 5 - 제6 영역 변형
본 명세서에서 제공하는 엔지니어링 된 스캐폴드에서 제6 영역은 PK (R:AR-1) 부분 중 crRNA에 속한 뉴클레오타이드를 포함하는 영역이다. 전술한 바, 상기 제6 영역은 CRISPR/Cas12f1 복합체에서, 이량체를 이루는 하나의 Cas12f1 단백질의 WED 도메인, ZF 도메인 및/또는 RuvC 도메인과 상호작용하는 하나 이상의 뉴클레오타이드를 포함한다. 상기 엔지니어링 된 스캐폴드의 제6 영역은 자연계에서 발견되는 스캐폴드의 제6 영역과 동일하거나, 상기 제6 영역의 기능이 손상되지 않는 한도 내에서 변형된 것일 수 있다.
엔지니어링 된 스캐폴드 영역 6 - 각 변형의 조합
각 변형의 조합 개괄
본 명세서에서 제공하는 엔지니어링 된 Cas12f1 가이드 RNA에 포함된 엔지니어링 된 스캐폴드 영역은, 자연계에서 발견되는 스캐폴드 영역에 전술한 각 영역 별 변형이 하나 이상 조합된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 및 변형된 제2 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 제1 영역 및 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 및 변형된 제3 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 몇 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제3 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 및 변형된 제3 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것일 수 있다.
이때, 상기 변형된 영역은 전술한 각 영역의 변형 단락에서 설명된 바와 같다.
각 변형의 조합 1 - 제1 영역 변형 및 제2 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제2 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 157); 및
5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3).
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
일 구현예로, 제1 영역 및 제2 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 207)일 수 있다.
각 변형의 조합 2 - 제2 영역 변형 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 3 - 제1 영역 변형 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 4 - 제1 영역 제거 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 상기 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 12, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'에서 3'말단 방향으로,
서열번호 12,
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 5 - 제1 영역 변형 및 제3 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역 및 변형된 제3 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 12,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 6 - 제3 영역 변형 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역이 변형되고 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형되고 제1 영역이 제거된 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 7 - 제1 영역 변형 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 158); 및
5'-GGAAUGCAAC-3'(서열번호 161).
일 구현예로, 제1 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제1 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 208)일 수 있다.
각 변형의 조합 8 - 제4 영역 및 제5 영역 변형 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 9 - 제2 영역 변형 및 제3 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제3 영역을 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 10 - 제3 영역 변형 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역이 변형되고 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형되고 제2 영역이 제거된 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 11 - 제2 영역 변형 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 159); 및
5'-GGAAUGCAAC-3'(서열번호 161).
일 구현예로, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACUUAGAGUGAAGGUGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 209)일 수 있다.
각 변형의 조합 12 - 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 13 - 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
서열번호 10,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 14 - 제1 영역 변형, 제2 영역 변형, 및 제3 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 및 변형된 제3 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제2 영역, 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제2 영역, 및 제3 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 15 - 제2 영역 변형, 제3 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제2 영역, 및 제3 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 및 제3 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 16 - 제1 영역 변형, 제3 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역, 및 제3 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 및 제3 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 17 - 제3 영역 변형, 제1 영역 제거, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다.
5'말단에서 3'말단 방향으로,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13이 연결된 서열; 및
5'말단에서 3'말단 방향으로, 서열번호 15 및 5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
서열번호 13,
링커,
서열번호 15, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
이때, 상기 링커는 5'-GAAA-3'일 수 있다.
각 변형의 조합 18 - 제1 영역 변형, 제2 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제2 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-ACCGCUUCACCAUUAGUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAA-3'(서열번호 160); 및
5'-GGAAUGCAAC-3'(서열번호 161).
일 구현예로, 제1 영역, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
일 구현예로, 제1 영역, 제2 영역 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 영역의 서열은 5'-ACCGCUUCACUUAGAGUGAAGGUGGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAGAAAGGAAUGCAAC-3'(서열번호 210)일 수 있다.
각 변형의 조합 19 - 제2 영역 변형, 제4 영역 및 제5 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 20 - 제1 영역 변형, 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역, 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 21 - 제4 영역 및 제5 영역 변형, 제1 영역 제거, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 12, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 12,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 22 - 제1 영역 변형, 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 23 - 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 11,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 24 - 제2 영역 변형, 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 25 - 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역, 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어린 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어린 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 10,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 26 - 제1 영역 변형, 제2 영역 변형, 제3 영역 변형, 및 제4 영역 및 제5 영역 변형
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제2 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함한다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다.
일 구현예로, 제1 영역, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 27 - 제2 영역 변형, 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제1 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제2 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역이 제거된 것이다. 이때, 상기 변형된 제2 영역은 "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제2 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 및 서열번호 342 내지 362로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 28 - 제1 영역 변형, 제3 영역 변형, 제4 영역 및 제5 영역 변형, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제1 영역, 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제2 영역이 제거된 것이다. 이때, 상기 변형된 제1 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제1 영역, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 서열번호 17 내지 27으로 이루어진 군에서 선택된 서열,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 29 - 제3 영역 변형, 제4 영역 변형, 제1 영역 제거, 및 제2 영역 제거
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역은 변형된 제3 영역 및 변형된 제4 영역 및 제5 영역을 포함하고, 제1 영역 및 제2 영역이 제거된 것이다. 이때, 상기 변형된 제3 영역은 "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 변형된 제4 영역 및 제5 영역은 "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형" 단락에서 설명된 변형을 모두 포함한다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역과 대응되는 영역을 포함하지 않는다. 이때, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역과 대응되는 영역을 포함하지 않는다.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 다음을 포함할 수 있다:
서열번호 434 내지 447로 이루어진 군에서 선택된 서열, 및
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 서열번호 67 내지 69로 이루어진 군에서 선택된 서열이 연결된 서열; 및
5'말단에서 3'말단 방향으로,
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 및 5'-AAUGAAGGA-3'로 이루어진 군에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 서열.
일 구현예로, 제3 영역, 및 제4 영역 및 제5 영역이 변형되고, 제1 영역 및 제2 영역이 제거된 엔지니어링 된 스캐폴드 서열은 5'말단에서 3'말단 방향으로,
서열번호 434 내지 447로 이루어진 군에서 선택된 서열,
서열번호 111 내지 117에서 선택된 서열, 및
5'-AUGCAAC-3'가 연결된 것일 수 있다.
각 변형의 조합 30 - 제6 영역의 추가적인 변형
전술한 바, 제6 영역 또한 그 기능이 손상되지 않는 범위 내에서 변형될 수 있으므로, 본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 전술한 제1 영역, 제2 영역, 제3 영역, 제4 영역, 및/또는 제5 영역의 변형 내지 제1 영역 및/또는 제2 영역의 제거 외, 제6 영역이 추가적으로 변형된 것일 수 있다.
엔지니어링 된 스캐폴드 영역 7 - 동일성을 가지는 있는 서열 포함
본 명세서에서 제공하는 엔지니어링 된 스캐폴드 영역은 "엔지니어링 된 스캐폴드 영역 1 - 제1 영역 변형", "엔지니어링 된 스캐폴드 영역 2 - 제2 영역 변형", "엔지니어링 된 스캐폴드 영역 3 - 제3 영역 변형", "엔지니어링 된 스캐폴드 영역 4 - 제4 영역 및 제5 영역 변형", 및 "엔지니어링 된 스캐폴드 영역 5 - 각 변형의 조합" 단락에서 서술된 엔지니어링 된 스캐폴드 영역(이하, 전술한 엔지니어링 된 스캐폴드 영역)의 서열과 동일성(identity)을 가지는 서열을 포함한다.
일 구현예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 전술한 엔지니어링 된 스캐폴드 영역의 서열 중 어느 하나와 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 또는 50% 의 서열 동일성(sequence identity), 또는 서열 상동성(sequence homology)을 가지는 서열일 수 있다. 일 구현예로, 상기 스캐폴드 서열은 전술한 엔지니어링 된 스캐폴드 영역의 서열 중 어느 하나와 바로 이전 문장에서 선택된 두 수치 범위 내의 %로 일치하는 서열일 수 있다. 예를 들어, 상기 스캐폴드 서열은 전술한 엔지니어링 된 스캐폴드 영역의 서열 중 어느 하나와 90% 내지 100% 일치하는 서열일 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA
엔지니어링 된 Cas12f1 가이드 RNA 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템의 세포 내 유전자 편집 효율을 높이기 위한, 엔지니어링 된 Cas12f1 가이드 RNA를 제공한다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드, 스페이서, 및 U-rich tail을 포함한다. 이때, 상기 엔지니어링 된 스캐폴드는 전술한 "엔지니어링 된 스캐폴드 영역"에서 설명된 것 중 어느 하나일 수 있다. 이때, 상기 U-rich tail은 "U-rich tail" 단락에서 설명된 것 중 어느 하나일 수 있다.
싱글 가이드 RNA 또는 듀얼 가이드 RNA
상기 엔지니어링 된 Cas12f1 가이드 RNA는 싱글 가이드 RNA 또는 듀얼 가이드 RNA일 수 있다. 상기 듀얼 가이드 RNA는, 가이드 RNA가 tracrRNA 및 crRNA의 독립적인 두 분자 RNA로 구성된 것을 의미한다. 상기 싱글 가이드 RNA는 (엔지니어링 된) tracrRNA의 3'말단 및 (엔지니어링 된) crRNA의 5' 말단이 링커를 통해 연결되어 하나의 분자를 형성한 것을 의미한다. 달리 표현하면, 상기 듀얼 가이드 RNA에서, 엔지니어링 된 스캐폴드에 포함된 제4 영역의 3'말단 및 제5 영역의 5'말단이 링커를 통해 연결된 것을 의미한다. 이때, 엔지니어링 된 스캐폴드의 각 영역은 "엔지니어링 된 스캐폴드 영역" 단락들에서 설명된 변형, 및 그 구체적인 서열을 모두 포함할 수 있다.
엔지니어링 된 싱글 가이드 RNA 예시 1
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 유리딘 연속 서열, 또는 변형된 유리딘 연속 서열을 포함할 수 있다. 일 예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다. 또 다른 예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다.
상기 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로, 자연계에서 발견되는 스캐폴드 영역과 대응되는 제1 영역, 제2 영역, 제3 영역, 제4 영역, 링커, 제5 영역, 제6 영역이 순서대로 연결된 것이며, 자연계에서 발견되는 스캐폴드 영역과 비교해 제1 영역, 제2 영역, 제4 영역, 및 제5 영역에서 선택된 하나 이상의 영역이 변형된 것이다.
일 예로, 상기 엔지니어링 된 스캐폴드 영역의 제1 영역이 변형된 경우, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 제거된 뉴클레오타이드는 상기 제1 영역 중 Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 이때, 상기 변형된 제1 영역의 서열은 5'-A-3'을 포함하는 것을 특징으로 한다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제2 영역이 변형된 경우, 상기 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제2 영역 중 Stem 2 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 상보적인 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제2 영역의 서열은 적어도 5'-CCGCUUCACCA-3'(서열번호 51) 및 5'-UGAGUGAAGGUG-3'(서열번호 52)을 포함하는 것을 특징으로 한다. 더 구체적으로, 상기 변형된 제2 영역의 서열은 5'말단에서 3'말단 방향으로 5'-CCGCUUCACCA-3'(서열번호 51) 및 5'-UGAGUGAAGGUG-3'(서열번호 52)가 순서대로 연결되어 있을 수 있으며, 적절한 중간 서열을 통해 연결되어 있을 수 있다. 일 예로, 상기 중간 서열은 5'-UUAG-3', 5'-AUUAGU-3', 5'-AAUUAGCU-3', 5'-AAAUUAGACU-3'(서열번호 58), 5'-AAAGUUAGAACU-3'(서열번호 59), 5'-AAAGCUUAGGAACU-3'(서열번호 60), 5'-AAAGCUUUAGAGAACU-3'(서열번호 61), 5'-AAAGCUGUUAGUUAGAACU-3'(서열번호 62), 5'-AAAGCUGUUAGUAGAACU-3'(서열번호 63), 5'-AAAGCUGUUUAGAUUAGAACU-3'(서열번호 64), 5'-AAAGCUGUCUUAGGAUUAGAACU-3'(서열번호 65), 및 5'-AAAGCUGUCCUUAGGGAUUAGAACU-3'(서열번호 66)로 이루어진 군에서 선택된 것일 수 있다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제4 영역 및 제5 영역이 변형된 경우, 상기 변형된 제4 영역 및 제5 영역은 자연계에서 발견되는 스캐폴드 영역 중 제4 영역 및/또는 제5 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제4 영역 및 제5 영역 중 Stem 5 (R:AR-2) 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 상보적인 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제4 영역의 서열은 적어도 5'-AACAAA-3'을 포함하는 것을 특징으로 한다. 이때, 상기 변형된 제5 영역의 서열은 적어도 5'-GGA-3'을 포함하는 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 2
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 내지 10이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 39), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 40), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 41), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 42), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 43), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 44), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 45), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 46), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 47), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 48), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 49), 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 50), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3',
이때, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 3
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 내지 10이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-A-3'로 표현되는 제1 서열;
5'-CCGCUUCACCA-3'(서열번호 51)로 표현되는 제2 서열;
5'-UUAG-3'로 표현되는 제3 서열;
5'-UGAGUGAAGGUG-3'(서열번호 52)로 표현되는 제4 서열;
5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 표현되는 제5 서열;
5'-AACAAA-3'로 표현되는 제6 서열;
링커;
5'-GGA-3'로 표현되는 제7 서열; 및
5'-AUGCAAC-3'로 표현되는 제8 서열.
일 예로, 상기 링커는 5'-GAAA-3'일 수 있다.
또 다른 예로, 상기 링커는 5'-GAAA-3', 5'-UGAAAA-3', 5'-UUGAAAAA-3', 5'-UUCGAAAGAA-3'(서열번호 642), 5'-UUCAGAAAUGAA-3'(서열번호 643), 5'-UUCAUGAAAAUGAA-3'(서열번호 644), 및 5'-UUCAUUGAAAAAUGAA-3'(서열번호 645)로 이루어진 군에서 선택된 것일 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-GA-3', 5'-AGA-3', 5'-GAGA-3', 5'-GGAGA-3', 5'-UGGAGA-3', 5'-GUGGAGA-3', 5'-AGUGGAGA-3', 5'-AAGUGGAGA-3', 5'-AAAGUGGAGA-3'(서열번호 28), 5'-UAAAGUGGAGA-3'(서열번호 29), 5'-AUAAAGUGGAGA-3'(서열번호 30), 5'-GAUAAAGUGGAGA-3'(서열번호 31), 5'-UGAUAAAGUGGAGA-3'(서열번호 32), 5'-CUGAUAAAGUGGAGA-3'(서열번호 33), 5'-ACUGAUAAAGUGGAGA-3'(서열번호 34), 5'-CACUGAUAAAGUGGAGA-3'(서열번호 35), 5'-UCACUGAUAAAGUGGAGA-3'(서열번호 36), 5'-UUCACUGAUAAAGUGGAGA-3'(서열번호 37), 및 5'-CUUCACUGAUAAAGUGGAGA-3'(서열번호 38)로 이루어진 군에서 선택된 제9 서열을 추가적으로 포함할 수 있다. 이때, 상기 제9 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAA-3', 5'-AAAG-3', 5'-AAAGC-3', 5'-AAAGCU-3', 5'-AAAGCUG-3', 5'-AAAGCUGU-3', 5'-AAAGCUGUC-3', 5'-AAAGCUGUCC-3'(서열번호 53), 및 5'-AAAGCUGUCCC-3'(서열번호 54)로 이루어진 군에서 선택된 제10 서열을 추가적으로 포함할 수 있다. 이때, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-CU-3', 5'-ACU-3', 5'-AACU-3', 5'-GAACU-3', 5'-AGAACU-3', 5'-UAGAACU-3', 5'-UUAGAACU-3', 5'-AUUAGAACU-3', 5'-GAUUAGAACU-3'(서열번호 55), 5'-GGAUUAGAACU-3'(서열번호 56), 및 5'-GGGAUUAGAACU-3'(서열번호 57)로 이루어진 군에서 선택된 제11 서열을 추가적으로 포함할 수 있다. 이때, 상기 제3 서열의 3'말단 및 상기 제4 서열의 5'말단은 상기 제11 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAA-3', 5'-AAAG-3', 5'-AAAGC-3', 5'-AAAGCU-3', 5'-AAAGCUG-3', 5'-AAAGCUGU-3', 5'-AAAGCUGUC-3', 5'-AAAGCUGUCC-3'(서열번호 53), 및 5'-AAAGCUGUCCC-3'(서열번호 54)로 이루어진 군에서 선택된 제10 서열 및 5'-U-3', 5'-CU-3', 5'-ACU-3', 5'-AACU-3', 5'-GAACU-3', 5'-AGAACU-3', 5'-UAGAACU-3', 5'-UUAGAACU-3', 5'-AUUAGAACU-3', 5'-GAUUAGAACU-3'(서열번호 55), 5'-GGAUUAGAACU-3'(서열번호 56), 및 5'-GGGAUUAGAACU-3'(서열번호 57)로 이루어진 군에서 선택된 제11 서열을 추가적으로 포함할 수 있다. 이때, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있고, 상기 제3 서열의 3'말단 및 상기 제4 서열의 5'말단은 상기 제11 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제10 서열이 5'-A-3'인 경우, 상기 제11 서열은 5'-U-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AA-3'인 경우, 상기 제11 서열은 5'-CU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAA-3'인 경우, 상기 제11 서열은 5'-ACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAG-3'인 경우, 상기 제11 서열은 5'-AACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGC-3'인 경우, 상기 제11 서열은 5'-GAACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCU-3'인 경우, 상기 제11 서열은 5'-AGAACU-3'일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUG-3'인 경우, 상기 제11 서열은 5'-UAGAACU-3' 또는 5'-UUAGAACU-3' 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGU-3'인 경우, 상기 제11 서열은 5'-AUUAGAACU-3' 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGUC-3'인 경우, 상기 제11 서열은 5'-GAUUAGAACU-3'(서열번호 55) 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGUCC-3'(서열번호 53)인 경우, 상기 제11 서열은 5'-GGAUUAGAACU-3'(서열번호 56) 일 수 있다. 또 다른 예로, 상기 제10 서열이 5'-AAAGCUGUCCC-3'(서열번호 54)인 경우, 상기 제11 서열은 5'-GGGAUUAGAACU-3'(서열번호 57) 일 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이루어진 군에서 선택된 제 12서열을 추가적으로 포함할 수 있다. 이때, 상기 제6 서열의 3'말단 및 상기 링커의 5'말단은 상기 제12 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이루어진 군에서 선택된 제 13서열을 추가적으로 포함할 수 있다. 이때, 상기 링커의 3'말단 및 상기 제7 서열의 5'말단은 상기 제13 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이루어진 군에서 선택된 제 12서열, 및 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이루어진 군에서 선택된 제 13서열을 추가적으로 포함할 수 있다. 이때, 상기 제6 서열의 3'말단 및 상기 링커의 5'말단은 상기 제12 서열을 통해 연결되고, 상기 링커의 3'말단 및 상기 제7 서열의 5'말단은 상기 제13 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제12 서열이 5'-U-3'인 경우, 상기 제13 서열은 5'-A-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UU-3'인 경우, 상기 제13 서열은 5'-AA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUC-3'인 경우, 상기 제13 서열은 5'-GAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCA-3'인 경우, 상기 제13 서열은 5'-UGAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCAU-3'인 경우, 상기 제13 서열은 5'-AUGAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCAUU-3'인 경우, 상기 제13 서열은 5'-AAUGAA-3'일 수 있다. 또 다른 예로, 상기 제12 서열이 5'-UUCAUUU-3'인 경우, 상기 제13 서열은 5'-GAAUGAA-3'일 수 있다.
엔지니어링 된 싱글 가이드 RNA 예시 4
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 유리딘 연속 서열, 또는 변형된 유리딘 연속 서열일 수 있다. 일 예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다. 또 다른 예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다.
상기 엔지니어링 된 스캐폴드 영역은 5'말단에서 3'말단 방향으로, 자연계에서 발견되는 스캐폴드 영역과 대응되는 제1 영역, 제2 영역, 제3 영역, 제4 영역, 링커, 제5 영역, 제6 영역이 순서대로 연결된 것이며, 자연계에서 발견되는 스캐폴드 영역과 비교해 제1 영역, 제2 영역, 제3 영역, 제4 영역, 및 제5 영역에서 선택된 하나 이상의 영역이 변형된 것일 수 있다. 더 나아가, 상기 엔지니어링 된 스캐폴드 영역은 자연계에서 발견되는 스캐폴드 영역과 대응되는 제1 영역 및/또는 제2 영역이 제거된 것일 수 있다.
일 예로, 상기 엔지니어링 된 스캐폴드 영역의 제1 영역이 변형된 경우, 상기 변형된 제1 영역은 자연계에서 발견되는 스캐폴드 영역의 제1 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 제거된 뉴클레오타이드는 상기 제1 영역 중 Stem 1 (Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))에 속하는 뉴클레오타이드일 수 있다. 이때, 상기 변형된 제1 영역의 서열은 5'-A-3'을 포함하는 것을 특징으로 한다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제2 영역이 변형된 경우, 상기 변형된 제2 영역은 자연계에서 발견되는 스캐폴드 영역의 제2 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제2 영역 중 Stem 2 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 상보적인 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제2 영역의 서열은 적어도 5'-G-3'을 포함하는 것을 특징으로 한다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제3 영역이 변형된 경우, 상기 변형된 제3 영역은 자연계에서 발견되는 스캐폴드 영역의 제3 영역에서 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제3 영역 중 Stem 4 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 상보적인 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제3 영역의 서열은 적어도 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475), 및 5'-CUCGA-3'을 포함하는 것을 특징으로 한다. 더 구체적으로, 상기 변형된 제3 영역의 서열은 5'말단에서 3'말단 방향으로 5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475) 및 5'-CUCGA-3'가 순서대로 연결되어 있을 수 있으며, 적절한 중간 서열을 통해 연결되어 있을 수 있다. 일 예로, 상기 중간 서열은 5'-UUCG-3', 5'-AUUCGC-3', 5'-AAUUCGC-3', 5'-AAUUCGCC-3', 5'-AAGUUCGCC-3', 5'-AAGUUCGACC-3'(서열번호 476), 5'-AAGUUUCGAACC-3'(서열번호 477), 5'-AAGUGUUCGUAACC-3'(서열번호 478), 5'-AAGUGCUUCGGUAACC-3'(서열번호 479), 5'-AAGUGCUUUCGAGUAACC-3'(서열번호 480), 5'-AAGUGCUCUUCGGAGUAACC-3'(서열번호 481), 5'-AAGUGCUUUUCGAAGUAACC-3'(서열번호 482), 5'-AAGUGCUUUUUCGAAAGUAACC-3'(서열번호 483), 및 5'-AAGUGCUUUCUUCGGAAAGUAACC-3'(서열번호 484)로 이루어진 군에서 선택된 것일 수 있다.
또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역의 제4 영역 및 제5 영역이 변형된 경우, 상기 변형된 제4 영역 및 제5 영역은 자연계에서 발견되는 스캐폴드 영역 중 제4 영역 및/또는 제5 영역의 하나 이상의 뉴클레오타이드가 제거된 것일 수 있다. 이때, 상기 뉴클레오타이드의 제거는 상기 제4 영역 및 제5 영역 중 Stem 5 (R:AR-2) 구조(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021))를 형성하는 부분에서 일어난 것이고, 서로 상보적인 페어를 이루는 뉴클레오타이드가 쌍 단위로 제거된 것일 수 있다. 이때, 상기 변형된 제4 영역의 서열은 적어도 5'-AACAAA-3'을 포함하는 것을 특징으로 한다. 이때, 상기 변형된 제5 영역의 서열은 적어도 5'-GGA-3'을 포함하는 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 5
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 0 내지 10이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3',
이때, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 한다.
엔지니어링 된 싱글 가이드 RNA 예시 6
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결된 것일 수 있다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고, c는 1 내지 10이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것이다:
5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475)로 표현되는 제1 서열;
5'-UUCG-3'로 표현되는 제2 서열;
5'-CUCGA-3'로 표현되는 제3 서열;
5'-AACAAA-3'로 표현되는 제4 서열;
링커;
5'-GGA-3'로 표현되는 제5 서열; 및
5'-AUGCAAC-3'로 표현되는 제6 서열.
일 예로, 상기 링커는 5'-GAAA-3'일 수 있다.
또 다른 예로, 상기 링커는 5'-GAAA-3', 5'-UGAAAA-3', 5'-UUGAAAAA-3', 5'-UUCGAAAGAA-3'(서열번호 642), 5'-UUCAGAAAUGAA-3'(서열번호 643), 5'-UUCAUGAAAAUGAA-3'(서열번호 644), 및 5'-UUCAUUGAAAAAUGAA-3'(서열번호 645)로 이루어진 군에서 선택된 것일 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제7 서열을 추가적으로 포함할 수 있다. 이때 상기 제7 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362) 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제8 서열을 추가적으로 포함할 수 있다. 이때 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제7 서열을 추가적으로 포함하고, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제8 서열을 추가적으로 포함할 수 있다. 이때 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAG-3', 5'-AAGU-3', 5'-AAGUG-3', 5'-AAGUGC-3', 5'-AAGUGCU-3', 5'-AAGUGCUU-3', 5'-AAGUGCUUU-3', 5'-AAGUGCUUUC-3'(서열번호 485)로 이루어진 군에서 선택된 제9 서열을 추가적으로 포함할 수 있다. 이때, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-C-3', 5'-CC-3', 5'-ACC-3', 5'-AACC-3', 5'-UAACC-3', 5'-GUAACC-3', 5'-AGUAACC-3', 5'-AAGUAACC-3', 5'-AAAGUAACC-3', 5'-GAAAGUAACC-3'(서열번호 486)로 이루어진 군에서 선택된 제10 서열을 추가적으로 포함할 수 있다. 이때, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 일 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAG-3', 5'-AAGU-3', 5'-AAGUG-3', 5'-AAGUGC-3', 5'-AAGUGCU-3', 5'-AAGUGCUU-3', 5'-AAGUGCUUU-3', 5'-AAGUGCUUUC-3'(서열번호 485)로 이루어진 군에서 선택된 제9 서열을 추가적으로 포함하고, 5'-C-3', 5'-CC-3', 5'-ACC-3', 5'-AACC-3', 5'-UAACC-3', 5'-GUAACC-3', 5'-AGUAACC-3', 5'-AAGUAACC-3', 5'-AAAGUAACC-3', 5'-GAAAGUAACC-3'(서열번호 486)로 이루어진 군에서 선택된 제10 서열을 추가적으로 포함할 수 있다. 이때, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있고, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제9 서열이 5'-A-3'인 경우, 상기 제10 서열은 5'-C-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AA-3'인 경우, 상기 제10 서열은 5'-C-3', 또는 5'-CC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAG-3'인 경우, 상기 제10 서열은 5'-CC-3', 또는 5'-ACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGU-3'인 경우, 상기 제10 서열은 5'-AACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUG-3'인 경우, 상기 제10 서열은 5'-UAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGC-3'인 경우, 상기 제10 서열은 5'-GUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCU-3'인 경우, 상기 제10 서열은 5'-AGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUC-3'인 경우, 상기 제10 서열은 5'-GAGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUU-3'인 경우, 상기 제10 서열은 5'-AAGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUUU-3'인 경우, 상기 제10 서열은 5'-AAAGUAACC-3'일 수 있다. 또 다른 예로, 상기 제9 서열이 5'-AAGUGCUUUC-3'(서열번호 485)인 경우, 상기 제10 서열은 5'-GAAAGUAACC-3'(서열번호 486)일 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이루어진 군에서 선택된 제 11서열을 추가적으로 포함할 수 있다. 이때, 상기 제4 서열의 3'말단 및 상기 링커의 5'말단은 상기 제11 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이루어진 군에서 선택된 제 12서열을 추가적으로 포함할 수 있다. 이때, 상기 링커의 3'말단 및 상기 제5 서열의 5'말단은 상기 제12 서열을 통해 연결되어 있을 수 있다.
상기 구현예의 또 다른 구체예로, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이루어진 군에서 선택된 제 11서열, 및 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이루어진 군에서 선택된 제 12서열을 추가적으로 포함할 수 있다. 이때, 상기 제4 서열의 3'말단 및 상기 링커의 5'말단은 상기 제11 서열을 통해 연결되고, 상기 링커의 3'말단 및 상기 제5 서열의 5'말단은 상기 제12 서열을 통해 연결되어 있을 수 있다.
일 예로, 상기 제11 서열이 5'-U-3'인 경우, 상기 제12 서열은 5'-A-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UU-3'인 경우, 상기 제12 서열은 5'-AA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUC-3'인 경우, 상기 제12 서열은 5'-GAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCA-3'인 경우, 상기 제12 서열은 5'-UGAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCAU-3'인 경우, 상기 제12 서열은 5'-AUGAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCAUU-3'인 경우, 상기 제12 서열은 5'-AAUGAA-3'일 수 있다. 또 다른 예로, 상기 제11 서열이 5'-UUCAUUU-3'인 경우, 상기 제12 서열은 5'-GAAUGAA-3'일 수 있다.
엔지니어링 된 싱글 가이드 RNA 서열 예시
일 구현예로, 상기 엔지니어링 된 싱글 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551 에서 선택된 서열을 가질 수 있다.
엔지니어링 된 듀얼 가이드 RNA 예시
일 구현예로, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함한다.
상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가지며, 표적 서열과 상보적인 서열을 가진다.
상기 U-rich tail의 서열은 (UaN)bUc로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이다.
일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다.
상기 엔지니어링 된 스캐폴드 영역의 서열은 다음 서열을 포함한다:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제1 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제2 서열,
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 제3 서열,
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 및 5'-AACAAAUUCAUUU-3'(서열번호 13)로 이루어진 군에서 선택된 제4 서열이 연결된 엔지니어링 된 tracrRNA; 및
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 및 5'-GAAUGAAGGA-3'(서열번호 15)으로 이루어진 군에서 선택된 제5 서열, 및
5'-AUGCAAC-3'로 표현되는 제6 서열이 연결된 엔지니어링 된 crRNA 반복 서열 부분,
이때, 상기 엔지니어링 된 crRNA 반복 서열 부분의 3'말단은 상기 스페이서의 5'말단과 연결 되어 있다.
이때, 상기 엔지니어링 된 tracrRNA의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 1)과 상이하고, 및/또는 상기 엔지니어링 된 crRNA 반복 서열 부분은 5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3)과 상이하다.
일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 서열번호 1과 동일하고, 상기 엔지니어링 된 crRNA 반복 서열 부분은 서열번호 3과 상이할 수 있다. 또 다른 일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 서열번호 1과 상이하고, 상기 엔지니어링 된 crRNA 반복 서열 부분은 서열번호 3과 동일할 수 있다. 또 다른 일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 서열번호 1과 상이하고, 상기 엔지니어링 된 crRNA 반복 서열 부분은 서열번호 3과 상이할 수 있다.
일 예로, 상기 엔지니어링 된 tracrRNA의 서열은 상기 제1 서열 및/또는 제2 서열을 포함하지 않을 수 있다.
구체적으로, 상기 엔지니어링 된 tracrRNA의 서열은 다음으로 이루어진 군에서 선택된 것일 수 있다:
5'말단에서 3'말단 방향으로, 상기 제2 서열, 상기 제3 서열, 및 상기 제4 서열이 연결된 서열,
5'말단에서 3'말단 방향으로, 상기 제1 서열, 상기 제3 서열, 및 상기 제4 서열이 연결된 서열, 및
5'말단에서 3'말단 방향으로, 상기 제3 서열, 및 상기 제4 서열이 연결된 서열.
일 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAA-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-GGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUC-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-GAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCA-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-UGAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCAU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AUGAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCAUU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-AAUGAAGGA-3'를 포함할 수 있다. 또 다른 예로, 상기 엔지니어링 된 tracrRNA가 5'-AACAAAUUCAUUU-3'를 포함하는 경우, 상기 엔지니어링 된 crRNA는 5'-GAAUGAAGGA-3'를 포함할 수 있다.
엔지니어링 된 CRISPR/Cas12f1 복합체
CRISPR/Cas12f1 복합체 개괄
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공한다. 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함한다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에서 설명된 것이다.
일 구현예로, 본 명세서에서는 Cas12f1 단백질 및 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공한다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에서 설명된 것 중 어느 하나일 수 있다.
Cas12f1 단백질 - 개괄
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 단백질이 포함된다. 기본적으로, 상기 Cas12f1 단백질은 자연계에 존재하는 야생형 Cas12f1 단백질일 수 있다. 상기 Cas12f1 단백질을 암호화하는 서열은 야생형 Cas12f1 단백질에 대해 인간 코돈-최적화된 Cas12f1 서열일 수 있다. 또한, 상기 Cas12f1 단백질은 자연계에 존재하는 야생형 Cas12f1 단백질과 동일한 기능을 가질 수 있다. 하지만, 특별히 한정하지 않는 한, 본 명세서에서 "Cas12f1 단백질"이라고 할 때, 이는 야생형, 또는 코돈 최적화된 Cas12f1 단백질 뿐 아니라, 변형된 Cas12f1 단백질 내지 Cas12f1 융합 단백질도 포괄하여 의미할 수 있다. 또한, 자연계에 존재하는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 것 뿐 아니라, 상기 기능의 전부 또는 일부가 변형된 것, 상기 기능의 전부 또는 일부가 상실된 것, 및/또는 추가적인 기능이 부가된 것을 통틀어 일컬을 수 있다. Cas12f1 단백질의 의미는 문맥에 따라 적절히 해석될 수 있고, 특별한 경우가 아닌 한 가장 넓은 의미로 해석된다. 이하 Cas12f1 단백질의 구성, 또는 기능에 대해 자세히 설명한다.
Cas12f1 단백질 - 야생형 Cas12f1 단백질
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 단백질을 포함할 수 있다.
일 구현예로, 상기 Cas12f1 단백질은 야생형의 Cas12f1 단백질일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 유래한 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a 단백질(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 Cas14a1 단백질일 수 있다.
Cas12f1 단백질 - 변형된 Cas12f1 단백질
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 변형된 Cas12f1 단백질을 포함할 수 있다. 상기 변형된 Cas12f1은 야생형, 또는 코돈 최적화된 Cas12f1 단백질 서열에서 적어도 일부 서열이 변형된 것을 의미한다. 상기 Cas12f1 단백질 변형은 개별 아미노산 단위로 이루어진 것일 수 있고, 단백질의 기능적 도메인 단위로 이루어진 것일 수 있다.
일 구현예로, 상기 단백질의 변형은 야생형, 또는 코돈 최적화된 Cas12f1 단백질 서열에서 하나 이상의 아미노산, 펩타이드, 폴리펩타이드, 단백질, 및/또는 도메인이 개별적으로 치환, 제거, 및/또는 부가된 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 하나 이상의 아미노산, 펩타이드, 및/또는 폴리펩타이드가 치환, 제거, 및/또는 부가된 것일 수 있다.
Cas12f1 단백질 - Cas12f1 융합 단백질
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 융합 단백질을 포함할 수 있다. 이때, 상기 Cas12f1 융합 단백질은 야생형, 또는 변형된 Cas12f1 단백질에 추가적인 아미노산, 펩타이드, 폴리펩타이드, 단백질, 및/또는 도메인이 융합된 단백질을 의미한다.
일 구현예로, Cas12f1 단백질은 야생형의 Cas12f1 단백질에 베이스 에디터, 및/또는 역전사 효소(reverse transcriptase)가 융합된 것일 수 있다. 일 구현예로, 상기 베이스 에디터는 adenosine deaminase, 및/또는 cytidine deaminase일 수 있다. 일 구현예로, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다. 이때, 상기 역전사 효소가 융합된 Cas12f1 단백질은 프라임 에디터로 기능할 수 있다.
일 구현예로 , Cas12f1 단백질은 야생형의 Cas12f1 단백질에, 세포 내의 유전자 발현 과정에 관여할 수 있는 다양한 효소가 융합된 것일 수 있다. 이때, 상기 효소가 융합된 Cas12f1 단백질은 세포 내 유전자 발현에 다양한 양적, 질적 변화를 초래할 수 있다. 일 구현예로, 상기 효소는 VP64, DNMT, TET, KRAB, DHAC, LSD, 및/또는 p300일 수 있다.
Cas12f1 단백질 - 기능의 변경
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체에 포함된 Cas12f1 단백질은 야생형의 Cas12f1 단백질과 동일한 기능을 가질 수 있다. 본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체에 포함된 Cas12f1 단백질은 야생형의 Cas12f1 단백질과 비교할 때, 기능이 변경된 것일 수 있다. 구체적으로, 상기 변경은 전부 또는 일부 기능의 변형, 전부 또는 일부 기능의 상실, 및/또는 부가적인 기능의 추가일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 당업계 통상의 기술자가 CRISPR/Cas 시스템의 Cas 단백질에 적용할 수 있는 변경이라면, 특별히 제한되지 않는다. 이때 상기 변경은 공지의 기술을 이용한 것일 수 있다.
일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 더 나아가, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없도록 변경된 것일 수 있다. 더 나아가, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 것일 수 있다.
Cas12f1 단백질 - 기타 변형 예시
일 구현예로, 상기 Cas12f1 단백질은 NLS(Nuclear Localization Sequence), 또는 NES(Nuclear Export Sequence)를 포함할 수 있다. 구체적으로, 상기 NLS는 "용어의 정의" 중 NLS 단락에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 Cas12f1 단백질은 태그를 포함할 수 있다. 구체적으로, 상기 태그는 "용어의 정의" 중 태그 단락에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다.
Cas12f1 단백질 - PAM 서열
CRISPR/Cas12f1 복합체가 표적 유전자, 또는 표적 핵산을 절단하기 위해서는 두 가지 조건이 필요하다.
첫째, 표적 유전자, 또는 표적 핵산 내에 Cas12f1 단백질이 인식할 수 있는 일정 길이의 염기 서열(뉴클레오타이드 서열)이 있어야 한다. 이때, 상기 Cas12f1 단백질에 의해 인식되는 일정 길이의 염기 서열(뉴클레오타이드 서열)을 Protospacer Adjacent Motif(PAM) 서열이라 한다. 상기 PAM 서열은 상기 Cas12f1 단백질에 따라 정해지는 고유한 서열이다, 둘째, 상기 일정 길이의 PAM 서열 주변에 가이드 RNA에 포함된 스페이서 서열과 상보적으로 결합할 수 있는 서열이 있어야 한다.
이러한 두 가지 조건이 만족되어 1) Cas12f1 단백질이 상기 일정 길이의 PAM 서열을 인식하고, 2) 상기 스페이서 서열 부분이 상기 PAM 서열 주변 서열 부분과 상보적으로 결합하는 경우, Cas12f1 단백질/가이드 RNA 복합체(CRISPR/Cas12f1 복합체)는 표적 유전자, 또는 표적 핵산을 절단한다. 따라서, 상기 CRISPR/Cas12f1 복합체의 표적 서열을 결정할 때, 상기 PAM 서열과 인접한 서열 내에서 상기 표적 서열을 결정해야 한다는 제약이 따른다.
Cas12f1 단백질 - PAM 서열 예시
일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 T-rich 서열일 수 있다.
일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, THTN일 수 있다. 이때, 상기 N은 디옥시티미딘(T), 디옥시아데노신(A), 디옥시사이티딘(C), 또는 디옥시구아노신(G) 중 하나이며, 상기 H는 디옥시티미딘(T), 디옥시아데노신(A), 및 디옥시사이티딘(C) 중 하나이다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, TTTN일 수 있다. 이때, 상기 N은 디옥시티미딘(T), 디옥시아데노신(A), 디옥시사이티딘(C), 또는 디옥시구아노신(G) 중 하나이다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, TTTA, TTTT, TTTC, 또는 TTTG일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, TATA, TATT, TATC, 또는 TATG일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, TCTA, TCTT, TCTC, 또는 TCTG일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5' 말단에서 3' 말단 순서로, TTTA 또는 TTTG일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 야생형 Cas12f1 단백질의 PAM 서열과는 다른 것일 수 있다.
Cas12f1 단백질 - 서열 예시
일 구현예로, 상기 Cas12f1 단백질은 서열번호 260 내지 267로 이루어진 군에서 선택된 아미노산 서열을 가질 수 있다.
일 구현예로, 상기 Cas12f1 단백질을 암호화하는 DNA 서열은 인간 코돈-최적화된 서열일 수 있다.
일 구현예로, 상기 Cas12f1 단백질을 암호화하는 DNA 서열은 서열번호 268 내지 277로 이루어진 군에서 선택된 DNA 서열일 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA
본 명세서에서 제공되는 CRISPR/Cas12f1 복합체를 구성하는 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에서 설명된 것과 동일한 특징 및 구조를 가진다.
CRISPR/Cas12f1 복합체 - 구성 예시
일 구현예로, 상기 Cas12f1 단백질은 서열번호 260의 아미노산 서열을 가지고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 선택된 아미노산 서열을 가진다. 이 때, 상기 Cas12f1 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 CRISPR/Cas12f1 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 Cas12f1 단백질은 서열번호 264 내지 267 로 이루어진 군에서 선택된 아미노산 서열을 가지고, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 선택된 서열을 가진다. 이 때, 상기 Cas12f1 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA가 결합하여 이루어진 CRISPR/Cas12f1 복합체는 베이스 에디팅 기능을 가질 수 있다.
CRISPR/Cas12f1 시스템의 각 구성요소를 발현시키기 위한 벡터
벡터 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템의 구성 요소를 발현시키기 위한 벡터를 제공한다. 상기 벡터는 Cas12f1 단백질, 및/또는 엔지니어링 된 Cas12f1 가이드 RNA를 발현시키도록 구성된다. 상기 벡터의 서열은 상기 CRISPR/Cas12f1 시스템의 구성요소 중 하나를 암호화하는 핵산 서열을 포함하거나, 둘 이상의 구성요소를 암호화하는 핵산 서열을 포함할 수 있다. 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열 및/또는 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함한다. 상기 벡터의 서열은 하나 이상의 프로모터 서열을 포함한다. 상기 프로모터는 Cas12f1 단백질을 암호화하는 핵산 서열 및/또는 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열과 작동적으로 연결되어, 세포 내에서 상기 핵산 서열의 전사가 촉진될 수 있도록 한다. 상기 Cas12f1 단백질은 "엔지니어링 된 CRISPR/Cas12f1 복합체" 단락에서 설명된 Cas12f1 단백질, 변형된 Cas12f1 단백질, 및/또는 Cas12f1 융합 단백질과 동일한 특징 및 구성을 가진다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에서 설명된 엔지니어링 된 Cas12f1 가이드 RNA와 동일한 특징 및 구성을 가진다.
상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열, 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열을 포함할 수 있다. 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열을 세포 내에서 발현시키기 위한 프로모터 서열, 및 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 세포 내에서 발현시키기 위한 프로모터 서열을 포함하고, 상기 프로모터들은 각 발현 대상과 작동적으로 연결(operably linked)되어 있다. 일 구현예로, 상기 벡터의 서열은 상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열, 및 상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열을 포함할 수 있다.
상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열 및 둘 이상의 서로 다른 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열, 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열, 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제3 서열을 포함할 수 있다. 더 나아가, 상기 벡터의 서열은 상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열, 상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열, 상기 제3 서열과 작동 가능하게 연결된 제3 프로모터 서열을 포함할 수 있다.
상기 벡터에서, 각 구성요소를 암호화하는 핵산 서열은 DNA 서열일 수 있다.
발현 대상 - Cas12f1 단백질
상기 벡터는 Cas12f1 단백질을 발현하도록 구성된 것일 수 있다. 이때, 상기 Cas12f1 단백질은 "엔지니어링 된 CRISPR/Cas12f1 복합체" 단락에서 설명된 것과 동일한 구성 및 특징을 가진다.
일 구현예로, 상기 벡터는 야생형의 Cas12f1 단백질을 발현하도록 구성된 것일 수 있다. 이때, 상기 야생형의 Cas12f1 단백질은 Cas14a1일 수 있다. 일 구현예로, 상기 벡터는 표적 핵산의 이중가닥 중 하나의 가닥만 절단하도록 변경된 Cas12f1 단백질을 발현하도록 구성된 것일 수 있다. 더 나아가, 상기 변경된 Cas12f1 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없도록 변경된 것일 수 있다. 더 나아가, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 것일 수 있다.
발현 대상 - 엔지니어링 된 Cas12f1 가이드 RNA
상기 벡터는 엔지니어링 된 Cas12f1 가이드 RNA를 발현하도록 구성된 것일 수 있다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에서 설명한 엔지니어링 된 Cas12f1 가이드 RNA와 동일한 특징 및 구성을 가진다. 상기 벡터는 둘 이상의 서로 다른 엔지니어링 된 Cas12f1 가이드 RNA를 발현하도록 구성된 것일 수 있다.
발현 대상 - 부가 구성 요소
상기 벡터는 전술한 발현 대상 외, NLS, 태그 단백질 등의 부가 구성 요소를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 부가 구성 요소는 상기 Cas12f1, 변형된 Cas12f1, 및/또는 엔지니어링 된 Cas12f1 가이드 RNA와는 독립적으로 발현될 수 있다. 또 다른 구현예로, 상기 부가 구성 요소는 상기 Cas12f1, 변형된 Cas12f1, 및/또는 엔지니어링 된 Cas12f1 가이드 RNA와 연결되어 발현될 수 있다. 이때, 상기 부가 구성 요소는 CRISPR/Cas 시스템을 발현시키고자 할 때 일반적으로 발현시키는 구성 요소일 수 있으며, 공지기술을 참조할 수 있다. 상기 부가 구성 요소는 "배경기술 - CRISPR/Cas 시스템 발현 벡터 설계" 섹션에서 설명된 구성 요소 중 하나 이상일 수 있다.
벡터 구성 - Cas12f1 단백질 발현 서열
상기 벡터 서열은 상기 Cas12f1 단백질을 암호화하는 핵산 서열을 포함할 수 있다. 이때, 상기 Cas12f1 단백질은 "엔지니어링 된 CRISPR/Cas12f1 복합체" 단락에서 설명된 것과 동일한 구성 및 특징을 가진다.
일 구현예로, 상기 벡터의 서열은 야생형의 Cas12f1 단백질을 암호화하는 서열을 포함할 수 있다. 이때, 상기 야생형의 Cas12f1 단백질은 Cas14a1일 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열을 포함할 수 있다. 이때, 상기 Cas12f1 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열은 Cas14a1 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열일 수 있다. 일 구현예로, 상기 벡터의 서열은 변형된 Cas12f1 단백질 또는 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 Cas12f1 단백질을 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 Cas12f1 단백질을 암호화하는 서열을 포함할 수 있다.
벡터 구성 - 엔지니어링 된 Cas12f1 가이드 RNA 발현 서열
일 구현예로, 상기 벡터의 서열은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 예를 들어, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 선택된 서열을 포함할 수 있다.
일 구현예로, 상기 벡터의 서열은 둘 이상의 서로 다른 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 예를 들어, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 각각 선택된 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열, 및 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열을 포함할 수 있다.
벡터 구성 - 프로모터 서열
상기 벡터 서열은 각 구성요소를 암호화하는 서열에 작동 가능하게 연결된 프로모터 서열을 포함한다. 구체적으로, 상기 프로모터 서열은 "배경기술 - CRISPR/Cas 시스템 발현 벡터 설계" 섹션 중 프로모터 부분에 개시된 프로모터 중 하나일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 Cas12f1 단백질을 암호화하는 서열과 작동 가능하게 연결된이다. 일 구현예로, 상기 벡터 서열은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열과 작동 가능하게 연결된이다. 일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 서열, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 Cas12f1 단백질을 암호화하는 서열, 및 상기 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 서열과 작동적으로 연결되며, 상기 프로모터 서열로 인해 활성화된 전사 인자가 상기 Cas12f1 단백질 및 상기 엔지니어링 된 Cas12f1 가이드 RNA를 발현시킨다.
벡터 구성 - 둘 이상의 프로모터 서열 포함 가능
일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 제1 서열, 제1 프로모터 서열, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 제2 서열, 및 제2 프로모터 서열을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상지 제2 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도된다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 동일한 종류의 프로모터일 수 있다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 상이한 종류의 프로모터일 수 있다.
일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 제1 서열, 제1 프로모터 서열, 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 제2 서열, 제2 프로모터 서열, 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 제3 서열, 및 제3 프로모터 서열 을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상기 제2 서열과 작동적으로 연결되고, 상기 제3 프로모터 서열은 상기 제3 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도되며, 상기 제3 프로모터 서열에 의해 상기 제3 서열의 전사가 유도된다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 동일한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터 서열 및 상기 제3 프로모터 서열은 U6 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 상이한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터는 U6 프로모터 서열, 상기 제3 프로모터는 H1 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다.
벡터 구성 - 종결 신호
상기 벡터는 상기 프로모터 서열과 작동 가능하게 연결된 종결 신호를 포함할 수 있다. 이때, 상기 종결 신호는 "배경기술 - CRISPR/Cas 시스템 발현 벡터 설계" 섹션의 종결 신호 부분에서 개시된 종결 신호 중 하나일 수 있으나, 이에 제한되지 않는다. 상기 종결 신호는, 프로모터 서열의 종류에 따라 달라질 수 있다.
일 구현예로, 상기 벡터 서열이 U6 프로모터 서열을 포함하는 경우, 상기 U6 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다. 일 구현예로, 상기 벡터 서열이 H1 프로모터 서열을 포함하는 경우, 상기 H1 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다.
벡터 구성 - 기타 구성
상기 벡터 서열은 상기 구성 외, 목적에 따라 필요한 구성요소를 포함할 수 있다.
일 구현예로, 상기 벡터 서열은 조절/제어 구성요소 서열, 및/또는 부가 구성 요소 서열을 포함할 수 있다. 일 구현예로, 상기 부가 구성 요소는 형질주입된 세포를 비형질주입 세포로부터 구별하기 위한 목적으로 부가된 것일 수 있다. 이때, 상기 조절/제어 구성요소 서열 및 부가 구성 요소는 "배경기술 - CRISPR/Cas 시스템 발현 벡터 설계" 섹션에 개시된 것 중 하나일 수 있으나, 이에 제한되는 것은 아니다.
벡터 종류 - 바이러스 벡터
상기 벡터는 바이러스 벡터일 수 있다.
일 구현예로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상일 수 있다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
벡터 종류 - 비바이러스 벡터
상기 벡터는 비바이러스 벡터일 수 있다. 일 구현예로, 상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, 및 mRNA로 구성된 군에서 선택되는 1 이상일 수 있다. 일 구현예로, 상기 플라스미드는 pcDNA 시리즈, pS456, pG1806, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이루어진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이루어진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 벡터는 PCR 앰플리콘(amplicon)일 수 있다.
벡터 형태 - 원형 또는 선형 벡터
상기 벡터는 원형 또는 선형 형태일 수 있다. 상기 벡터가 선형 벡터인 경우, 상기 선형 벡터 서열이 종결 신호를 따로 포함하지 않더라도, 그 3'말단에서 RNA 전사가 종결된다. 이와 비교하여, 상기 벡터가 원형 벡터인 경우, 상기 원형 벡터 서열이 종결 신호를 따로 포함하지 않는다면, RNA 전사가 종결되지 않게 된다. 따라서, 상기 벡터로 원형 벡터를 사용하는 경우, 의도한 대상을 발현하기 위해서는 각 프로모터 서열과 관련된 전사 인자에 대응하는 종결 신호가 포함되어야 한다.
일 구현예로, 상기 벡터는 선형 벡터일 수 있다. 일 구현예로, 상기 벡터는 선형의 앰플리콘일 수 있다. 일 구현예로, 상기 벡터는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 선택된 서열을 포함하는 선형의 앰플리콘일 수 있다. 일 구현예로, 상기 벡터는 원형 벡터일 수 있다. 일 구현예로, 상기 벡터는 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 선택된 서열을 포함하는 원형 벡터일 수 있다.
벡터 - 서열 예시
일 구현예로, 상기 벡터의 서열은 서열번호 211 내지 서열번호 253, 서열번호 296 내지 서열번호 308, 서열번호 311 내지 서열번호 323, 서열번호 326 내지 서열번호 338, 서열번호 488 내지 서열번호 541, 및 서열번호 545 내지 서열번호 551로 이루어진 군에서 선택된 서열을 포함할 수 있다.
엔지니어링 된 CRISPR/Cas12f1 시스템의 각 구성요소를 포함하는 유전자 편집용 조성물
본 명세서에서는, CRISPR/Cas12f1 시스템의 각 구성요소를 포함하는 유전자 편집용 조성물을 개시한다. 일 구현예로, 본 명세서에서는 다음을 포함하는 유전자 편집용 조성물을 개시한다: Cas12f1 단백질 또는 이를 암호화하는 핵산; 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산. 이때, 상기 Cas12f1 단백질은 "엔지니어링 된 CRISPR/Cas12f1 복합체" 단락에서 개시된 것일 수 있다. 이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에 개시된 것일 수 있다.
상기 유전자 편집용 조성물은 상기 CRISPR/Cas12f1 시스템의 각 구성요소 외 유전자 편집 용도에 필요한 적절한 물질을 추가로 포함할 수 있다.
핵산의 화학적인 변형
본 명세서에서는 엔지니어링 된 crRNA 또는 이를 암호화하는 핵산, 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화 하는 핵산, 및/또는 CRISPR/Cas12f1 시스템의 구성 요소를 발현시키기 위한 벡터 등 핵산을 포함하거나, 핵산으로 이루어진 구성 요소를 제공한다. 이때, 상기 구성 요소에서 "핵산"이라 함은, 자연계에 존재하는 DNA, 또는 RNA일 수 있고, 상기 구성 핵산의 일부 또는 전부에 화학적 변형이 일어난, 변형된 핵산일 수 있다. 일 구현예로, 상기 구성 핵산은 자연계에 존재하는 DNA, 및/또는 RNA일 수 있다. 일 구현예로, 상기 구성 핵산은 하나 이상의 뉴클레오타이드가 화학적으로 변형된 것일 수 있다. 이때, 상기 화학적 변형은 당업자에게 알려진 핵산의 변형을 모두 포함한다. 구체적으로, 상기 화학적 변형은 (WO 2019/089820 A1)에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되는 것은 아니다.
엔지니어링 된 Cas12f1 가이드 RNA를 이용한 유전자 편집 방법
유전자 편집 방법 개괄
본 명세서에서는 엔지니어링 된 crRNA를 이용하여 대상 세포 내의 표적 유전자, 또는 표적 핵산을 편집하는 방법을 제공한다. 상기 표적 유전자, 또는 표적 핵산은 표적 서열을 포함한다. 상기 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 상기 유전자 편집 방법은, 엔지니어링 된 Cas12f1 가이드 RNA, 및 Cas12f1 단백질, 또는 각각을 암호화하는 핵산을 표적 유전자, 또는 표적 핵산을 포함하고 있는 대상 세포 내에 전달하는 것을 포함한다. 그 결과, 상기 대상 세포 내에 엔지니어링 된 CRISPR/Cas12f1 복합체가 주입되거나, 엔지니어링 된 CRISPR/Cas12f1 복합체의 형성이 유도되며, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체에 의해 표적 유전자가 편집된다. 상기 엔지니어링 된 Cas12f1 가이드 RNA는 "엔지니어링 된 Cas12f1 가이드 RNA" 단락에서 설명된 것과 동일한 특징 및 구조를 가진다. 상기 Cas12f1 단백질은 "엔지니어링 된 CRISPR/Cas12f1 복합체" 섹션에서 설명된 Cas12f1 단백질, 및/또는 변형된 Cas12f1 단백질과 동일한 특징 및 구성을 가진다.
일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 대상 세포 내로 전달하는 것을 포함할 수 있다.
이때, 상기 엔지니어링 된 Cas12f1 가이드 RNA는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail을 포함한다.
이때, 상기 엔지니어링 된 스캐폴드 영역은 전술한 "엔지니어링 된 스캐폴드 영역" 단락 중 어느 하나에서 서술된 것과 동일한 특징 및 구조를 가진다. 일 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 168 내지 187으로 이루어진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 188 내지 199으로 이루어진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 200 내지 206으로 이루어진 군에서 선택된 서열로 표현될 수 있다. 또 다른 예로, 상기 엔지니어링 된 스캐폴드 영역은 서열번호 207 내지 210으로 이루어진 군에서 선택된 서열로 표현될 수 있다.
이때, 상기 스페이서 서열은 상기 대상 세포 내에 포함된 표적 유전자, 또는 표적 핵산과 상보적으로 결합할 수 있다.
이때, 상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상고, c는 1 내지 10이다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUAUUUU-3'일 수 있다. 일 예로, 상기 U-rich tail의 서열은 5'-UUUUGUUUU-3'일 수 있다.
대상 세포
일 구현예로, 상기 대상 세포는 원핵 세포일 수 있다. 일 구현예로, 상기 대상 세포는 진핵 세포일 수 있다. 구체적으로, 상기 진핵 세포는 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
표적 서열 결정
CRISPR/Cas12f1 복합체로 편집하고자 하는 표적 유전자, 또는 표적 핵산, 및 표적 서열은 유전자 편집의 목적, 대상 세포 환경, Cas12f1 단백질이 인식하는 PAM 서열, 및/또는 기타 변수를 고려하여 결정할 수 있다. 이때, 적절한 길이의 표적 서열을 결정할 수 있다면, 그 방법은 특별히 제한되지 않으며, 공지된 기술을 활용할 수 있다.
표적 서열에 따른 스페이서 서열 결정
상기 표적 서열이 결정되고 나면, 이에 대응하는 스페이서 서열을 설계한다. 상기 스페이서 서열은 상기 표적 서열과 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 유전자와 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산과 상보적으로 결합할 수 있도록 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 표적 가닥 서열에 포함된 표적 서열과 상보적인 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 비표적 가닥 서열에 포함된 프로토스페이서의 DNA 서열에 상응하는 RNA 서열로 설계된다. 구체적으로, 상기 스페이서 서열은, 상기 프로토스페이서 서열과 동일한 뉴클레오티드 서열을 가지되, 상기 뉴클레오티드 서열에 포함된 티미딘 각각이 모두 유리딘으로 치환된 서열로 설계된다.
일 구현예에서, 상기 스페이서는 10 내지 50 뉴클레오타이드 길이를 가진다. 예를 들어, 10개, 11개 , 12개, 13개, 14 개, 15 개, 16 개, 17 개, 18 개, 19 개, 20 개, 21 개, 22 개, 23 개, 24 개, 25 개, 26 개, 27 개, 28 개, 29 개, 30 개, 31 개, 32 개, 33 개, 34 개, 35 개, 36 개, 37 개, 38 개, 39 개, 40 개, 41 개, 42 개, 43 개, 44 개, 45 개, 46 개, 47 개, 48 개, 49 개 또는 50개의 뉴클레오타이드 길이를 가진다. 바람직하게는 17 개, 18 개, 19 개, 20 개, 21 개, 22 개, 23 개, 24 개 또는 25개의 뉴클레오타이드 길이를 가진다.
표적 서열과 스페이서 서열의 상보성
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 바로 이전 문장에서 선택된 수치 범위 내 상보적인 서열일 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 60% 내지 90% 상보적인 서열일 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 90% 내지 100% 상보적인 서열일 수 있다.
표적 서열과 스페이서 서열 간 미스매치 개수
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 미스매치를 가지는 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 바로 이전 문장에서 선택된 수치 범위 내의 미스매치를 가질 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 0 개, 1 개, 2 개, 3 개, 4 개,또는 5개의 미스매치를 가질 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 6개 내지 10개의 미스매치를 기질 수 있다.
CRISPR/Cas12f1 복합체 이용
본 명세서에서 제공하는 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 표적 특이적으로 유전자, 또는 핵산을 절단하는 활성을 가지는 점을 이용한다. 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 "엔지니어링 된 CRISPR/Cas12f1 복합체" 섹션에서 설명된 엔지니어링 된 CRISPR/Cas12f1 복합체와 동일한 특징 및 구성을 가진다.
CRISRP/Cas12f1 복합체 각 구성 요소의 세포 내 전달
본 명세서에서 제공하는 유전자 편집 방법은 대상 세포 내에서 엔지니어링 된 CRISPR/Cas12f1 복합체가 표적 유전자 또는 표적 핵산과 접촉하는 것을 포함로 한다. 따라서, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체가 상기 표적 유전자, 또는 표적 핵산과 접촉하는 것을 유도하기 위해, 상기 유전자 편집 방법은 상기 엔지니어링 된 CRISPR/Cas12f1 복합체의 각 구성요소를 대상 세포 내에 전달하는 것을 포함한다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 단백질을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 단백질을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다.
엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산은 다양한 전달 형태로, 다양한 전달 방법을 이용하여 대상 세포 내에 전달될 수 있다.
전달 형태 - RNP
상기 전달 형태로, 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 단백질이 결합한 리보뉴클레오프로틴 입자(Ribonucleoprotein particle, RNP)를 이용할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 단백질이 결합한 CRISPR/Cas12f1 복합체를 대상 세포 내에 주입하는 것을 포함할 수 있다.
전달 형태 - 비바이러스 벡터
또 다른 전달 형태로, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 비바이러스 벡터는 플라스미드, 네이키드 DNA, DNA 복합체, 또는 mRNA일 수 있으나, 이에 제한되는 것은 아니다. 또 다른 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 비바이러스 벡터, 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제2 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 비바이러스 벡터 및 상기 제2 비바이러스 벡터는 각각 플라스미드, 네이키드 DNA, DNA 복합체, 및 mRNA로 이루어진 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 - 바이러스 벡터
또 다른 전달 형태로, 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
또 다른 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 바이러스 벡터, 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제2 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 바이러스 벡터 및 제2 바이러스 벡터는 각각 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 방법 - 일반적인 전달 수단
상기 전달 방법은, 세포 내로 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 적절한 전달 형태로 세포 내로 전달할 수 있는 것이라면 특별히 제한되지 않는다. 일 구현예로, 상기 전달 방법은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 및/또는 일시적인 세포 압축 또는 스퀴징일 수 있다.
전달 방법 - 나노파티클
상기 전달 방법은, 상기 CRISPR/Cas12f1 시스템에 포함된 적어도 하나의 구성요소를 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 당업계 통상의 기술자가 적절히 선택할 수 있는 공지된 방법일 수 있다. 예를 들어, 상기 나노파티클 전달 방법은 (WO 2019/089820 A1)에 개시된 방법일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 전달 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산 및/또는 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 일 구현예로, 상기 전달 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및/또는 제2 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et., al Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 CRISPR/Cas12f1 시스템의 구성 요소는 RNP, 비바이러스 벡터, 및/또는 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 CRISPR/Cas12f1 시스템의 구성 요소는 각 구성요소를 암호화하는 mRNA 형태일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 및 방법 - 조합 가능
상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성의 전달 형태 및/또는 전달 방법은 서로 동일하거나 상이할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 형태로 전달하고, Cas12f1 단백질 또는 이를 암호화하는 핵산은 제2 전달 형태로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 형태 및 상기 제2 전달 형태는 각각 전술한 전달 형태 중 어느 하나일 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 방법으로 전달하고, Cas12f1 단백질 또는 이를 암호화하는 핵산은 제2 전달 방법으로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 방법 및 상기 제2 전달 방법은 각각 전술한 전달 방법 중 어느 하나일 수 있다.
전달 순서
상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성이 세포 내에 동시에 전달되거나 또는 시간차를 두고 순차적으로 전달될 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 동시에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 엔지니어링 된 Cas12f1 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질을 암호화하는 핵산을 세포 내로 전달한 후, 엔지니어링 된 Cas12f1 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다.
복수의 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산 전달
본 명세서에서 제공하는 유전자 편집 방법은 대상 세포 내에 Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 둘 이상의 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 전달하는 것을 포함할 수 있다. 상기 방법을 통해, 서로 다른 서열을 표적하는 둘 이상의 CRISPR/Cas12f1 복합체가 대상 세포 내에 도입되거나, 대상 세포 내에서 형성될 수 있다. 그 결과, 세포 내에 포함된 서로 다른 둘 이상의 표적 유전자 또는 표적 핵산이 편집될 수 있다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 제2 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하고 있는 대상 세포 내에 전달하는 것을 포함한다. 이때, 상기 각 구성요소는 전술한 전달 형태 및 전달 방법 중 하나 이상을 사용하여 세포 내로 전달될 수 있다. 이때, 둘 이상의 구성요소가 세포 내에 동시에 전달될 수 있고,또는 순차적으로 전달될 수 있다.
CRISPR/Cas12f1 복합체가 표적 핵산과 접촉
본 명세서에서 제공하는 유전자 편집 방법에서, 표적 유전자, 또는 표적 핵산의 편집은 대상 세포 내에서 엔지니어링 된 CRISPR/Cas12f1 복합체가 표적 유전자 또는 표적 핵산과 접촉하면서 이루어진이다. 따라서, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 접촉하도록 하거나, 접촉을 유도하는 것을 포함할 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 표적 핵산과 접촉하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 표적 핵산과 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 엔지니어링 된 CRISPR/Cas12f1 복합체가 세포 내에서 표적 핵산과 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 일 구현예로, 상기 유도는 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
유전자 편집 결과 - 인델(indel)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산에 인델이 발생할 수 있다. 이때, 상기 인델은 표적 서열 부분 및/또는 프로토스페이서 서열 부분의 내부 및/또는 외부에서 일어날 수 있다. 상기 인델은, 유전자 편집 전 핵산의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 결실되거나, 임의의 뉴클레오타이드가 삽입되거나, 및/또는 상기 삽입과 결실이 혼입된 변이를 일컫는다. 일반적으로, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화된다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 결실 및/또는 추가될 수 있다.
유전자 편집 결과 - 베이스 에디팅(base editing)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 뉴클레오타이드가 결실, 또는 추가되는 인델과는 달리, 핵산 내 하나 이상의 특정 뉴클레오타이드를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 다른 뉴클레오타이드로 치환될 수 있다.
유전자 편집 결과 - 삽입(insertion)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 넉인이 발생할 수 있다. 상기 넉인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 넉인이 일어나려면, CRISPR/Cas12f1 복합체 외에 상기 추가적인 핵산 서열을 포함하는 도너가 더 필요하다. 세포 내에서 CRISPR/Cas12f1 복합체가 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열이 표적 유전자 또는 표적 핵산 내에 삽입될 수 있도록 한다. 일 구현예로, 상기 유전자 편집 방법은 대상 세포 내로 도너를 도입하는 것을 추가적으로 포함할 수 있다. 예를 들어, 상기 도너는 세포 내 게놈에 삽입하기 위한 외래 DNA 서열(exogeneous DNA sequence)을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 외래 DNA 서열 의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 전달 형태 및/또는 전달 방법이 사용될 수 있다.
유전자 편집 결과 - 제거(deletion)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부를 제거할 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열(뉴클레오타이드 서열)을 일정 길이 이상 제거하는 것을 의미한다. 상기 제거는 전술한 인델 효과와 비교하여, 유전자의 특정 영역, 예를 들어, 제1 엑손 영역을 전체적으로 제거(removal)할 수 있는 효과를 의미한다.
일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산, 및 제2 엔지니어링 된 Cas12f1 가이드 RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포내에 도입하는 것을 포함한다. 이로 인해, 상기 유전자 편집 결과 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.
유전자 편집 방법 예시
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA 및 Cas12f1 단백질이 결합한 리보뉴클레오프로틴 입자 형태의 CRISPR/Cas12f1 복합체를 진핵 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 전달은 전기천공법, 또는 lipofection을 이용한 것일 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 진핵 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 전달은 전기천공법, 또는 lipofection을 이용한 것일 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터를 진핵세포 내에 전달하는 것을 포함할 수 있다.
일 구현예로, 상기 유전자 편집 방법은 제1 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열, 제2 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 핵산 서열, 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터를 진핵세포 내에 전달하는 것을 포함할 수 있다.
발명의 가능한 실시예
실시예 1, sgRNA ver.A
다음을 포함하는, CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
실시예 2, sgRNA ver.A, U-rich tail
실시예 1에 있어서, 상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 3, sgRNA ver.A, v4.0
실시예 1에 있어서, 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 가이드 RNA:
5'-A-3';
5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
실시예 4, sgRNA ver.A, v4.1
실시예 1에 있어서, 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 가이드 RNA:
5'-A-3';
5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
실시예 5, sgRNA ver.A, DNA
실시예 1 내지 실시예 4 중 어느 하나의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
실시예 6, sgRNA ver.B
다음을 포함하는, CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
엔지니어링 된 스캐폴드;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475)로 표현되는 제1 서열;
5'-UUCG-3'로 표현되는 제2 서열;
5'-CUCGA-3'로 표현되는 제3 서열;
5'-AACCAAA-3'로 표현되는 제4 서열;
링커;
5'-GGA-3'로 표현되는 제5 서열; 및
5'-AUGCAAC-3'로 표현되는 제6 서열.
실시예 7, sgRNA ver.B, Linker
실시예 6에 있어서, 상기 링커는 5'-GAAA-3'인 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 8, sgRNA ver.B, Linker variation
실시예 6에 있어서, 상기 링커는 5'-GAAA-3', 5'-UGAAAA-3', 5'-UUGAAAAA-3', 5'-UUCGAAAGAA-3'(서열번호 642), 5'-UUCAGAAAUGAA-3'(서열번호 643), 5'-UUCAUGAAAAUGAA-3'(서열번호 644), 및 5'-UUCAUUGAAAAAUGAA-3'(서열번호 645)로 이루어진 군에서 선택된 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 9, sgRNA ver.B, + 1st region
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제7 서열을 추가적으로 포함하며, 상기 제7 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 10, sgRNA ver.B, U-rich tail
실시예 6에 있어서, 상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 11, sgRNA ver.B, + 2nd region
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362) 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제8 서열을 추가적으로 포함하고, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 12, sgRNA ver.B, + 1st region + 2nd region
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제7 서열을 추가적으로 포함하고, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제8 서열을 추가적으로 포함하며, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 13, sgRNA ver.B, additional sequence of 3rd region
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAG-3', 5'-AAGU-3', 5'-AAGUG-3', 5'-AAGUGC-3', 5'-AAGUGCU-3', 5'-AAGUGCUU-3', 5'-AAGUGCUUU-3', 5'-AAGUGCUUUC-3'(서열번호 485)로 이루어진 군에서 선택된 제9 서열을 추가적으로 포함하고, 5'-C-3', 5'-CC-3', 5'-ACC-3', 5'-AACC-3', 5'-UAACC-3', 5'-GUAACC-3', 5'-AGUAACC-3', 5'-AAGUAACC-3', 5'-AAAGUAACC-3', 5'-GAAAGUAACC-3'(서열번호 486)로 이루어진 군에서 선택된 제10 서열을 추가적으로 포함하며, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있고, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 14, sgRNA ver.B, experimental examples of 3rd region
실시예 13에 있어서,
상기 제9 서열이 5'-A-3'인 경우, 상기 제10 서열은 5'-C-3'이고,
상기 제9 서열이 5'-AA-3'인 경우, 상기 제10 서열은 5'-C-3', 또는 5'-CC-3'이고,
상기 제9 서열이 5'-AAG-3'인 경우, 상기 제10 서열은 5'-CC-3', 또는 5'-ACC-3'이고,
상기 제9 서열이 5'-AAGU-3'인 경우, 상기 제10 서열은 5'-AACC-3'이고,
상기 제9 서열이 5'-AAGUG-3'인 경우, 상기 제10 서열은 5'-UAACC-3'이고,
상기 제9 서열이 5'-AAGUGC-3'인 경우, 상기 제10 서열은 5'-GUAACC-3'이고,
상기 제9 서열이 5'-AAGUGCU-3'인 경우, 상기 제10 서열은 5'-AGUAACC-3'이고,
상기 제9 서열이 5'-AAGUGCUC-3'인 경우, 상기 제10 서열은 5'-GAGUAACC-3'이고,
상기 제9 서열이 5'-AAGUGCUU-3'인 경우, 상기 제10 서열은 5'-AAGUAACC-3'이고,
상기 제9 서열이 5'-AAGUGCUUU-3'인 경우, 상기 제10 서열은 5'-AAAGUAACC-3'이고,
상기 제9 서열이 5'-AAGUGCUUUC-3'(서열번호 485)인 경우, 상기 제10 서열은 5'-GAAAGUAACC-3'(서열번호 486)인 엔지니어링 된 가이드 RNA.
실시예 15, sgRNA ver.B, additional sequence of 4th region
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이루어진 군에서 선택된 제 11서열, 및 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이루어진 군에서 선택된 제 12서열을 추가적으로 포함하며, 상기 제4 서열의 3'말단 및 상기 링커의 5'말단은 상기 제11 서열을 통해 연결되고, 상기 링커의 3'말단 및 상기 제5 서열의 5'말단은 상기 제12 서열을 통해 연결된 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 16, sgRNA ver.B, experimental example of 4th region
실시예 15에 있어서,
상기 제11 서열이 5'-U-3'인 경우, 상기 제12 서열은 5'-A-3'이고,
상기 제11 서열이 5'-UU-3'인 경우, 상기 제12 서열은 5'-AA-3'이고,
상기 제11 서열이 5'-UUC-3'인 경우, 상기 제12 서열은 5'-GAA-3'이고,
상기 제11 서열이 5'-UUCA-3'인 경우, 상기 제12 서열은 5'-UGAA-3'이고,
상기 제11 서열이 5'-UUCAU-3'인 경우, 상기 제12 서열은 5'-AUGAA-3'이고,
상기 제11 서열이 5'-UUCAUU-3'인 경우, 상기 제12 서열은 5'-AAUGAA-3'이고,
상기 제11 서열이 5'-UUCAUUU-3'인 경우, 상기 제12 서열은 5'-GAAUGAA-3'인 엔지니어링 된 가이드 RNA.
실시예 17, sgRNA ver.B, v4.0
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3'로 표현되는 제7 서열, 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 표현되는 제8 서열, 5'-AAGUGCUUUC-3'(서열번호 485)로 표현되는 제9 서열, 및 5'-GAAAGUAACC-3'(서열번호 486)로 표현되는 제10 서열을 추가적으로 포함하고, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있고, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있으며, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 18, sgRNA ver.B, v4.1
실시예 6에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3'로 표현되는 제7 서열, 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350)로 표현되는 제8 서열, 5'-AAGUGCUUUC-3'(서열번호 485)로 표현되는 제9 서열, 및 5'-GAAAGUAACC-3'(서열번호 486)로 표현되는 제10 서열을 추가적으로 포함하고, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있고, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있으며, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
실시예 19, sgRNA ver.B, DNA
실시예 6 내지 실시예 18 중 어느 하나의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
실시예 20, dual gRNA
다음을 포함하는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역은 다음을 포함함:
5'말단에서 3'말단 방향으로,
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제1 서열,
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제2 서열,
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 제3 서열,
5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 및 5'-AACAAAUUCAUUU-3'(서열번호 13)로 이루어진 군에서 선택된 제4 서열이 연결된 엔지니어링 된 tracrRNA; 및
5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 및 5'-GAAUGAAGGA-3'(서열번호 15)으로 이루어진 군에서 선택된 제5 서열, 및
5'-AUGCAAC-3'로 표현되는 제6 서열이 연결된 엔지니어링 된 crRNA 반복 서열 부분,
이때, 상기 엔지니어링 된 crRNA 반복 서열 부분의 3'말단은 상기 스페이서의 5'말단과 연결 되어 있고,
상기 엔지니어링 된 tracrRNA의 서열이 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 1)와 동일하고, 상기 엔지니어링 된 crRNA 반복 서열이 5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3)과 동일한 경우는 포함하지 않는 것을 특징으로 한다.
실시예 21, dual gRNA, DNA
실시예 20의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
실시예 22, complex, ver.A
다음을 포함하는, 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체:
Cas12f1 단백질; 및
엔지니어링 된 가이드 RNA,
이때, 상기 엔지니어링 된 가이드 RNA는 다음을 포함함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 상기 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
실시예 23, complex, ver.A, U-rich tail
제22 항에 있어서, 상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 엔지니어링 된 CRISPR/Cas12f1 복합체.
실시예 24, complex, ver.A, v4.0
제22 항에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 CRISPR/Cas12f1 복합체:
5'-A-3';
5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
실시예 25, complex, ver.A, v4.1
제22 항에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 CRISPR/Cas12f1 복합체:
5'-A-3';
5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
실시예 26, complex, ver.B
다음을 포함하는, 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체:
Cas12f1 단백질; 및
실시예 6 내지 실시예 18 중 어느 한 항에 따른 엔지니어링 된 가이드 RNA.
실시예 27, vector, ver.A
다음을 포함하는, CRISPR/Cas12f1 시스템의 각 구성요소를 발현할 수 있는 벡터:
Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열;
상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열; 및
상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열,
이때, 상기 엔지니어링 된 가이드 RNA는 다음을 포함함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
여기서, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및 5'-AUGCAAC-3'.
실시예 28, vector, ver.A, v4.0
실시예 27에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 벡터:
5'-A-3';
5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
실시예 29, vector, ver.A, v4.1
실시예 27에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 벡터:
5'-A-3';
5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
5'-AUGCAAC-3'.
실시예 30, vector, ver.A, U6 promoter
실시예 27에 있어서, 상기 제2 프로모터 서열은 U6 프로모터 서열인 벡터.
실시예 31, vector, ver.A, viral or plasmid
실시예 27에 있어서, 상기 벡터는 플라스미드, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 벡터.
실시예 32, vector, ver.B
다음을 포함하는, CRISPR/Cas12f1 시스템의 각 구성요소를 발현할 수 있는 벡터:
Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열;
상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
실시예 6 내지 실시예 18 중 어느 한 항에 따른 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열; 및
상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열.
실시예 33, editing method, ver.A
다음을 포함하는, 세포 내에서 표적 서열을 포함하는 핵산을 편집하는 방법:
Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 가이드 RNA 또는 이름 암호화하는 핵산을 세포 내로 전달하는 것,
이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
이로 인해 상기 표적 서열을 포함하는 핵산이 CRISPR/Cas12f1 복합체에 의해 편집될 수 있고,
상기 엔지니어링 된 가이드 RNA는 다음을 포함하는 것을 특징으로 함:
엔지니어링 된 스캐폴드 영역;
스페이서; 및
U-rich tail,
이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
5'-AUGCAAC-3'.
실시예 34, editing method, ver.A, introducing RNP
실시예 33에 있어서, 상기 전달은 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 CRISPR/Cas12f1 복합체로써 세포 내에 주입하는 것인 방법.
실시예 35, editing method, ver.A, introducing vector
실시예 33에 있어서, 상기 전달은 상기 Cas12f1 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 벡터를 세포 내에 주입하는 것인 방법.
실시예 36, editing method, ver.A, vector limitation
실시예 35에 있어서, 상기 벡터는 플라스미드, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 벡터.
실시예 37, editing method, ver.A, editing eukaryotic cell
실시예 33에 있어서, 상기 세포는 진핵세포인 것을 특징으로 하는 방법.
실시예 38, editing method, ver.B
다음을 포함하는, 세포 내에서 표적 서열을 포함하는 핵산을 편집하는 방법:
Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 실시예 6 내지 실시예 18 중 어느 한 항에 따른 엔지니어링 된 가이드 RNA 또는 이름 암호화하는 핵산을 세포 내로 전달하는 것,
이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
이로 인해 상기 표적 서열을 포함하는 핵산이 CRISPR/Cas12f1 복합체에 의해 편집될 수 있음.
이하, 실험예 및 실시예를 통해 본 명세서가 제공하는 발명에 대해 더욱 상세히 설명한다. 이들 실시예는 오로지 본 명세서에 의해 개시되는 내용을 예시하기 위한 것으로, 본 명세서에 의해 개시되는 내용의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실험예 1 실험 재료 준비
실험예 1.1 플라스미드 벡터 설계 및 제조
인간 세포에서 발현하기 위해, Cas12f1 유전자를 코돈-최적화 시켰으며, 상기 최적화된 서열이 벡터 제조를 위해 합성되었다. 최종적으로 Cas12f1 단백질을 암호화하는 서열에는 chicken β-actin 프로모터, 5'- 및 3'-말단의 핵 위치 신호 서열(nuclear localization signal sequence), 자가 절단 T2A 펩타이드로 연결된 eGFP를 인코딩하는 서열이 부가되었다. 상기 Cas12f1 단백질의 아미노산 서열 및 이를 암호화하는 DNA 서열을 [표01]에 나타냈다.
[표01]
Figure PCTKR2021013898-appb-I000001
(엔지니어링 된) Cas12f1 가이드 RNA를 암호화하는 주형 DNA가 합성되었고, pTwist Amp plasmid vector (Twist Bioscience)에 클로닝되었다. 필요한 경우, 상기 벡터는 U6-상보적 forward primer 및 protospacer-상보적 reverse primer를 사용하여, 상기 가이드 RNA 암호화 서열의 증폭을 위한 주형으로 사용되었다. Gibson assembly를 사용하여, 상기 코돈-최적화 된 Cas12f1 유전자를 포함하는 벡터에 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 올리고뉴클레오타이드를 클로닝함으로써, 엔지니어링 된 CRISPR/Cas12f1 시스템에 대한 벡터를 제조하였다.
실험예 1.2 Cas12f1 가이드 RNA 엔지니어링
엔지니어링 된 Cas12f1 가이드 RNA 3'말단에 대한 U-rich tail 연결은, 서열-변형된 primer 및 Cas12f1 가이드 RNA 플라스미드 벡터의 존재 하, Pfu PCR Master Mix5 (Biofact)를 사용하여 수행되었다. 상기 PCR 앰플리콘은 HiGeneTM Gel&PCR Purification System (Biofact)을 사용하여 정제되었다. 상기 엔지니어링 된 Cas12f1 가이드 RNA의 엔지니어링 된 스캐폴드 영역 중 제2 영역, 제4 영역 및 제5 영역의 변형은 ApoI 및 BamHI 제한 효소를 사용하여 선형화된 가이드 RNA-암호화 벡터에 변형된 서열 (Macrogen)을 전달하는 합성 올리고뉴클레오타이드를 클로닝하여 수행되었다. 상기 엔지니어링 된 Cas12f1 가이드 RNA의 엔지니어링 된 스캐폴드 영역 중 제1 영역의 변형은, tracrRNA의 5'말단 부분을 표적으로 하는 forward primer 및 U6 프로모터 영역을 표적으로 하는 reverse primer를 사용하여 캐노니컬(canonical), 또는 엔지니어링 된 주형 플라스미드 벡터의 PCR 증폭에 의해 수행되었다. 상기 PCR 증폭은 Q5 Hot Start high-fidelity DNA polymerase (NEB)에 의해 수행되었으며, PCR 산물은 KLD Enzyme Mix (NEB)를 사용하여 결찰되었다(ligated). 상기 결찰된(ligated) PCR 산물은 DH5α E.coli 세포로 형질도입(transformed)되었다. Sanger 시퀀싱 분석에 의해 Mutagenesis가 확인되었다. 변형된 플라스미드 벡터는 NucleoBond ® Xtra Midi EF kit (MN)를 사용하여 정제되었다. 정제된 플라스미드 1 마이크로그램이 T7 RNA polymerase (NEB) 및 NTPs (Jena Bioscience)를 사용한 mRNA 합성의 주형으로 사용되었다. 상기 제조된 엔지니어링 된 Cas12f1 가이드 RNA를 Monarch® RNA cleanup kit (NEB)를 사용하여 정제하고, 극저온 바이알(cryogenic vials)에 분취하여 액체 질소에 보관하였다.
실험예 1.3 세포 배양 및 형질도입(transfection)
HEK293 T 세포(LentX-293T, Takara)가 10%의 열-불활성화 된 fetal bovine serum (FBS) 혈청(Corning) 및 페니실린/스트렙토마이신이 보충된 Dulbecco's Modified Eagle Medium (DMEM) 배지에서, 5% CO2 조건 하 배양되었다. 세포 형질주입은 전기천공법(electroporation) 또는 lipofection으로 수행되었다. 전기천공법의 경우, 실험예1.2 에서 제조된 Cas12f1 단백질을 암호화하는 플라스미드 벡터및 가이드 RNA(및 엔지니어링 된 가이드 RNA)를 암호화하는 DNA 각 2-5 μg를 Neon transfection system (Invitrogen)을 사용해 4X105 HEK-293 T세포에 형질주입(transfection) 하였다. 상기 전기천공법은 1300V, 10 mA, 3 pulse 조건 하 수행하였다. lipofection을 위해, 6-15 μL FuGene 시약을 (Promega) 2-5 μg의 Cas12f1 단백질을 암호화하는 플라스미드 벡터 및 1.5-5 μg의 PCR 앰플리콘과 15분동안 혼합하였다. 상기 혼합물(300 μL)이 형질주입 1일 전에 1X106개의 세포가 플레이팅 된 1.5 ml DMEM 배지에 첨가되었다. 상기 세포들을 상기 혼합물의 존재 하 1 내지 10일 간 배양시켰다. 배양 후, 상기 세포들이 수집되었고, 상기 세포의 게놈 DNA가 PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하거나, Maxwell RSC Cultured cells DNA Kit (Promega)를 사용하여 수작업으로 분리되었다.
실험예 1.4 세포 내 인델 효율 측정
HEK-293 T세포로부터 분리된 게놈 DNA 중, 프로토스페이서를 포함하는 영역을 표적-특이적 프라이머를 사용하여 KAPA HiFi HotStart DNA polymerase (Roche)의 존재 하 PCR을 수행하였다. 상기 증폭 방법은 제조사의 지시를 따랐다. Illumina TruSeq HT dual indexes를 포함하는 상기 증폭의 결과물인 PCR 앰플리콘을 Illumina iSeq 100를 사용하여 150-bp 페어 엔드 시퀀싱을 수행하였다. 인델 빈도는 MAUND를 사용하여 계산되었다. 상기 MAUND는 https://github.com/ibscge/maund 에서 제공된다.
실험예 1.5 Quantitave real-time PCR
HEK293 T세포에 RNeasy Miniprep kit (Qiagen) 또는 Maxwell RSC miRNA Tissue Kit (Promega)또는 DNeasy Blood & Tissue Kit(Qiagen)를 사용하여 가이드 RNA(또는 엔지니어링 된 가이드 RNA) 또는 게놈 DNA를 각각 추출하였다. 가이드 RNA를 정량화하기 위해서, RNA특이적 프라이머를 ligation 하고, crRNA-특이적 프라이머를 사용해 cDNA를 합성하였다. 상기 cDNA는 주형으로써 정량적 real-time PCR에 사용되었다. real-time PCR은 KAFA SYBR FAST qPCR Master Mix(2X) Kit (KAPAbiosystems)를 사용하여 분석되었다.
실험예 1.6 통계 분석
각 실험예 별 실험은 3번씩 수행하였으며, 각 값의 평균값을 분석에 사용하였다.
실험예 2 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 1
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 다음 [표02]에 나타냈다.
[표02]
Figure PCTKR2021013898-appb-I000002
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표03] 내지 [표08]에 나타냈다.
[표03]
Figure PCTKR2021013898-appb-I000003
[표04]
Figure PCTKR2021013898-appb-I000004
[표05]
Figure PCTKR2021013898-appb-I000005
[표06]
Figure PCTKR2021013898-appb-I000006
[표07]
Figure PCTKR2021013898-appb-I000007
[표08]
Figure PCTKR2021013898-appb-I000008
이때, 각 표적 서열 별로,
1) Comparative Example 1.n.1은 자연계에서 발견되는 Cas12f1 tracrRNA 및 자연계에서 발견되는 Cas12f1 crRNA를 5'-GAAA-3'로 연결시킨 싱글 가이드 RNA,
2) Comparative Example 1.n.2는 자연계에서 발견되는 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 싱글 가이드 RNA,
3) Example 1.n.1 내지 1.n.3은 변형된 제1 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
4) Example 1.n.4 내지 1.n.6는 변형된 제2 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
5) Example 1.n.7 내지 1.n.9는 변형된 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
6) Example 1.n.10은 변형된 제1 영역 및 제2 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
7) Example 1.n.11은 변형된 제1 영역 및 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
8) Example 1.n.12는 변형된 제2 영역 및 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA,
9) Example 1.n.13은 변형된 제1 영역, 제2 영역, 및 제4 영역 및 제5 영역을 가지는 엔지니어링 된 스캐폴드 영역, 스페이서, 및 5'-UUUUAUUUU-3'로 표현되는 U-rich tail을 가지는 엔지니어링 된 Cas12f1 가이드 RNA를 나타낸다.
이때, n은 표적 서열 별로, 1, 2, 또는 3이며, n이 1인 경우 Target 1(DY2), n이 2인 경우, Target 2(DY10), n이 3인 경우, Target3(Intergenic-22)를 나타낸다.
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 2 내지 도 13에 나타나있다.
실험예 3 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 2
실험예 3.1 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 2-1
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 다음 [표09]에 나타냈다.
[표09]
Figure PCTKR2021013898-appb-I000009
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표10] 내지 [표13]에 나타냈다.
[표10]
Figure PCTKR2021013898-appb-I000010
[표11]
Figure PCTKR2021013898-appb-I000011
[표12]
Figure PCTKR2021013898-appb-I000012
[표13]
Figure PCTKR2021013898-appb-I000013
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 16 내지 도 19에 나타나있다.
실험예 3.2 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 2-2
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 [표09]에 나타낸 바와 같다.
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표14] 내지 [표17]에 나타냈다.
[표14]
Figure PCTKR2021013898-appb-I000014
[표15]
Figure PCTKR2021013898-appb-I000015
[표16]
Figure PCTKR2021013898-appb-I000016
[표17]
Figure PCTKR2021013898-appb-I000017
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 20 내지 도 23에 나타나있다.
실험예 3.3 실험 결과
상기 실험 결과를 동일 표적에 대한 이전 실험 데이터와 비교해 보면(도 14 및 도 15 참조), 자연계에서 발견되는 tracrRNA 및 crRNA를 링커로 연결한 Cas12f1 싱글 가이드 RNA보다 실험예 3.1, 실험예 3.2의 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템의 유전자 편집 효율이 더 높은 것을 알 수 있다. 이러한 결과에 따라, 실험예 3.2, 실험예 3.3의 실시예에 나타난 가이드 RNA의 변형이 유전자 편집 효율을 향상시키는 것을 유추할 수 있다. 또한, 실험예 2 및 실험예 3에서 얻어진 실험 결과를 참조하면, 변형된 제1 영역, 및/또는 변형된 제2 영역을 포함하는 엔지니어링된 Cas12f1 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템이, 자연계에서 발견되는 CRISPR/Cas12f1 시스템, 및 자연계에서 발견되는 tracrRNA 및 crRNA를 링커로 연결한 Cas12f1 싱글 가이드 RNA를 포함하는 CRISPR/Cas12f1 시스템보다 유전자 편집 효율이 더 높을 것이라 유추할 수 있다.
실험예 4 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 4
실험예 4.1 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율 비교 4-1
엔지니어링 된 Cas12f1 가이드 RNA를 사용한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 측정하기 위해, 실험예 1.1 내지 1.2에 의해 각 실시예를 제조하였다. 실험에 사용한 표적 서열은 다음 [표18]에 나타냈다.
[표18]
Figure PCTKR2021013898-appb-I000018
각 실시예 별 엔지니어링 된 Cas12f1 가이드 RNA의 서열은 다음 [표19]에 나타냈다.
[표19]
Figure PCTKR2021013898-appb-I000019
상기 실시예 별 제조된 벡터를 실험예 1.3에 의해 HEK293 T세포에 형질도입(transfection)하고, 실험예 1.4 내지 1.5에 의해 인델 발생 효율을 측정하였다. 이를 실험예 1.6에 의해 분석한 결과가 도 24 내지 도 26에 나타나있다.
실험예 4.2 실험 결과
상기 실험 결과, 변형된 제3 영역을 가지는 엔지니어링 된 Cas12f1 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템의 유전자 편집 효율이 자연계에서 발견되는 스캐폴드를 가지는 CRISPR/Cas12f1 시스템, 및 자연계에서 발견되는 tracrRNA 및 crRNA를 링커로 연결한 Cas12f1 싱글 가이드 RNA를 포함하는 CRISPR/Cas12f1 시스템보다 유전자 편집 효율이 더 높을 것이라 유추할 수 있다.
실험예 5 Large scale validation
상기 실험예 2 내지 실험예 4는 몇 개의 내인성 표적에 대해서만 인델 효율을 측정한 결과이다. 상기 결과를 보충하기 위해, 더 광범위한 표적에 대해 유전자 편집이 가능한 지 여부를 실험하였다.
1) in silico로, 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 검색하여, 88개의 표적을 무작위로 선택하였다 (표20 내지 표22). 이는, Cas9, Cas12a, 및 Cas12f1 모두로 편집이 가능한 서열이므로, 각 CRISPR/Cas 시스템의 유전자 편집 효율을 비교할 수 있는 표적이다.
[표20]
Figure PCTKR2021013898-appb-I000020
[표21]
Figure PCTKR2021013898-appb-I000021
[표22]
Figure PCTKR2021013898-appb-I000022
2) CRISPR/SpCas9 시스템, CRISPR/AsCas12a 시스템, 자연계에서 발견되는 CRISPR/Cas12f1 시스템 또는 엔지니어링 된 CRISPR/Cas12f1 시스템의 각 구성을 HEK293-T 세포에 형질 감염(transfection) 시켰다. 이때, 엔지니어링 된 CRISPR/Cas12f1 시스템에 사용된 엔지니어링 된 Cas12f1 가이드 RNA는 다음 [표23]에 정리되어 있다.
[표23]
Figure PCTKR2021013898-appb-I000023
이때, 상기 서열 중 5'-NNNNNNNNNNNNNNNNNNNN-3' 부분은 스페이서 서열로, 상기 [표20] 내지 [표22]에 나타난 프로토스페이서 서열에 대응되는 스페이서 서열로 각각 설계되었다.
3) 형질 감염 후, 상기 88개의 표적에 대한 유전자 편집 효율은 도 27 및 표24에 나타내었다.
[표24]
Figure PCTKR2021013898-appb-I000024
실험 결과, 본 명세서에서 개시하고 있는 엔지니어링 된 CRISPR/Cas12f1 시스템은 1) 자연계에서 발견되는 CRISPR/Cas12f1 시스템에 비해 유전자 편집 효율이 월등히 높으며, 2) 진핵 세포 내 임의의 표적에 대해 CRISPR/SpCas9 시스템 및 CRISPR/AsCas12a 시스템과 견줄 수 있는 유전자 편집 효율을 보이고, 3) 일부 표적에 대해서는 타 CRISPR/Cas 시스템보다 더 높은 유전자 편집 효율을 보일 수 있음을 알 수 있었다.
실험예 6 in vitro cleavage assay
본 명세서에서 개시하고 있는 엔지니어링 된 CRISPR/Cas12f1 시스템의 유전자 절단 양상을 보충적으로 관찰하기 위하여, in vitro cleavage assay를 진행하였다. 실험예 6에서 사용한 표적 protospacer 서열은 5'-TTTAAGAACACATACCCCTGGGCC-3'(서열번호 341, 이하 Intergenic-22)로, 상기 표적의 PAM 서열은 5'-TTTA-3'이다.
실험예 6에서 사용한 (엔지니어링 된) Cas12f1 가이드 RNA는 다음 [표25]에 나타나있다.
[표25]
Figure PCTKR2021013898-appb-I000025
실험 방법은 다음과 같다.
1) Recombinant Cas14 (2.5 μg)와 Canonical, MS2/MS3/MS4, 및 MS2/MS3/MS4/MS5의 sgRNA를 각각 2μg을 인큐베이션하여 RNA complex를 형성시켰다.
2) 이를 표적 서열(Intergenic-22)을 포함하고 있는 플라스미드 벡터 (5 μg)와 37℃에서 3 시간 동안 반응시켜 In vitro cleavage assay를 진행하였다.
3) Positive control로써 Apa1 restriction enzyme cut을 진행하였다.
4) Cleavage가 된 DNA를 Ultrasonicator인 Covaris (M220)를 가지고 다음의 조건에서 DNA shearing을 진행하였다.
Peak incident power: 50W, Duty factor: 20%, Cycles per Burst: 200 cpb, Treatment time: 110 sec.
5) 조각난 DNA를 DNA purification kit를 이용하여 정제하였다.
6) 정제된 DNA를 T4 ligase를 이용하여 End-filling을 수행하였다.
7) 그 후 NEBNext® Ultra쪠 II DNA Library Prep Kit for Illumina® (NEB, # E7103) kit와 NEBNext® Multiplex Oligos for Illumina® (Dual Index Primers Set 1) (NEB, # E7600) kit를 이용하여 DNA library를 제작하였다.
8) qPCR을 수행하여 각 샘플의 농도를 동일하게 조절하였다.
9) 제작된 library를 Illumina iSeq 100을 사용하여 150-bp paired-end sequencing 하였다.
10) 분석된 서열은 IGV 프로그램으로 alignment하였다.
상기 실험 결과를 도 28에 도시하였다.
실험 결과, 본 명세서에서 개시하는 엔지니어링 된 가이드 RNA를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 시스템은 자연계에서 발견되는 CRISPR/Cas12f1 시스템과 비교하여 비표적 가닥(Non-target strand, NTS)에 대한 절단 활성이 더 높은 것으로 나타났다. 상기 결과는 본 명세서에서 개시하는 엔지니어링 된 CRISPR/Cas12f1 시스템의 향상된 유전자 편집 활성에 영향을 미치는 요인으로 판단된다.
본 명세서에서는 유전자 편집 기술에 사용할 수 있는 CRISPR/Cas12f1 시스템을 제공하며, 특히, U-rich tail 및 엔지니어링 된 스캐폴드 영역을 도입하여 유전자 편집 효율을 향상시킨 엔지니어링 된 CRISPR/Cas12f1 시스템을 제공한다. 본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 시스템을 유전자 편집에 사용하는 경우, 자연계에서 발견되는 CRISPR/Cas12f1 시스템을 사용하는 것과 비교해 높은 유전자 편집 효율을 나타내며, 진핵세포 유전자를 편집하는 용도로 사용할 수 있다.

Claims (38)

  1. 다음을 포함하는, CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
    엔지니어링 된 스캐폴드 영역;
    스페이서; 및
    U-rich tail,
    이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
    상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
    상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
    5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
    5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
    5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
    5'-AUGCAAC-3'.
  2. 제1항에 있어서, 상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  3. 제1항에 있어서, 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 가이드 RNA:
    5'-A-3';
    5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
    5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
    5'-AUGCAAC-3'.
  4. 제1항에 있어서, 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 가이드 RNA:
    5'-A-3';
    5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
    5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
    5'-AUGCAAC-3'.
  5. 제1항 내지 제4항 중 어느 한 항의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
  6. 다음을 포함하는, CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
    엔지니어링 된 스캐폴드;
    스페이서; 및
    U-rich tail,
    이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
    상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
    상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이며, a는 1 이상 5 이하이고, b는 0 이상이며,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAG-3'(서열번호 475)로 표현되는 제1 서열;
    5'-UUCG-3'로 표현되는 제2 서열;
    5'-CUCGA-3'로 표현되는 제3 서열;
    5'-AACCAAA-3'로 표현되는 제4 서열;
    링커;
    5'-GGA-3'로 표현되는 제5 서열; 및
    5'-AUGCAAC-3'로 표현되는 제6 서열.
  7. 제6항에 있어서, 상기 링커는 5'-GAAA-3'인 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  8. 제6항에 있어서, 상기 링커는 5'-GAAA-3', 5'-UGAAAA-3', 5'-UUGAAAAA-3', 5'-UUCGAAAGAA-3'(서열번호 642), 5'-UUCAGAAAUGAA-3'(서열번호 643), 5'-UUCAUGAAAAUGAA-3'(서열번호 644), 및 5'-UUCAUUGAAAAAUGAA-3'(서열번호 645)로 이루어진 군에서 선택된 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  9. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제7 서열을 추가적으로 포함하며, 상기 제7 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  10. 제6항에 있어서, 상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  11. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362) 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제8 서열을 추가적으로 포함하고, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  12. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제7 서열을 추가적으로 포함하고, 5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제8 서열을 추가적으로 포함하며, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  13. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3', 5'-AA-3', 5'-AAG-3', 5'-AAGU-3', 5'-AAGUG-3', 5'-AAGUGC-3', 5'-AAGUGCU-3', 5'-AAGUGCUU-3', 5'-AAGUGCUUU-3', 5'-AAGUGCUUUC-3'(서열번호 485)로 이루어진 군에서 선택된 제9 서열을 추가적으로 포함하고, 5'-C-3', 5'-CC-3', 5'-ACC-3', 5'-AACC-3', 5'-UAACC-3', 5'-GUAACC-3', 5'-AGUAACC-3', 5'-AAGUAACC-3', 5'-AAAGUAACC-3', 5'-GAAAGUAACC-3'(서열번호 486)로 이루어진 군에서 선택된 제10 서열을 추가적으로 포함하며, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있고, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  14. 제13항에 있어서,
    상기 제9 서열이 5'-A-3'인 경우, 상기 제10 서열은 5'-C-3'이고,
    상기 제9 서열이 5'-AA-3'인 경우, 상기 제10 서열은 5'-C-3', 또는 5'-CC-3'이고,
    상기 제9 서열이 5'-AAG-3'인 경우, 상기 제10 서열은 5'-CC-3', 또는 5'-ACC-3'이고,
    상기 제9 서열이 5'-AAGU-3'인 경우, 상기 제10 서열은 5'-AACC-3'이고,
    상기 제9 서열이 5'-AAGUG-3'인 경우, 상기 제10 서열은 5'-UAACC-3'이고,
    상기 제9 서열이 5'-AAGUGC-3'인 경우, 상기 제10 서열은 5'-GUAACC-3'이고,
    상기 제9 서열이 5'-AAGUGCU-3'인 경우, 상기 제10 서열은 5'-AGUAACC-3'이고,
    상기 제9 서열이 5'-AAGUGCUC-3'인 경우, 상기 제10 서열은 5'-GAGUAACC-3'이고,
    상기 제9 서열이 5'-AAGUGCUU-3'인 경우, 상기 제10 서열은 5'-AAGUAACC-3'이고,
    상기 제9 서열이 5'-AAGUGCUUU-3'인 경우, 상기 제10 서열은 5'-AAAGUAACC-3'이고,
    상기 제9 서열이 5'-AAGUGCUUUC-3'(서열번호 485)인 경우, 상기 제10 서열은 5'-GAAAGUAACC-3'(서열번호 486)인 엔지니어링 된 가이드 RNA.
  15. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-U-3', 5'-UU-3', 5'-UUC-3', 5'-UUCA-3', 5'-UUCAU-3', 5'-UUCAUU-3', 및 5'-UUCAUUU-3'로 이루어진 군에서 선택된 제 11서열, 및 5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-UGAA-3', 5'-AUGAA-3', 5'-AAUGAA-3', 및 5'-GAAUGAA-3'로 이루어진 군에서 선택된 제 12서열을 추가적으로 포함하며, 상기 제4 서열의 3'말단 및 상기 링커의 5'말단은 상기 제11 서열을 통해 연결되고, 상기 링커의 3'말단 및 상기 제5 서열의 5'말단은 상기 제12 서열을 통해 연결된 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  16. 제15항에 있어서,
    상기 제11 서열이 5'-U-3'인 경우, 상기 제12 서열은 5'-A-3'이고,
    상기 제11 서열이 5'-UU-3'인 경우, 상기 제12 서열은 5'-AA-3'이고,
    상기 제11 서열이 5'-UUC-3'인 경우, 상기 제12 서열은 5'-GAA-3'이고,
    상기 제11 서열이 5'-UUCA-3'인 경우, 상기 제12 서열은 5'-UGAA-3'이고,
    상기 제11 서열이 5'-UUCAU-3'인 경우, 상기 제12 서열은 5'-AUGAA-3'이고,
    상기 제11 서열이 5'-UUCAUU-3'인 경우, 상기 제12 서열은 5'-AAUGAA-3'이고,
    상기 제11 서열이 5'-UUCAUUU-3'인 경우, 상기 제12 서열은 5'-GAAUGAA-3'인 엔지니어링 된 가이드 RNA.
  17. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3'로 표현되는 제7 서열, 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 표현되는 제8 서열, 5'-AAGUGCUUUC-3'(서열번호 485)로 표현되는 제9 서열, 및 5'-GAAAGUAACC-3'(서열번호 486)로 표현되는 제10 서열을 추가적으로 포함하고, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있고, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있으며, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  18. 제6항에 있어서, 상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-A-3'로 표현되는 제7 서열, 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350)로 표현되는 제8 서열, 5'-AAGUGCUUUC-3'(서열번호 485)로 표현되는 제9 서열, 및 5'-GAAAGUAACC-3'(서열번호 486)로 표현되는 제10 서열을 추가적으로 포함하고, 상기 제8 서열의 3'말단은 상기 제1 서열의 5'말단과 연결되어 있고, 상기 제7 서열의 3'말단은 상기 제8 서열의 5'말단과 연결되어 있고, 상기 제1 서열의 3'말단 및 상기 제2 서열의 5'말단은 상기 제9 서열을 통해 연결되어 있으며, 상기 제2 서열의 3'말단 및 상기 제3 서열의 5'말단은 상기 제10 서열을 통해 연결되어 있는 것을 특징으로 하는 엔지니어링 된 가이드 RNA.
  19. 제6항 내지 제18항 중 어느 한 항의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
  20. 다음을 포함하는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
    엔지니어링 된 스캐폴드 영역;
    스페이서; 및
    U-rich tail,
    이때, 상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
    상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
    상기 엔지니어링 된 스캐폴드 영역은 다음을 포함함:
    5'말단에서 3'말단 방향으로,
    5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 제1 서열,
    5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 제2 서열,
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 제3 서열,
    5'-AACAAA-3', 5'-AACAAAU-3', 5'-AACAAAUU-3', 5'-AACAAAUUC-3', 5'-AACAAAUUCA-3'(서열번호 67), 5'-AACAAAUUCAU-3'(서열번호 68), 5'-AACAAAUUCAUU-3'(서열번호 69), 및 5'-AACAAAUUCAUUU-3'(서열번호 13)로 이루어진 군에서 선택된 제4 서열이 연결된 엔지니어링 된 tracrRNA; 및
    5'-GGA-3', 5'-AGGA-3', 5'-AAGGA-3', 5'-GAAGGA-3', 5'-UGAAGGA-3', 5'-AUGAAGGA-3', 5'-AAUGAAGGA-3', 및 5'-GAAUGAAGGA-3'(서열번호 15)으로 이루어진 군에서 선택된 제5 서열, 및
    5'-AUGCAAC-3'로 표현되는 제6 서열이 연결된 엔지니어링 된 crRNA 반복 서열 부분,
    이때, 상기 엔지니어링 된 crRNA 반복 서열 부분의 3'말단은 상기 스페이서의 5'말단과 연결 되어 있고,
    상기 엔지니어링 된 tracrRNA의 서열이 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU-3'(서열번호 1)와 동일하고, 상기 엔지니어링 된 crRNA 반복 서열이 5'-GAAUGAAGGAAUGCAAC-3'(서열번호 3)과 동일한 경우는 포함하지 않는 것을 특징으로 한다.
  21. 제20항의 엔지니어링 된 가이드 RNA를 암호화하는 DNA.
  22. 다음을 포함하는, 엔지니어링 된 CRISPR/Cas12f1 복합체:
    Cas12f1 단백질; 및
    엔지니어링 된 가이드 RNA,
    이때, 상기 엔지니어링 된 가이드 RNA는 다음을 포함함:
    엔지니어링 된 스캐폴드 영역;
    스페이서; 및
    U-rich tail,
    이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
    상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 상기 표적 서열과 상보적인 서열을 가지고,
    상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
    5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
    5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
    5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
    5'-AUGCAAC-3'.
  23. 제22 항에 있어서, 상기 U-rich tail의 서열은 5'-UUUURUUUU-3'로 표현되는 것을 특징으로 하는 엔지니어링 된 CRISPR/Cas12f1 복합체.
  24. 제22 항에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 CRISPR/Cas12f1 복합체:
    5'-A-3';
    5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
    5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
    5'-AUGCAAC-3'.
  25. 제22 항에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 엔지니어링 된 CRISPR/Cas12f1 복합체:
    5'-A-3';
    5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
    5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
    5'-AUGCAAC-3'.
  26. 다음을 포함하는, 엔지니어링 된 CRISPR/Cas12f1 복합체:
    Cas12f1 단백질; 및
    제6항 내지 제18항 중 어느 한 항에 따른 엔지니어링 된 가이드 RNA.
  27. 다음을 포함하는, CRISPR/Cas12f1 시스템의 각 구성요소를 발현할 수 있는 벡터:
    Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열;
    상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
    엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열; 및
    상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열,
    이때, 상기 엔지니어링 된 가이드 RNA는 다음을 포함함:
    엔지니어링 된 스캐폴드 영역;
    스페이서; 및
    U-rich tail,
    여기서, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
    상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
    상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
    5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
    5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
    5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
    5'-AUGCAAC-3'.
  28. 제27항에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 벡터:
    5'-A-3';
    5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11);
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
    5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
    5'-AUGCAAC-3'.
  29. 제27항에 있어서, 상기 엔지니어링 된 가이드 RNA에 포함된 상기 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것을 특징으로 하는 벡터:
    5'-A-3';
    5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350);
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12);
    5'-AACCAAAGAAAGGA-3'(서열번호 111); 및
    5'-AUGCAAC-3'.
  30. 제27항에 있어서, 상기 제2 프로모터 서열은 U6 프로모터 서열인 벡터.
  31. 제27항에 있어서, 상기 벡터는 플라스미드, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 벡터.
  32. 다음을 포함하는, CRISPR/Cas12f1 시스템의 각 구성요소를 발현할 수 있는 벡터:
    Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열;
    상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
    제6항 내지 제18항 중 어느 한 항에 따른 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열; 및
    상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열.
  33. 다음을 포함하는, 세포 내에서 표적 핵산을 편집하는 방법:
    Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 가이드 RNA 또는 이름 암호화하는 핵산을 세포 내로 전달하는 것,
    이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
    이로 인해 상기 표적 핵산이 CRISPR/Cas12f1 복합체에 의해 편집될 수 있고,
    상기 엔지니어링 된 가이드 RNA는 다음을 포함하는 것을 특징으로 함:
    엔지니어링 된 스캐폴드 영역;
    스페이서; 및
    U-rich tail,
    이때, 상기 엔지니어링 된 가이드 RNA는 5'말단에서 3'말단 방향으로, 엔지니어링 된 스캐폴드 영역, 스페이서, 및 U-rich tail이 순서대로 연결되어 있고,
    상기 스페이서는 10개 이상 50개 이하의 뉴클레오타이드를 포함하며, 표적 서열과 상보적인 서열을 가지고,
    상기 U-rich tail의 서열은 (UaN)bUc로 표현되며, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이고, 상기 a, b, c는 정수이고, a는 1 이상 5 이하, b는 0 이상이고,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACCAAAUUCAUUUGAAAGAAUGAAGGAAUGCAAC-3'(서열번호 7)과 상이한 것을 특징으로 하며,
    상기 엔지니어링 된 스캐폴드 영역의 서열은 5'말단에서 3'말단 방향으로 다음 서열이 순서대로 연결된 것임:
    5'-A-3', 5'-AA-3', 5'-GAA-3', 5'-AGAA-3', 5'-GAGAA-3', 5'-GGAGAA-3', 5'-UGGAGAA-3', 5'-GUGGAGAA-3', 5'-AGUGGAGAA-3', 5'-AAGUGGAGAA-3'(서열번호 17), 5'-AAAGUGGAGAA-3'(서열번호 18), 5'-UAAAGUGGAGAA-3'(서열번호 19), 5'-AUAAAGUGGAGAA-3'(서열번호 20), 5'-GAUAAAGUGGAGAA-3'(서열번호 21), 5'-UGAUAAAGUGGAGAA-3'(서열번호 22), 5'-CUGAUAAAGUGGAGAA-3'(서열번호 23), 5'-ACUGAUAAAGUGGAGAA-3'(서열번호 24), 5'-CACUGAUAAAGUGGAGAA-3'(서열번호 25), 5'-UCACUGAUAAAGUGGAGAA-3'(서열번호 26), 5'-UUCACUGAUAAAGUGGAGAA-3'(서열번호 27), 및 5'-CUUCACUGAUAAAGUGGAGAA-3'(서열번호 10)로 이루어진 군에서 선택된 서열;
    5'-G-3', 5'-UUAGG-3', 5'-CUUAGGG-3', 5'-CUUAGUGG-3', 5'-CCUUAGGUGG-3'(서열번호 342), 5'-CCGUUAGGUGG-3'(서열번호 343), 5'-CCGCUUAGGGUGG-3'(서열번호 344), 5'-CCGCUUUAGAGGUGG-3'(서열번호 345), 5'-CCGCUUUUAGAAGGUGG-3'(서열번호 346), 5'-CCGCUUCUUAGGAAGGUGG-3'(서열번호 347), 5'-CCGCUUCAUUAGUGAAGGUGG-3'(서열번호 348), 5'-CCGCUUCACUUAGGUGAAGGUGG-3'(서열번호 349), 5'-CCGCUUCACUUAGAGUGAAGGUGG-3'(서열번호 350), 5'-CCGCUUCACCUUAGGAGUGAAGGUGG-3'(서열번호 351), 5'-CCGCUUCACCAUUAGUGAGUGAAGGUGG-3'(서열번호 352), 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGG-3'(서열번호 353), 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG-3'(서열번호 354), 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG-3'(서열번호 355), 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 356), 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG-3'(서열번호 357), 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG-3'(서열번호 358), 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG-3'(서열번호 359), 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG-3'(서열번호 360), 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 361), 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 362), 및 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG-3'(서열번호 11)로 이루어진 군에서 선택된 서열;
    5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 434), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUUCGAAAGUAACCCUCGA-3'(서열번호 435), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUUCGAAGUAACCCUCGA-3'(서열번호 436), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUCUUCGGAGUAACCCUCGA-3'(서열번호 437), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCGAGUAACCCUCGA-3'(서열번호 438), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUCGGUAACCCUCGA-3'(서열번호 439), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGUUCGUAACCCUCGA-3'(서열번호 440), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUUCGAACCCUCGA-3'(서열번호 441), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGACCCUCGA-3'(서열번호 442), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUUCGCCCUCGA-3'(서열번호 443), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCCUCGA-3'(서열번호 444), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAUUCGCCUCGA-3'(서열번호 445), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAUUCGCCUCGA-3'(서열번호 446), 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGUUCGCUCGA-3'(서열번호 447), 및 5'-GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA-3'(서열번호 12)로 이루어진 군에서 선택된 서열;
    5'-AACAAAGAAAGGA-3'(서열번호 111), 5'-AACAAAUGAAAAGGA-3'(서열번호 112), 5'-AACAAAUUGAAAAAGGA-3'(서열번호 113), 5'-AACAAAUUCGAAAGAAGGA-3'(서열번호 114), 5'-AACAAAUUCAGAAAUGAAGGA-3'(서열번호 115), 5'-AACAAAUUCAUGAAAAUGAAGGA-3'(서열번호 116), 5'-AACAAAUUCAUUGAAAAAUGAAGGA-3'(서열번호 117), 및 5'-AACAAAUUCAUUUGAAAGAAUGAAGGA-3'(서열번호 118)에서 선택된 서열; 및
    5'-AUGCAAC-3'.
  34. 제33항에 있어서, 상기 전달은 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 CRISPR/Cas12f1 복합체로써 세포 내에 주입하는 것인 방법.
  35. 제33항에 있어서, 상기 전달은 상기 Cas12f1 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 벡터를 세포 내에 주입하는 것인 방법.
  36. 제35항에 있어서, 상기 벡터는 플라스미드, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 벡터.
  37. 제33항에 있어서, 상기 세포는 진핵세포인 것을 특징으로 하는 방법.
  38. 다음을 포함하는, 세포 내에서 표적 핵산을 편집하는 방법:
    Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 제6항 내지 제18항 중 어느 한 항에 따른 엔지니어링 된 가이드 RNA 또는 이름 암호화하는 핵산을 세포 내로 전달하는 것,
    이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
    이로 인해 상기 표적 핵산이 CRISPR/Cas12f1 복합체에 의해 편집될 수 있음.
PCT/KR2021/013898 2020-10-08 2021-10-08 Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도 WO2022075808A1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
EP21878058.3A EP4227408A1 (en) 2020-10-08 2021-10-08 Engineered guide rna comprising u-rich tail for increasing efficiency of crispr/cas12f1 system, and use thereof
AU2021357283A AU2021357283A1 (en) 2020-10-08 2021-10-08 Engineered guide RNA comprising U-rich tail for optimized CRISPR/Cas12f1 system and use thereof
CA3198422A CA3198422A1 (en) 2020-10-08 2021-10-08 Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof
CN202180082801.5A CN116568803A (zh) 2020-10-08 2021-10-08 用于增加CRISPR/Cas12f1系统的效率的包含富含U的尾部的经工程化的引导RNA及其用途
JP2023521510A JP2023545079A (ja) 2020-10-08 2021-10-08 CRISPR/Cas12f1システム効率化のためのU-rich tailを含むエンジニアリングされたガイドRNAおよびその用途
US18/030,418 US20230374500A1 (en) 2020-10-08 2021-10-08 Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR10-2020-0129937 2020-10-08
KR20200129937 2020-10-08
KR20200185528 2020-12-29
KR10-2020-0185528 2020-12-29
KR10-2021-0050093 2021-04-16
KR1020210050093 2021-04-16

Publications (1)

Publication Number Publication Date
WO2022075808A1 true WO2022075808A1 (ko) 2022-04-14

Family

ID=81127008

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/013898 WO2022075808A1 (ko) 2020-10-08 2021-10-08 Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도

Country Status (6)

Country Link
US (1) US20230374500A1 (ko)
EP (1) EP4227408A1 (ko)
JP (1) JP2023545079A (ko)
AU (1) AU2021357283A1 (ko)
CA (1) CA3198422A1 (ko)
WO (1) WO2022075808A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022266298A1 (en) * 2021-06-17 2022-12-22 Massachusetts Institute Of Technology Systems, methods, and compositions comprising miniature crispr nucleases for gene editing and programmable gene activation and inhibition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023500188A (ja) * 2019-10-29 2023-01-05 ゲンコレ インコーポレイテッド 最適化されたCRISPR/Cas12f1システムのための人工ガイドRNAおよびその使用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019089820A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
US20200190494A1 (en) 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
CN111363763A (zh) * 2020-03-31 2020-07-03 海南大学 一种RNA激活Cas14a酶附带切割效应的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019089820A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Casz compositions and methods of use
US20200172886A1 (en) * 2017-11-01 2020-06-04 The Regents Of The University Of California Casz compositions and methods of use
US20200190494A1 (en) 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
CN111363763A (zh) * 2020-03-31 2020-07-03 海南大学 一种RNA激活Cas14a酶附带切割效应的方法

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
HARRINGTON ET AL.: "Programmed DNA destruction by miniature CRISPR-Cas14 enzymes", SCIENCE, vol. 362, 2018, pages 839 - 842, XP055614750, DOI: 10.1126/science.aav4294
HARRINGTON, L. B.: "Programmed DNA destruction by miniature CRISPR-Cas14 enzymes", SCIENCE, vol. 362, 18 August 1612 (1612-08-18), pages 839 - 842, XP055614750, DOI: 10.1126/science.aav4294 *
KARVELIS ET AL., NUCLEIC ACIDS RESEARCH, vol. 48, no. 9, 2020, pages 5017
KARVELIS TAUTVYDAS, BIGELYTE GRETA, YOUNG JOSHUA K, HOU ZHENGLIN, ZEDAVEINYTE RIMANTE, BUDRE KAROLINA, PAULRAJ SUSHMITHA, DJUKANOV: "PAM recognition by miniature CRISPR–Cas12f nucleases triggers programmable double-stranded DNA target cleavage", NUCLEIC ACIDS RESEARCH, OXFORD UNIVERSITY PRESS, GB, vol. 48, no. 9, 21 May 2020 (2020-05-21), GB , pages 5016 - 5023, XP055920188, ISSN: 0305-1048, DOI: 10.1093/nar/gkaa208 *
KIM DO YON; LEE JEONG MI; MOON SU BIN; CHIN HYUN JUNG; PARK SEYEON; LIM YOUJUNG; KIM DAESIK; KOO TAEYOUNG; KO JEONG-HEON; KIM YONG: "Efficient CRISPR editing with a hypercompact Cas12f1 and engineered guide RNAs delivered by adeno-associated virus", NATURE BIOTECHNOLOGY, NATURE PUBLISHING GROUP US, NEW YORK, vol. 40, no. 1, 2 September 2021 (2021-09-02), New York, pages 94 - 102, XP037667066, ISSN: 1087-0156, DOI: 10.1038/s41587-021-01009-z *
MAKAROVA ET AL.: "Nature Reviews", MICROBIOLOGY, vol. 18, 2020, pages 67
MIYAGISHI ET AL., NATURE BIOTECHNOLOGY, vol. 20, 2002, pages 497 - 500
MOON, S. B.: "Highly efficient genome editing by CRISPR-Cpf1 using CRISPR RNA with a uridinylate-rich 3′-overhang", NATURE COMMUNICATIONS, vol. 9, 2018, pages 1 - 11, XP055785455, DOI: 10.1038/s41467-018-06129-w *
PANYAM, ADV DRUG DELIV REV, 13 September 2012 (2012-09-13)
TAKEDA ET AL.: "Structure of the miniature type V-F CRISPR-Cas effector enzyme", MOLECULAR CELL, vol. 81, 2021, pages 1 - 13
XIA ET AL., NUCLEIC ACIDS RES., vol. 1, no. 17, September 2003 (2003-09-01), pages 31
XIAO ET AL.: "Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease", BIORXIV, 2020

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022266298A1 (en) * 2021-06-17 2022-12-22 Massachusetts Institute Of Technology Systems, methods, and compositions comprising miniature crispr nucleases for gene editing and programmable gene activation and inhibition

Also Published As

Publication number Publication date
CA3198422A1 (en) 2022-04-14
US20230374500A1 (en) 2023-11-23
AU2021357283A1 (en) 2023-05-25
JP2023545079A (ja) 2023-10-26
EP4227408A1 (en) 2023-08-16

Similar Documents

Publication Publication Date Title
WO2021086083A2 (ko) CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
WO2022075813A1 (ko) Crispr/cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 그 용도
WO2022220503A1 (ko) Crispr 시스템을 이용한 유전자 발현 조절 시스템
WO2019009682A2 (ko) 표적 특이적 crispr 변이체
WO2022075816A1 (ko) Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
WO2022075808A1 (ko) Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도
WO2017217768A1 (ko) 온타겟 및 오프타겟의 다중 타겟 시스템을 이용하는, 표적 특이적 유전자 가위 스크리닝 방법 및 이의 용도
WO2020235974A2 (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
WO2017188797A1 (ko) In vivo에서 rna-가이드 뉴클레아제의 활성을 고처리량 방식으로 평가하는 방법
AU2013335451C1 (en) Composition for cleaving a target DNA comprising a guide RNA specific for the target DNA and Cas protein-encoding nucleic acid or Cas protein, and use thereof
WO2016021973A1 (ko) 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
WO2018231018A2 (ko) 간에서 목적하는 단백질 발현하기 위한 플랫폼
WO2018001258A1 (zh) 一种用于核酸富集捕获的探针及设计方法
CN101522899A (zh) 安全性改善的表达载体
WO2018088694A2 (ko) 인위적으로 조작된 sc 기능 조절 시스템
WO2015199387A2 (ko) 가용성 단백질 발현량 및 활성이 증대된 헬리코박터 파일로리 유래 α-1,3 푸코실 전달효소의 유전자와 단백질 및 α-1,3 푸코실올리고당 생산에의 응용
WO2023059115A1 (ko) 유전자 편집을 위한 target 시스템 및 이의 용도
WO2023153845A2 (ko) 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법
CN1330666C (zh) 低氧-诱导因子1αHIF-1α变体和鉴定HIF-1α调节剂的方法
WO2019022520A1 (ko) 핵산 복합체 페어, 경쟁 구조체, 이를 이용한 pcr 키트
WO2018182361A1 (ko) CRISPR/Cas 시스템과 재조합 효소 및 단일가닥 올리고디옥시리보핵산을 이용한 코리네박테리움 변이균주 제조방법
WO2020218657A1 (ko) 표적 특이적 crispr 변이체
WO2023229222A1 (ko) 확장된 표적 범위를 갖는 엔지니어링된 cas12f 단백질 및 이의 용도
WO2023282597A1 (ko) 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
WO2023140694A1 (ko) 스트렙토코커스 피오게네스 유래 cas9 변이체

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21878058

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3198422

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2023521510

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 202317027031

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021878058

Country of ref document: EP

Effective date: 20230508

ENP Entry into the national phase

Ref document number: 2021357283

Country of ref document: AU

Date of ref document: 20211008

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 202180082801.5

Country of ref document: CN