KR102638799B1 - CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 - Google Patents

CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 Download PDF

Info

Publication number
KR102638799B1
KR102638799B1 KR1020210044152A KR20210044152A KR102638799B1 KR 102638799 B1 KR102638799 B1 KR 102638799B1 KR 1020210044152 A KR1020210044152 A KR 1020210044152A KR 20210044152 A KR20210044152 A KR 20210044152A KR 102638799 B1 KR102638799 B1 KR 102638799B1
Authority
KR
South Korea
Prior art keywords
sequence
seq
engineered
time
crrna
Prior art date
Application number
KR1020210044152A
Other languages
English (en)
Other versions
KR20220047502A (ko
Inventor
김용삼
김도연
이정미
문수빈
Original Assignee
주식회사 진코어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 진코어 filed Critical 주식회사 진코어
Priority to CN202180082971.3A priority Critical patent/CN116568806A/zh
Priority to US18/030,575 priority patent/US20230416784A1/en
Priority to CA3198435A priority patent/CA3198435A1/en
Priority to AU2021358805A priority patent/AU2021358805A1/en
Priority to JP2023521490A priority patent/JP2023544826A/ja
Priority to PCT/KR2021/013933 priority patent/WO2022075816A1/ko
Priority to EP21878066.6A priority patent/EP4227412A1/en
Publication of KR20220047502A publication Critical patent/KR20220047502A/ko
Priority to KR1020240019104A priority patent/KR20240023081A/ko
Application granted granted Critical
Publication of KR102638799B1 publication Critical patent/KR102638799B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 보다 구체적으로, 본 발명은 표적 핵산의 절단, 편집 또는 변형을 더욱 효과적으로 수행하기 위한 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 또한, 본 발명은 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system를 이용한 표적 핵산의 절단, 편집 또는 변형 방법에 관한 것이다.

Description

CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 {An engineered guide RNA for the optimized CRISPR/Cas12f1(Cas14a1) system and use thereof}
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 보다 구체적으로, 본 발명은 표적 핵산의 절단(cleavage), 편집(editing) 또는 변형(modifying)을 더욱 효과적으로 수행하기 위한 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 또한, 본 발명은 engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system를 이용한 표적 핵산의 절단, 편집 또는 변형 방법에 관한 것이다.
CRISPR/Cas12f1 system은 Class 2, Type V로 분류되는 CRISPR/Cas 시스템이다. 선행연구(Harrington et al., Science 362, 839-842 (2018))에서 최초로 고균 유래의 CRISPR/Cas 시스템인 CRISPR/Cas14 시스템에 대해 밝혀졌다. 그 후 후속 연구(Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 상기 CRISPR/Cas14 시스템을 CRISPR/Cas12f 시스템으로 분류하였다. CRISPR/Cas12f1 system은 상기 Class 2, Type V로 분류되는 CRISPR/Cas 시스템 중 하나의 베리언트인 V-F1 시스템에 속하며, 이는 Cas14a1를 이펙터 단백질로 가지는 CRISPR/Cas14a1 system을 포함한다. 상기 CRISPR/Cas12f1 system은 CRISPR/Cas9 system에 비하여 이펙터 단백질의 크기가 현저히 작다는 특징이 있다. 다만, 선행 연구(Harrington et al., Science 362, 839-842 (2018), US 2020/0190494 A1)에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템, 특히 CRISPR/Cas14a1 system은 이중 가닥 DNA 절단 활성이 없거나, 극히 낮아(Karvelis, T. et al., bioRxiv, 654897 (2019)) 유전자 편집 기술에 응용하는 데 한계가 있다.
본 발명의 일 목적은 CRISPR/Cas12f1(Cas14a1) system을 위한 engineered guide RNA를 제공하는 것이다.
본 발명의 다른 목적은 engineered CRISPR/Cas12f1(Cas14a1) system을 제공하는 것이다.
본 발명의 또 다른 목적은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 표적 핵산 또는 표적 유전자를 변형하는 방법을 제공하는 것이다.
본 발명은 CRISPR/Cas12f1(Cas14a1) system을 위한 engineered guide RNA를 제공한다. 상기 engineered guide RNA는 engineered tracrRNA(trans-activating CRISPR RNA) 및 crRNA(CRISPR RNA)를 포함한다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA이다. 또는, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA이다.
일 구현예로서, 상기 engineered guide RNA는 engineered tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함할 수 있다.
상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA일 수 있다.
상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5서열을 3'말단에서 5'말단 방향으로 순서대로 포함할 수 있다.
이때, 상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열일 수 있다. 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G일 수 있다. 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 일 구체예로, 상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 111 서열의 일부 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 273) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 274) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 275) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 276) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 277) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 278) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 279) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 280) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 281) 서열, 5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 282) 서열, 5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 283) 서열, 5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 284) 서열, 5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 285) 서열, 5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 286) 서열, 5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 287) 서열, 5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 288) 서열, 5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 289) 서열, 5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 290) 서열 또는 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 SEQ ID NO: 111 또는 이의 일부 서열 내에 존재하는 5'-NNNCN-3' 서열은 5'-UUUCU-3' 서열, 5'-GUUCU-3' 서열, 5'-UCUCU-3' 서열, 5'-UUGCU-3' 서열, 5'-UUUCC-3' 서열, 5'-GCUCU-3' 서열, 5'-GUUCC-3' 서열, 5'-UCGCU-3' 서열, 5'-UCUCC-3' 서열, 5'-UUGCC-3' 서열, 5'-GCGCU-3' 서열, 5'-GCUCC-3' 서열, 5'-GUGCC-3' 서열, 5'-UCGCC-3' 서열, 5'-GCGCC-3' 서열 또는 5'-GUGCU-3' 서열일 수 있다.
이때, 상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
이때, 상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
이때, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 상기 SEQ ID NO: 213 서열의 일부 서열은 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열, 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열, 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 231) 서열, 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 232) 서열, 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 233) 서열, 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 234) 서열, 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 235) 서열, 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 236) 서열, 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 237) 서열, 5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 238) 서열, 5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO:239) 서열, 5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 240) 서열, 5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 241) 서열, 5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 242) 서열, 5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 243) 서열, 5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 244) 서열, 5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 245) 서열, 5'-CCGCUUAGGGUG-3' (SEQ ID NO: 246) 서열, 5'-CCGUUAGGUG-3' (SEQ ID NO: 247) 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 또는 5'-UUAG-3' 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열 내에 포함된 5'-UUAG-3' 서열은 선택적으로 5'-GAAA-3' 서열로 치환될 수 있다.
이때, 상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열일 수 있다. 상기 SEQ ID NO: 248 서열의 일부 서열은 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열, 5'-AAGUGGAGAA-3' (SEQ ID NO: 249) 서열, 5'-AAAGUGGAGAA-3' (SEQ ID NO: 250) 서열, 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 251) 서열, 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 252) 서열, 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 253) 서열, 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 254) 서열, 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 255) 서열, 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 256) 서열, 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 257) 서열, 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 258) 서열 또는 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 259) 서열일 수 있다.
상기 crRNA은 야생형 crRNA 또는 engineered crRNA일 수 있다.
이때, 상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열일 수 있다.
이때, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다.
이때, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3’ (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열일 수 있다. 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 일 구체예로, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 408) 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 상기 SEQ ID NO: 408 서열의 일부 서열은 5’-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 413) 서열, 5’-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 414) 서열, 5’-GCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 415) 서열, 5’-CAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 416) 서열, 5’-AGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 417) 서열, 5’-GAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 418) 서열, 5’-AACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 419) 서열, 5’-ACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 420) 서열, 5’-CCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 421) 서열, 5’-CCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 422) 서열, 5’-CGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 423) 서열, 5’-GAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 424) 서열, 5’-AAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 425) 서열, 5’-AUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 426) 서열, 5’-UAGNGNNNUGAAGGA-3’ (SEQ ID NO: 427) 서열, 5’-AGNGNNNUGAAGGA-3’ (SEQ ID NO: 428) 서열 또는 5’-NGNNNUGAAGGA-3’ (SEQ ID NO: 412) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 SEQ ID NO: 408 서열 또는 이의 일부 서열 내에 존재하는 5'-NGNNN-3' 서열은 5'-AGGAA-3' 서열, 5'-AGCAA-3' 서열, 5'-AGAAA-3' 서열, 5'-AGCAU-3' 서열, 5'-AGCAG-3' 서열, 5'-AGCAC-3' 서열, 5'-AGCUA-3' 서열, 5'-AGCGA-3' 서열, 5'-AGCCA-3' 서열, 5'-UGCAA-3' 서열, 5'-UGCUA-3' 서열, 5'-UGCGA-3' 서열, 5'-UGCCA-3' 서열, 5'-GGCAA-3' 서열, 5'-GGCUA-3' 서열, 5'-GGCGA-3' 서열, 5'-GGCCA-3' 서열, 5'-CGCAA-3' 서열, 5'-CGCUA-3' 서열, 5'-CGCGA-3' 서열 또는 5'-CGCCA-3' 서열일 수 있다.
이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
이때, 상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열로, 15 내지 30 nt(nucleotide) 서열일 수 있다.
상기 crRNA는 U-rich tail 서열을 추가로 더 포함할 수 있다. 이때, 상기 U-rich tail 서열은 상기 crRNA의 3'말단에 위치할 수 있다. 이때, 상기 U-rich tail 서열은 5’-(UaN)dUe-3’ 서열, 5’-UaVUaVUe-3’ 서열 또는 5’-UaVUaVUaVUe-3’ 서열일 수 있다. 상기 N은 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 상기 e는 0 내지 10의 정수일 수 있다.
상기 engineered guide RNA는 dual guide RNA 또는 single guide RNA일 수 있다.
상기 engineered guide RNA가 single guide RNA일 때, 상기 engineered guide RNA는 linker 서열을 추가로 더 포함할 수 있다. 이때, 상기 linker 서열은 상기 engineered tracrRNA와 상기 crRNA 사이에 위치할 수 있다.
일 구체예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 590) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAAC-3’ (SEQ ID NO: 591) 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 595) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3’ (SEQ ID NO: 539) 서열 및 가이드 서열을 포함할 수 있다.
다른 일 구체예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 592) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 593) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 300) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GAAUAGNGNNNUGAAGGAAUGCAAC-3’ (SEQ ID NO: 594) 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGUGCUCCUCUC-3' (SEQ ID NO: 596) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열, 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 597) 서열 또는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열을 포함할 수 있다. 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAAC-3’ (SEQ ID NO: 598) 서열 및 가이드 서열을 포함할 수 있다.
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system을 위한 벡터를 제공한다. 상기 벡터는 engineered guide RNA를 암호화하는 핵산을 포함한다.
일 구현예로서, 상기 벡터는 engineered guide RNA를 암호화하는 핵산을 포함할 수 있다.
상기 engineered guide RNA는 engineered tracrRNA 및 crRNA를 포함할 수 있다. 이때, 상기 engineered guide RNA는 앞서 설명한 engineered guide RNA의 구현예 와 동일한 구성을 가질 수 있다.
상기 벡터는 상기 engineered guide RNA를 암호화하는 핵산을 위한 프로모터를 더 포함할 수 있다. 이때, 상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터일 수 있다.
상기 벡터는 플라스미드, PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 적어도 하나의 바이러스 벡터일 수 있다.
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 제공한다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA 또는 이를 암호화하는 핵산; 및 Cas14a1 단백질 또는 이를 암호화하는 핵산을 포함한다.
일 구현예로서, 상기 조성물은 engineered guide RNA 또는 이를 암호화하는 핵산; 및 Cas14a1 단백질 또는 이를 암호화하는 핵산을 포함할 수 있다.
상기 engineered guide RNA는 engineered tracrRNA 및 crRNA를 포함할 수 있다. 이때, 상기 engineered guide RNA는 앞서 설명한 engineered guide RNA의 구현예 와 동일한 구성을 가질 수 있다.
상기 조성물은 벡터 형태일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산; 및 Cas14a1 단백질을 암호화하는 핵산을 포함할 수 있다. 이때, 상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터일 수 있다.
이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산; 및 Cas14a1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 벡터를 포함할 수 있다. 상기 벡터는 상기 engineered guide RNA를 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터일 수 있다. 또한, 상기 벡터는 상기 Cas14a1 단백질을 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터일 수 있다. 또는 상기 조성물은 상기 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 벡터 및 Cas14a1 단백질을 암호화하는 핵산을 포함하는 제2 벡터를 포함할 수 있다. 상기 제1 벡터는 상기 engineered guide RNA를 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터일 수 있다. 또한, 상기 제2 벡터는 상기 Cas14a1 단백질을 암호화하는 핵산을 위한 프로모터를 추가로 더 포함할 수 있고, 상기 프로모터는 CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터일 수 있다.
또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 조성물은 engineered guide RNA 및 Cas14a1 단백질을 포함할 수 있다. 상기 조성물은 engineered CRISPR/Cas14a1 복합체 형태인 ribonucleoprotein (RNP)형태일 수 있다.
또한, 본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 대상 세포에 존재하는 표적 핵산 또는 표적 유전자를 변형시키는 방법을 제공한다. 상기 방법은 표적 핵산 또는 표적 유전자가 존재하는 대상 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 처리하는 것을 포함한다.
일 구현예로서, 상기 방법은 표적 핵산 또는 표적 유전자가 존재하는 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 처리하는 것을 포함할 수 있다.
상기 진핵 세포는 효모(yeast), 식물 세포, 비인간-동물 세포 또는 인간 세포일 수 있다.
상기 표적 핵산 또는 표적 유전자는 표적 서열을 가지는 표적 가닥을 포함하는 이중 가닥 DNA 또는 단일 가닥 DNA일 수 있다.
상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물은 앞서 설명한 조성물의 구현예와 동일할 수 있다.
상기 방법은 in vitro, ex vivo 또는 비인간 동물 생체 내에서 수행될 수 있다.
상기 방법은 선택적으로 상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 처리한 진핵 세포를 배양하는 것을 추가로 더 포함할 수 있다.
상기 방법을 통해, 상기 표적 핵산 또는 표적 유전자는 상기 engineered CRISPR/Cas12f1(Cas14a1) system에 의한 변형을 포함할 수 있다. 이때, 상기 변형은 상기 표적 핵산 또는 표적 유전자에 적어도 하나 이상의 뉴클레오타이드의 삭제, 치환 및/또는 삽입일 수 있다.
본 발명은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 본 명세서에 의해 개시되는 기술을 통해, engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system을 제공할 수 있다. 또한, engineered guide RNA 및 이를 포함한 engineered CRISPR/Cas12f1(Cas14a1) system를 이용한 효과적인 표적 핵산의 절단, 편집 또는 변형 방법을 제공할 수 있다.
도 1은 야생형 tracrRNA(SEQ ID NO: 1) 및 야생형 crRNA(SEQ ID NO: 405)를 나타내며, 각 영역을 표시하였다. 야생형 tracrRNA는 stem 형성에 따라 영역 1(region 1), 영역 2(region 2), 영역 3(region 3), 영역 4(region 4) 및 영역 5(region 5)로 나뉘어 표시하였다. 야생형 crRNA는 반복 서열(repeat sequence; repeat seq.) 및 가이드 서열(guide sequence; guide seq., 또는 스페이서 서열(spacer sequence))로 나누어 표시하였다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라지며, 각각의 N는 독립적으로 A, C, G 또는 U일 수 있다.
도 2는 engineered tracrRNA의 구조를 간결하게 나타낸 것으로, 각각의 서열을 야생형 tracrRNA(SEQ ID NO: 1)에 비교 매칭하여 나타냈다. 상기 engineered tracrRNA는 제1 서열(first sequence; 1st seq.), 제2 서열(second sequence; 2nd seq.), 제3 서열(third sequence; 3rd seq.)을 3'말단에서 5'말단 방향으로 순서대로 포함한다. 또한, 상기 engineered tracrRNA는 선택적으로 5' 말단에 제4 서열(fourth sequence; 4th seq.) 및/또는 제5 서열(fifth sequence; 5th seq.)을 더 포함할 수 있다.
도 3은 engineered crRNA의 구조를 간결하게 나타낸 것으로, 각각의 서열을 야생형 crRNA(SEQ ID NO: 405)와 비교하여 나타냈다. 상기 engineered crRNA는 i) 야생형 반복 서열의 일부 및 가이드 서열; ii) 야생형 반복 서열의 일부, 가이드 서열 및 U-rich tail 서열(U-rich tail sequence; U-rich tail seq.); iii) 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열; iv) 제6 서열(sixth sequence; 6th seq.), 제7 서열(seventh sequence; 7th seq.) 및 가이드 서열; 또는 v) 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열 및 제7 서열은 야생형 crRNA의 반복 서열과 연관된다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라지며, 각각의 N는 독립적으로 A, C, G 또는 U일 수 있다.
도 4 내지 10은 gRNA 엔지니어링의 다양한 예시에 대한 모식도이다. 이때, 상기 가이드 서열은 표적에 따라 서열 및 서열의 길이가 달라질 수 있다. 각각의 N는 독립적으로 A, C, G 또는 U일 수 있고, 각각의 V는 A, C 또는 G일 수 있고, 각각의 B는 U, C 또는 G일 수 있다.
도 11은 야생형 tracrRNA 내에 존재하는 연속된 다섯 개의 유리딘 서열을 각각 아데노신, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다.
도 12는 도 11의 결과를 토대로 141번때 유리딘을 사이티딘으로 치환하여 고정하고, 나머지 4개의 유리딘 서열을 각각 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인하였다. (n=3, *, p<0.05)
도 13은 도 12의 결과를 토대로 tracrRNA의 변형된 서열에 대응되는 crRNA의 5'-ACGAA-3'을 각각 아데노신, 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다.
도 14은 도 13의 결과를 토대로 crRNA의 5'-ACGAA-3' 중 사이티딘과 구아노신을 각각 아데노신, 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다. (n=3, *, p<0.05)
도 15는 도 14의 결과를 토대로 crRNA의 5'-AGCAA-3'중 아데노신을 각각 유리딘, 사이티딘 또는 구아노신으로 치환하여 indel(%)을 확인한 결과이다. (n=3, n.s., not significant)
도 16은 M1-1을 포함하는 engineered tracrRNA 및/또는 engineered crRNA를 이용한 경우의 indel(%)을 확인한 결과이다. engineered crRNA(M1-1)는 engineered tracrRNA(M1-1)와 함께 사용하였을 때 indel(%)이 증가하는 것을 확인하였다. (n=3, *, p<0.05, n.s., not significant)
도 17은 M1-1 및 M1-2를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 13nt, 25nt 및 37nt를 삭제한 변형이다. (n=3)
도 18은 M1-1 및 M2를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M2는 MS2 (즉, stem 2를 구성하는 영역)에서 각각 6nt, 13nt 및 21nt를 삭제한 변형이다. (n=3)
도 19는 M1-1 및 M3를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M3는 MS3 (즉, stem 1를 구성하는 영역)에서 각각 7nt, 14nt 및 20nt를 삭제한 변형이다. (n=3)
도 20은 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. (n=3, n.s., not significant)
도 21은 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, M4는 앞선 도 20의 결과를 기초로 하여 U4VU6로 설계하고, 상기 V는 A, C 또는 G이다. (n=3, n.s., not significant)
도 22는 M1-1 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다.
도 23은 M1-1 및/또는 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. M1-1 및 M4를 모두 포함하는 engineered gRNA를 이용하였을 때 indel(%)이 증가하는 것을 확인하였다. (n=3, *, p<0.05; **, p<0.01; ***, p<0.001. n.s., not significant)
도 24는 M1-1, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1 및 M4을 포함하고 있고, M3를 부가하여 그 효과를 비교하였다. 이때, M3는 MS3 (즉, stem 1를 구성하는 영역)에서 각각 12nt, 13nt,14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt 및 21nt를 삭제한 변형이다. (n=3)
도 25는 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1, M3 및 M4을 포함하고 있고, M1-2를 부가하여 그 효과를 비교하였다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 10bp, 12bp 및 18bp를 삭제한 변형이다. (n=3, n.s., not significant)
도 26은 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용하여 indel(%)을 확인한 결과이다. 이때, 상기 engineered gRNA는 M1-1, M3 및 M4을 포함하고 있고, M1-2를 부가하여 그 효과를 비교하였다. 이때, M1-2는 MS1 (즉, stem 5를 구성하는 영역)에서 각각 1nt, 3nt, 5nt, 7nt, 9nt, 11nt, 13nt, 15nt, 17nt, 19nt, 21nt, 23nt, 25nt, 27nt, 29nt, 31nt, 33nt, 35nt 및 37nt를 삭제한 변형이다. (n=3)
도 27은 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 추가 변형하여 indel(%)을 확인한 결과이다. 이때, 상기 추가 변형은 engineered tracrRNA의 3' 말단과 engineered crRNA의 5'말단을 hammerhead ribozyme 뉴클레오타이드 서열을 이용해 연결한 것이다. 상기 hammerhead ribozyme 뉴클레오타이드 서열을 포함하는 engineered gRNA는 hammerhead ribozyme에 의해 engineered tracrRNA의 3' 말단에 연결된 hammerhead ribozyme 뉴클레오타이드 서열이 self-cleavage 되고, 이로 인해 engineered gRNA는 dual gRNA로 작용할 수 있다. (n=3)
도 28은 M1-1, M1-2, M2, M3 및/또는 M4를 포함하는 engineered gRNA를 추가 변형하여 indel(%)을 확인한 결과이다. (n=3)
도 29는 M1-1, M1-2, M3 및 M4를 포함하는 engineered gRNA를 이용한 engineered CRISPR/Cas14a1 system인 geCas14a1_3.0 system에 의한 인델 패턴을 확인한 결과이다.
도 30은 gRNA 엔지니어링(M1-M4)의 효과의 기초가 되는 분자 메커니즘을 조사하기 위한 실험 설계 모식도(A) 및 이의 결과(B 및 C)이다. A에 대한 구체적인 설명은 아래에 기재한 실험방법의 "8. Quantitative analysis of gRNA expression" 섹션을 참고할 수 있다. B 및 C에서 gRNA 엔지니어링(M1-M4)에 의해 완전한 서열을 가지는 gRNA의 발현을 급격히 증가함을 보여준다.
도 31은 gRNA 엔지니어링(M1-M4)의 시험 관내 이중 가닥 DNA (dsDNA) 분해 분석 결과이다. 특히, M3의 유무에 따른 이중 가닥 DNA (dsDNA) 분해 효과에 차이가 있음을 보여준다.
도 32 내지 34는 Cas9, Cas12a 및 Cas12f1으로 편집할 수 있는 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 in silico로 검색하여 무작위로 선정한 88 개의 내인성 유전자좌의 프로토스페이서 서열을 정리한 표이다.
도 35는 CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 또는 geCas14a1_3.0 system을 이용한 도 32 내지 34에서 선별한 88개의 내인성 유전자좌에서의 인델(%)을 확인한 결과이다. A는 CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 및 geCas14a1_3.0 system가 가지는 각각의 가이드 RNA를 모식화한 것으로, 이때, DR은 가이드 RAN에서 스페이서 서열을 제외한 나머지 부분이다. B는 각각의 CRISPR/Cas system을 이용해 88개의 내인성 유전자좌에서의 인델(%)을 확인한 결과이다.
도 36은 앞선 도35의 결과를 다양한 방법으로 정리한 것으로, A는 각 CRISPR/Cas system에 의한 88개의 내인성 유전자좌에서의 인델(%)에 대한 box-and-whisker plot으로, 청록색 가로선은 각 CRISPR/Cas system의 평균값을 나타낸다. B는 각 CRISPR/Cas system에 의한 인델(%)를 세분화하여 특정 인델 범위 당 표적 수의 분포를 정리한 표이다. C는 각 CRISPR/Cas system에 의해 얻은 표적 당 인델(%)에 대한 heat map이다.
도 37은 in vitro cleavage assay 결과이다. 프로토스페이서 서열인 Intergenic22 서열 (5'-TTTAAGAACACATACCCCTGGGCC-3' (SEQ ID NO: 490))을 포함하는 플라스미드를 이용해 실험하였고, 대조군을 위해 상기 플라스미드에 ApaI 제한 효소 사이트(5'-GGGCCC-3')도 포함한다. 도면 상에 표시된 서열은 5'-GGGCGAATTGGGCCCTCTAGATGCATGCTCGAGCGGCCGCCAGTGTGATGGATATCTGCAGAATTCGCCCTTTGCATTTAAGAACACATACCCCTGGGCCAGGATGCATGCATGCATGCATG-3' (SEQ ID NO: 737)이고, ApaI 제한 효소 사이트 및 프로토스페이서는 밑줄로 표시하였다.
용어 정의
본 명세서에서 사용되는 용어에 대한 정의는 이하와 같다.
핵산(Nucleic acid), 뉴클레오타이드(Nucleotide), 뉴클레오사이드(Nucleoside) 및 염기(Base)
"핵산(nucleic acid)"은 뉴클레오타이드 단위체로 구성된 생체 분자(또는 생체 고분자)이며, 폴리뉴클레오타이드(polynucleotide)로도 불린다. 핵산은 DNA와 RNA를 모두 포함한다. "뉴클레오타이드(nucleotide)"는 인산, 오탄당 및 염기(또는 핵염기)로 이루어진 단위체이다. RNA(리보핵산)은 오탄당이 리보오스이며, DNA(디옥시리보핵산)은 오탄당이 디옥시리보오스이다. 뉴클레오타이드는 핵염기로 아데닌(adenine; A), 구아닌(guanine; G), 사이토신(cytosine; C), 티민(Thymine; T) 및 유라실(uracil; U) 중 선택된 하나를 가진다. 이때, 아데닌, 구아닌 및 사이토신은 RNA와 DNA에 공통적으로 존재하고, 티민은 DNA에만 존재하며, 유라실은 RNA에만 존재한다. 또한, 뉴클레오타이드는 인산과 뉴클레오사이드로 구성된다고도 할 수 있다. 이때, "뉴클레오사이드(nucleoside)"는 오탄당과 핵 염기로 이루어진다. 뉴클레오사이드는 핵염기의 종류에 따라 아데노신, 티미딘, 사이티딘(시티딘), 구아노신 및 유리딘으로 분류된다. 각 뉴클레오사이드는 U(유리딘), A(아데노신), T(티미딘), C(사이티딘 또는 시티딘) 및 G(구아노신)으로 약칭된다. 더불어, 뉴클레오타이드는 뉴클레오사이드의 종류에 따라 U(유리딘 일인산), A(아데노신 일인산), T(티미딘 일인산), C(사이티딘 일인산 또는 시티딘 일인산) 및 G(구아노신 일인산)으로 약칭된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
본 명세서에서 염기, 뉴클레오사이드, 뉴클레오타이드, 핵산, RNA 및 DNA는 염기의 종류에 따라 A, T, G, C 및 U로 약칭하여 기재한다. 상기 약칭은 문맥에 따라 적절히 해석될 수 있다. 예를 들어, 5'-UUUUU-3' 서열은 연속된 5개의 염기(유라실) 서열, 연속된 5개의 뉴클레오사이드(유리딘) 서열 및/또는 연속된 5개의 뉴클레오타이드(유리딘 일인산) 서열일 수 있다. 또한, 핵산, RNA 및 DNA의 경우, 핵산, RNA 및 DNA를 구성하는 뉴클레오타이드는 뉴클레오사이드의 종류에 따라 유리딘, 아데노신, 티미딘, 사이티딘 및 구아노신으로 약칭하여 기재한다. 상기 약칭은 문맥에 따라 적절히 해석될 수 있다. 예를 들어, 연속된 4개의 유리딘 서열을 포함하는 RNA는 연속된 4개의 유리딘 일인산 뉴클레오타이드를 포함하는 RNA로 해석될 수 있다.
RNA duplex
"RNA duplex"는 두 개의 RNA 절편(fragment) 사이에 상보적인 결합(또는 염기쌍 간의 결합)에 의해 형성된 이중가닥 RNA 구조를 의미한다. 이때, 상기 두 개의 RNA 절편은 서로 다른 가닥(strand)에 존재하거나, 또는 하나의 가닥(단일 가닥)에 존재할 수 있다. 상기 두 개의 RNA 절편이 단일 가닥에 존재하는 경우, 단일 가닥 내의 일부 영역(즉, 두 개의 RNA 절편)은 염기쌍 간의 결합을 형성하여 스템-루프(stem-loop 또는 헤어핀(hairpin)) 구조를 형성한다. 상기 RNA duplex는 "RNA stem" 또는 "stem"으로도 불리며, 이하에서 RNA stem 또는 stem과 혼용되어 사용된다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 핵산(Target nucleic acid) 또는 표적 유전자(Target gene)
"표적 핵산(Target nucleic acid)" 또는 "표적 유전자(Target gene)"는 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의한 편집의 대상이 되는 핵산 또는 유전자를 의미한다. 상기 표적 핵산 또는 표적 유전자는 세포 내에 존재하거나 인위적으로 합성된 핵산 또는 유전자일 수 있다. 세포 내에 존재하는 경우, 상기 표적 핵산 또는 표적 유전자는 세포가 가진 고유한 유전자 또는 핵산(즉, endogenous gene or nucleic acid), 또는 외부 유래의 유전자 또는 핵산(즉, exogenous gene or nucleic acid) 모두를 의미할 수 있으며, CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의한 편집의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 핵산 또는 표적 유전자는 단일가닥 DNA, 이중가닥 DNA, 단일가닥 RNA, 이중가닥 RNA 및/또는 DNA-RNA hybrid 일 수 있다. 상기 표적 핵산 또는 표적 유전자는 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열(Target sequence), 표적 가닥(Target strand) 및 비표적 가닥(Non-target strand)
"표적 서열(target sequence)"는 표적 핵산 또는 표적 유전자 내에 존재하는 서열로, CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)의 가이드 RNA에 의해 인식되는 서열 또는 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)에 의해 변형되는 대상 서열을 의미한다. 구체적으로, 상기 표적 서열은 가이드 RNA에 포함된 가이드 서열에 상보성을 가지는 서열 또는 가이드 서열과 상보적으로 결합하는 서열을 의미한다.
"표적 가닥(target strand)"는 표적 서열을 포함하는 가닥을 의미한다. 표적 핵산 또는 표적 유전자가 단일 가닥인 경우, 해당 가닥은 표적 가닥일 수 있다. 또는 표적 핵산 또는 표적 유전자가 이중가닥인 경우, 상기 이중가닥 중 하나는 표적 가닥일 수 있으며, 상기 표적 가닥에 상보적인 가닥이 존재할 수 있다. 이때, 상기 표적 가닥에 상보적인 가닥은 "비표적 가닥(non-target strand)"로 지칭된다.
비표적 가닥(non-target strand)은 PAM(Protospacer Adjacent Motif) 서열 및 프로토스페이서(protospacer) 서열을 포함한다. 상기 PAM 서열은 CRISPR/Cas12f1 시스템(또는 CRISPR/Cas14a1 시스템)의 Cas12f1(또는 Cas14a1) 단백질이 인식하는 서열이다. 상기 프로토스페이서 서열은 PAM 서열의 5' 말단 또는 3' 말단에 위치하는 서열로, 상기 프로토스페이서 서열은 표적 서열에 상보성을 가지는 서열 또는 표적 서열과 상보적인 결합을 하는 서열이다. 프로토스페이서 서열과 표적 서열 간의 상관관계는 표적 서열과 가이드 서열 간의 상관관계와 유사하다. 이러한 특징에 의해, 일반적으로 가이드 서열 설계시 프로토스페이서 서열을 이용하여 설계할 수 있다. 즉, 표적 서열에 상보적으로 결합하는 가이드 서열을 설계시, 가이드 서열은 프로토스페이서 서열과 동일한 염기서열을 가지는 뉴클레오타이드 서열로 설계할 수 있다. 이때, 프로토스페이서 서열의 염기서열 중 T는 U로 대체하여 가이드 서열을 설계한다.
벡터(Vector)
"벡터(vector)"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어, CRISPR/Cas 시스템의 이펙터 단백질(Cas 단백질)을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
작동 가능하게 연결된(Operably linked)
"작동 가능하게 연결된(operably linked)"이라는 용어는 특정 구성이 다른 구성과 기능적 관계로 배치되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 다른 구성에 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 A 단백질을 암호화하는 서열과 작동 가능하게 연결되었다고 할 때, 상기 프로모터가 세포 내에서 상기 A 단백질을 암호화하는 서열을 전사 및/또는 발현하도록 A 단백질을 암호화하는 서열에 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
엔지니어링 된(Engineered)
"엔지니어링 된(engineered)"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 가이드 RNA(engineered guide RNA)"의 경우, 자연계에 존재하는 가이드 RNA의 구성에 인위적인 변경이 가해진 가이드 RNA를 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS (Nuclear localization sequence, or signal)
"NLS(Nuclear Localization Sequence, or Signal)"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그" 역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
태그(Tag)
"태그(tag)"라 함은, 펩타이드 또는 단백질의 추적 및/또는 분리정제를 쉽게 하기 위하여 부가되는 기능적 도메인을 통틀어 일컫는다. 구체적으로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질; 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형관 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 형광 단백질; 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 단백질(효소)를 포함하나, 이에 제한되는 것은 아니다. 본 명세서에서 사용되는 "태그"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에서 언급된 모든 간행물, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한되는 것으로 의도되지 않는다.
이하 본 발명을 설명한다.
개괄 - CRISPR/Cas12f1 system (또는 CRISPR/Cas14a1 system), 이의 한계 및 해결방안
CRISPR/Cas12f1 시스템은 Class 2, Type V로 분류되는 CRISPR/Cas 시스템이다. 선행연구(Harrington et al., Science 362, 839-842 (2018))에서 최초로 고균 유래의 CRISPR/Cas 시스템인 CRISPR/Cas14 시스템에 대해 밝혀졌다. 그 후 후속 연구(Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 상기 CRISPR/Cas14 시스템을 CRISPR/Cas12f 시스템으로 분류하였다. CRISPR/Cas12f1 시스템은 상기 Class 2, Type V로 분류되는 CRISPR/Cas 시스템 중 하나의 올솔로그(ortholog)인 V-F1 시스템에 속하며, 이는 Cas14a를 이펙터 단백질로 가지는 CRISPR/Cas14a 시스템을 포함한다. 본 명세서에서 개시하는 CRISPR/Cas12f1 system은 CRISPR/Cas14a1 system에 관한 것으로, 명세서에 기재된 CRISPR/Cas12f1 system은 CRISPR/Cas14a1 system을 지칭하며, CRISPR/Cas12f1 system과 CRISPR/Cas14a1 system은 혼용되어 사용되며, 또한 CRISPR/Cas12f1 system은 CRISPR/Cas12f1(Cas14a1) system 또는 CRISPR/Cas14a1 system 로도 지칭된다.
상기 CRISPR/Cas12f1 시스템은 CRISPR/Cas9 시스템에 비하여 이펙터 단백질의 크기가 현저히 작다는 특징이 있다. 이러한 특징은 기존에 연구된 대부분의 Cas 뉴클레아제의 크기로 인한 AAV (아데노 관련 바이러스)에 탑재의 어려움 및 이로 인한 유전자 치료제로서 적용 어려움을 해결 가능하게 한다. 하지만 이러한 장점에도 불구하고, 선행 연구(Harrington et al., Science 362, 839-842 (2018), Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템, 특히 CRISPR/Cas14a1 시스템은 세포 내에서 이중가닥 DNA에 대한 절단 활성을 보이지 않거나, 절단 활성을 보이더라도 그 효율이 매우 낮아 이를 적극적으로 유전자 편집에 활용하기 힘들다는 한계를 가지고 있다.
이에 본 발명자들은 CRISPR/Cas14a1 시스템의 표적 핵산 또는 표적 유전자의 편집 또는 변형 효율을 증가시키기 위해 가이드 RNA(guide RNA)를 인위적으로 조작하였다. 보다 구체적으로, 본 발명자들은 가이드 RNA를 구성하는 tracrRNA의 일부 서열을 인위적으로 조작하였다. 이러한 조작은 야생형 tracrRNA가 가지는 서열 상의 문제를 해결하기 위함이다. 야생형 tracrRNA은 다섯 개의 연속된 유리딘 서열을 포함하고 있다(야생형 tracrRNA(wildtype tracrRNA)는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA-3'(서열번호 1(SEQ ID NO: 1)) 서열을 가진다.). 야생형 tracrRNA을 세포 내에서 벡터 등을 이용하여 발현시키고자 할 때, 야생형 tracrRNA의 다섯 개의 연속된 유리딘 서열은 이에 대응되는 다섯 개의 연속된 티미딘 서열로 벡터 내에 포함되게 된다. 이 경우, 상기 다섯 개의 연속된 티미딘 서열은 특정 조건에서 전사 종결 신호로서 작용할 수 있다. 이러한 종결 신호로의 작용은 tracrRNA의 정상적인 발현을 저해하고, 더불어 정상적인 가이드 RNA의 형성을 저해하여, 최종적으로 CRISPR/Cas14a1 시스템의 표적 핵산 또는 표적 유전자의 편집 또는 변형 효율을 감소시킬 수 있다. 이에 본 발명자들은 야생형 tracrRNA의 다섯 개의 연속된 유리딘 서열을 인위적으로 변형한 engineered tracrRNA를 개발하였다. 더불어, 본 발명자들은 가이드 RNA를 구성하는 tracrRNA 및 crRNA의 길이를 최적화하기 위해 인위적으로 조작하였다. 이러한 조작은 긴 길이의 tracrRNA 및 crRNA를 최적의 길이를 가지도록 하여 guide RNA 합성 비용 절감 또는 바이러스 벡터에 삽입시 추가 공간(용량) 확보 등 치료제 적용에 더욱 효과적일 수 있다. 또한, 최적화된 guide RNA를 이용한 CRISPR/Cas14a1 시스템은 표적 핵산 또는 표적 유전자의 편집 또는 변형 효율을 증가시킬 수 있다. 이에 본 발명자는 tracrRNA 및 crRNA의 길이를 조절하여 최적화된 engineered tracrRNA 및 engineered crRNA를 개발하였다. 또한, 이를 포함한 engineered guide RNA 및 engineered CRISPR/Cas14a1 시스템을 완성하였다.
이하에서 engineered guide RNA 및 engineered CRISPR/Cas14a1 시스템에 대해 자세히 설명한다.
<Engineered Guide RNA>
본 명세서에 의해 개시되는 일 태양은 CRISPR/Cas12f1(Cas14a1) system을 위한 engineered guide RNA에 관한 것이다. 상기 engineered guide RNA는 CRISPR/Cas12f1(Cas14a1) system의 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 더욱 효과적으로 수행되도록 한다. 특히, 상기 engineered guide RNA는 다음과 같은 효과를 수반할 수 있다:
Guide RNA의 길이 최적화, 및 이에 따른 guide RNA 합성 비용 절감 또는 바이러스 벡터에 삽입시 추가 공간(용량) 확보;
tracrRNA의 정상적인 발현;
기능(작동) 가능한 guide RNA 발현 증가;
guide RNA의 stability 증가;
guide RNA-Cas12f1 protein complex의 stability 증가;
효과적인 guide RNA-Cas12f1 protein complex 형성 유도;
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 절단 효율 증가; 및
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 편집 또는 변형 효율 증가.
보다 구체적으로, 상기 engineered guide RNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, wildtype tracrRNA보다 길이가 짧도록 변형 및/또는 U-rich tail 서열을 포함하도록 변형된 engineered guide RNA로, engineered tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함한다. 이때, 상기 crRNA는 야생형(wildtype) crRNA 또는 engineered crRNA이다. 즉, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함하거나, 또는 engineered tracrRNA 및 engineered crRNA를 포함한다.
상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA로, 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서 wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA로, 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으며 wildtype tracrRNA의 5'말단 및/또는 3'말단의 일부 뉴클레오타이드 서열을 포함하지 않는다.
상기 야생형 crRNA는 야생형(wildtype) 반복 서열을 포함하는 crRNA이다. 상기 engineered crRNA는 engineered 반복 서열을 포함하는 crRNA로, 이때, engineered 반복 서열은 wildtype 반복 서열보다 길이가 짧도록 변형되거나 일부 뉴클레오타이드 서열이 변형된 서열이다. 상기 야생형 crRNA 및 engineered crRNA는 선택적으로 3'말단에 U-rich tail 서열을 추가로 더 포함할 수 있다.
또한, 상기 engineered guide RNA는 선택적으로 linker을 더 포함할 수 있다.
이하에서 각 구성을 자세히 설명한다.
1. Engineered tracrRNA
Engineered tracrRNA는 야생형(wildtype) tracrRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나 및/또는 wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA이다.
보다 구체적으로, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA이다. 또는, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 더불어 wildtype tracrRNA보다 길이가 짧도록 변형된 tracrRNA이다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함한다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 engineered tracrRNA는 다음의 그룹 중 선택된 하나이다:
i) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 tracrRNA;
ii) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, 및 wildtype tracrRNA의 5'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA;
iii) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, 및 wildtype tracrRNA의 3'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA;
iv) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형, 및 wildtype tracrRNA의 중간의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA; 및
v) 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 더불어, wildtype tracrRNA의 5'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형, wildtype tracrRNA의 중간의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형 및/또는 wildtype tracrRNA의 3'말단의 일부 뉴클레오타이드 서열을 포함하지 않도록 변형된 tracrRNA.
상기 engineered tracrRNA는 crRNA와 상호작용하거나 및/또는 Cas12f1(Cas14a1)과 상호작용할 수 있다.
상기 engineered tracrRNA는 적어도 2개 이상의 RNA stem을 형성할 수 있다. 이때, 상기 RNA stem은 Cas12f1(Cas14a1) 단백질과 상호작용할 수 있다.
상기 engineered tracrRNA는 wildtype tracrRNA의 일 영역이 변형된 것이다. 이때, 상기 wildtype tracrRNA의 일 영역은 wildtype tracrRNA의 변형 대상 영역 중 하나 이상일 수 있다. 이때, 상기 wildtype tracrRNA의 변형 대상 영역은 RNA duplex 형성하는 영역을 기준으로 나눠 설정할 수 있다(도 1).
상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열 중 적어도 3개 이상의 서열을 포함한다. 이때, 상기 적어도 3개 이상의 서열은 제1 서열, 제2 서열 및 제3 서열이다. 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 engineered tracrRNA의 3'말단에서 5'말단 방향으로 순서대로 위치한다. 또는, 상기 제3 서열, 제2 서열 및 제1 서열은 engineered tracrRNA의 5'말단에서 3'말단 방향으로 순서대로 위치한다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 wildtype tracrRNA의 변형 대상 영역을 기준으로 나눈 것으로, 상기 각 서열은 RNA duplex 형성하거나 RNA duplex 형성에 참여한다. 따라서, 상기 engineered tracrRNA은 적어도 둘 이상의 RNA duplex를 포함할 수 있다(도 2). 이하에서, wildtype tracrRNA의 변형 대상 영역 및 각 서열에 대해 상세히 기술한다.
Wildtype tracrRNA의 변형 대상 영역(region to be modified)
본 명세서의 기재된 engineered tracrRNA는 wildtype tracrRNA의 일 영역이 변형된 것이다. 상기 wildtype tracrRNA의 일 영역은 wildtype tracrRNA의 변형 대상 영역 중 하나 이상이다. 이때, 상기 wildtype tracrRNA의 변형 대상 영역은 wildtype tracrRNA 내에서 RNA duplex 형성하거나 또는 RNA duplex 형성에 참여하는 영역을 기준으로 나눠 설정한다. 상기 wildtype tracrRNA은 4개의 RNA duplexes를 형성하고 1개의 RNA duplex 형성에 참여한다. 즉, 상기 wildtype tracrRNA은 총 5개의 RNA duplex 형성에 관여한다. 따라서, 상기 wildtype tracrRNA의 변형 대상 영역은 총 5개의 영역으로 나뉠 수 있으며, 상기 5개의 영역은 변형 대상 영역 1(region 1 to be modified), 변형 대상 영역 2 (region 2 to be modified), 변형 대상 영역 3 (region 3 to be modified), 변형 대상 영역 4 (region 4 to be modified) 및 변형 대상 영역 5 (region 5 to be modified)일 수 있다. 이때, 상기 변형 대상 영역 1은 상기 wildtype tracrRNA의 5' 말단에서 130번째 시티딘(C)부터 161번째 아데노신(A)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 2은 상기 wildtype tracrRNA의 5' 말단에서 91번째 아데노신(A)부터 129번째 아데노신(A)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 3은 상기 wildtype tracrRNA의 5' 말단에서 72번째 구아노신(G)부터 90번째 아데노신(A)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 4은 상기 wildtype tracrRNA의 5' 말단에서 22번째 시티딘(C)부터 71번째 구아노신(G)까지의 영역일 수 있다. 이때, 상기 변형 대상 영역 5은 상기 wildtype tracrRNA의 5' 말단에서 1번째 시티딘(C)부터 21번째 아데노신(A)까지의 영역일 수 있다(도 1). 이러한 wildtype tracrRNA의 변형 대상 영역 설정은 engineered tracrRNA가 포함하는 각 서열(제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열)을 설명하기 위함이다.
1-1) First sequence (one strand for Stem 5) - 필수 서열
상기 engineered tracrRNA는 제1 서열(first sequence)를 포함한다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 1에 대응된다(도 2). 상기 제1 서열은 상기 engineered tracrRNA에 포함되는 필수 서열이다. 상기 제1 서열은 crRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제1 서열은 crRNA의 일부 서열과 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제1 서열과 crRNA에 의해 형성된 RNA duplex는 본 명세서에서 스템 5(stem 5)로 명명된다. 상기 스템 5를 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 WED 도메인 및/또는 ZF 도메인과 상호작용할 수 있다.
상기 제1 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제1 서열은 연속된 네 개 이하의 유리딘 서열을 포함한다. 이때, 상기 제1 서열은 연속된 네 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 연속된 세 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 연속된 두 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 한 개의 유리딘 서열을 포함할 수 있다. 또는, 상기 제1 서열은 유리딘 서열을 포함하지 않을 수 있다.
상기 제1 서열은 crRNA와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제1 서열은 crRNA와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제1 서열은 crRNA와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제1 서열은 crRNA와 적어도 하나 이상의 염기 페어링(base pairing)을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제1 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수있다. 이때, 상기 제1 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제1 서열은 상기 engineered tracrRNA의 3' 말단에 위치한다.
상기 제1 서열은 다음의 서열들 중 선택된 하나의 서열일 수 있다:
5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열;
5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열;
5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열;
5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열;
5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열;
5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및
SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열.
이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다.
이때, 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다.
이때, 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 d가 3인 경우, (N)3은 5'-NNN-3' 서열을 의미하며, 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
이때, 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 예를 들어, 상기 a가 4인 경우, (V)4는 5'-VVVV-3' 서열을 의미하며, 이때, 각각의 V는 독립적으로 A, C 또는 G일 수 있다.
이때, 상기 SEQ ID NO: 2 내지 7 서열의 5'말단에 위치하는 5'-CAAAUUCA-3' 서열 및/또는 3'말단에 위치하는 5'-CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 8) 서열은 선택적으로 변형될 수 있다. 상기 변형은 5'-CAAAUUCA-3' 서열 및/또는 5'-CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 8) 서열 중 적어도 하나 이상의 뉴클레오타이드가 삭제 또는 다른 뉴클레오타이드로 치환되는 것일 수 있다. 또는 상기 변형은 5'-CAAAUUCA-3' 서열 및/또는 5'-CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 8) 서열에 하나 이상의 뉴클레오타이드가 삽입되는 것일 수 있다.
5'-CAAAUUCA(N) a CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 a는 0 내지 4의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 9) 서열일 수 있다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 10) 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 11) 서열, 5'-CAAAUUCACCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 12) 서열, 5'-CAAAUUCAGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 13) 서열 또는 5'-CAAAUUCAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 14) 서열 일 수 있다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 15) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 16) 서열, 5'-CAAAUUCACUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 17) 서열, 5'-CAAAUUCAGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 18) 서열 또는 5'-CAAAUUCAUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 19) 서열 일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 20) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 21) 서열, 5'-CAAAUUCAGUGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 22) 서열, 5'-CAAAUUCAGUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 23) 서열 또는 5'-CAAAUUCAUAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 24) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNCCUCUCCAAUUCUGCACAA-3'(SEQ ID NO: 25) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 26) 서열, 5'-CAAAUUCAGUGCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 27) 서열, 5'-CAAAUUCAGUUCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 28) 서열, 5'-CAAAUUCAGUGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 29) 서열, 5'-CAAAUUCAUUGCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 30) 서열 또는 5'-CAAAUUCAUUUCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 31) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCAVNNNN(V) a CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다.
상기 a는 0 내지 4의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCAANNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 32) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 33) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 34) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 35) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 36) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCAANNNNVVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 37) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAAUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 38) 서열, 5'-CAAAUUCAAUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 39) 서열, 5'-CAAAUUCAAUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 40) 서열 또는 5'-CAAAUUCAAUGCUACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 41) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCACNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 42)서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 43) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 44) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 45) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 46) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCACNNNNVVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 47) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCACUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 48) 서열, 5'-CAAAUUCACUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 49) 서열, 5'-CAAAUUCACUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 50) 서열 또는 5'-CAAAUUCACUGCUCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 51) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCAGNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 52) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 53) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 54) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 55) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 56) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCAGNNNNVVVVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 57) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAGUUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 58) 서열, 5'-CAAAUUCAGUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 59) 서열, 5'-CAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 60) 서열 또는 5'-CAAAUUCAGUGCUGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 61) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANVNNN(N) b CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 b는 0 내지 1의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANANNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 62) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 b는 0 또는 1의 정수일 수 있다. 이때, 상기 b가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 63) 서열일 수 있다. 또는 상기 b가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 64) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUAUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 65) 서열, 5'-CAAAUUCAUAUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 66) 서열 또는 5'-CAAAUUCAUAGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 67) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예서, 상기 제1 서열은 5'-CAAAUUCANCNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 68) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 b는 0 또는 1의 정수일 수 있다. 이때, 상기 b가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 69) 서열일 수 있다. 또는 상기 b가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 70) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAGCUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 71) 서열, 5'-CAAAUUCAUCUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 72) 서열, 5'-CAAAUUCAUCUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 73) 서열 또는 5'-CAAAUUCAUCGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 74) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예서, 상기 제1 서열은 5'-CAAAUUCANGNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 75) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 b는 0 또는 1의 정수일 수 있다. 이때, 상기 b가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 76) 서열일 수 있다. 또는 상기 b가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 77) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUGUUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 78) 서열, 5'-CAAAUUCAUGUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 79) 서열 또는 5'-CAAAUUCAUGGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 80) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANNVNN(N) c CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 c는 0 내지 2의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNANN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 81) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 c가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 82) 서열일 수 있다. 또는 상기 c가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 83) 서열일 수 있다. 또는 상기 c가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 84) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUAUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 85) 서열, 5'-CAAAUUCAUUACUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 86) 서열 또는 5'-CAAAUUCAUCACUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 87) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNCNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 88) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 c가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNCNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 89) 서열일 수 있다. 또는 상기 c가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 90) 서열일 수 있다. 또는 상기 c가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 91) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUCUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 92) 서열, 5'-CAAAUUCAUUCCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 93) 서열 또는 5'-CAAAUUCAGUCUUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 94) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNGNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 95) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 c가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNGNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 96) 서열일 수 있다. 또는 상기 c가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 97) 서열일 수 있다. 또는 상기 c가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 98) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 99) 서열, 5'-CAAAUUCAUCGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 100) 서열 또는 5'-CAAAUUCAGCGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 101) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANNNVN(N) d CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 d는 0 내지 3의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNAN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 102) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 d가 0인 경우, 제1 서열은 5'-CAAAUUCANNNANCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 103) 서열일 수 있다. 또는 상기 d가 1인 경우, 제1 서열은 5'-CAAAUUCANNNANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 104) 서열일 수 있다. 또는 상기 d가 2인 경우, 제1 서열은 5'-CAAAUUCANNNANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 105) 서열일 수 있다. 또는 상기 d가 3인 경우, 제1 서열은 5'-CAAAUUCANNNANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 106) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 107) 서열, 5'-CAAAUUCAGUUAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 108) 서열 또는 5'-CAAAUUCAUUGAUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 109) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNCN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 110) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 d가 0인 경우, 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열일 수 있다. 또는 상기 d가 1인 경우, 제1 서열은 5'-CAAAUUCANNNCNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 112) 서열일 수 있다. 또는 상기 d가 2인 경우, 제1 서열은 5'-CAAAUUCANNNCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 113) 서열일 수 있다. 또는 상기 d가 3인 경우, 제1 서열은 5'-CAAAUUCANNNCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 114) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 115) 서열, 5'-CAAAUUCAGUGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 116) 서열, 5'-CAAAUUCAGCGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 117) 서열, 5'-CAAAUUCAUUGCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 118) 서열 또는 5'-CAAAUUCAGCUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 119) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNGN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 120) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 d가 0인 경우, 제1 서열은 5'-CAAAUUCANNNGNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 121) 서열일 수 있다. 또는 상기 d가 1인 경우, 제1 서열은 5'-CAAAUUCANNNGNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 122) 서열일 수 있다. 또는 상기 d가 2인 경우, 제1 서열은 5'-CAAAUUCANNNGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 123) 서열일 수 있다. 또는 상기 d가 3인 경우, 제1 서열은 5'-CAAAUUCANNNGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 124) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 125) 서열, 5'-CAAAUUCAUUGGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 126) 서열 또는 5'-CAAAUUCAGUCGUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 127) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5'-CAAAUUCANNNNV(N) a CCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열일 수 있다.
상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
상기 V는 A, C 또는 G 일 수 있다.
상기 a는 0 내지 4의 정수일 수 있다.
일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 128) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 129) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 130) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 131) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 132) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 133) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUUACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 134) 서열, 5'-CAAAUUCAUUUCACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 135) 서열 또는 5'-CAAAUUCAUUGCACCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 136) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNC(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 137) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 138) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 139) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 140) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 141) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNCNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 142) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUCUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 143) 서열, 5'-CAAAUUCAGUUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 144) 서열 또는 5'-CAAAUUCAUUUCCCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 145) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구체예에서, 상기 제1 서열은 5'-CAAAUUCANNNNG(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 146) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 a가 0인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 147) 서열일 수 있다. 또는 상기 a가 1인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 148) 서열일 수 있다. 또는 상기 a가 2인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 149) 서열일 수 있다. 또는 상기 a가 3인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 150) 서열일 수 있다. 또는 상기 a가 4인 경우, 상기 제1 서열은 5'-CAAAUUCANNNNGNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 151) 서열일 수 있다.
예를 들어, 상기 제1 서열은 5'-CAAAUUCAUUUCGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 152) 서열, 5'-CAAAUUCAGUGCGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 153) 서열 또는 5'-CAAAUUCAGUUCGCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 154) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열
일 구현예로서, 상기 제1 서열은 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열의 일부 서열로, SEQ ID NO: 2 서열 중 5'-CAAAUUCA(N)a-3'서열을 포함하면서 SEQ ID NO: 2 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 25) 서열의 일부 서열로, 5'-CAAAUUCANNNN-3' (SEQ ID NO: 155) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNNNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 156) 서열, 5'-CAAAUUCANNNNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 157) 서열, 5'-CAAAUUCANNNNCCUCUCCAAUUCU-3' (SEQ ID NO: 158) 서열, 5'-CAAAUUCANNNNCCUCUCCAAUU-3' (SEQ ID NO: 159) 서열, 5'-CAAAUUCANNNNCCUCUCCAA-3' (SEQ ID NO: 160) 서열, 5'-CAAAUUCANNNNCCUCUCC-3' (SEQ ID NO: 161) 서열, 5'-CAAAUUCANNNNCCUCU-3' (SEQ ID NO: 162) 서열, 5'-CAAAUUCANNNNCCU-3' (SEQ ID NO: 163) 서열, 5'-CAAAUUCANNNNC-3' (SEQ ID NO: 164) 서열 또는 5'-CAAAUUCANNNN-3' (SEQ ID NO: 155) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열의 일부 서열로, SEQ ID NO: 3 서열 중 5'-CAAAUUCAVNNNN-3' (SEQ ID NO: 165) 서열을 포함하면서 SEQ ID NO: 3 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCAVNNNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 166) 서열의 일부 서열로, 5'-CAAAUUCAVNNNN-3' (SEQ ID NO: 165) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCAVNNNNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 167) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAAUUCUG-3' (SEQ ID NO: 168) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAAUUCU-3' (SEQ ID NO: 169) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAAUU-3' (SEQ ID NO: 170) 서열, 5'-CAAAUUCAVNNNNCCUCUCCAA-3' (SEQ ID NO: 171) 서열, 5'-CAAAUUCAVNNNNCCUCUCC-3' (SEQ ID NO: 172) 서열, 5'-CAAAUUCAVNNNNCCUCU-3' (SEQ ID NO: 173) 서열, 5'-CAAAUUCAVNNNNCCU-3' (SEQ ID NO: 174) 서열 또는 5'-CAAAUUCAVNNNN-3' (SEQ ID NO: 165) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA -3' (SEQ ID NO: 4) 서열의 일부 서열로, SEQ ID NO: 4 서열 중 5'-CAAAUUCANVNNN-3' (SEQ ID NO: 175) 서열을 포함하면서 SEQ ID NO: 4 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 b는 0 내지 1의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANVNNNCCUCUCCAAUUCUGCACAA -3' (SEQ ID NO: 176) 서열의 일부 서열로, 5'-CAAAUUCANVNNN-3' (SEQ ID NO: 175) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANVNNNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 177) 서열, 5'-CAAAUUCANVNNNCCUCUCCAAUUCU-3' (SEQ ID NO: 178) 서열, 5'-CAAAUUCANVNNNCCUCUCCAAUU-3' (SEQ ID NO: 179) 서열, 5'-CAAAUUCANVNNNCCUCUCCAA-3' (SEQ ID NO: 180) 서열, 5'-CAAAUUCANVNNNCCUCUCC-3' (SEQ ID NO: 181) 서열, 5'-CAAAUUCANVNNNCCUCU-3' (SEQ ID NO: 182) 서열, 5'-CAAAUUCANVNNNCC-3' (SEQ ID NO: 183) 서열 또는 5'-CAAAUUCANVNNN-3' (SEQ ID NO: 175) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열의 일부 서열로, SEQ ID NO: 5 서열 중 5'-CAAAUUCANNVNN-3' (SEQ ID NO: 184) 서열을 포함하면서 SEQ ID NO: 5 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNVNNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 185) 서열의 일부 서열로, 5'-CAAAUUCANNVNN-3' (SEQ ID NO: 184) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNVNNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 186) 서열, 5'-CAAAUUCANNVNNCCUCUCCAAUUCU-3' (SEQ ID NO: 187) 서열, 5'-CAAAUUCANNVNNCCUCUCCAAUU-3' (SEQ ID NO: 188) 서열, 5'-CAAAUUCANNVNNCCUCUCCAA-3' (SEQ ID NO: 189) 서열, 5'-CAAAUUCANNVNNCCUCUCC-3' (SEQ ID NO: 190) 서열, 5'-CAAAUUCANNVNNCCUCU-3' (SEQ ID NO: 191) 서열, 5'-CAAAUUCANNVNNCC-3' (SEQ ID NO: 192) 서열 또는 5'-CAAAUUCANNVNN-3' (SEQ ID NO: 184) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열의 일부 서열로, SEQ ID NO: 6 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 SEQ ID NO: 6 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열의 일부 서열로, 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 195) 서열, 5'-CAAAUUCANNNVNCCUCUCCAAUUCU-3' (SEQ ID NO: 196) 서열, 5'-CAAAUUCANNNVNCCUCUCCAAUU-3' (SEQ ID NO: 197) 서열, 5'-CAAAUUCANNNVNCCUCUCCAA-3' (SEQ ID NO: 198) 서열, 5'-CAAAUUCANNNVNCCUCUCC-3' (SEQ ID NO: 199) 서열, 5'-CAAAUUCANNNVNCCUCU-3' (SEQ ID NO: 200) 서열, 5'-CAAAUUCANNNVNCC-3' (SEQ ID NO: 201) 서열 또는 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제1 서열은 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열의 일부 서열로, SEQ ID NO: 7 서열 중 5'-CAAAUUCANNNNV-3' (SEQ ID NO: 202) 서열을 포함하면서 SEQ ID NO: 7 서열의 3'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 V는 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제1 서열은 5'-CAAAUUCANNNNVCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 203) 서열의 일부 서열로, 5'-CAAAUUCANNNNV-3' (SEQ ID NO: 202) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제1 서열은 5'-CAAAUUCANNNNVCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 204) 서열, 5'-CAAAUUCANNNNVCCUCUCCAAUUCU-3' (SEQ ID NO: 205) 서열, 5'-CAAAUUCANNNNVCCUCUCCAAUU-3' (SEQ ID NO: 206) 서열, 5'-CAAAUUCANNNNVCCUCUCCAA-3' (SEQ ID NO: 207) 서열, 5'-CAAAUUCANNNNVCCUCUCC-3' (SEQ ID NO: 208) 서열, 5'-CAAAUUCANNNNVCCUCU-3' (SEQ ID NO: 209) 서열, 5'-CAAAUUCANNNNVCC-3' (SEQ ID NO: 210) 서열 또는 5'-CAAAUUCANNNNV-3' (SEQ ID NO: 202) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
1-2) Second sequence (Stem 4) - 필수 서열
상기 engineered tracrRNA는 제2 서열(second sequence)를 포함한다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 2에 대응된다 (도 2). 상기 제2 서열은 상기 engineered tracrRNA에 포함되는 필수 서열이다. 상기 제2 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제2 서열 내에서 형성된 RNA duplex는 본 명세서에서 스템 4(stem 4)로 명명된다. 상기 스템 4를 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 REC 도메인 및/또는 RuvC 도메인과 상호작용할 수 있다.
상기 제2 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제2 서열은 상기 제1 서열의 5' 말단에 위치한다.
상기 제2 서열은 상기 제1 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열일 수 있다.
다른 일 구현예로서, 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 70% 이상 동일한(identical) 또는 유사한(similar) 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성(sequence identity) 또는 서열 유사성(sequence similarity)을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한(identical) 또는 유사한(similar) 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제2 서열은 SEQ ID NO: 211 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제2 서열은 SEQ ID NO: 211 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
1-3) Third sequence (Stem 3) - 필수 서열
상기 engineered tracrRNA는 제3 서열(third sequence)를 포함한다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 3에 대응된다 (도 2). 상기 제3 서열은 상기 engineered tracrRNA에 포함되는 필수 서열이다. 상기 제3 서열은 crRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제3 서열은 crRNA의 일부 서열과 상보적인 결합을 통해 RNA duplex를 형성한다. 또한, 상기 제3 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 crRNA의 일부 서열과 상보적인 결합 및 상기 제3 서열 내의 상보적인 결합에 의해 형성된 RNA duplex는 본 명세서에서 스템 3(stem 3)으로 명명된다. 상기 스템 3을 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 WED 도메인 및/또는 RuvC 도메인과 상호작용할 수 있다.
상기 제3 서열은 crRNA와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제3 서열은 crRNA와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제3 서열은 crRNA와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제3 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제3 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제3 서열은 crRNA와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제3 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제3 서열은 상기 제2 서열의 5' 말단에 위치한다.
상기 제3 서열은 상기 제2 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열일 수 있다.
다른 일 구현예로서, 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 70% 이상 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제3 서열은 SEQ ID NO: 212 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제3 서열은 SEQ ID NO: 212 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
1-4) Fourth sequence (Stem 2)
상기 engineered tracrRNA는 제4 서열(fourth sequence)를 포함할 수 있다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 4에 대응된다 (도 2). 상기 제4 서열은 다양하게 변형이 가능한 뉴클레오타이드 서열로, 1 내지 50개의 뉴클레오타이드 서열(1 내지 50nt 서열)이다. 상기 제4 서열은 engineered tracrRNA의 필수 서열인 제3 서열의 5'말단에 위치한다. 상기 제4 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제4 서열 내에서 형성된 RNA duplex는 본 명세서에서 스템 2(stem 2)로 명명된다. 상기 스템 2를 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 RuvC 도메인과 상호작용할 수 있다.
상기 제4 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제4 서열은 상기 제3 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열일 수 있다. 이때, 상기 제4 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성할 수 있으며, 형성된 RNA duplex는 야생형 스템 2(wildtype stem 2)으로 명명한다.
다른 일 구현예로서, 상기 제4 서열은 SEQ ID NO: 213 서열의 일부 서열로, 상기 SEQ ID NO: 213 서열에 의해 형성된 야생형 스템 2의 길이가 짧아지도록 변형된 서열일 수 있다. 이때, 상기 제4 서열은 상기 야생형 스템 2보다 길이가 짧은 변형된 스템 2(modified stem 2)을 포함하거나 RNA duplex를 형성하지 않을 수 있다. 일 구체예로서, 상기 제4 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 예를 들어, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열, 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열, 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열, 5'-CCGCUUCACCAAAAGCGUUAGUUGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 218) 서열, 5'-CCGCUUCACCAAAAGGUUAGUUAACUUGAGUGAAGGUG-3' (SEQ ID NO: 219) 서열, 5'-CCGCUUCACCAAAGGUUAGUUAACUGAGUGAAGGUG-3' (SEQ ID NO: 220) 서열, 5'-CCGCUUCACCAAGGUUAGUUAACGAGUGAAGGUG-3' (SEQ ID NO: 221) 서열, 5'-CCGCUUCACAAGGUUAGUUAACAGUGAAGGUG-3' (SEQ ID NO: 222) 서열, 5'-CCGCUUCAAAGGUUAGUUAACAUGAAGGUG-3' (SEQ ID NO: 223) 서열, 5'-CCGCUUCAAGGUUAGUUAACAGAAGGUG-3' (SEQ ID NO: 224) 서열, 5'-CCGCUUAAGGUUAGUUAACAAAGGUG-3' (SEQ ID NO: 225) 서열, 5'-CCGCUAAGGUUAGUUAACAAGGUG-3' (SEQ ID NO: 226) 서열, 5'-CCGCAAGGUUAGUUAACAGGUG-3' (SEQ ID NO: 227) 서열, 5'-CCGAAGGUUAGUUAACAGUG-3' (SEQ ID NO: 228) 서열, 5'-CGAAGGUUAGUUAACAUG-3' (SEQ ID NO: 229) 서열 또는 5'-GAAGGUUAGUUAACAU-3' (SEQ ID NO: 230) 서열일 수 있으며, 이때, 상기 SEQ ID NO: 214 내지 230 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 다른 일 구체예로서, 상기 제4 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 예를 들어, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열, 5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열, 5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열, 5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 231) 서열, 5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 232) 서열, 5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 233) 서열, 5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 234) 서열, 5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 235) 서열, 5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 236) 서열, 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 237) 서열, 5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 238) 서열, 5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO:239) 서열, 5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 240) 서열, 5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 241) 서열, 5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 242) 서열, 5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 243) 서열, 5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 244) 서열, 5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 245) 서열, 5'-CCGCUUAGGGUG-3' (SEQ ID NO: 246) 서열, 5'-CCGUUAGGUG-3' (SEQ ID NO: 247) 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 또는 5'-UUAG-3' 서열일 수 있으며, 이때, 상기 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 또 다른 일 구체예로서, 상기 제4 서열은 SEQ ID NO: 213 서열에서 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열은 SEQ ID NO: 213 서열 내에서 순서 또는 방향에 상관없이 무작위적으로 선정된 서열일 수 있고, 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 둘 이상의 뉴클레오타이드 서열인 경우, 연속적인 둘 이상의 뉴클레오타이드 서열 또는 비 연속적인 둘 이상의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 제4 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다. 이때, 상기 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열은 1 내지 50nt 서열일 수 있다.
1-5) Fifth sequence (Stem 1)
상기 engineered tracrRNA는 제5 서열(fifth sequence)를 포함할 수 있다. 상기 제1 서열은 상기 wildtype tracrRNA의 변형 대상 영역 5에 대응된다 (도 2). 상기 제5 서열은 다양하게 변형이 가능한 뉴클레오타이드 서열로, 1 내지 21개의 뉴클레오타이드 서열(1 내지 21nt 서열)이다. 상기 제5 서열은 해당 서열 내에서 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제5 서열 내에서 형성된 RNA duplex는 본 명세서에서 스템 1(stem 1)로 명명된다.
상기 제5 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는다.
상기 제5 서열은 상기 제4 서열의 5'말단에 위치한다.
상기 제5 서열은 상기 제4 서열의 5'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열일 수 있다.
다른 일 구현예로서, 상기 제5 서열은 SEQ ID NO: 248 서열의 일부 서열로, SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열일 수 있다. 일 구체예로서, 상기 제5 서열은 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열, 5'-AAGUGGAGAA-3' (SEQ ID NO: 249) 서열, 5'-AAAGUGGAGAA-3' (SEQ ID NO: 250) 서열, 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 251) 서열, 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 252) 서열, 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 253) 서열, 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 254) 서열, 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 255) 서열, 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 256) 서열, 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 257) 서열, 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 258) 서열 또는 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 259) 서열일 수 있다.
또 다른 일 구현예로서, 상기 제5 서열은 SEQ ID NO: 248 서열에서 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열은 SEQ ID NO: 248 서열 내에서 순서 또는 방향에 상관없이 무작위적으로 선정된 서열일 수 있고, 이때, 상기 임의로 선정된 하나 이상의 뉴클레오타이드 서열이 둘 이상의 뉴클레오타이드 서열인 경우, 연속적인 둘 이상의 뉴클레오타이드 서열 또는 비 연속적인 둘 이상의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 제5 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다. 이때, 상기 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열은 1 내지 21nt 서열일 수 있다.
1-6) 추가 서열(additional sequence)
상기 engineered tracrRNA는 추가 서열(additional sequence)을 선택적으로 더 포함할 수 있다. 상기 추가 서열은 engineered tracrRNA의 3'말단에 위치할 수 있다. 상기 추가 서열은 상기 제1 서열의 3'말단에 위치할 수 있다. 상기 추가 서열은 engineered tracrRNA의 5'말단에 위치할 수 있다. 상기 추가 서열은 상기 제5 서열의 5'말단에 위치할 수 있다.
상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다.
일 구현예로서, 상기 추가 서열은 1 내지 5개, 1 내지 10개, 1 내지 15개, 1 내지 20개, 1 내지 25개, 1 내지 30개, 1 내지 35개, 1 내지 40개, 5 내지 10개, 5 내지 15개, 5 내지 20개, 5 내지 25개, 5 내지 30개, 5 내지 35개 또는 5 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 10 내지 15개, 10 내지 20개, 10 내지 25개, 10 내지 30개, 10 내지 35개, 10 내지 40개, 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개, 20 내지 40개, 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 30 내지 35개, 30 내지 40개 또는 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 추가 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 추가 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 서열은 5'-AUAAAGGUGA-3'(SEQ ID NO: 260) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
상기 추가 서열은 공지된 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 이때, 상기 hammerhead ribozyme 뉴클레오타이드 서열은 5'-CUGAUGAGUCCGUGAGGACGAAACGAGUAAGCUCGUC-3'(SEQ ID NO: 261) 서열 또는 5'-CUGCUCGAAUGAGCAAAGCAGGAGUGCCUGAGUAGUC-3'(SEQ ID NO: 262) 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
1-7) 화학적 변형(Chemical modification)
앞서 설명한 engineered tracrRNA는 선택적으로 적어도 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다. 이때, 상기 화학적 변형은 뉴클레오타이드의 염기 및/또는 당에서 발생할 수 있는 다양한 공유 결합의 변형일 수 있으며, 예를 들어, 상기 화학적 변형은 methylation, halogenation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있고, 또는 WO 2019/089820 A1에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되지 않는다.
1-8) Engineered tracrRNA의 예시
앞선 설명을 기초로, engineered tracrRNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않다.
일 구현예로서, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다.
일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성(sequence identity)을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열 및 제3 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 263) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 264) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 265) 서열을 포함할 수 있다.
다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 213 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'- CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 266) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'- CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 267) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'- CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAUUUCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 268) 서열을 포함할 수 있다.
또 다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 248 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 213 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 271) 서열일 수 있다.
다른 일 구현예로서, engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다.
일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열 및 제3 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열의 일부 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열의 일부 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열의 일부 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열의 일부 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열의 일부 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열 및 제3 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 273) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 274) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 275) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 276) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 277) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 278) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 279) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 280) 서열, 5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 281) 서열, 5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 282) 서열, 5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 283) 서열, 5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 284) 서열, 5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 285) 서열, 5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 286) 서열, 5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 287) 서열, 5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 288) 서열, 5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 289) 서열, 5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 290) 서열 또는 5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열 및 제3 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 291) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 292) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUC-3' (SEQ ID NO: 293) 서열을 포함할 수 있다.
다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열 및 제4 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 213 서열 또는 이의 일부 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이의 일부 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-CCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 294) 서열 또는 5'-CCGCUUCACCGAAAGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 295) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-CCGCUUUUAGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 296) 서열 또는 5'-CCGCUUGAAAAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 297) 서열을 포함할 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 298) 서열 또는 5'-CCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 299) 서열을 포함할 수 있다.
또 다른 일 구체예로서, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 서열일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열이며, 연속된 네 개 이하의 유리딘 서열을 포함하는 서열일 수 있다. 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-[추가 서열]-3').
예를 들어, 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[SEQ ID NO: 248 서열 또는 이의 일부 서열]-[SEQ ID NO: 213 서열 또는 이의 일부 서열]-[SEQ ID NO: 212 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 211 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[SEQ ID NO: 111 서열 또는 이의 일부 서열]-3'). 상기 engineered tracrRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 추가 서열은 상기 engineered tracrRNA의 3' 말단에 위치할 수 있다. 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 300) 서열, 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열, 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 302) 서열 또는 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 303) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열 또는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열, 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열, 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열 또는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열일 수 있다. 또 다른 일 예로, 상기 engineered tracrRNA는 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 310) 서열 또는 5'-ACCGCUUCACCAAGAAAUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 311) 서열일 수 있다.
2. Wildtype crRNA or Engineered crRNA
crRNA(crispr RNA)는 표적 핵산과 상호작용하는 서열과 Cas12f1(Cas14a1) 단백질과 상호작용하는 서열(tracrRNA와 상호작용하는 서열)을 포함한다. 상기 crRNA는 표적 핵산을 인식, 결합 또는 타겟할 수 있고, 상기 crRNA는 tracrRNA를 인식 또는 결합할 수 있다. 또한 상기 crRNA는 Cas12f1(Cas14a1) 단백질을 인식 또는 결합할 수 있다. 본 명세서에 의해 설명되는 crRNA는 야생형 crRNA 및 engineered crRNA를 모두 포함한다.
야생형 crRNA는 야생형(wildtype) 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 포함한다. 이때, 상기 야생형 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치한다. 이때, 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이다.
Engineered crRNA는 wildtype crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, wildtype crRNA보다 길이가 짧도록 변형되거나 및/또는 3' 말단에 U-rich tail 서열이 부가된 crRNA이다 (도 3). 이때, 상기 engineered crRNA는 앞서 설명한 engineered tracrRNA와의 상호작용 또는 engineered guide RNA(또는 engineered CRISPR/Cas12f1(Cas14a1) system)의 추가적인 기능 향상을 위해 야생형 crRNA가 변형된 것이다.
상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함한다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다.
또는 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함한다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 이때, 상기 제6 서열 및 제7 서열은 각각 상기 engineered tracrRNA와 결합하는 영역을 기준으로 나눈 것이다 (도 3).
또는 상기 engineered crRNA는 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열을 포함한다. 이때, 상기 야생형 반복 서열, 가이드 서열 및 U-rich tail 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 이때, 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이다.
또는 상기 engineered crRNA는 야생형 반복 서열의 일부 서열 및 가이드 서열을 포함하거나 또는 야생형 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열을 포함한다. 이때, 상기 야생형 반복 서열의 일부 서열 및 가이드 서열; 또는 야생형 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열은 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 이때, 상기 야생형 반복 서열의 일부 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열의 일부 서열로, SEQ ID NO: 312 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않는 서열이다.
이하에서, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열에 대해 상세히 기술한다.
2-1) Sixth sequence (the other strand for Stem 5 / a part of Repeat sequence)
상기 engineered crRNA는 제6 서열(sixth sequence)를 포함한다. 상기 제6 서열은 상기 engineered crRNA에 포함되는 필수 서열이다. 상기 제6 서열은 상기 engineered tracrRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제6 서열은 상기 engineered tracrRNA의 상기 제1 서열과 상보적인 결합을 통해 RNA duplex를 형성한다. 이때, 상기 제6 서열과 상기 제1 서열에 의해 형성된 RNA duplex는 스템 5(stem 5)이다. 상기 스템 5을 형성하는 적어도 하나 이상의 뉴클레오타이드는 Cas12f1 단백질의 WED 도메인 및/또는 ZF 도메인과 상호작용할 수 있다.
상기 제6 서열은 5'-ACGAA-3'서열을 포함하지 않는다.
상기 제6 서열은 상기 제1 서열와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제6 서열은 상기 제1 서열와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 염기 페어링을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수있다. 이때, 상기 제6 서열은 상기 제1 서열와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제6 서열은 상기 engineered crRNA의 5' 말단에 위치한다.
상기 제6 서열은 앞서 설명한 engineered tracrRNA의 제1 서열에 따라 다양하게 변형된 서열일 수 있다. 즉, 상기 제6 서열은 상기 제1 서열 내에 존재하는 N 및/또는 V에 따라 다양하게 변형된 서열일 수 있다. 이때, 상기 제6 서열은 상기 제1 서열에 존재하는 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성하는 뉴클레오타이드를 포함하는 서열일 수 있다.
상기 제6 서열은 다음의 서열들 중 선택된 하나의 서열일 수 있다:
5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열;
5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열;
5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열;
5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열;
5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열;
5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및
SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열.
이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다.
이때, 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다.
이때, 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 예를 들어, 상기 d가 3인 경우, (N)3은 5’-NNN-3’ 서열을 의미하며, 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다.
이때, 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 예를 들어, 상기 a가 4인 경우, (B)4는 5’-BBBB-3’ 서열을 의미하며, 이때, 각각의 B는 독립적으로 U, C 또는 G일 수 있다.
이때, 상기 SEQ ID NO: 313 내지 318 서열의 5’말단에 위치하는 5’-GUUGCAGAACCCGAAUAG-3’ (SEQ ID NO: 319) 서열 및/또는 3’말단에 위치하는 5’-UGAAGGA-3’서열은 선택적으로 변형될 수 있다. 상기 변형은 SEQ ID NO: 319 서열 및/또는 5’-UGAAGGA-3’서열 중 적어도 하나 이상의 뉴클레오타이드가 삭제 또는 다른 뉴클레오타이드로 치환되는 것일 수 있다. 또는 상기 변형은 SEQ ID NO: 319 서열 및/또는 5’-UGAAGGA-3’서열에 하나 이상의 뉴클레오타이드가 삽입되는 것일 수 있다.
상기 제6 서열은 engineered tracrRNA의 제1 서열에 따라 상기 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 서열일 수 있다. 이때, 상기 제6 서열은 상기 제1 서열과 유기적인 관계를 가질 수 있다. 상기 제6 서열은 상기 제1 서열에 따라 다양하게 설계될 수 있다. 즉, 상기 제6 서열은 상기 제1 서열 내에 존재하는 N 및/또는 V에 따라 다양하게 설계될 수 있다. 이때, 상기 제6 서열은 상기 제1 서열에 존재하는 적어도 하나 이상의 N 및/또는 V와 상보적인 결합을 형성하는 뉴클레오타이드를 포함할 수 있다.
5’-GUUGCAGAACCCGAAUAG(N) a UGAAGGA-3’ (SEQ ID NO: 313) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열인 경우, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3' (SEQ ID NO: 313) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 제6 서열의 (N)a 중 적어도 하나의 N은 상기 제1 서열의 (N)a 중 적어도 하나의 N과 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCAUUCUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 320) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGUGCCUGAAGGA-3’ (SEQ ID NO: 321) 서열일 수 있다((N)a에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(B) a NNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 제6 서열의 (B)aNNNNB 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 VNNNN(V)a 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCACAUUCCCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 322) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGGAAAGCUGAAGGA-3’ (SEQ ID NO: 323) 서열일 수 있다((B)aNNNNB 및 VNNNN(V)a에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N) b NNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 b는 0 내지 1의 정수일 수 있다. 이때, 상기 제6 서열의 (N)bNNNBN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NVNNN(N)b 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 324) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGA-3’ (SEQ ID NO: 325) 서열일 수 있다((N)bNNNBN 및 NVNNN(N)b에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N) c NNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다. 이때, 상기 제6 서열의 (N)cNNBNN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NNVNN(N)c 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCAUUUCUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 326) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGAGGAAUGAAGGA-3’ (SEQ ID NO: 327) 서열일 수 있다((N)cNNBNN 및 NNVNN(N)c에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N) d NBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다. 이때, 상기 제6 서열의 (N)dNBNNN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NNNVN(N)d 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCACUGCCUUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 328) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGAAGGCAGUGAAGGA-3’ (SEQ ID NO: 329) 서열일 수 있다((N)dNBNNN 및 NNNVN(N)d에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
5’-GUUGCAGAACCCGAAUAG(N) a BNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열
일 구현예로서, 제1 서열이 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, B는 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다. 이때, 상기 제6 서열의 (N)aBNNNN 중 적어도 하나의 N 및/또는 B는 상기 제1 서열의 NNNNV(N)a 중 적어도 하나의 N 및/또는 V와 상보적인 결합을 형성할 수 있다. 예를 들어, 제1 서열이 5’-CAAAUUCACAUUGAUCCUCUCCAAUUCUGCACAA-3’ (SEQ ID NO: 330) 서열인 경우, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGACGAAAGUGAAGGA-3’ (SEQ ID NO: 331) 서열일 수 있다((N)aBNNNN 및 NNNNV(N)a에 대응되는 뉴클레오타이드 중 서로 상보적 결합을 형성하는 뉴클레오타이드는 각각 밑줄로 표시함). 상기 예시는 단순 예시로, 이에 제한되지 않는다.
SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열
일 구현예로서, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3' (SEQ ID NO: 313) 서열의 일부 서열로, SEQ ID NO: 313 서열 중 5'-(N)aUGAAGGA-3'서열을 포함하면서 SEQ ID NO: 313 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 332) 서열의 일부 서열로, 5'-NNNNUGAAGGA-3' (SEQ ID NO: 333) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 334) 서열, 5'-CAGAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 335) 서열, 5'-GAACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 336) 서열, 5'-ACCCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 337) 서열, 5'-CCGAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 338) 서열, 5'-GAAUAGNNNNUGAAGGA-3' (SEQ ID NO: 339) 서열, 5'-AUAGNNNNUGAAGGA-3' (SEQ ID NO: 340) 서열, 5'-AGNNNNUGAAGGA-3' (SEQ ID NO: 341) 서열 또는 5'-NNNNUGAAGGA-3' (SEQ ID NO: 333) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열의 일부 서열로, SEQ ID NO: 314 서열 중 5'-NNNNBUGAAGGA-3' (SEQ ID NO: 342) 서열을 포함하면서 SEQ ID NO: 314 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNNNNBUGAAGGA-3’ (SEQ ID NO: 343) 서열의 일부 서열로, 5'-NNNNBUGAAGGA-3' (SEQ ID NO: 342) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 344) 서열, 5'-CAGAACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 345) 서열, 5'-GAACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 346) 서열, 5'-ACCCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 347) 서열, 5'-CCGAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 348) 서열, 5'-GAAUAGNNNNBUGAAGGA-3' (SEQ ID NO: 349) 서열, 5'-AUAGNNNNBUGAAGGA-3' (SEQ ID NO: 350) 서열, 5'-AGNNNNBUGAAGGA-3' (SEQ ID NO: 351) 서열 또는 5'-NNNNBUGAAGGA-3' (SEQ ID NO: 342) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열의 일부 서열로, SEQ ID NO: 315 서열 중 5'-NNNBNUGAAGGA-3' (SEQ ID NO: 352) 서열을 포함하면서 SEQ ID NO: 315 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 b는 0 내지 1의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNNNBNUGAAGGA-3’ (SEQ ID NO: 353) 서열의 일부 서열로, 5'-NNNBNUGAAGGA-3' (SEQ ID NO: 352) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 354) 서열, 5'-CAGAACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 355) 서열, 5'-GAACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 356) 서열, 5'-ACCCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 357) 서열, 5'-CCGAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 358) 서열, 5'-GAAUAGNNNBNUGAAGGA-3' (SEQ ID NO: 359) 서열, 5'-AUAGNNNBNUGAAGGA-3' (SEQ ID NO: 360) 서열, 5'-AGNNNBNUGAAGGA-3' (SEQ ID NO: 361) 서열 또는 5'-NNNBNUGAAGGA-3' (SEQ ID NO: 352) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열의 일부 서열로, SEQ ID NO: 316 서열 중 5'-NNBNNUGAAGGA-3' (SEQ ID NO: 362) 서열을 포함하면서 SEQ ID NO: 316 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 c는 0 내지 2의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNNBNNUGAAGGA-3’ (SEQ ID NO: 363) 서열의 일부 서열로, 5'-NNBNNUGAAGGA-3' (SEQ ID NO: 362) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 364) 서열, 5'-CAGAACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 365) 서열, 5'-GAACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 366) 서열, 5'-ACCCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 367) 서열, 5'-CCGAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 368) 서열, 5'-GAAUAGNNBNNUGAAGGA-3' (SEQ ID NO: 369) 서열, 5'-AUAGNNBNNUGAAGGA-3' (SEQ ID NO: 370) 서열, 5'-AGNNBNNUGAAGGA-3' (SEQ ID NO: 371) 서열 또는 5'-NNBNNUGAAGGA-3' (SEQ ID NO: 362) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열의 일부 서열로, SEQ ID NO: 317 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 SEQ ID NO: 317 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 d는 0 내지 3의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3’ (SEQ ID NO: 373) 서열의 일부 서열로, 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 374) 서열, 5'-CAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 375) 서열, 5'-GAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 376) 서열, 5'-ACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 377) 서열, 5'-CCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 378) 서열, 5'-GAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 379) 서열, 5'-AUAGNBNNNUGAAGGA-3' (SEQ ID NO: 380) 서열, 5'-AGNBNNNUGAAGGA-3' (SEQ ID NO: 381) 서열 또는 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
또 다른 일 구현예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열의 일부 서열로, SEQ ID NO: 318 서열 중 5'-BNNNNUGAAGGA-3' (SEQ ID NO: 382) 서열을 포함하면서 SEQ ID NO: 318 서열의 5'말단부에서 순차적인 일부 서열을 포함하지 않을 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수일 수 있다.
일 구체예로서, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGBNNNNUGAAGGA-3’ (SEQ ID NO: 383) 서열의 일부 서열로, 5'-BNNNNUGAAGGA-3' (SEQ ID NO: 382) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 예를 들어, 상기 제6 서열은 5'-UGCAGAACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 384) 서열, 5'-CAGAACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 385) 서열, 5'-GAACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 386) 서열, 5'-ACCCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 387) 서열, 5'-CCGAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 388) 서열, 5'-GAAUAGBNNNNUGAAGGA-3' (SEQ ID NO: 389) 서열, 5'-AUAGBNNNNUGAAGGA-3' (SEQ ID NO: 390) 서열, 5'-AGBNNNNUGAAGGA-3' (SEQ ID NO: 391) 서열 또는 5'-BNNNNUGAAGGA-3' (SEQ ID NO: 382) 서열일 수 있다. 이때, 상기 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 B는 U, C 또는 G일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
2-2) Seventh sequence (interaction with the third sequence (or Stem 3) / a part of Repeat sequence)
상기 engineered crRNA는 제7 서열(seventh sequence)를 포함한다. 상기 제7 서열은 상기 engineered crRNA에 포함되는 필수 서열이다. 상기 제7 서열은 상기 engineered tracrRNA의 일부 서열과 상보적인 결합을 하는 서열이다. 이때, 상기 제7 서열은 상기 engineered tracrRNA의 상기 제3 서열의 일부 서열과 상보적인 결합을 통해 RNA duplex를 형성한다.
상기 제7 서열은 상기 제3 서열와 상보적 결합을 형성하는 적어도 하나 이상의 뉴클레오타이드를 포함한다. 이때, 상기 제7 서열은 상기 제3 서열와 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 상보적 결합을 형성할 수 있다.
상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 염기 페어링을 형성하는 뉴클레오타이드를 포함한다. 이때, 상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 염기 페어링을 형성하지 않는 뉴클레오타이드를 포함할 수 있다. 이때, 상기 제7 서열은 상기 제3 서열와 적어도 하나 이상의 염기 페어링을 형성할 수 있다.
상기 제7 서열은 상기 제6 서열의 3' 말단에 위치한다.
상기 제7 서열은 상기 제6 서열의 3'말단과 공유결합으로 연결된다.
일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열일 수 있다.
다른 일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열과 적어도 70% 이상 동일한 또는 유사한 서열일 수 있다. 또는 상기 제7 서열은 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열과 적어도 70% 내지 85%, 적어도 70% 내지 100% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제7 서열은 5’-AUGCAAC-3’ 서열에 적어도 적어도 70% 내지 85%, 적어도 70% 내지 100% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
또 다른 일 구현예로서, 상기 제7 서열은 5’-AUGCAAC-3’ 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 제7 서열은 5’-AUGCAAC-3’ 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
2-3) 가이드 서열 (Guide sequence)
상기 wildtype crRNA 및 engineered crRNA는 가이드 서열를 포함한다. 가이드 서열은 표적 핵산을 인식(recognizing), 결합(binding) 또는 타겟(targeting)하는 RNA 서열이다. 보다 구체적으로, 가이드 서열은 표적 서열과 상보적으로 결합하는 RNA 서열, 표적 서열과 상보적인 결합을 형성할 수 있는 RNA 서열 또는 표적 서열에 상보성을 가지는 RNA 서열이다. 또는 가이드 서열은 프로토스페이서 서열과 동일하거나 유사한 RNA 서열이다. 이때, 프로토스페이서 서열은 표적 서열과 유기적인 관계를 가지며, 이와 관련된 설명은 상기 용어의 정의 섹션의 “표적 서열, 표적 가닥 및 비표적 가닥”에서 설명한 바와 같다. 가이드 서열은 표적 서열에 따라 변경되는 서열로, 가이드 서열은 표적 서열에 따라 달라진다. 또한, 가이드 서열은 RNA 서열로, 표적 핵산이 DNA인 경우에 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 가이드 서열은 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함한다. 또는 표적 핵산이 DNA인 경우에 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 가이드 서열은 티미딘(T) 대신에 유리딘(U)을 포함한다. 또한, 상기 가이드 서열은 스페이서 서열(spacer sequence)로도 지칭되며, 이하에서 가이드 서열과 스페이서 서열은 병용되어 사용된다.
상기 가이드 서열은 상기 야생형 반복 서열의 3' 말단에 위치한다. 또는 상기 가이드 서열은 상기 제7 서열의 3' 말단에 위치한다.
상기 가이드 서열은 상기 야생형 반복 서열의 3' 말단과 공유결합으로 연결된다. 또는 상기 가이드 서열은 상기 제7 서열의 3'말단과 공유결합으로 연결된다.
상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 가이드 서열은 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개 또는 20 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 30 내지 35개 또는 30 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 가이드 서열은 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 가이드 서열은 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 가이드 서열은 표적 서열과 상보적인 결합을 하는 서열일 수 있다. 이때, 상기 상보적인 결합은 선택적으로 적어도 하나 이상의 미스매칭 결합을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 표적 서열과 상보적인 결합을 하는 서열로, 이때, 상기 상보적인 결합은 0 내지 5개의 미스매칭 결합을 포함할 수 있다.
상기 가이드 서열은 표적 서열에 대해 상보적인 서열일 수 있다. 이때, 상기 상보적인 서열은 표적 서열에 대해 0 내지 5개의 미스매치된(mismatched) 뉴클레오타이드 서열을 포함할 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 70% 이상 상보적인 뉴클레오타이드 서열일 수 있다. 이때, 표적 서열이 DNA인 경우에 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 가이드 서열은 상기 아데노신(A)에 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함할 수 있다.
일 구현예로서, 상기 가이드 서열은 표적 서열에 대해 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 상보적인 서열일 수 있다. 또는 상기 가이드 서열은 표적 서열에 대해 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 상보적인 서열일 수 있다.
상기 가이드 서열은 프로토스페이서 서열과 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 대해 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 이때, 상기 서열 동일성 또는 서열 유사성은 적어도 70% 이상인 것일 수 있다. 이때, 프로토스페이서 서열이 DNA인 경우에 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 가이드 서열은 티미딘(T) 대신에 유리딘(U)을 포함할 수 있다.
일 구현예로서, 상기 가이드 서열은 프로토스페이서 서열과 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100% 동일한 또는 유사한 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열과 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일한 또는 유사한 서열일 수 있다.
다른 일 구현예로서, 상기 가이드 서열은 프로토스페이서 서열에 적어도 70% 내지 75%, 적어도 70% 내지 80%, 적어도 70% 내지 85%, 적어도 70% 내지 90%, 적어도 70% 내지 95%, 적어도 70% 내지 100%, 적어도 75% 내지 80%, 적어도 75% 내지 85%, 적어도 75% 내지 90%, 적어도 75% 내지 95% 또는 적어도 75% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 80% 내지 85%, 적어도 80% 내지 90%, 적어도 80% 내지 95%, 적어도 80% 내지 100%, 적어도 85% 내지 90%, 적어도 85% 내지 95% 또는 적어도 85% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 90% 내지 95%, 적어도 90% 내지 100% 또는 적어도 95% 내지 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다. 또는 상기 가이드 서열은 프로토스페이서 서열에 적어도 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 서열 동일성 또는 서열 유사성을 가지는 서열일 수 있다.
2-4) U-rich tail sequence
상기 engineered crRNA는 U-rich tail 서열을 선택적으로 더 포함할 수 있다. U-rich tail 서열은 상기 engineered crRNA의 3’ 말단에 부가되는 유리딘(U)가 풍부한 서열이다. 상기 U-rich tail 서열은 engineered guide RNA(또는 engineered CRISPR/Cas12f1(Cas14a1) system)을 이용한 표적 유전자(표적 핵산) 에디팅 효율을 높이는 역할을 한다고 알려져 있다(PCT/KR2020/014961).
상기 U-rich tail 서열은 5’-(UaN)dUe-3’ 서열, 5’-UaVUaVUe-3’ 서열 또는 5’-UaVUaVUaVUe-3’ 서열일 수 있다.
이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다.
이때, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다.
일 구현예로서, 상기 U-rich tail 서열은 5’-(UaU)dUe-3’ 서열, 즉, Ux 서열일 수 있다. 이때, 상기 x는 0 내지 22의 정수일 수 있다. 예를 들어, 상기 U-rich tail 서열은 U, UU, UUU, UUUU, UUUUU, UUUUUU, UUUUUUU, UUUUUUUU, UUUUUUUUU 또는 UUUUUUUUUU (SEQ ID NO: 392) 일 수 있다.
다른 일 구현예로서, 상기 U-rich tail 서열은 5’-(UaA)dUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UAU, UUAUUAU, UUUUAUUUU, UUUAUUUUU 또는 UUUAUUUAUUUAU (SEQ ID NO: 393) 일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5’-(UaG)dUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUG, UUUGU, UUGUUGU, UUUUGUUUU, UGUGUGUUUU (SEQ ID NO: 394) 또는 UUUGUUUGUUUU (SEQ ID NO: 395) 일 수 있다.
다른 일 구현예로서, 상기 U-rich tail 서열은 5’-(UaC)dUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 CUUUUU, UCUCUUU, UUCUU, UUUCU, UUUUCUUUU 또는 UUUUCUUUUCUUUU (SEQ ID NO: 396) 일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5’-UaAUaAUe-3’ 서열, 5’-UaAUaCUe-3’ 서열, 5’-UaAUaGUe-3’ 서열, 5’-UaCUaAUe-3’ 서열, 5’-UaCUaCUe-3’ 서열, 5’-UaCUaGUe-3’ 서열, 5’-UaGUaAUe-3’ 서열, 5’-UaGUaCUe-3’ 서열 또는 5’-UaGUaGUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUAUUUAUU, UUUCUAUUUU (SEQ ID NO: 397), UGUCU, UUAUGUUUUU (SEQ ID NO: 398) 또는 UCUUUUGUU일 수 있다.
또 다른 일 구현예로서, 상기 U-rich tail 서열은 5’-UaAUaAUaAUe-3’ 서열, 5’-UaAUaAUaCUe-3’ 서열, 5’-UaAUaAUaGUe-3’ 서열, 5’-UaAUaCUaAUe-3’ 서열, 5’-UaAUaCUaCUe-3’ 서열, 5’-UaAUaCUaGUe-3’ 서열, 5’-UaAUaGUaAUe-3’ 서열, 5’-UaAUaGUaCUe-3’ 서열, 5’-UaAUaGUaGUe-3’ 서열, 5’-UaCUaAUaAUe-3’ 서열, 5’-UaCUaAUaCUe-3’ 서열, 5’-UaCUaAUaGUe-3’ 서열, 5’-UaCUaCUaAUe-3’ 서열, 5’-UaCUaCUaCUe-3’ 서열, 5’-UaCUaCUaGUe-3’ 서열, 5’-UaCUaGUaAUe-3’ 서열, 5’-UaCUaGUaCUe-3’ 서열, 5’-UaCUaGUaGUe-3’ 서열, 5’-UaGUaAUaAUe-3’ 서열, 5’-UaGUaAUaCUe-3’ 서열, 5’-UaGUaAUaGUe-3’ 서열, 5’-UaGUaCUaAUe-3’ 서열, 5’-UaGUaCUaCUe-3’ 서열, 5’-UaGUaCUaGUe-3’ 서열, 5’-UaGUaGUaAUe-3’ 서열, 5’-UaGUaGUaCUe-3’ 서열 또는 5’-UaGUaGUaGUe-3’ 서열일 수 있다. 예를 들어, 상기 U-rich tail 서열은 UUUAUUCUGUU (SEQ ID NO: 399), UUCUCUUUCUUU (SEQ ID NO: 400), UGUUAUUUAUU (SEQ ID NO: 401), UUUCUUUAUGUUU (SEQ ID NO: 402), UAUUUGUUUC (SEQ ID NO: 403) 또는 UUCUUGUUUUAUU (SEQ ID NO: 404) 일 수 있다.
2-5) 추가 서열(additional sequence)
상기 wildtype crRNA 및/또는 engineered crRNA는 추가 서열(additional sequence)을 선택적으로 더 포함할 수 있다. 상기 추가 서열은 wildtype crRNA 및/또는 engineered crRNA의 5’말단에 위치할 수 있다. 상기 추가 서열은 상기 야생형 반복 서열 또는 engineered 반복 서열의 5’말단에 위치할 수 있다. 상기 추가 서열은 상기 제6 서열의 5’말단에 위치할 수 있다.
상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다.
일 구현예로서, 상기 추가 서열은 1 내지 5개, 1 내지 10개, 1 내지 15개, 1 내지 20개, 1 내지 25개, 1 내지 30개, 1 내지 35개, 1 내지 40개, 5 내지 10개, 5 내지 15개, 5 내지 20개, 5 내지 25개, 5 내지 30개, 5 내지 35개 또는 5 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 10 내지 15개, 10 내지 20개, 10 내지 25개, 10 내지 30개, 10 내지 35개, 10 내지 40개, 15 내지 20개, 15 내지 25개, 15 내지 30개, 15 내지 35개 또는 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 20 내지 25개, 20 내지 30개, 20 내지 35개, 20 내지 40개, 25 내지 30개, 25 내지 35개 또는 25 내지 40개의 뉴클레오타이드 서열일 수 있다. 또는 상기 추가 서열은 30 내지 35개, 30 내지 40개 또는 35 내지 40개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 추가 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 뉴클레오타이드 서열일 수 있다.
상기 추가 서열은 임의의 뉴클레오타이드 서열 또는 임의로 배열된 뉴클레오타이드 서열일 수 있다.
상기 추가 서열은 공지된 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 서열은 hammerhead ribozyme 뉴클레오타이드 서열일 수 있다. 이때, 상기 hammerhead ribozyme 뉴클레오타이드 서열은 SEQ ID NO: 261 서열 또는 SEQ ID NO: 262 서열일 수 있다. 상기 예시는 단순 예시로, 이에 제한되지 않는다.
2-6) 화학적 변형(Chemical modification)
앞서 설명한 wildtype crRNA 또는 engineered crRNA는 선택적으로 적어도 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다. 이때, 상기 화학적 변형은 뉴클레오타이드의 염기 및/또는 당에서 발생할 수 있는 다양한 공유 결합의 변형일 수 있으며, 예를 들어, 상기 화학적 변형은 methylation, halogenation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있고, 또는 WO 2019/089820 A1에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되지 않는다.
2-7) crRNA의 예시 (Engineered crRNA의 예시)
앞선 설명을 기초로, wildtype crRNA 및 engineered crRNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-3'). 일 예로, 상기 wildtype crRNA는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 405) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
일 구현예로서, engineered crRNA는 wildtype crRNA의 3' 말단에 U-rich tail 서열이 부가된 crRNA일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[wildtype 반복 서열]-[가이드 서열]-[U-rich tail 서열]-3').
예를 들어, 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 312 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3'(SEQ ID NO: 406) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 407) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구현예로서, engineered crRNA는 야생형(wildtype) crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형된 서열일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 및 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 408) 서열 또는 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-GNGNNNUG-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 409) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 410) 서열을 포함할 수 있다.
또 다른 일 구현예로서, engineered crRNA는 야생형(wildtype) crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, 및/또는 wildtype crRNA보다 길이가 짧도록 변형된 서열일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열의 일부 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열의 일부 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-3'). 이때, 상기 wildtype 반복 서열의 일부 서열은 SEQ ID NO: 312 서열의 일부 서열로, SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-3'). 일 예로, 상기 engineered crRNA는 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 411) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되고, wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 5’-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 413) 서열, 5’-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 414) 서열, 5’-GCAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 415) 서열, 5’-CAGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 416) 서열, 5’-AGAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 417) 서열, 5’-GAACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 418) 서열, 5’-AACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 419) 서열, 5’-ACCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 420) 서열, 5’-CCCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 421) 서열, 5’-CCGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 422) 서열, 5’-CGAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 423) 서열, 5’-GAAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 424) 서열, 5’-AAUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 425) 서열, 5’-AUAGNGNNNUGAAGGA-3’ (SEQ ID NO: 426) 서열, 5’-UAGNGNNNUGAAGGA-3’ (SEQ ID NO: 427) 서열, 5’-AGNGNNNUGAAGGA-3’ (SEQ ID NO: 428) 서열 또는 5’-NGNNNUGAAGGA-3’ (SEQ ID NO: 412) 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열 또는 이의 일부 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 429) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 430) 서열을 포함할 수 있다.
다른 일 구현예로서, engineered crRNA는 야생형(wildtype) crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, wildtype crRNA보다 길이가 짧도록 변형되거나, 및/또는 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다.
일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제되고, 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열의 일부 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 wildtype 반복 서열의 일부 서열은 SEQ ID NO: 312 서열의 일부 서열로, SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 431) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되고, 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 및 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-GNGNNNUG-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 432) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 433) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered crRNA는 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3’ (SEQ ID NO: 434) 서열을 포함할 수 있다.
또 다른 일 구체예로서, 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되거나, wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제되거나, 및/또는 3' 말단에 U-rich tail 서열이 부가된 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered crRNA는 선택적으로 추가 서열을 더 포함할 수 있다. 이때, 상기 추가 서열은 1 내지 40개의 뉴클레오타이드 서열(1 내지 40nt 서열)일 수 있다. 상기 추가 서열은 상기 engineered crRNA의 5' 말단에 위치할 수 있다(5'-[추가 서열]-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3').
예를 들어, 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 412 내지 428 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다(5'-[SEQ ID NO: 408 서열의 일부 서열]-[5’-AUGCAAC-3’ 서열 또는 이에 적어도 70% 이상의 서열 동일성을 가지는 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 일 예로, 상기 engineered crRNA는 5’-GAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 435) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다. 다른 일 예로, 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 436) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered crRNA는 5’-GAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUUAUUUU-3’ (SEQ ID NO: 545) 서열을 포함할 수 있다.
3. Engineered guide RNA
Engineered guide RNA는 engineered tracrRNA(trans-activating crispr RNA)과 crRNA(crispr RNA)을 포함한다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다. 이때, 상기 engineered tracrRNA, wildtype crRNA 및 engineered crRNA 관련 설명은 앞서 기재한 바와 같다.
상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다.
이하에서, engineered dual guide RNA 및 engineered single guide RNA에 대해 자세히 설명한다.
3-1) Dual guide RNA
Engineered dual guide RNA는 두 개의 분자로, engineered tracrRNA 및 crRNA 각각을 별개의 RNA 분자로 포함한다. 즉, 상기 engineered dual guide RNA는 engineered tracrRNA 및 crRNA가 각각 독립적으로 존재한다.
이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
이때, 상기 engineered tracrRNA, wildtype crRNA 및 engineered crRNA 관련 설명은 앞서 기재한 바와 같다.
3-2) Single guide RNA
Engineered single guide RNA는 하나의 RNA 분자로, engineered tracrRNA, 링커(linker) 및 crRNA를 포함한다. 이때, 상기 engineered single guide RNA는 engineered tracrRNA, linker 및 crRNA가 연결된 하나의 RNA 분자이다.
Engineered single guide RNA는 5'-[engineered tracrRNA]-[linker]-[crRNA]-3' 서열일 수 있다.
이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
이때, 상기 engineered tracrRNA, wildtype crRNA 및 engineered crRNA 관련 설명은 앞서 기재한 바와 같다.
이때, 상기 linker는 상기 engineered tracrRNA 및 crRNA를 연결하는 역할을 하는 서열이다. 즉, 상기 engineered single guide RNA는 engineered tracrRNA와 crRNA가 linker를 통해 연결된 하나의 RNA 분자이다.
상기 linker는 engineered tracrRNA 및/또는 crRNA의 기능에 영향을 주지 않는 서열일 수 있다. 또는 상기 linker는 engineered tracrRNA 및/또는 crRNA와 RNA duplex를 형성하지 않는 서열일 수 있다.
상기 linker는 1 내지 30개의 뉴클레오타이드 서열일 수 있다.
일 구현예로서, 상기 linker는 1 내지 5개, 5 내지 10개, 10 내지 15개, 15 내지 20개, 20개 내지 25개 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
다른 일 구현예로서, 상기 linker는 1 내지 30개, 5 내지 30개, 10 내지 30개, 15 내지 30개, 20 내지 30개 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.
또 다른 일 구현예로서, 상기 linker는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 linker는 5'-GAAA-3' 서열일 수 있으나, 이에 제한된 것은 아니다.
3-3) Engineered guide RNA의 예시
앞선 설명을 기초로, engineered guide RNA의 예시를 설명한다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 crRNA를 포함할 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다. 상기 engineered tracrRNA는 앞서 기재한 "1-8) Engineered tracrRNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다. 상기 crRNA는 "2-7) crRNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 crRNA는 linker를 통해 연결되어 있을 수 있다.
다른 일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다.
일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 및 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 wildtype crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열은 5'-CANNNCNC-3'서열 외에 나머지 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열 또는 SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열 또는 SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype crRNA은 wildtype 반복 서열과 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열 및 wildtype crRNA인 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 405) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 437) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 438) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않고, wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있고, wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype 반복 서열과 가이드 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 wildtype crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 wildtype crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 wildtype crRNA는 wildtype 반복 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 wildtype crRNA은 wildtype 반복 서열과 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 wildtype crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 439) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 440) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 441) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열 및 wildtype crRNA인 SEQ ID NO: 405 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 442) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
또 다른 일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered crRNA는 wildtype crRNA보다 반복 길이가 짧도록 변형되거나, 및/또는 wildtype crRNA의 3' 말단에 U-rich tail 서열이 부가된 것일 수 있다.
일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 wildtype 반복 서열은 SEQ ID NO: 312 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 wildtype 반복 서열, 가이드 서열 및 U-rich tail 서열은 wildtype crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 301 서열 및 engineered crRNA인 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 407) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 443) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 304 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 444) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 306 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 445) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 308 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 446) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 269 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 447) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 270 서열 및 engineered crRNA인 SEQ ID NO: 407 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 448) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열의 일부 서열 및 가이드 서열을 포함할 수 있다. 상기 engineered crRNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 wildtype 반복 서열의 일부 서열은 SEQ ID NO: 312 서열의 일부 서열로, SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 wildtype 반복 서열의 일부 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-3'). 이때, 선택적으로 U-rich tail 서열을 더 포함하는 경우, 상기 U-rich tail 서열은 상기 engineered crRNA의 3' 말단에 위치할 수 있다(5'-[wildtype 반복 서열의 일부 서열]-[가이드 서열]-[U-rich tail]-3'). 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열의 일부 서열 및 가이드 서열을 포함할 수 있다. 상기 engineered crRNA는 선택적으로 U-rich tail 서열을 더 포함할 수 있다. 이때, 상기 SEQ ID NO: 312 서열의 일부 서열은 SEQ ID NO: 312 서열의 5' 말단부 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 SEQ ID NO: 312 서열의 일부 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있고, U-rich tail 서열을 더 포함하는 경우, 상기 U-rich tail 서열은 3' 말단에 포함될 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열 및 engineered crRNA인 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 411) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 449) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 305 서열 및 engineered crRNA인 5'-GAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 431) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 450) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열 및 engineered crRNA인 SEQ ID NO: 431 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCUUAGGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 451) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열 및 engineered crRNA인 SEQ ID NO: 431 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGACGAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 452) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
또 다른 일 구현예로서, engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered crRNA는 야생형 crRNA의 일부 뉴클레오타이드 서열이 인위적으로 변형되거나, wildtype crRNA보다 길이가 짧도록 변형되거나, 및/또는 3' 말단에 U-rich tail 서열이 부가된 것일 수 있다.
일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환된 것일 수 있다. 상기 engineered crRNA는 선택적으로 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 것일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열 및 가이드 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 412 내지 428 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 301 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 409) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 453) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 304 서열 및 engineered crRNA인 SEQ ID NO: 409 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 454) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 306 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3’ (SEQ ID NO: 410) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 455) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 308 서열 및 engineered crRNA인 SEQ ID NO: 410 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 456) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 269 서열 및 engineered crRNA인 SEQ ID NO: 409 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 457) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 270 서열 및 engineered crRNA인 SEQ ID NO: 410 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNN-3'(SEQ ID NO: 458) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
다른 일 구체예로서, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 포함하지 않도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA보다 길이가 짧도록 추가로 변형된 것일 수 있다. 상기 engineered tracrRNA는 연속된 네 개 이하의 유리딘 서열을 포함할 수 있다. 상기 engineered tracrRNA는 선택적으로 wildtype tracrRNA의 일부 서열을 포함하지 않을 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열은 상기 engineered tracrRNA의 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다(5'-[제5 서열]-[제4 서열]-[제3 서열]-[제2 서열]-[제1 서열]-3'). 이때, 상기 제1 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5'-CAAAUUCA(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 2) 서열; 5'-CAAAUUCAVNNNN(V)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 3) 서열; 5'-CAAAUUCANVNNN(N)bCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 4) 서열; 5'-CAAAUUCANNVNN(N)cCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 5) 서열; 5'-CAAAUUCANNNVN(N)dCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 6) 서열; 5'-CAAAUUCANNNNV(N)aCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 7) 서열; 및 SEQ ID NO: 2 내지 7 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 V는 독립적으로 A, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (V)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (V)a의 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 상기 engineered crRNA는 wildtype 반복 서열과 비교하여 적어도 하나 이상의 뉴클레오타이드가 다른 서열로 치환되고, 3' 말단에 U-rich tail 서열이 부가된 것일 수 있다. 상기 engineered crRNA는 선택적으로 wildtype 반복 서열 중 일부 뉴클레오타이드 서열이 삭제된 것일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열은 상기 engineered crRNA의 5' 말단에서 3' 말단 방향으로 순서대로 위치할 수 있다(5'-[제6 서열]-[제7 서열]-[가이드 서열]-[U-rich tail 서열]-3'). 이때, 상기 제6 서열은 다음의 서열들 중 선택된 적어도 하나의 서열일 수 있다: 5’-GUUGCAGAACCCGAAUAG(N)aUGAAGGA-3’ (SEQ ID NO: 313) 서열; 5’-GUUGCAGAACCCGAAUAG(B)aNNNNBUGAAGGA-3’ (SEQ ID NO: 314) 서열; 5’-GUUGCAGAACCCGAAUAG(N)bNNNBNUGAAGGA-3’ (SEQ ID NO: 315) 서열; 5’-GUUGCAGAACCCGAAUAG(N)cNNBNNUGAAGGA-3’ (SEQ ID NO: 316) 서열; 5’-GUUGCAGAACCCGAAUAG(N)dNBNNNUGAAGGA-3’ (SEQ ID NO: 317) 서열; 5’-GUUGCAGAACCCGAAUAG(N)aBNNNNUGAAGGA-3’ (SEQ ID NO: 318) 서열; 및 SEQ ID NO: 313 내지 318 서열 중 선택된 하나의 일부 서열. 이때, 각각의 N은 독립적으로 A, C, G 또는 U이고, 각각의 B는 독립적으로 U, C 또는 G 일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 b는 0 내지 1의 정수이며, 상기 c는 0 내지 2의 정수이고, 상기 d는 0 내지 3의 정수일 수 있다. 상기 (N)a, (N)c 또는 (N)d에서, 상기 a, c 및 d가 0 또는 1이 아닌 정수의 경우, 상기 (N)a, (N)c 또는 (N)d의 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 상기 (B)a에서, 상기 a가 0 또는 1이 아닌 정수의 경우, 상기 (B)a의 각각의 B은 독립적으로 U, C 또는 G일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열일 수 있다. 이때, 상기 N은 A, C, G 또는 U 일 수 있고, 상기 각각의 V는 독립적으로 A, C 또는 G일 수 있다. 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수일 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA일 수 있다. 이때, 상기 engineered dual guide RNA는 engineered tracrRNA와 engineered crRNA를 각각 별개의 RNA 분자로 포함할 수 있다. 또는 상기 engineered guide RNA는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다.
예를 들어, 상기 engineered guide RNA는 engineered tracrRNA 및 engineered crRNA를 포함할 수 있다. 상기 engineered tracrRNA는 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 포함할 수 있다. 이때, 상기 제1 서열은 SEQ ID NO: 111 서열 또는 SEQ ID NO: 111 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 상기 SEQ ID NO: 111 서열 중 SEQ ID NO: 272 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 111 서열의 일부 서열은 SEQ ID NO: 272 내지 290 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제2 서열은 SEQ ID NO: 211 서열 또는 SEQ ID NO: 211 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제3 서열은 SEQ ID NO: 212 서열 또는 SEQ ID NO: 212 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 제4 서열은 SEQ ID NO: 213 서열, SEQ ID NO: 213 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 213 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 상기 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열일 수 있다. 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 214 내지 217 서열, SEQ ID NO: 231 내지 247 서열, 5'-CCUUAGGUG-3' 서열, 5'-CUUAGUG-3' 서열, 5'-CUUAGG-3' 서열 및 5'-UUAG-3' 서열로 구성된 군에서 선택된 하나의 서열일 수 있으며, 이때, 상기 선택된 하나의 서열 내에 포함된 5'-UUAG-3' 서열은 5'-GAAA-3' 서열로 치환될 수 있다. 이때, 상기 제5 서열은 SEQ ID NO: 248 서열, SEQ ID NO: 248 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열 또는 SEQ ID NO: 248 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열로, 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열 및 SEQ ID NO: 249 내지 259 서열로 구성된 군에서 선택된 하나의 서열일 수 있다. 상기 engineered tracrRNA는 상기 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3' 말단에서 5' 말단 방향으로 순서대로 위치할 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 포함할 수 있다. 이때, 상기 제6 서열은 SEQ ID NO: 408 서열 또는 SEQ ID NO: 408 서열의 일부 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 408 서열 중 5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열을 포함하면서 5' 말단부의 일부 서열이 포함하지 않는 서열일 수 있다. 이때, 상기 SEQ ID NO: 408 서열의 일부 서열은 SEQ ID NO: 412 내지 428 서열 중 선택된 하나의 서열일 수 있다. 이때, 각각의 N은 독립적으로 A, C, G 또는 U일 수 있다. 이때, 상기 제7 서열은 5’-AUGCAAC-3’ 서열 또는 5’-AUGCAAC-3’ 서열에 적어도 70% 이상의 서열 동일성을 가지는 서열일 수 있다. 이때, 상기 가이드 서열은 15 내지 40개의 뉴클레오타이드 서열일 수 있다. 이때, 상기 U-rich tail 서열은 5'-UUUU-3' 서열, 5'-UUUUAUU-3' 서열 또는 5'-UUUUAUUUU-3' 서열일 수 있다. 상기 engineered crRNA는 제6 서열, 제7 서열, 가이드 서열 및 U-rich tail 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함할 수 있다. 상기 engineered guide RNA는 engineered dual guide RNA 또는 engineered single guide RNA일 수 있다. 이때, 상기 engineered single guide RNA는 linker를 더 포함할 수 있으며, 상기 engineered tracrRNA와 engineered crRNA는 linker를 통해 연결되어 있을 수 있다. 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 301 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 432) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 459) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 304 서열 및 engineered crRNA인 SEQ ID NO: 432 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 460) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 306 서열 및 engineered crRNA인 5’-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3’ (SEQ ID NO: 433) 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 461) 서열을 포함할 수 있다. 또 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 308 서열 및 engineered crRNA인 SEQ ID NO: 433 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 462) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 269 서열 및 engineered crRNA인 SEQ ID NO: 432 서열을 포함할 수 있다. 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 463) 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 engineered tracrRNA인 SEQ ID NO: 270 서열 및 engineered crRNA인 SEQ ID NO: 433 서열을 포함할 수 있다. 또 다른 일 예로, 상기 engineered guide RNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAACNNNNNNNNNNNNNNNNNNNNUUUU-3'(SEQ ID NO: 464) 서열을 포함할 수 있다. 이때, 상기 각각의 N은 A, C, G 또는 U일 수 있다.
4. Engineered guide RNA의 용도
상기 engineered guide RNA는 Cas12f1(Cas14a1)와 함께 engineered CRISPR/Cas12f1(Cas14a1) system을 구성할 수 있다.
상기 engineered guide RNA는 Cas12f1(Cas14a1) 단백질과 결합하여 engineered CRISPR/Cas12f1 복합체(또는 CRISPR/Cas14a1 복합체)를 이룰 수 있다.
상기 engineered guide RNA는 engineered CRISPR/Cas12f1(Cas14a1) system의 표적 핵산의 절단, 편집 또는 변형을 위한 용도로 사용될 수 있으며, 이를 더욱 효과적으로 수행되도록 할 수 있다.
<Engineered CRISPR/Cas12f1(Cas14a1) system>
본 명세서에 의해 개시되는 다른 일 태양은 engineered CRISPR/Cas12f1(Cas14a1) system에 관한 것이다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA 및 Cas12f1(Cas14a1) 단백질이 정상적으로 발현하고 및/또는 정상적으로 작동하도록 하는 모든 형태를 포함한다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 더욱 효과적으로 수행되도록 한다. 특히, 상기 engineered CRISPR/Cas12f1(Cas14a1) system는 다음과 같은 효과를 수반할 수 있다:
guide RNA-Cas12f1 protein complex의 stability 증가;
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 절단 효율 증가; 및
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 편집 또는 변형 효율 증가.
보다 구체적으로, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산
을 포함한다.
이하에서 각 구성을 자세히 설명한다.
1. Engineered guide RNA
본 명세서에 의해 개시되는 engineered CRISPR/Cas12f1(Cas14a1) system은 표적 핵산 또는 표적 유전자에 존재하는 표적 서열을 인식하는 engineered guide RNA을 포함한다. 일반적으로 하나의 engineered guide RNA는 하나의 표적 서열을 인식할 수 있다. 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
또한, engineered guide RNA를 암호화하는 핵산은 engineered guide RNA를 전사하기 위해 engineered guide RNA를 암호화하는 DNA일 수 있다.
2. Cas12f1(Cas14a1) protein
Cas12f1 단백질은 CRISPR/Cas12f1(Cas14a1) system의 주요 단백질 구성요소로, 선행연구(Harrington et al., Science, 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중 하나로, Cas14a1 단백질로도 불린다. 본 명세서에서, Cas12f1 단백질은 Cas14a1 단백질 또는 Cas12f1(Cas14a1) 단백질과 혼용되어 사용된다. 본 명세서에 의해 개시되는 Cas12f1 단백질은 자연계에 존재하는 야생형(wildtype) Cas12f1 단백질(야생형 Cas14a1 단백질)일 수 있다. 또는, Cas12f1 단백질은 야생형 Cas12f1 단백질의 변이체(variant)일 수 있으며, 이때, 상기 변이체는 "Cas12f1 변이체(Cas12f1 variant)" 또는 "Cas14a1 변이체(Cas14a1 variant)"로 지칭한다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체, 기능 일부 또는 전부가 변형된 변이체 및/또는 추가적인 기능이 부가된 변이체일 수 있다. Cas12f1 단백질의 의미는 문맥에 따라 적절히 해석될 수 있고, 특별한 경우가 아닌 한 가장 넓은 의미로 해석된다. 이하에서 Cas12f1 단백질에 대해 자세히 설명한다.
2-1) Wildtype Cas12f1(Cas14a1) protein
상기 Cas12f1 단백질은 야생형 Cas12f1 단백질일 수 있다. 이때, 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥 또는 단일 가닥을 절단할 수 있다. 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자 내에 존재하는 Protospacer Adjacent Motif(PAM) 서열을 인식할 수 있다. 이때, PAM 서열은 상기 Cas14a1 단백질에 따라 정해지는 고유한 서열이다. 상기 Cas12f1 단백질을 위한 PAM 서열은 T-rich 서열일 수 있다. 상기 Cas12f1 단백질을 위한 PAM 서열은 5'-TTTR-3'서열일 수 있다. 이때, 상기 R은 A 또는 G일 수 있다. 예를 들어, 상기 PAM 서열은 5'-TTTA-3' 또는 5'-TTTG-3' 서열일 수 있다.
일 구현예로서, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)에서 유래한 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a1 단백질(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)일 수 있다. 예를 들어, 상기 Cas14a1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다.
Cas14a1(Cas12f1) 단백질
Name Amino acid sequence
Cas12f1 단백질 mAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLF
CKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLS
DVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSD
FIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQ
TSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFN
KKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLES
MKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPH
FKCEKCNFKENADYNAALNISNPKLKSTKEEP (SEQ ID NO: 465)
2-2) Cas12f1(Cas14a1) variant - Cas12f1(Cas14a1) mutant
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다. 이때, 상기 변형은 삭제(deletion) 및/또는 치환(substitution)일 수 있다. 이때, 상기 Cas12f1 변이체는 "Cas12f1 돌연변이(Cas12f1 mutant)" 또는 "Cas14a1 돌연변이(Cas14a1 mutant)"로 지칭한다.
일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 삭제된 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 치환은 하나의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 하나의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있으며, 이때, 치환되는 아미노산의 수와 치환하는 아미노산의 수는 서로 동일하거나 다를 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체 또는 기능 일부 또는 전부가 변형된 변이체일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 표적 핵산의 이중 가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 또는 상기 Cas12f1 돌연변이는 5'-TTTA-3' 또는 5'-TTTG-3'이 아닌 다른 PAM 서열을 인식하도록 변형된 것일 수 있다.
2-3) Cas12f1(Cas14a1) variant - Cas12f1(Cas14a1) fusion protein
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 변이체일 수 있다. 이때, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 변이체는 "Cas12f1 융합 단백질" 또는 "Cas14a1 융합 단백질"로 지칭된다. 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이의 N 말단, C 말단 및/또는 아미노산 서열 내에 부가될 수 있다. 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 야생형 Cas12f1 단백질과 동일하거나 다른 기능을 가지는 도메인, 펩타이드 또는 단백질일 수 있다. 예를 들어, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 단백질일 수 있으나, 이에 제한되지 않는다. 또는, 상기 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질은 역전사 효소(reverse transcriptase) 또는 디아미네이즈(deaminase)일 수 있다.
일 구현예로서, 상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질 및 디아미네이즈를 포함할 수 있다. 이때, 상기 디아미네이즈는 시토신 디아미네이즈(cytosine deaminase), 시티딘 디아미네이즈(cytidine deaminase) 또는 아데닌 디아미네이즈(adenine deaminase)일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 선택적으로 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질을 더 포함할 수 있다. 일 구체예로서, 상기 Cas12f1 융합 단백질은 SEQ ID NO: 466 아미노산 서열 또는 SEQ ID NO: 467 아미노산 서열일 수 있다. 다른 일 구체예로서, 상기 Cas12f1 융합 단백질은 SEQ ID NO: 468 아미노산 서열 또는 SEQ ID NO: 469 아미노산 서열일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질 및 역전사 효소(reverse transcriptase)를 포함할 수 있다. 이때, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소 또는 이의 변이체일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 선택적으로 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질을 더 포함할 수 있다. 일 구체예로서, 상기 Cas12f1 융합 단백질은 SEQ ID NO: 470 아미노산 서열일 수 있다.
상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질과 동일한 기능 및 추가적인 기능을 가지는 변이체일 수 있다. 또는 상기 Cas12f1 융합 단백질은 야생형 Cas12f1 단백질의 기능 일부 또는 전부의 변형 및 추가적인 기능을 가지는 변이체일 수 있다. 예를 들어, 상기 Cas12f1 융합 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 이때, 상기 Cas12f1 융합 단백질은 Cas12f1 돌연변이 및 디아미네이즈를 포함할 수 있고, 이 경우, 상기 베이스 에디팅은 디아미네이즈에 의한 것일 수 있다. 또는 상기 Cas12f1 융합 단백질은 Cas12f1 돌연변이 및 역전사 효소를 포함할 수 있고, 이 경우, 상기 프라임 에디팅은 역전사 효소에 의한 것일 수 있다.
2-4) Cas12f1(Cas14a1) variant - 기타
상기 Cas12f1 단백질은 Cas12f1 변이체일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질, Cas12f1 돌연변이 또는 Cas12f1 융합 단백질에 선택적으로 NLS(Nuclear Localization Sequence) 또는 NES(Nuclear Export Sequence)가 더 포함된 것일 수 있다. 상기 NLS 및 NES는 세포 내 또는 외에서 Cas12f1 단백질의 위치 결정을 위한 시그널 펩타이드로, 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다. 예를 들어, 상기 NLS는 아미노산 서열 PKKKRKV (SEQ ID NO: 471)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK (SEQ ID NO: 472)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD (SEQ ID NO: 473) 또는 RQRRNELKRSP (SEQ ID NO: 474)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 475)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 476); 마이오마(myoma) T 단백질의 서열 VSRKRPRP (SEQ ID NO: 477) 및 PPKKARED (SEQ ID NO: 478); 인간 p53의 서열 PQPKKKPL (SEQ ID NO: 479); 마 우스 c-abl IV의 서열 SALIKKKKKMAP (SEQ ID NO: 480); 인플루엔자 바이러스 NS1의 서열 DRLRR (SEQ ID NO: 481) 및 PKQKKRK (SEQ ID NO: 482); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL (SEQ ID NO: 483); 마우스 Mx1 단백질의 서열 REKKKFLKRR (SEQ ID NO: 484); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 485); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (SEQ ID NO: 486)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
또한, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질, Cas12f1 돌연변이 또는 Cas12f1 융합 단백질에 선택적으로 태그가 더 포함된 것일 수 있다. 상기 태그는 Cas12f1 단백질의 분리 정제 및/또는 추적을 위한 기능적 도메인, 펩타이드 또는 단백질로, 앞서 기재한 용어 정의 중 "태그" 섹션에 예시된 것 중 하나일 수 있으나, 이에 제한되지 않는다.
2-5) Nucleic acid encoding Cas12f1(Cas14a1) protein
Cas12f1 단백질을 암호화하는 핵산은 야생형 Cas12f1 단백질을 암호화하는 핵산 또는 Cas12f1 변이체를 암호화하는 핵산일 수 있다. 상기 Cas12f1 단백질을 암호화하는 핵산은 Cas12f1 단백질을 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.
“코돈 최적화"는 고유 서열의 적어도 하나의 코돈을 대상 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노산 서열을 유지함으로써 관심 대상 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.
일 구현예로서, 상기 Cas12f1 단백질을 암호화하는 핵산은 인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산일 수 있다. 예를 들어, 상기 인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산은 SEQ ID NO: 487 서열일 수 있다.
인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산
Name Sequence
인간 코돈 최적화된 Cas12f1 단백질을 암호화하는 핵산 ATGGCCAAGAACACAATTACAAAGACACTGAAGCTGAGGATCGTGAGACCATACAACAGCGCTGAG
GTCGAGAAGATTGTGGCTGATGAAAAGAACAACAGGGAAAAGATCGCCCTCGAGAAGAACAAGGAT
AAGGTGAAGGAGGCCTGCTCTAAGCACCTGAAAGTGGCCGCCTACTGCACCACACAGGTGGAGAGG
AACGCCTGTCTGTTTTGTAAAGCTCGGAAGCTGGATGATAAGTTTTACCAGAAGCTGCGGGGCCAG
TTCCCCGATGCCGTCTTTTGGCAGGAGATTAGCGAGATCTTCAGACAGCTGCAGAAGCAGGCCGCC
GAGATCTACAACCAGAGCCTGATCGAGCTCTACTACGAGATCTTCATCAAGGGCAAGGGCATTGCC
AACGCCTCCTCCGTGGAGCACTACCTGAGCGACGTGTGCTACACAAGAGCCGCCGAGCTCTTTAAG
AACGCCGCTATCGCTTCCGGGCTGAGGAGCAAGATTAAGAGTAACTTCCGGCTCAAGGAGCTGAAG
AACATGAAGAGCGGCCTGCCCACTACAAAGAGCGACAACTTCCCAATTCCACTGGTGAAGCAGAAG
GGGGGCCAGTACACAGGGTTCGAGATTTCCAACCACAACAGCGACTTTATTATTAAGATCCCCTTT
GGCAGGTGGCAGGTCAAGAAGGAGATTGACAAGTACAGGCCCTGGGAGAAGTTTGATTTCGAGCAG
GTGCAGAAGAGCCCCAAGCCTATTTCCCTGCTGCTGTCCACACAGCGGCGGAAGAGGAACAAGGGG
TGGTCTAAGGATGAGGGGACCGAGGCCGAGATTAAGAAAGTGATGAACGGCGACTACCAGACAAGC
TACATCGAGGTCAAGCGGGGCAGTAAGATTGGCGAGAAGAGCGCCTGGATGCTGAACCTGAGCATT
GACGTGCCAAAGATTGATAAGGGCGTGGATCCCAGCATCATCGGAGGGATCGATGTGGGGGTCAAG
AGCCCCCTCGTGTGCGCCATCAACAACGCCTTCAGCAGGTACAGCATCTCCGATAACGACCTGTTC
CACTTTAACAAGAAGATGTTCGCCCGGCGGAGGATTTTGCTCAAGAAGAACCGGCACAAGCGGGCC
GGACACGGGGCCAAGAACAAGCTCAAGCCCATCACTATCCTGACCGAGAAGAGCGAGAGGTTCAGG
AAGAAGCTCATCGAGAGATGGGCCTGCGAGATCGCCGATTTCTTTATTAAGAACAAGGTCGGAACA
GTGCAGATGGAGAACCTCGAGAGCATGAAGAGGAAGGAGGATTCCTACTTCAACATTCGGCTGAGG
GGGTTCTGGCCCTACGCTGAGATGCAGAACAAGATTGAGTTTAAGCTGAAGCAGTACGGGATTGAG
ATCCGGAAGGTGGCCCCCAACAACACCAGCAAGACCTGCAGCAAGTGCGGGCACCTCAACAACTAC
TTCAACTTCGAGTACCGGAAGAAGAACAAGTTCCCACACTTCAAGTGCGAGAAGTGCAACTTTAAG
GAGAACGCCGATTACAACGCCGCCCTGAACATCAGCAACCCTAAGCTGAAGAGCACTAAGGAGGAG
CCC (SEQ ID NO: 487)
3. Engineered guide RNA-Cas12f1(Cas14a1) protein(s) complex (CRISPR complex)
본 명세서에 의해 개시되는 engineered CRISPR/Cas12f1(Cas14a1) system은 CRISPR complex 형태로 제공될 수 있다. 상기 CRISPR complex는 engineered guide RNA 및 Cas12f1 단백질을 포함한다. 이때, 상기 CRISPR complex는 engineered guide RNA 및 두 개의 Cas12f1 단백질을 포함한다(Satoru N. Takeda et al., Molecular Cell, 81, 1-13, (2021)). 상기 CRISPR complex는 engineered guide RNA와 Cas12f1 단백질 사이의 상호작용에 의해 형성된 ribonucleoprotein (RNP)일 수 있다. 이때, 상기 CRISPR complex는 engineered guide RNA와 하나의 Cas12f1 단백질 사이의 상호작용에 의해 형성된 ribonucleoprotein (RNP) 또는 engineered guide RNA와 두 개의 Cas12f1 단백질 사이의 상호작용에 의해 형성된 RNP일 수 있다(Satoru N. Takeda et al., Molecular Cell, 81, 1-13, (2021)). 상기 CRISPR complex는 "engineered guide RNA-Cas12f1(Cas14a1) 단백질 복합체", "engineered CRISPR/Cas12f1 복합체" 또는 "engineered CRISPR/Cas14a1 복합체"로 지칭되며, 상기 용어는 본 명세서에서 혼용되어 사용된다. 이하의 예시에 포함된 구성요소의 구체적인 설명은 앞서 해당 구성요소에 대해 기재한 바와 같다. 이하의 예시는 단순 예시로, 이에 제한되지 않는다.
일 구현예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 야생형 Cas12f1 단백질 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 engineered guide RNA은 engineered tracrRNA 및 crRNA를 포함하며, 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것 또는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고 wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서, wildtype tracrRNA의 5'말단에 위치한 1 내지 24개의 뉴클레오타이드 서열 및/또는 wildtype tracrRNA의 3'말단에 위치한 1 내지 28개의 뉴클레오타이드 서열을 포함하지 않는 서열일 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
일 구체예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 야생형 Cas12f1 단백질 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구현예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 Cas12f1 돌연변이 또는 Cas12f1 융합 단백질일 수 있다. 이때, 상기 engineered guide RNA은 engineered tracrRNA 및 crRNA를 포함하며, 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것 또는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고 wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서, wildtype tracrRNA의 5'말단에 위치한 1 내지 24개의 뉴클레오타이드 서열 및/또는 wildtype tracrRNA의 3'말단에 위치한 1 내지 28개의 뉴클레오타이드 서열을 포함하지 않는 서열일 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
일 구체예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 Cas14a1 돌연변이일 수 있다. 이때, 상기 두 개의 Cas12f1 변이체는 동일하거나 다를 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구체예로서, 상기 CRISPR complex는 Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 CRISPR complex는 두 개의 Cas12f1 변이체 및 engineered guide RNA을 포함할 수 있다. 이때, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 Cas12f1 융합 단백질일 수 있다. 상기 Cas12f1 융합 단백질은 SEQ ID NO: 466 아미노산 서열, SEQ ID NO: 467 아미노산 서열, SEQ ID NO: 468 아미노산 서열, SEQ ID NO: 469 아미노산 서열 또는 SEQ ID NO: 470 아미노산 서열을 가지는 단백질일 수 있다. 이때, 상기 두 개의 Cas12f1 변이체는 동일하거나 다를 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
또 다른 일 구현예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 Cas12f1 돌연변이 또는 Cas12f1 융합 단백질일 수 있다. 이때, 상기 engineered guide RNA은 engineered tracrRNA 및 crRNA를 포함하며, 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것 또는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않고 wildtype tracrRNA보다 길이가 짧도록 변형된 것일 수 있다. 이때, 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열일 수 있다. 또는 상기 engineered tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않으면서, wildtype tracrRNA의 5'말단에 위치한 1 내지 24개의 뉴클레오타이드 서열 및/또는 wildtype tracrRNA의 3'말단에 위치한 1 내지 28개의 뉴클레오타이드 서열을 포함하지 않는 서열일 수 있다. 이때, 상기 crRNA는 wildtype crRNA 또는 engineered crRNA일 수 있다.
일 구체예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 SEQ ID NO: 465 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 Cas12f1 돌연변이일 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
다른 일 구체예로서, 상기 CRISPR complex는 야생형 Cas12f1 단백질, Cas12f1 변이체 및 engineered guide RNA이 결합하여 형성된 RNP일 수 있다. 이때, 상기 야생형 Cas12f1 단백질은 SEQ ID NO: 465 아미노산 서열일 수 있다. 이때, 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질 또는 Cas12f1 돌연변이에 추가적인 기능을 가지는 도메인, 펩타이드 또는 단백질이 부가된 Cas12f1 융합 단백질일 수 있다. 상기 Cas12f1 융합 단백질은 SEQ ID NO: 466 아미노산 서열, SEQ ID NO: 467 아미노산 서열, SEQ ID NO: 468 아미노산 서열, SEQ ID NO: 469 아미노산 서열 또는 SEQ ID NO: 470 아미노산 서열을 가지는 단백질일 수 있다. 이때, 상기 engineered guide RNA은 앞서 기재한 "3-3) Engineered guide RNA의 예시" 섹션에 기재된 예시 중 하나일 수 있다.
4. Engineered CRISPR/Cas12f1(Cas14a1) system의 용도
상기 engineered CRISPR/Cas12f1(Cas14a1) system은 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 위한 용도로 사용할 수 있으며, 이를 더욱 효과적으로 수행되도록 할 수 있다.
일 구현예로서, 상기 용도는 engineered CRISPR/Cas14a1 복합체가 대상 세포 내에서 표적 핵산 또는 표적 유전자와 접촉하는 것을 포함할 수 있다.
다른 일 구현예로서, 상기 용도는 engineered CRISPR/Cas14a1 복합체가 대상 세포 내에서 표적 핵산 또는 표적 유전자와 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 engineered CRISPR/Cas14a1 복합체가 세포 내에서 표적 핵산과 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 예를 들어, 상기 유도는 engineered guide RNA 또는 이를 암호화하는 핵산, 및 Cas14a1 단백질 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
<Modification of target using engineered CRISPR/Cas12f1(Cas14a1) system>
본 명세서에 의해 개시되는 또 다른 일 태양은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 표적의 변형에 관한 것이다. 보다 구체적으로, 상기 태양은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 방법에 의해 표적 핵산 또는 표적 유전자를 변형시키는 것에 관한 것이다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물 및 이를 이용한 방법은 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 더욱 효과적으로 수행되도록 한다. 특히, 상기 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물의 이용은 다음과 같은 효과를 수반할 수 있다:
guide RNA-Cas12f1 protein complex의 stability 증가;
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 절단 효율 증가; 및
CRISPR/Cas12f1(Cas14a1) system에 의한 표적 핵산의 편집 또는 변형 효율 증가.
이하에서, 조성물 및 이를 이용한 방법에 대해 자세히 설명한다.
1. Composition
본 명세서에서 개시하는 조성물은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함할 수 있다. 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 앞서 설명한 "<Engineered CRISPR/Cas12f1(Cas14a1) system>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
보다 구체적으로, 상기 조성물은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
이때, 상기 조성물은 선택적으로 하나 이상의 engineered guide RNA 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 다수의 engineered guide RNA를 포함할 수 있고, 다수의 engineered guide RNA는 각각 서로 다른 표적 서열을 인식할 수 있다.
이때, 상기 조성물은 선택적으로 하나 이상의 Cas12f1(Cas14a1) 단백질 또는 이를 암호화하는 핵산을 더 포함할 수 있다. 이 경우, 상기 조성물은 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질을 포함할 수 있다. 이때, 상기 서로 다른 아미노산 서열을 가지는 둘 이상의 Cas12f1(Cas14a1) 단백질은 야생형 Cas12f1(Cas14a1) 단백질 및 Cas14a1 변이체일 수 있다.
상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1(Cas14a1) 단백질은 앞서 설명한 "2. Cas12f1(Cas14a1) protein" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 핵산 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질이 혼합된 형태일 수 있다. 이하에서 조성물의 형태에 대해 자세히 설명한다.
1-1) 핵산 형태
상기 조성물은 핵산 형태일 수 있다. 상기 핵산 형태는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 핵산 형태는 벡터 형태일 수 있다. 이때, 상기 벡터는 바이러스 벡터 또는 비바이러스 벡터일 수 있다.
또한, 상기 핵산의 형태는 원형 또는 선형일 수 있다.
또한, 상기 핵산의 형태는 이중 가닥 또는 단일 가닥일 수 있다.
a) Viral vector
상기 조성물은 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터일 수 있다.
일 구현예로서, 상기 조성물은 바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1(Cas14a1) 단백질을 암호화하는 핵산을 바이러스 벡터 형태로 포함할 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다.
다른 구현예로서, 상기 조성물이 다수개의 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 경우, 상기 조성물은 다수개의 engineered guide RNA를 암호화하는 핵산을 모두 포함하는 제1 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다. 또는, 상기 조성물은 다수개의 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터 형태일 수 있다. 또는, 상기 조성물은 하나의 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터가 다수 개(engineered guide RNA의 수만큼)로 포함될 수 있다.
또 다른 구현예로서, 상기 조성물이 engineered guide RNA를 암호화하는 핵산 및 둘 이상의 Cas12f1 단백질(예를 들어, 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질)을 암호화하는 핵산을 포함하는 경우, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 바이러스 벡터, 제1 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터 및 제2 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제3 바이러스 벡터를 포함할 수 있다. 또는, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 둘 이상의 Cas12f1 단백질(예를 들어, 제1 Cas12f1 단백질 및 제2 Cas12f1 단백질)을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터 형태일 수 있다. 또는, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 제1 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제1 바이러스 벡터 및 제2 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 바이러스 벡터를 포함할 수 있다.
b) Non-viral vector
상기 조성물은 비바이러스 벡터 형태일 수 있다. 이 경우, 상기 조성물의 engineered guide RNA는 RNA 형태 또는 이를 암호화하는 핵산 형태일 수 있다.
상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, mRNA(전사물) 또는 PCR 앰플리콘(amplicon)일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 플라스미드는 pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 예를 들어, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다.
일 구현예로서, 상기 조성물은 비바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 비바이러스 벡터 형태로 포함할 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 제1 비바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 제2 비바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 플라스미드를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 또 다른 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 네이키드 DNA를 포함할 수 있다.
다른 구현예로서, 상기 조성물은 비바이러스 벡터 형태일 수 있다. 즉, 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질을 암호화하는 핵산을 비바이러스 벡터 형태로 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
c) 바이러스 벡터 및 비바이러스 벡터 혼합
상기 조성물은 바이러스 벡터 및 비바이러스 벡터 혼합 형태일 수 있다. 상기 바이러스 벡터 및 비바이러스 벡터에 관한 설명은 앞서 기재한 바와 같다. 이 경우, 상기 조성물의 engineered guide RNA는 RNA 형태 또는 이를 암호화하는 핵산 형태일 수 있다.
일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 렌티바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 비바이러스 벡터 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다. 다른 일구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 플라스미드 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 렌티바이러스 벡터를 포함할 수 있다.
또 다른 일 구현예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터를 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터를 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 mRNA를 포함할 수 있다. 다른 구체예로서, 상기 조성물은 engineered guide RNA, 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 플라스미드를 포함할 수 있다.
d) 기타 - 벡터의 추가 구성
앞서 설명한 벡터는 선택적으로 조절/제어 구성요소, 프로모터 및/또는 부가 발현 요소를 추가로 포함할 수 있다.
조절/제어 구성요소
상기 벡터는 선택적으로 조절/제어 구성요소를 포함할 수 있다. 이때, 상기 조절/제어 구성요소는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 조절/제어 구성요소는 인핸서, 인트론, 종결 신호, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
프로모터
상기 벡터는 선택적으로 프로모터를 포함할 수 있다. 이때, 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산)을 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 일 구현예로서, 상기 프로모터 서열은 RNA 중합효소(예를 들어, pol I, pol II, 또는 pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, CBA 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), 7SK 프로모터 및 human H1 프로모터 (H1) 중 하나 수 있으나, 이에 제한되는 것은 아니다.
부가 발현 요소
상기 벡터는 선택적으로 부가 발현 요소를 포함할 수 있다. 상기 벡터는 engineered guide RNA를 암호화하는 핵산 및/또는 Cas12f1 단백질을 암호화하는 핵산 외에 통상의 기술자가 필요에 의해 발현시키고자 하는 부가 발현 요소를 암호화하는 핵산 서열을 포함하고 있을 수 있다. 예를 들어, 상기 부가 발현 요소는, 앞서 기재한 용어 정의 중 "태그" 섹션에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저항성 유전자; 또는 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin) 또는 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
1-2) 핵산 및 단백질의 혼합 형태
상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 이때, 상기 핵산은 앞서 기재한 "1-1) 핵산 형태"에 기재한 바와 같다. 이 경우, 상기 조성물은 Cas12f1 단백질을 포함한다. 이때, 상기 조성물은 두 개의 Cas12f1 단백질을 포함할 수 있으며, 상기 두 개의 Cas12f1 단백질은 동일한 아미노산 서열을 가지는 Cas12f1 단백질 또는 서로 다른 아미노산 서열을 가지는 Cas12f1 단백질일 수 있다.
일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 아데노-연관 바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다.
다른 일 구현예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 비바이러스 벡터 및 Cas12f1 단백질을 포함할 수 있다. 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 플라스미드 및 Cas12f1 단백질을 포함할 수 있다. 다른 일 구체예로서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다.
또 다른 일 구현예로서, 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질을 포함할 수 있다. 이 경우, 상기 조성물은 engineered CRISPR/Cas12f1 복합체 형태인 RNP 형태일 수 있다. 만약 다수의 engineered guide RNA 및 Cas12f1 단백질을 포함하는 조성물의 경우, 상기 조성물은 다수개의 engineered CRISPR/Cas12f1 복합체를 포함할 수 있으며, 다수개의 engineered CRISPR/Cas12f1 복합체는 각각 서로 다른 표적 서열을 인지할 수 있다.
1-3) Composition의 용도
상기 조성물은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 표적 핵산 또는 표적 유전자의 절단, 편집 또는 변형을 위한 용도로 사용할 수 있으며, 이를 더욱 효과적으로 수행되도록 할 수 있다.
2. Method for modifying a target using engineered CRISPR/Cas12f1(Cas14a1) system
본 명세서에서 개시하는 방법은 engineered CRISPR/Cas12f1(Cas14a1) system을 이용한 방법에 관한 것이다. 보다 구체적으로, 상기 방법은 engineered CRISPR/Cas12f1(Cas14a1) system을 포함하는 조성물을 대상체 및/또는 대상 세포에 도입(또는 전달)하여 대상체 및/또는 대상 세포 내에 존재하는 표적 핵산 또는 표적 유전자를 변형시키는 방법에 관한 것이다. 또는 상기 방법은 engineered guide RNA를 대상체 및/또는 대상 세포에 도입(또는 전달)하여 대상체 및/또는 대상 세포 내에 존재하는 표적 핵산 또는 표적 유전자를 표적하는 방법에 관한 것이다. 이때, 대상체는 식물, 동물 또는 이의 일부 조직이며, 상기 동물은 인간 또는 비인간 동물일 수 있다. 이때, 대상 세포는 원핵 세포 또는 진핵 세포일 수 있다. 이때, 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다. 상기 방법은 in vitro, ex vivo 또는 생체 내(in vivo)에서 수행될 수 있다. 이때, 상기 생체 내는 인간 생체 내 또는 비인간 동물 생체 내일 수 있다.
상기 방법은 engineered guide RNA 또는 engineered CRISPR/Cas12f1(Cas14a1) system을 대상체 및/또는 대상 세포에 도입(또는 전달, 처리)하는 것을 포함하는 방법일 수 있다. 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 앞서 설명한 "<Engineered CRISPR/Cas12f1(Cas14a1) system>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
이하에서, 상기 방법의 구현예를 이용해 자세히 설명한다.
2-1) Method 예시(1)
일 구현예로서, 상기 방법은 진핵 세포에 조성물을 처리하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 조성물은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
상기 조성물은 앞서 설명한 "1. Composition" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 앞서 설명한 <Engineered CRISPR/Cas14a1 system> 중 "2. Cas12f1(Cas14a1) protein" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 "1-2) 핵산 및 단백질 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터 형태일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택되는 하나 이상일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 바이러스 벡터를 포함할 수 있다.
다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터 형태일 수 있다. 이때, 상기 비바이러스 벡터는 플라스미드일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 플라스미드를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 플라스미드를 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질이 결합한 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 진핵 세포는 표적 핵산 또는 표적 유전자를 포함할 수 있다. 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
상기 진핵 세포에 조성물을 처리하는 것은 진핵 세포로 engineered CRISPR/Cas12f1(Cas14a1) system이 도입되기 위한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 진핵 세포에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1(Cas14a1) system이 접촉되기 위한 것일 수 있다.
상기 진핵 세포에 조성물을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 방법은 선택적으로 진핵 세포를 배양하는 것을 더 포함할 수 있다. 이 경우, 상기 배양은 조성물을 처리한 후 진핵 세포를 배양하는 것일 수 있다.
2-2. Method 예시(2)
다른 일 구현예로서, 상기 방법은 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
상기 engineered CRISPR/Cas12f1(Cas14a1) system은 앞서 설명한 "<Engineered CRISPR/Cas12f1(Cas14a1) system>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 engineered CRISPR/Cas12f1(Cas14a1) system은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 "1-2) 핵산 및 단백질 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
다른 일 구체예에서, 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다.
또 다른 일 구체예에서 상기 engineered CRISPR/Cas12f1(Cas14a1) system은 engineered guide RNA 및 Cas12f1 단백질이 결합한 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 진핵 세포는 표적 핵산 또는 표적 유전자를 포함할 수 있다. 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 진핵 세포에서 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 형성하기 위한 것일 수 있다. 또는 상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 진핵 세포에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 접촉시키기 위한 것일 수 있다.
상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 조성물을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 engineered guide RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 동시에 처리하는 것일 수 있다. 또는 상기 진핵 세포에 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 것은 engineered guide RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 순차적으로 처리하는 것일 수 있다.
상기 방법은 선택적으로 진핵 세포를 배양하는 것을 더 포함할 수 있다. 이 경우, 상기 배양은 조성물을 처리한 후 진핵 세포를 배양하는 것일 수 있다.
2-3. Method 예시(3)
또 다른 일 구현예로서, 상기 방법은 진핵 세포에 engineered guide RNA 또는 이를 암호화하는 핵산을 처리하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 진핵 세포는 Cas12f1 단백질 또는 이를 암호화하는 핵산을 포함하는 세포일 수 있다. 또한, 상기 진핵 세포는 표적 핵산 또는 표적 유전자를 포함할 수 있다. 상기 진핵 세포는 효모(yeast), 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 engineered guide RNA를 암호화하는 핵산은 바이러스 벡터 또는 비바이러스 벡터 형태일 수 있다. 상기 바이러스 벡터 또는 비바이러스 벡터 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 engineered guide RNA를 암호화하는 핵산은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 형태일 수 있다.
다른 일 구체예에서, 상기 engineered guide RNA를 암호화하는 핵산은 engineered guide RNA를 암호화하는 핵산을 포함하는 아데노 연관 바이러스 벡터 형태일 수 있다.
상기 진핵 세포에 engineered guide RNA 또는 이를 암호화하는 핵산을 처리하는 것은 진핵 세포에서 engineered CRISPR/Cas12f1 복합체를 형성하기 위한 것일 수 있다. 또는 상기 진핵 세포에 engineered guide RNA 또는 이를 암호화하는 핵산을 처리하는 것은 진핵 세포에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1 복합체를 접촉시키기 위한 것일 수 있다.
상기 진핵 세포에 engineered CRISPR/Cas12f1 system을 처리하는 것은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 진핵 세포에 engineered CRISPR/Cas12f1 system을 처리하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
상기 방법은 선택적으로 진핵 세포를 배양하는 것을 더 포함할 수 있다. 이 경우, 상기 배양은 조성물을 처리한 후 진핵 세포를 배양하는 것일 수 있다.
2-4. Method 예시(4)
일 구현예로서, 상기 방법은 대상체에 조성물을 도입(주입)하는 것을 포함하는 표적 핵산 또는 표적 유전자를 변형시키는 방법일 수 있다.
이때, 상기 조성물은
engineered guide RNA 또는 이를 암호화하는 핵산; 및
Cas12f1 단백질 또는 이를 암호화하는 핵산
을 포함할 수 있다.
상기 조성물은 앞서 설명한 "1. Composition" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 engineered guide RNA는 앞서 설명한 "<Engineered guide RNA>" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 Cas12f1 단백질은 앞서 설명한 <Engineered CRISPR/Cas14a1 system> 중 "2. Cas12f1(Cas14a1) protein" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
상기 조성물은 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태일 수 있다. 또는 상기 조성물은 핵산 및 단백질 혼합 형태일 수 있다. 상기 바이러스 벡터, 비바이러스 벡터 또는 이의 혼합 형태는 앞서 설명한 "1-1) 핵산 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다. 또한, 상기 핵산 및 단백질 혼합 형태는 앞서 설명한 "1-2) 핵산 및 단백질 혼합 형태" 섹션에 기재한 바와 같으며, 상기 섹션에 설명된 각 구성과 동일한 특징 및 구조를 가진다.
일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 바이러스 벡터 형태일 수 있다. 이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택되는 하나 이상일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 바이러스 벡터를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 바이러스 벡터를 포함할 수 있다.
다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 포함하는 비바이러스 벡터 형태일 수 있다. 이때, 상기 비바이러스 벡터는 플라스미드일 수 있다. 이때, 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 모두 포함하는 하나의 플라스미드를 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 각각 포함하는 두 개의 플라스미드를 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 암호화하는 mRNA을 포함할 수 있다.
또 다른 일 구체예에서, 상기 조성물은 engineered guide RNA를 암호화하는 핵산을 포함하는 PCR 앰플리콘 및 Cas12f1 단백질을 포함할 수 있다. 또는 상기 조성물은 engineered guide RNA 및 Cas12f1 단백질이 결합한 engineered CRISPR/Cas12f1(Cas14a1) 복합체를 포함할 수 있다.
상기 대상체는 표적 핵산 또는 표적 유전자를 포함한 게놈을 가질 수 있다. 상기 대상체는 식물, 비인간 동물, 인간 또는 이의 일부 조직일 수 있으나, 이에 제한되지 않는다.
상기 대상체에 조성물을 도입(주입)하는 것은 대상체에 존재하는 표적 핵산 또는 표적 유전자에 engineered CRISPR/Cas12f1(Cas14a1) system이 접촉되기 위한 것일 수 있다.
상기 대상체에 조성물을 도입(주입)하는 것은 미세주입(microinjection), 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 나노파티클 방법 및/또는 일시적인 세포 압축 또는 스퀴징 방법을 이용한 것일 수 있다. 또는 상기 대상체에 조성물을 도입(주입)하는 것은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)을 이용한 것일 수 있으나, 이에 제한되는 것은 아니다.
3. Modification of target
본 명세서에서 개시하는 조성물 및 방법을 통해 표적 유전자 또는 표적 핵산을 변형될 수 있다. 보다 구체적으로, 표적 유전자 또는 표적 핵산은 engineered CRISPR/Cas12f1(Cas14a1) system에 의해 변형될 수 있다. 이때, 상기 변형은 i) engineered CRISPR/Cas12f1(Cas14a1) system에 의한 표적 유전자 또는 표적 핵산의 절단 또는 손상 및 ii) 절단된(또는 손상된) 표적 유전자 또는 표적 핵산의 수선 또는 수복을 모두 포함할 수 있다. 이때, 상기 변형은 표적 유전자 또는 표적 핵산 서열의 제거 또는 치환일 수 있다. 또는 상기 변형은 표적 유전자 또는 표적 핵산에 추가적인 핵산 서열의 삽입(insertion)일 수 있다. 또는 상기 변형은 표적 유전자 또는 표적 핵산의 일부 서열 제거되고 추가 서열 삽입되는 인델(insertion and deletion; indel)일 수 있다. 이하에서 상기 변형에 대해 자세히 설명한다.
3-1) 삭제 (Deletion)
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부가 제거될 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열을 제거하는 것을 의미한다. 일 구현예로, 상기 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 engineered guide RNA 또는 이를 암호화하는 핵산, 및 제2 engineered guide RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포 내에 도입하는 것을 포함한다. 이로 인해, 상기 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.
3-2) 삽입 (Insertion)
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 녹인(knockin)이 발생할 수 있다. 상기 녹인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 녹인이 일어나려면, engineered CRISPR/Cas12f1(Cas14a1) system 외에 상기 추가적인 핵산 서열을 포함하는 도너가 더 필요하다. 세포 내에서 engineered CRISPR/Cas12f1(Cas14a1) system이 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이 경우, 상동 재조합 수리(homology directed repairing, HDR)을 이용하여 수복할 수 있으며, 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열을 표적 유전자 또는 표적 핵산 내에 삽입한다. 일 구현예로, 상기 방법은 대상 세포 내로 도너를 전달하는 것을 추가적으로 포함할 수 있다. 이때, 상기 도너는 추가 대상 핵산을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 추가 대상 핵산의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 engineered CRISPR/Cas12f1(Cas14a1) system을 처리하는 방법 중 하나의 방법이 사용될 수 있다.
3-3) 삽입 및 삭제 (또는 인델, Insertion and deletion (Indel))
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 인델(deletion and insertion; indel)이 발생할 수 있다. 상기 인델은 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)에 의해 발생할 수 있다. 일반적으로, NHEJ는 이중 가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 DNA 내 이중 가닥 파손을 수복 또는 수선하는 방법이다. NHEJ를 이용한 손상된 유전자 또는 핵산의 수복은 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래한다. 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 따라서, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화될 수 있다. 일 구현예로, 상기 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 결실 및/또는 추가될 수 있다.
3-4) 치환 (Substitution) 또는 염기 편집 (Base editing)
본 명세서에서 제공하는 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 뉴클레오타이드가 결실 및/또는 삽입되는 인델과는 달리, 핵산 내 하나 이상의 특정 염기를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 다른 염기로 치환될 수 있다.
3-5) 표적 변형에 의한 표현형 (Phenotype by modification of target)
표적 핵산 또는 표적 유전자의 변형은 녹아웃(knockout), 녹다운(knockdown), 녹인(knockin)의 효과를 초래할 수 있다. "녹아웃(knockout)"은 표적 유전자 또는 표적 핵산을 불활성화 시키는 것을 의미하며, "표적 유전자 또는 표적 핵산의 불활성화"는 표적 유전자 또는 표적 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 녹아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다. "녹다운(knockdown)"은 표적 유전자 또는 표적 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 녹다운을 통해 과발현 되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다. "녹인(knockin)"은 표적 유전자 또는 표적 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"는 삽입하고자 하는 또는 발현시키기 원하는 유전자 또는 핵산을 의미한다. 녹인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
이하, 실시예를 통해 본 발명을 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 범위가 이들의 실시예에 의해 제한되지 않는다는 것은 본 발명이 속한 기술 분야에서 통상의 지식을 가진 자에게 있어 자명할 것이다.
실시예
실험 방법
1. Plasmid vector construction
Cas12f1(Cas14a1)의 인간 코돈 최적화 서열(SEQ ID NO: 487)을 적용하여 chicken b-actin 프로모터, 5'말단 및 3'말단 양쪽에 nuclear-localization signal 서열 및 T2A-linked eGFP를 포함하는 올리고뉴클레오타이드(Bionics)를 합성하였다. 가이드 RNA를 위한 주형 DNA를 합성하고 pTwist Amp 플라스미드 벡터 (Twist Bioscience)에 복제하였다. 필요한 경우, 복제된 벡터는 U6-complementary forward primer 및 protospacer-complementary reverse primer를 사용하여 gRNA-encoding PCR amplicon을 위한 주형으로 사용되었다. dual guide RNA의 구성을 위해, tracrRNA 및 crRNA를 암호화하는 올리고뉴클레오타이드는 BamHI 및 HindIII 제한 효소 (New England Biolabs)를 사용하여 pSilencer 2.0 (ThermoFisher Scientific)에 클로닝 되었다. Engineered CRISPR/Cas14as1 system_3.0(geCas14a_3.0) 벡터는 Cas12f1(Cas14a1)의 인간 코돈 최적화 올리고뉴클레오타이드 및 Cas14a1을 위한 engineered gRNA 서열로 구성된다. SpCas9의 경우, SpCas9의 인간 코돈 최적화 올리고뉴클레오타이드 및 SpCas9을 위한 single guide RNA(sgRNA)는 pSpCas9 (BB) -2A-EGFP (PX458) V2.0 (Addgene)을 백본 플라스미드로 사용하여 Gibson 어셈블리 하였다.
2. Guide RNA engineering
gRNA의 내부 변형(i. stem 5를 구성하는 뉴클레오타이드 서열의 변형, 이하에서 상기 i 변형을 modification 1 (M1)로 기재함, 이때, stem 5를 구성하는 tracrRNA 및/또는 crRNA의 뉴클레오타이드 서열의 변형은 M1-1으로, stem 5를 구성하는 뉴클레오타이드 서열의 삭제 변형은 M1-2으로 기재함; 및 ii. stem 2를 구성하는 뉴클레오타이드 서열의 변형, 이하에서 상기 ii 변형을 modification 2 (M2)로 기재함)은 ApoI 및 BamHI 제한 효소를 사용하여 선형화 된 gRNA 인코딩 벡터에 변형된 서열을 운반하는 합성 올리고뉴클레오타이드(Macrogen)를 클로닝하여 수행되었다. tracrRNA의 5'말단 변형(stem 1를 구성하는 뉴클레오타이드 서열의 변형, 이하에서 상기 변형을 modification 3 (M3)로 기재함)은 U6 프로모터 영역을 표적으로 하는 역방향 프라이머와 tracrRNA의 5'말단 영역을 표적으로 하는 정방향 프라이머를 사용하여 canonical 또는 engineered 템플릿 플라스미드 벡터의 PCR 증폭에 의해 수행되었다. PCR 증폭은 Q5 Hot Start high-fidelity DNA polymerase (NEB)를 이용하여 수행되었으며, PCR 산물은 KLD Enzyme Mix (NEB)를 사용하여 ligation 시켰다. ligation 된 생성물을 사용하여 DH5α E. coli 세포를 형질 전환시켰다. 돌연변이 유발은 Sanger 시퀀싱 분석에 의해 확인되었다. 변형된 플라스미드 벡터는 NucleoBond ® Xtra Midi EF kit (MN)를 사용하여 정제되었다. 정제된 플라스미드 1 μg을 T7 RNA 중합 효소 (NEB) 및 NTP (Jena Bioscience)를 사용하여 mRNA 합성을 위한 주형으로 사용하였다. 가이드 RNA는 Monarch® RNA cleanup kit (NEB)를 사용하여 정제하고 액체 질소에 보관하기 전에 cryogenic vial에 분주하였다.
crRNA의 3'말단 변형 (U-rich tail 부가, 이하에서 상기 U-rich tail 부가 변형을 modification 4 (M4)로 기재함)은 염기 서열 변형된 프라이머와 canonical gRNA 플라스미드 벡터가 있는 상태에서 Pfu PCR Master Mix5 (Biofact)를 사용하여 수행되었다. PCR 앰플리콘은 HiGeneTM Gel&PCR Purification System (Biofact)을 사용하여 정제하였다.
3. Human cell culture and transfection
HEK-293T 세포 (ATCC CRL-11268)를 5 % CO2 인큐베이터에서 37 ℃에서 10 % heat-inactivated FBS (Corning) 및 1 % 페니실린/스트렙토 마이신을 보충된 DMEM에서 배양하였다. 세포 형질 감염은 electroporation 또는 lipofection 방법을 통해 수행되었다. Electroporation을 위해, 2 - 5 μg의 Cas14a1, AsCpf1 또는 SpCas9을 암호화하는 핵산을 포함하는 플라스미드 벡터를 2 - 5 μg의 gRNA 암호화하는 DNA와 함께 Neon transfection system (Invitrogen)을 사용하여 4 X 105 HEK-293T 세포로 형질 감염시켰다. Electroporation 조건은 다음과 같습니다: 1,300V, 10mA, 3 펄스. Lipofection을 위해, 6 - 15 μL FuGene 시약 (Promega)을 2 - 5 μg의 Cas14a1 암호화하는 핵산을 포함하는 플라스미드 벡터 및 1.5 - 5 μg의 PCR 앰플리콘과 15 분 동안 혼합하였다. 혼합물(300 μL)을 1.5 ml DMEM 배지에 첨가하고, 여기서 1 X 106 세포를 형질 감염 1 일 전에 플레이팅하고, 세포를 혼합물의 존재하에 72 - 96 시간 동안 배양시켰다. 배양 후, 세포를 수확하고, PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하거나 MaxwellTM RSC nucleic acid isolation workstation (Promega)을 사용하여 genomic DNA를 준비하였다. 형질 감염에 대한 표적의 정보는 아래의 표 3에 정리하였다.
표적 정보
Target Name Gene Name Protospacer sequence with PAM sequence (SEQ ID NO) Chromosome Location a
Target_1 Intergene TTTGCACACACACAGTGGGCTACC (SEQ ID NO: 488) chr3 120228353
Target_2 KRT1 TTTGCATCCCCAGGACACACACAC (SEQ ID NO: 489) chr12 52679076
Target_3 Intergene TTTAAGAACACATACCCCTGGGCC (SEQ ID NO: 490) chr5 171540057
Target_a PGBD2 TTTGACTCAGCAATCCTATTACTG (SEQ ID NO: 491) chr1 248902470
TTTATATTCCTGTGGGTATATGCC (SEQ ID NO: 492)
Target_b LINC02045 TTTAAGAGGTGATTAGGTCATGGC (SEQ ID NO: 493) chr3 148270685
TTTAATCCATTCATGAGGGTGGTG (SEQ ID NO: 494)
Target_c Intergene TTTAGCTCAAATCTGTACTACTAA (SEQ ID NO: 495) chr3 175897710
TTTATTATTATAGTGTGTACTTGA (SEQ ID NO: 496)
Target_d LOC105379078 TTTATGTCCTCATAGCTTACCTTC (SEQ ID NO: 497) chr5 91689633
TTTAATTGTATGTTCTCACTCATA (SEQ ID NO: 498)
Target_e LOC100133077 TTTGGGTCTGTGGCTGTTGGGCTG (SEQ ID NO: 499) chr9 137891128
TTTAGAGCCCATCTCAGATCCCTG (SEQ ID NO: 500)
Target_f CNTN5 TTTACCAGTGAAGATATAACATTA (SEQ ID NO: 501) chr11 100207471
TTTAGTGAGGCTTCTTAAGATGTC (SEQ ID NO: 502)
Target_g HEPHL1 TTTGCTGCTGGTAACAAGGTCATA (SEQ ID NO: 503) chr11 94033294
TTTAGATCTGAGACCCAGCTGCTC (SEQ ID NO: 504)
Target_h CFAP97D2 TTTGTCCTTGACCACGGCATCAGC (SEQ ID NO: 505) chr13 114162274
TTTAAGTGGGAATAATATAGTTCC (SEQ ID NO: 506)
Target_i Intergene TTTGAAGACATCTTGCTGTCAGAC (SEQ ID NO: 507) chr13 105892482
TTTGTGTATAATTATTCAGAGTAG (SEQ ID NO: 508)
Target_j TAOK1 TTTGGCATCAAGTTAACATCACAC (SEQ ID NO: 509) chr17 29544381
TTTAGCACTGAGGCTTGAGACTTG (SEQ ID NO: 510)
a Listed information is based on the Genome Reference Consortium Human Build 38 patch release 11 (GRCh38.p11).
4. Measurement of indel efficiency
PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하여 HEK-293T 세포에서 genomic DNA를 분리하였다. Target-specific primer는 합성되었고, 제조업체의 지침에 따라 KAPA HiFi HotStart DNA polymerase (Roche)가 있는 상태에서 protospacer-함유 영역을 증폭하는 데 사용되었다. 생성된 PCR 앰플리콘은 Illumina TruSeq HT dual index로 라벨링 되었다. 최종 PCR 산물은 Illumina iSeq 100을 사용하여 150-bp paired-end sequencing 하였다. Indel frequency는 MAUND (https://github.com/ibs-cge/maund)에 의해 계산되었다.
5. Recombinant Cas14a1
Cas12f1 유전자는 변형된 pMAL-c2x 플라스미드 벡터 (Addgene)로 클로닝되었고,상기 벡터 구축물을 사용하여 BL21 (DE3) E. coli 세포를 형질 전환하였다. E. coli 형질 전환체 콜로니는 0.7의 광학 밀도에 도달할 때까지 LB broth에서 37 ℃에서 성장시켰다. 상기 세포를 0.1 mM isopropylthio-β-D-galactoside의 존재하에 30 ℃에서 밤새 배양한 후, 30 분 동안 3,500g에서 원심 분리하여 수집하였다. 수집된 세포를 20mM Tris-HCl (pH 7.6), 500mM NaCl, 5mM β-mercaptoethanol, 5 % 글리세롤에 재현탁시켰다. Cell lysate은 초음파 처리하고, 15,000g에서 30 분 동안 원심 분리한 다음 0.45μm 주사기 필터 (Millipore)를 통해 여과하여 준비하였다. cleared lysate를 FPLC 정제 시스템 (AKTA Purifier, GE Healthcare)을 사용하여 Ni2+- affinity column에 로드하였다. Ni2+- affinity column에 결합된 분획은 80-400 mM imidazole gradients에서 20 mM Tris-HCl (pH 7.5)로 용출 되었다. 용출된 단백질은 1mg의 TEV protease 로 6 시간 동안 처리되었다. 절단된 단백질은 0.15 - 1.6 M NaCl의 선형 구배로 Heparin column에서 정제되었다. 재조합 Cas14a1 단백질은 20mM Tris pH7.6, 150mM NaCl, 5mM β-mercaptoethanol, 5 % 글리세롤에 대해 투석 되었다. 투석 된 단백질을 0.5 - 1.2M NaCl의 선형 구배로 monoS column (GE Healthcare)에서 다시 정제하였다. 선택된 분획을 풀링하고 20mM Tris pH7.6, 150mM NaCl, 5mM β-mercaptoethanol, 5 % 글리세롤에 대해 투석하였다. 수득된 단백질의 농도는 bovine serum albumin을 표준으로 사용하여 coomassie blue-stained SDS-PAGE 겔에서 전기구형적으로(electropherometrically) 측정되었다.
6. Off-target analysis using Digenome-seq method
Genome-wide off-target 분석은 Digenome-seq 방법을 통해 수행되었다. 간단히 설명하면, genomic DNA를 HEK-293T 세포에서 분리하고, 분리한 genomic DNA에 10μg Cas12f1 또는 AsCas12a 재조합 단백질과 900nM engineered guide RNA를 실온에서 2 시간 동안 사전 인큐베이션하여 형성된 ribonucleoprotein complex를 처리하였다. genomic DNA의 분해(digestion)는 100mM NaCl, 10mM MgCl2, 100μg/ml BSA, 50mM Tris-HCl (pH 7.9)를 포함하는 반응 버퍼에서 37 ℃에서 8 시간 동안 수행되었다. 분해된 genomic DNA는 RNase A (50μg/ml)로 처리한 후 DNeasy Tissue kit (Qiagen)를 사용하여 정제하였다. 정제된 genomic DNA는 Illumina HiSeq X Ten Sequencer를 사용하여 30x 내지 40x의 sequencing depth에서 전체 게놈 시퀀싱 (whole genome sequencing; WGS)에 적용되었다. DNA cleavage score는 방정식에 따라 WGS 데이터를 사용하여 전체 게놈에 걸쳐 각 뉴클레오타이드 위치에 할당되었다. 2.5의 컷오프 값은 온 타겟 시퀀스에서 6 개 이하의 불일치 기준이 추가된 Digenome-seq 프로그램 (https://github.com/chizksh/digenome-toolkit2)을 사용하여 잠재적 인 오프 타겟을 스크리닝 하기 위해 할당되었다. 선별된 잠재적인 오프-타겟은 HEK293-T 세포로의 가이드 RNA와 함께 Cas14a1을 처리한 후 targeted deep sequencing 분석에 의해 검증되었다.
7. Droplet digital PCR
Guide RNA 또는 genomic DNA는 각각 RNeasy Miniprep kit (Qiagen) 또는 PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하여 HEK-293T 세포에서 추출되었다. Guide RNA의 정량화를 위해, cDNA 합성에 crRNA-specific primer를 사용하였으며, 합성된 cDNA는 정량적 실시간 PCR을 주형으로 사용하였다. 엑손 결실은 iCycler (Bio-Rad)에서 QuantiTect SYBR Green RT-PCR kit (Qiagen)를 사용하여 분석되었다.
8. Quantitative analysis of gRNA expression
Canonical 또는 engineered gRNA를 암호화하는 PCR 앰플리콘 (3μg)을 Neon transfection system (Invitrogen)을 사용하여 HEK293-T 세포로 형질 감염시키고, 형질 감염 2 일 후에 세포를 수확하였다. 수확한 세포로부터 maxwell® RSC miRNA Tissue Kit (Promega, AS1460)를 사용하여 총 RNA를 수득하였다. 수득한 RNA를 5μg의 RNA 제제를 E. coli Poly(A) Polymerase (NEB, M0276)와 함께 37 ℃에서 30분 동안 배양하여 폴리아데닐화 시켰다. RNA를 Monarch® RNA Cleanup Kit (NEB, T2050)로 정제하였다. 500 μg의 poly(A)-tailed RNA를 3'말단에 T6 서열과 어댑터 서열을 전달하는 RT-specific primer의 존재하에 SuperScript IV Reverse Transcriptase (Invitrogen)를 사용하여 역전사시켰다. Guide RNA는 어댑터 및 gRNA-specific primer를 사용하여 PCR 증폭되었다. PCR 산물을 2 % 아가 로스 겔에서 분리하였다.
9. Production of AAV vectors and transduction
인간 코돈 최적화된 Cas12f1 유전자 및 sgRNA 서열은 역 말단 반복을 가지는 AAV 벡터 플라스미드로 클로닝되었다. 상기 Cas12f1 유전자는 nuclear localization signal 및 자가 절단 T2A 서열을 통해 enhanced green fluorescent protein (eGFP) 유전자와 연결된다. Cas12f1 및 sgRNA 전사는 각각 chicken -actin 프로모터 및 U6 프로모터에 의해 유도되었다. rAAV2 벡터를 생산하기 위해, pAAV-ITR-sgRNA-Cas12f1 또는 pAAV-ITR-sgRNA-SaCas9; pAAVED2/9; 및 헬퍼 플라스미드를 HEK-293T 세포에 형질주입하였다. 상기 형질주입된 HEK-293T 세포를 2 % FBS가 포함된 DMEM에서 배양하였다. PEIpro (Polyplus-transfection)와 PEI coprecipitation 및 HEK-293T 세포에서 동일한 몰비로 플라스미드를 사용한 삼중-형질주입(triple-transfection)을 사용하여 재조합 pseudotyped AAV vector stock을 생성하였다. 72 시간의 인큐베이션 후, 세포를 용해시키고 particle을 iodixanol (Sigma-Aldrich) step-gradient ultracentrifugation를 이용해 정제하였다. 벡터 게놈의 수는 정량적 PCR에 의해 결정되었다. HEK-293T 세포는 정량적 PCR에 의해 결정된 바와 같이 1, 5, 10, 50 및 100의 상이한 감염 다중도 (multiplicity of infection; MOI)에서 rAAV2-Cas12f1-sgRNA 또는 rAAV2-SaCas9-sgRNA로 감염되었다. 형질 도입된 세포는 2 % FBS가 있는 DMEM에서 2 주까지 유지되었다. 다른 time points에서 genomic DNA의 분리를 위해 세포를 수집하였다.
10. Statistical analysis
two-tailed Student's t-test에 의한 통계적 유의성 검증이 Sigma Plot software (ver. 14.0)에 의해 수행되었다. 0.05 미만의 p-value가 나타나는 경우 통계적으로 유의한 것으로 간주하였으며, p-value는 각 도면에 도시되어 있다. 박스 플롯(box plot) 및 점 플롯(dot plot)에서 데이터 포인트들은 전체 값 범위를 나타내며, 각 박스는 4분위 범위 (25-75 percentile)에 걸쳐 있다. 중위값 및 평균값은 각각 검은색 및 빨간색 평행선으로 표시되었다. 모든 점 플롯(dot plot) 및 바 플롯(bar plot) 데이터의 에러바들은 Sigmaplot (v. 41.0)을 사용하여 도시되었으며, 각 데이터의 표준편차 값을 의미한다. 통계적 방법을 기반으로 샘플 크기를 미리 결정하지는 않았다. Cas 유형에 대한 블라인드 정보로 대규모 검증이 수행되었다.
11. In vitro cleavage assay
Recombinant Cas14 (2.5 μg)와 Canonical 및 M1-1/4, M1-1/3/4의 sgRNA를 각각 2μg을 인큐베이션하여 RNA complex를 형성시켰다. 이를 Intergenic22 서열 (5'-TTTAAGAACACATACCCCTGGGCC-3' (SEQ ID NO: 490))을 포함하고 있는 플라즈미드 벡터 (5 μg)와 37℃에서 3 시간 동안 반응시켜 In vitro cleavage assay를 진행하였다. Positive control로써 Apa1 restriction enzyme cut을 진행하였다. Cleavage가 된 DNA를 Ultrasonicator인 Covaris (M220)를 가지고 다음의 조건에서 DNA shearing을 진행하였다. Peak incident power: 50W, Duty factor: 20%, Cycles per Burst: 200 cpb, Treatment time: 110 sec. 조각난 DNA를 DNA purification kit를 이용하여 정제하였다. 정제된 DNA를 T4 ligase를 이용하여 End-filling을 수행하였다. 그 후 NEBNext® Ultra?? II DNA Library Prep Kit for Illumina® (NEB, # E7103) kit와 NEBNext® Multiplex Oligos for Illumina® (Dual Index Primers Set 1) (NEB, # E7600) kit를 이용하여 DNA library를 제작하였다. qPCR을 수행하여 각 샘플의 농도를 동일하게 조절하였다. 제작된 library를 Illumina iSeq 100을 사용하여 150-bp paired-end sequencing 하였다. 분석된 서열은 IGV 프로그램으로 alignment하였다.
실시예 1. Guide RNA engineering
선행연구(Harrington et al., Science 362, 839-842 (2018), Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))를 통해 CRISPR/Cas14a1 system이 단일 가닥 DNA (ssDNA)을 절단하는 것처럼 보고되었고, CRISPR/Cas14a1 system 자체가 진핵 세포의 게놈 편집에 적합하지 않을 수 있다고 가정하였다. 이러한 문제를 인식하고, CRISPR/Cas12f1 system을 진핵 세포에 적용하기 위해, CRISPR/Cas14a1 system을 위한 가이드 RNA(gRNA)를 최적화하는 연구를 수행하였다.
gRNA 엔지니어링은 CRISPR/Cas14a1 system의 gRNA를 구성하는 tracrRNA 및 crRNA 전체에 걸쳐 4 개의 변형 부위 (modification site; MS)를 다음과 같이 지정하였다 (도 2):
1) MS1 - tracrRNA의 penta-uridinylate (UUUUU) 서열을 포함하는 stem 5를 구성하는 영역 (wildtype tracrRNA의 변형 대상 영역 1에 대응됨) 및 이에 대응되는 crRNA의 영역;
2) MS2 - stem 2를 구성하는 tracrRNA의 내부 영역 (wildtype tracrRNA의 변형 대상 영역 4에 대응됨);
3) MS3 - stem 1을 구성하는 tracrRNA의 5' 말단 영역 (wildtype tracrRNA의 변형 대상 영역 5에 대응됨); 및
4) MS4 - crRNA의 3'말단 영역.
gRNA 엔지니어링은 MS1, MS2, MS3 및 MS4에서 각각 개별적으로 수행하거나 다양한 조합으로 수행하여 매우 효율적인 CRISPR-Cas14a1 시스템을 도출하였다. 안정된 tracrRNA-crRNA 복합체의 형성을 위해 일부 engineered guide RNA의 경우, tracrRNA와 crRNA를 linker인 GAAA 서열로 연결한 단일 가이드 RNA (single guide RNA; sgRNA)로 사용하였다.
실시예 2. Engineered guide RNA (MS1)
선행연구(Harrington et al., Science 362, 839-842 (2018)에 의해 보고된 Cas14a1에 대한 canonical gRNA 서열을 면밀히 조사하였다. 그 결과, wildtype tracrRNA (SEQ ID NO: 1)가 진핵 세포에서 정상적으로 전사되기 어려운 부적절한 서열을 포함하고 있음을 확인하였다. wildtype tracrRNA는 tracrRNA의 5'말단에서 3'말단 방향으로 138번째부터 142번째 위치에 내부 UUUUU(U5) 서열을 포함한다 (도 1). 따라서, tracrRNA를 전사하기 위해서 tracrRNA를 암호화하는 핵산은 연속하는 5 개의 티미딘(T5) 서열을 포함하게 된다. 이때, 연속하는 5 개의 티미딘(T5) 서열은 U6 프로모터 아래에서 종결 서열로 작용할 수 있으며, 이로 인해 tracrRNA이 정상적으로 전사되지 못하여 불완전한 tracrRNA가 생성될 가능성이 높다. 따라서 본 발명자는 tracrRNA의 penta-uridinylate (UUUUU) 서열을 포함하는 stem 5를 구성하는 영역 (MS1)을 gRNA 엔지니어링을 위한 핫스팟으로 간주하였다.
실시예 2-1. Engineered tracrRNA (M1-1): tracrRNA의 penta-uridinylate (UUUUU) 서열을 포함하는 stem 5를 구성하는 영역 변형
이하에서, tracrRNA 내에 UUUUU(U5) 서열을 포함하는 영역이 변형된 경우 M1-1 또는 MS1 엔지니어링으로 표시하였다. 즉, 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 경우, tracrRNA는 M1-1 변형을 포함하는 engineered tracrRNA 또는 engineered tracrRNA (M1-1)로 표시하였다. 또한, 앞서 서술한 상세한 설명을 기초로, MS1 엔지니어링에 의해 생성된 engineered tracrRNA(M1-1)는 앞서 1. Engineered tracrRNA 설명 중 "1-1) 제1 서열"섹션에 기재된 제1 서열(연속된 다섯 개 이상의 유리딘 서열을 포함하지 않는 서열)을 가질 수 있다(도 4A).
종결 신호로 작용할 수 있는 연속된 다섯 개 이상의 유리딘 서열를 제거하기 위해 각각의 유리딘(U)을 유리딘 외의 다른 뉴클레오타이드(A, C 또는 G)로 치환하여 engineered tracrRNA를 생성하였다 (표 4). 생성된 engineered tracrRNA를 이용하여 HEK293T 세포에서 내인성 표적 (Target 1)에 대한 인델 효율을 조사하였다. Deep sequencing 분석 결과, 각각의 치환이 최소 4 배의 인델 효율 증가를 가져왔고, 특히, 141번째 유리딘(U141)이 시티딘(C)로 치환되었을 때 인델 효율이 약 50 배 정도 현저히 증가함을 확인하였다(도 11). 시티딘은 종결 신호를 제거할 뿐만 아니라 그 위치에 구조적으로 적합하도록 작용한 것으로 추측된다.
tracrRNA 내에 연속된 다섯 개 이상의 유리딘 서열을 포함하는 MS1이 변형된 engineered tracrRNA (tracrRNA 중 MS1 밑줄로 표시)
Label Sequence (5' to 3') SEQ ID NO
Wildtype tracrRNA
(canonical tracrRNA)
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCA
AUUCUGCACAA
1
U138A CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAAUUUUCCUCUCCA
AUUCUGCACAA
511
U138G CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUUUUCCUCUCCA
AUUCUGCACAA
512
U138C CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCACUUUUCCUCUCCA
AUUCUGCACAA
513
U139A CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUAUUUCCUCUCCA
AUUCUGCACAA
514
U139G CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUGUUUCCUCUCCA
AUUCUGCACAA
515
U139C CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCUUUCCUCUCCA
AUUCUGCACAA
516
U140A CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUAUUCCUCUCCA
AUUCUGCACAA
517
U140G CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGUUCCUCUCCA
AUUCUGCACAA
518
U140C CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUCUUCCUCUCCA
AUUCUGCACAA
519
U141A CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUAUCCUCUCCA
AUUCUGCACAA
520
U141G CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUGUCCUCUCCA
AUUCUGCACAA
521
U141C CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCA
AUUCUGCACAA
271
U142A CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUACCUCUCCA
AUUCUGCACAA
522
U142G CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUGCCUCUCCA
AUUCUGCACAA
523
U142C CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGG
AUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAA
GUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUCCCUCUCCA
AUUCUGCACAA
524
더불어, 추가적인 치환에 의해 효과를 확인하기 위해, 141번째 U를 C로 고정하고, 나머지 유리딘을 도 12를 기초로 다양하게 치환하여 조합한 16가지의 engineered tracrRNA을 비교하였다(표 5). 비교 분석한 결과, 대부분의 engineered tracrRNA은 UUUUU를 포함하는 canonical tracrRNA(즉, 야생형 tarcrRNA)보다 높은 인델 효율을 보였다. 특히, tracrRNA에서 UUUUU 서열을 'GUGCU'서열로 대체한 경우, 인델 효율이 더욱 증가하는 것으로 나타났다(도 12).
tracrRNA 내에 연속된 다섯 개 이상의 유리딘 서열을 포함하는 MS1이 변형된 engineered tracrRNA (tracrRNA 중 MS1 밑줄로 표시)
Label Sequence (5' to 3') SEQ ID NO
UUUUU
(Wildtype tracrRNA)
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUG
CACAA
1
UUUCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCUCCUCUCCAAUUCUG
CACAA
271
GUUCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUUCUCCUCUCCAAUUCUG
CACAA
525
UCUCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCUCUCCUCUCCAAUUCUG
CACAA
526
UUGCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGCUCCUCUCCAAUUCUG
CACAA
527
UUUCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUCCCCUCUCCAAUUCUG
CACAA
528
GCUCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCUCUCCUCUCCAAUUCUG
CACAA
529
GUGCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUG
CACAA
270
GUUCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUUCCCCUCUCCAAUUCUG
CACAA
530
UCGCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCGCUCCUCUCCAAUUCUG
CACAA
531
UCUCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCUCCCCUCUCCAAUUCUG
CACAA
532
UUGCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUGCCCCUCUCCAAUUCUG
CACAA
533
GCGCU CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCGCUCCUCUCCAAUUCUG
CACAA
534
GCUCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCUCCCCUCUCCAAUUCUG
CACAA
535
GUGCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCCCCUCUCCAAUUCUG
CACAA
536
UCGCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUCGCCCCUCUCCAAUUCUG
CACAA
537
GCGCC CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAU
UAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGCGCCCCUCUCCAAUUCUG
CACAA
538
실시예 2-2. Engineered crRNA (M1-1): engineered tracrRNA (M1-1)에 대응되는 crRNA의 변형
더불어, 인델 효율을 극대화하기 위해, 상기 engineered tracrRNA(M1-1)에 대응되는 crRNA를 조작하였다. 이하에서, 상기 engineered tracrRNA(M1-1)에 따라 변형되는 crRNA는 engineered crRNA(M1-1)로 표시하였다(도 4A). 또한, 앞서 서술한 상세한 설명을 기초로, engineered crRNA(MS1-1)는 앞서 2. Wildtype crRNA or Engineered crRNA 설명 중 "2-1) 제6 서열"섹션에 기재된 제6 서열(5'-ACGAA-3'서열을 포함하지 않는 서열)을 가질 수 있다.
상기 engineered tracrRNA(M1-1)의 5'-GUGCU-3' 서열에 대응되는 crRNA의 최적의 서열을 찾기 위해, 앞서 tracrRNA의 조작 방법과 유사한 방법을 이용해 다양한 서열로의 치환에 따른 효과를 분석하였다. 상기 engineered tracrRNA(M1-1)의 5'-GUGCU-3' 서열에 대응되는 crRNA의 5'-ACGAA-3'서열의 각각의 뉴클레오타이드를 다양한 뉴클레오타이드로 치환하고 다양하게 조합하여 engineered crRNA를 생성하였다. 생성된 engineered crRNA를 이용하여 HEK293T 세포에서 세 개의 표적 유전자에 대한 인델 효율을 확인한 결과, 5'-AGCAA-3' 서열이 tracrRNA의 5'-GUGCU-3' 서열에 대한 최적의 대응 서열임을 확인하였다 (도 13 내지 15).
또한, HEK293T 세포에서 세 개의 표적 유전자에서 MS1 변형을 포함한 engineered gRNA의 효과를 확인하였다. 그 결과, crRNA의 단독 변형(즉, engineered crRNA(M1-1)는 5'-AGCAA-3' 서열을 포함하며, 즉, 5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 539)을 포함함)은 Cas12f1에 의한 인델 활성에 영향을 주지 않았지만, tracrRNA의 단독 변형(즉, engineered tracrRNA(M1-1)은 5'-GUGCU-3' 서열을 포함하는 SEQ ID NO: 270 서열임)은 모든 표적 유전자에 대해 인델 효율을 현저히 증가시켰다. 또한, 상기 tracrRNA과 crRNA를 함께 변형시킨 결과, tracrRNA을 단독 변형한 경우보다 인델 효율의 더욱 증가하였다 (도 16).
간단히 정리하면, 상기 tracrRNA 및 crRNA의 engineering 결과, engineered tracrRNA(M1-1)는 5'-UUUUU-3' 서열 대신에 5'-GUGCU-3' 서열을 포함하고, engineered crRNA(M1-1)는 5'-ACGAA-3' 서열 대신에 5'-AGCAA-3' 서열을 포함하는 경우, 인델 효과가 극대화되는 것을 확인하였다. 이하에서, engineered tracrRNA(M1-1) 및 engineered crRNA(M1-1)를 포함하는 engineered gRNA는 engineered gRNA(M-1)로 표시하였다.
실시예 2-3. Engineered tracrRNA(M1-2) and engineered crRNA(M1-2): Truncation of tracrRNA-crRNA complementary sequence in stem 5
앞선 실시예 2-1 및 2-3에 의해 생성된 engineered tracrRNA(M1-1) 및 engineered crRNA(M1-1)을 추가로 조작하였다. Cas14a1을 위한 gRNA는 tracrRNA와 crRNA로 구성되며 긴 서열을 가진다. 이에, 본 발명자는 indel 효율을 감소시키지 않으면서 gRNA의 길이를 줄이기 위해 gRNA의 crRNA-tracrRNA 상보적으로 결합하는 영역, 즉, stem 5를 구성하는 영역(MS1)을 추가 변형하였다. 이는 향후 임상 적용을 고려한 것으로, 길이가 200nt 이상인 sgRNA의 화학적 합성은 임상 환경에서 부담이 될 수 있다. 이하에서, tracrRNA-crRNA 상보적으로 결합하는 영역, 즉, stem 5를 구성하는 영역에 일부 염기 쌍 서열을 삭제하는 경우 M1-2로 표시하였다. 즉, tracrRNA의 3'말단 및 crRNA의 5'말단에 존재하는 상보적으로 결합하는 서열이 전체 또는 일부가 삭제된 경우, tracrRNA는 engineered tracrRNA(M1-2)로 표시하고, crRNA는 engineered crRNA(M1-2)로 표시하거나, 또는 engineered sgRNA(M1-2)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 모두 포함한 경우, engineered tracrRNA(M1) 및 engineered crRNA(M1)으로 표시하거나, 또는 engineered gRNA(M1)로 표시한다(도 4B).
인델 효율에 미치는 영향을 확인하기 위해, 다양한 길이의 stem 5(tracrRNA-crRNA 상보적으로 결합하는 영역)를 가지는 sgRNA를 생성하여 테스트하였다 (표 6, 도 17). 그 결과, tracrRNA-crRNA 상보적으로 결합하는 영역이 삭제된 sgRNA는 거의 인델 효율이 유지되었다.
tracrRNA-crRNA 상보적으로 결합하는 영역에 일부 염기 쌍 서열을 삭제한 engineered sgRNA(M1)의 가이드 서열을 제외한 서열(가이드 서열의 경우, 아래 정리된 서열의 3'말단에 위치함)
Label Sequence (5' to 3') SEQ ID NO
M1-1(sgRNA) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG
GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC
UCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAA
UGAAGGAAUGCAAC
540
Δ6bp(Δ13nt) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG
GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC
UCCUCUCCAAUUCGAAAGAACCCGAAUAGAGCAAUGAAGGAAUGCAA
C
541
Δ12bp(Δ25nt) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG
GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC
UCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC
542
Δ18bp(Δ37nt) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAG
GGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGC
UGAAAAGCAAUGAAGGAAUGCAAC
543
실시예 3. Engineered guide RNA (MS1 and MS2): Truncation of tracrRNA-crRNA complementary sequence in stem 2 (engineered tracrRNA(M2))
Cas14a1은 다른 class II CRISPR syetem에 비해 tracrRNA의 큰 크기로 인해 매우 긴 gRNA를 가진다. 이에 본 발명자는 Cas12f1의 컴팩트한 크기를 고려할 때 전체 tracrRNA 서열이 Cas12f1과의 상호 작용에 참여할 가능성이 낮다는 가설을 세웠다. 이 가설을 확인하기 위해, tracrRNA의 stem 2를 구성하는 영역(MS2)을 추가 변형하였다. 이는 향후 임상 적용을 고려한 것으로, 길이가 200nt 이상인 sgRNA의 화학적 합성은 임상 환경에서 부담이 될 수 있다. 이하에서, stem 2를 구성하는 영역에 일부 염기 쌍 서열을 삭제하는 경우 M2로 또는 MS2 엔지니어링으로 표시하였다. 즉, tracrRNA의 3'말단 및 crRNA의 5'말단에 존재하는 상보적으로 결합하는 서열이 전체 또는 일부가 삭제된 경우, tracrRNA는 engineered tracrRNA(M2)로 표시하거나, 또는 engineered gRNA(M2)로 표시한다. 또한, MS1의 일부 변형을 포함한 경우, 즉, M1-1를 포함한 경우, engineered tracrRNA(M1-1/2)로 표시하거나, 또는 engineered gRNA(M1-1/2)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 포함한 경우, engineered tracrRNA(M1/2)로 표시하거나, 또는 engineered gRNA(M1/2)로 표시한다(도 5).
인델 효율에 미치는 영향을 확인하기 위해, 다양한 길이의 stem 2를 가지는 sgRNA를 생성하여 테스트하였다 (표 7, 도 18). 그 결과, tracrRNA-crRNA 상보적으로 결합하는 영역이 삭제된 sgRNA는 거의 인델 효율이 유지되었다.
stem 2를 구성하는 영역에 일부 염기 쌍 서열을 삭제한 engineered gRNA(M1-1/2)의 가이드 서열을 제외한 서열(가이드 서열의 경우, 아래 정리된 서열의 3'말단에 위치함)
Label Sequence (5' to 3') SEQ ID NO
M1-1(sgRNA) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGG
GAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAG
AAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU
CCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAA
UGCAAC
540
Δ3bp(Δ6nt) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUUUAGAUUAG
AACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGC
UUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUU
CUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC
544
Δ6bp(Δ13nt) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUUAGGAACUUGA
GUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUC
GGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACA
AGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC
546
Δ10bp(Δ21nt) CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGU
GGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUA
ACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUU
GCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC
547
실시예 4. Engineered guide RNA (MS1 and MS3): 5'-Truncation of tracrRNA (engineered tracrRNA(M3))
Cas14a1은 다른 class II CRISPR syetem에 비해 tracrRNA의 큰 크기로 인해 매우 긴 gRNA를 가진다. 이에 본 발명자는 Cas12f1의 컴팩트한 크기를 고려할 때 전체 tracrRNA 서열이 Cas12f1과의 상호 작용에 참여할 가능성이 낮다는 가설을 세웠다. 이 가설을 확인하기 위해, tracrRNA의 5'말단 영역(stem 1을 구성하는 tracrRNA의 5' 말단 영역)을 삭제하도록 tracrRNA을 설계하였다. 이하에서, tracrRNA의 5'말단에 일부 서열을 삭제하는 경우 M3 또는 MS3 엔지니어링으로 표시하였다. 즉, tracrRNA의 5'말단에 일부 서열이 삭제된 경우, tracrRNA는 MS3 변형을 포함하는 engineered tracrRNA 또는 engineered tracrRNA(M3)로 표시하였다. 또한, MS1의 일부 변형을 포함한 경우, 즉, M1-1를 포함한 경우, engineered tracrRNA(M1-1/3)로 표시하거나, 또는 engineered gRNA(M1-1/3)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 포함한 경우, engineered tracrRNA(M1/3)으로 표시하거나, 또는 engineered gRNA(M1/3)으로 표시한다(도 6).
tracrRNA의 5'말단 영역을 삭제하도록 설계한 engineered tracrRNA(M1-1/3)를 이용해 실험한 결과 (표 8), 20nt가 삭제된 tracrRNA를 이용한 경우 인델 효율이 현저히 증가하는 것을 확인하였다 (도 19).
tracrRNA의 5'말단 영역을 삭제하도록 설계한 engineered tracrRNA(M1-1/3)
Label Sequence (5' to 3') SEQ ID NO
M1-1 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUA
GAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUC
UUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
270
-7nt GAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUG
AGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAA
AGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
548
-14nt UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG
GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACC
CUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
549
-20nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
308
실시예 5. Engineered guide RNA (MS1 and MS4): Addition of 3'-poly-uridinylates in crRNA (engineered crRNA(M4))
이전 연구에서 crRNA에 U-rich tail 서열을 부가하는 변형을 통해 CRISPR/Cas12f1 system의 향상된 인델 효율을 확인한바 있다(PCT/KR2020/014961 참고). 이를 기초로 crRNA의 3'말단에 U-rich tail 서열을 부가하는 변형을 설계하였다. crRNA의 3'말단에 U-rich tail 서열을 포함하는 경우 M4 또는 MS4 엔지니어링으로 표시하였다. 즉, crRNA의 3'말단에 U-rich tail 서열이 부가된 경우, crRNA는 MS4 변형을 포함하는 engineered crRNA 또는 engineered crRNA(M4)로 표시하였다. 또한, MS1의 일부 변형을 포함한 경우, 즉, M1-1를 포함한 경우, engineered crRNA(M1-1/4)로 표시하거나, 또는 engineered gRNA(M1-1/4)로 표시한다. 또한, MS1의 변형을 모두 포함한 경우, 즉, M1-1 및 M1-2를 포함한 경우, engineered crRNA(M1/4)으로 표시하거나, 또는 engineered gRNA(M1/4)으로 표시한다(도 7).
실시예 2의 engineered tracrRNA(M1-1)과 더불어 U-rich tail 서열이 부가된 engineered crRNA(M1-1/4)를 포함한 engineered gRNA(M1-1/4)의 인델 효율을 확인하였다.
Engineered crRNA(M1-1/4)를 위해, Cas12f1를 위한 engineered crRNA(M1-1)의 3' 말단에 다양한 길이의 U-rich tail 서열을 포함하도록 설계하였다. 이때, crRNA를 암호화하는 핵산의 3' 말단에 티미딘의 길이를 단계적으로 늘려 다양한 길이의 U-rich tail 서열을 가지는 engineered crRNA(M1-1/4)를 설계하였다 (표 9). 특히, 티미딘이 5개 이상인 경우 더욱 인델 효율이 증가하였다 (도 20). 이때, T4A, T4AT 등 연속된 티미딘 서열 중간에 A는 U6 프로모터 하에서 종결 신호로 작용하는 연속하는 5 개의 티미딘(T5) 서열을 제거하기 위함으로 설계되었으며, 더불어 A 대신 C 또는 G를 TTTT 후에 부가하여 그 효과를 확인하였다 (도 21).
Engineered crRNA(M1-1)의 3'말단에 부가되는 U-rich tail 서열
Label U-rich tail Sequence (5' to 3')
T U
T2 UU
T3 UUU
T4 UUUU
T5 UUUUU
T6 UUUUUU
T4A UUUUA
T4AT UUUUAU
T4AT2 UUUUAUU
T4AT3 UUUUAUUU
T4AT4 UUUUAUUUU
T4AT5 UUUUAUUUUU (SEQ ID NO: 550)
T4AT6 UUUUAUUUUUU (SEQ ID NO: 551)
T4AT7 UUUUAUUUUUUU (SEQ ID NO: 552)
T4AT8 UUUUAUUUUUUUU (SEQ ID NO: 553)
T4AT9 UUUUAUUUUUUUUU (SEQ ID NO: 554)
T4AT10 UUUUAUUUUUUUUUU (SEQ ID NO: 555)
그 결과, 티미딘의 길이가 증가할수록 인델 효율이 증가하는 것을 확인하였다. 특히, U4AU4를 포함한 engineered crRNA(M1-1/4)과 engineered tracrRNA(M1-1)을 함께 이용한 경우, 각각을 단독으로 변형한 것보다 큰 시너지 효과를 보였고, Target 1에 대해 최대 1,148 배까지 인델 효율이 크게 향상됨을 확인하였다 (도 22 및 23).
실시예 6. Engineered guide RNA (MS1, MS3 and MS4)
앞선 실시예들을 기초로 MS1 엔지니어링, MS3 엔지니어링 및 MS4 엔지니어링을 포함한 engineered tracrRNA(M1-1/3)(표 9) 및 engineered crRNA(M1-1/4)(5'-[SEQ ID NO: 516]-[가이드 서열]-[U4AU4]-3')를 설계하였다. 이를 이용해 실험한 결과, 세 개의 타겟에서 모두 높은 인델 효율을 확인하였다. 특히, 단독 변형(M1-1)이나 두 개의 조합 변형(M1-1/3 또는 M1-1/4)보다 세 개의 조합 변형(M1-1/3/4) 경우 약 3 내지 6 배의 인델 효율이 더 증가하였다.
이러한 효과를 확인한 후, tracrRNA의 5'말단 영역에 삭제 서열을 최적화하기 위해, tracrRNA의 5'말단 길이를 -12 ~ -21 범위 내에서 미세 조정하여 3 개의 표적에 대한 인델 효과를 비교하였다 (표 10). 그 결과, tracrRNA 5'말단의 18nt에서 21nt까지의 범위로 삭제(truncation)하는 것이 인델 효율에 가장 효과적임을 확인하였다 (도 24). 특히, 5'말단에 20nt 서열이 삭제된(truncated) tracrRNA가 가장 효과적이었다.
tracrRNA의 5'말단 영역을 삭제하도록 설계한 engineered tracrRNA(M1-1/3)
Label Sequence (5' to 3') SEQ ID NO
M1-1 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU
AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU
UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCAC
AA
270
-12nt AGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUG
AAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGU
AACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
556
-13nt GUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGA
AGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUA
ACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
557
-14nt UGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAA
GGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAA
CCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
549
-15nt GGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG
GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAAC
CCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
558
-16nt GAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGG
UGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACC
CUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
559
-17nt AGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGU
GGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCC
UCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
560
-18nt GAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG
GGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCU
CGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
561
-19nt AACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG
GCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUC
GAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
562
-20nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG
CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG
AAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
308
-21nt CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA
AACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA
563
실시예 7. Engineered guide RNA (MS1, MS3 and MS4)
앞선 실시예들을 기초로 MS1 엔지니어링, MS3 엔지니어링 및 MS4 엔지니어링을 포함한 engineered tracrRNA(M1/3) 및 engineered crRNA(M1/4)를 설계하였다.
앞선 실시예 6에 의해 세 개의 조합 변형(M1-1/3/4) 경우 인델 효율이 증가함을 확인하였다. 하지만, tracrRNA의 5'말단 삭제(truncation)에도 Cas14a1을 위한 gRNA는 여전히 긴 서열을 가진다. 이에, 본 발명자는 gRNA의 길이를 최적화하기 위한 M1-2 변형 더 포함하도록 추가 설계하였다 (표 11). Engineered tracrRNA(M1/3) 및 engineered crRNA(M1/4)를 포함하는 engineered sgRNA(M1/3/4)을 이용한 경우, 실시예 6에서 engineered tracrRNA(M1-1/3) 및 engineered crRNA(M1-1/4)을 이용한 인델 효율과 비슷하거나 약간 증가된 인델 효율이 확인되었다 (도 25).
Engineered sgRNA(M1/3/4)의 가이드 서열 및 U-rich tail 서열을 제외한 서열(가이드 서열 및 U-rich tail 서열의 경우, 아래 정리된 서열의 3'말단에 위치하며, 이때, U-rich tail 서열은 5'-U4AU4-3'서열임)
Label Sequence (5' to 3') SEQ ID NO
M1-1/3/4(sgRNA) ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG
GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA
GUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAA
AGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC
564
Δ10bp(Δ21nt) ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG
GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA
GUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAGAAACCGAAUAGAG
CAAUGAAGGAAUGCAAC
565
Δ12bp(Δ25nt) ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG
GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA
GUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAU
GAAGGAAUGCAAC
566
Δ18bp(Δ37nt) ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAG
GUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAA
GUAACCCUCGAAACAAAUUCAGUGCUGAAAAGCAAUGAAGGAAUGCAA
C
567
이러한 결과를 기초로 Cas14a1과의 상호작용에 영향을 주지 않으면서 최적의 길이를 가지는 sgRNA를 찾기 위해 추가적인 스크리닝을 수행하였다. tracrRNA-crRNA 상보적으로 결합하는 영역(stem 5)의 전체 범위에 걸쳐 1bp씩 차이를 가지도록 다양한 sgRNA를 설계하고 테스트하였다 (표 12, 도 26).
Engineered sgRNA(M1/3/4)의 가이드 서열 및 U-rich tail 서열을 제외한 서열(가이드 서열 및 U-rich tail 서열의 경우, 아래 정리된 서열의 3'말단에 위치하며, 이때, U-rich tail 서열은 5'-U4AU4-3'서열임)
Label Sequence (5' to 3') SEQ ID NO
M1-1/3/4
(sgRNA)
ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUA
GAGCAAUGAAGGAAUGCAAC
564
-1nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAGAAAGUUGCAGAACCCGAAUAG
AGCAAUGAAGGAAUGCAAC
568
-3nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGCACGAAAUUGCAGAACCCGAAUAGAG
CAAUGAAGGAAUGCAAC
569
-5nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGCAGAAAUGCAGAACCCGAAUAGAGCA
AUGAAGGAAUGCAAC
570
-7nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGCGAAAGCAGAACCCGAAUAGAGCAAU
GAAGGAAUGCAAC
571
-9nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGGAAACAGAACCCGAAUAGAGCAAUGA
AGGAAUGCAAC
572
-11nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCUGAAAAGAACCCGAAUAGAGCAAUGAAG
GAAUGCAAC
573
-13nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUCGAAAGAACCCGAAUAGAGCAAUGAAGGA
AUGCAAC
574
-15nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUUGAAAAACCCGAAUAGAGCAAUGAAGGAAU
GCAAC
575
-17nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAUGAAAACCCGAAUAGAGCAAUGAAGGAAUGC
AAC
576
-19nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAAGAAACCCGAAUAGAGCAAUGAAGGAAUGCAA
C
577
-21nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCAGAAACCGAAUAGAGCAAUGAAGGAAUGCAAC
578
-23nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCCGAAACGAAUAGAGCAAUGAAGGAAUGCAAC
579
-25nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC
566
-27nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUCUGAAAAAUAGAGCAAUGAAGGAAUGCAAC
580
-29nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC.UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA
CAAAUUCAGUGCUCCUCGAAAAUAGAGCAAUGAAGGAAUGCAAC
581
-31nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCUGAAAUAGAGCAAUGAAGGAAUGCAAC
582
-33nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCCGAAAAGAGCAAUGAAGGAAUGCAAC
583
-35nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUCGAAAGAGCAAUGAAGGAAUGCAAC
584
-37nt ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAA
ACAAAUUCAGUGCUGAAAAGCAAUGAAGGAAUGCAAC
585
한편, sgRNA의 linker 서열을 이용한 추가 변형을 시도하였다. 일반적으로 sgRNA을 위해 링커로 GAAA를 이용한다. 이 경우, gRNA는 하나의 RNA 분자로 작동한다. 반면에 GAAA 서열을 hammerhead ribozyme 서열으로 대체하는 경우, 발현 단계에서 sgRNA가 생성되지만 hammerhead ribozyme에 의해 자체 절단(self-cleavage)되어 tracrRNA 또는 crRNA에 오버행이 있는 이중 가이드 RNA가 생성된다. 즉, tracrRNA 및 crRNA와 hammerhead ribozyme의 결합은 3'-truncated tracrRNA와 5'-elongated crRNA을 생성할 수 있다 (도 27). 또는 반대로, hammerhead ribozyme 서열을 반대 방향으로 통합하면 5'-elongated tracrRNA 및 3'-truncated crRNA가 생성된다. 이러한 hammerhead ribozyme 서열의 특성을 이용한 gRNA 구조 변형을 테스트하여 게놈 편집을 더 향상시킬 수 있는지 여부를 조사하였다. 그 결과, hammerhead ribozyme 서열을 가지도록 설계된 gRNA 중 어느 것도 총 25nt-trucated sgRNA(즉, crRNA 및 tracrRNA의 경우 각각 12nt 및 13nt 절단)에 비해 증가된 효율을 나타내지 않았다 (도 27).
실시예 8. 다양한 engineered guide RNA: MS1, MS2, MS3 및/또는 MS4
앞서 실시한 실시예2 내지 5에서 확인한 다양한 gRNA 엔지니어링을 기초로, MS1, MS2, MS3 및 MS4 엔지니어링을 다양하게 조합하여 다양한 engineered gRNA를 설계하여 그 효과를 확인하였다 (도 4 내지 10 및 표 13). 그 결과, 다양한 gRAN의 엔지니어링은 인델 효율을 향상시켰다 (도 28). 특히, M1/3/4 조합 및 M1/2/3/4 조합으로 엔지니어링 된 gRNA를 이용한 CRISPR/Cas14a1 system이 가장 우수한 게놈 편집 성능을 보여주었다. 이하에서는 M1/3/4 조합으로 엔지니어링 된 gRNA를 포함하는 engineered CRISPR/Cas14a1 system은 geCas14a1_3.0 system으로 표시하였다. 또한, HEK293T 세포에서 geCas14a1_3.0 system을 이용한 인델 패턴을 확인하였다(도 29). 종합하면, 광범위한 gRNA 엔지니어링을 통해 강력하고 더욱 컴팩트한 CRISPR/Cas12f1 시스템을 개발하였고, 이를 이용해 진핵 세포에서 기존 CRISPR/Cas12f1 시스템(즉, 야생형 CRISPR/Cas12f1 시스템)으로 달성할 수 없었던 고효율의 게놈 편집을 가능하게 하였다.
다양한 engineered sgRNA의 가이드 서열을 제외한 서열(가이드 서열의 경우, 아래 정리된 서열의 3'말단에 위치함). 이때, M4를 포함하는 경우, 가이드 서열의 3'말단에 5'-UUUUAUUUU-3' 서열이 부가됨.
Label Sequence (5' to 3') (SEQ ID NO) 5'-UUUUAUUUU-3' 서열 포함 여부
Canonical
(Wildtype sgRNA)
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU
AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU
UCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCAC
AAGAAAGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC (SEQ ID NO: 586)
미포함
M1-1 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU
AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU
UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCAC
AAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 540)
미포함
M1 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU
AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU
UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGA
GCAAUGAAGGAAUGCAAC (SEQ ID NO: 542)
미포함
M1-1/2 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA
AACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAA
UAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 547)
미포함
M1/2 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA
AACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 587)
미포함
M1-1/3 ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG
CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG
AAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGA
AUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 564)
미포함
M1/3 ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG
CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG
AAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 566)
미포함
M1-1/4 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU
AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU
UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCAC
AAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 540)
포함
M1/4 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUU
AGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUU
UCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGA
GCAAUGAAGGAAUGCAAC (SEQ ID NO: 542)
포함
M1-1/2/3 ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU
CCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCA
AC (SEQ ID NO: 588)
미포함
M1/2/3 ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU
CGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 589)
미포함
M1-1/2/4 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA
AACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGAA
UAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 547)
포함
M1/2/4 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGC
UGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGA
AACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC
(SEQ ID NO: 587)
포함
M1-1/3/4 ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG
CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG
AAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAAGAAAGUUGCAGAACCCGA
AUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 564)
포함
M1/3/4
(geCas14a1_3.0)
ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGG
CUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCG
AAACAAAUUCAGUGCUCCUCUCGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 566)
포함
M1-1/2/3/4 ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU
CCAAUUCUGCACAAGAAAGUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCA
AC (SEQ ID NO: 588)
포함
M1/2/3/4 ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGU
CGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCU
CGAAAGAAUAGAGCAAUGAAGGAAUGCAAC (SEQ ID NO: 589)
포함
실시예 9. gRNA 엔지니어링에 의한 효과
더불어, 본 발명자는 증가된 인델 효율에 대한 gRNA 엔지니어링(M1-M4)의 효과의 기초가 되는 분자 메커니즘을 조사하였다. 그 결과, 예상대로 M1-1은 표적 RNA-seq 분석에 의해 평가된 바와 같이 완전한 서열로 gRNA의 발현을 급격히 증가시킴을 확인하였다 (도 30). 대조적으로 M3와 M4는 gRNA 발현의 변화와 관련이 없었다. M4와 관련하여 U-rich tail 서열은 효율적인 RNP 형성을 유도하였다. 그러나 M3의 효과에 대한 구체적인 정보를 확인할 수 없었다. 다만, 시험 관내 이중 가닥 DNA (dsDNA) 분해 분석을 통해, MS3 엔지니어링이 추가된 engineered gRNA의 경우, 이중 가닥 절단이 더 잘 발생함을 확인할 수 있었다. 아직 구체적인 메커니즘을 알 수 없으나, MS3 엔지니어링에 의해 gRNA의 5' 말단에 일부 서열이 제거됨에 따라 Cas12f1의 표적 가닥에 대한 접근성이 증가되었을 것으로 예측되며, MS3 엔지니어링으로 인해 야생형 CRISPR/Cas12f1 시스템의 표적 가닥에 대한 낮은 절단 효율을 향상시켰을 것으로 사료된다 (도 31). 다시 말해, 야생형 CRISPR/Cas12f1 시스템은 표적 가닥의 저효율 절단에 의해 주로 단일 가닥만 절단하는 nick을 생성하여 현저히 낮은 인델 효율을 가진다. 그러나, MS3 엔지니어링을 한 경우, CRISPR/Cas12f1 시스템의 절단 패턴을 변경하지 않으면서 표적 가닥의 절단을 현저하게 증가시켜 결과적으로 이중 가닥 절단에 의한 현저히 증가한 인델 효과를 보였다.
실시예 10. Large-scale validation of engineered CRISPR/Cas12f1 as an efficient genome editor
앞서 실시한 gRNA 엔지니어링은 3 개의 내인성 표적에 대해서만 인델 효율의 변화를 모니터링하여 구현되었기 때문에 engineered CRISPR/Cas12f1 시스템(이하에서, geCas14a1 system와 혼용하여 사용함)이 광범위한 표적에 대한 게놈 편집을 가능한지 여부를 실험하였다. 이를 위해, Cas9, Cas12a 및 Cas12f1으로 편집할 수 있는 in silico로 5'-TTTR-N20-NGG-3' 서열을 가지는 내인성 타겟을 검색하여 88 개의 내인성 유전자좌를 무작위로 선택하였다 (도 32 내지 34). CRISPR/SpCas9 system, CRISPR/AsCas12a system, canonical CRISPR/Cas14a1 system 또는 geCas14a1_3.0 system을 이용한 HEK293-T 세포로 형질 감염 후 deep sequencing 분석을 통해 선별한 88개의 내인성 유전자좌에서의 인델 효율을 확인하였다 (도 35). 그 결과, canonical CRISPR/Cas14a1 system이 표적의 91 % (80/88)가 인델 효율이 0.1 % 미만으로 나타났다. 그러나, geCas14a1_3.0 system은 광범위한 표적에 대한 인델 효율을 크게 향상시켰다 (도 35). geCas14a1_3.0 system의 평균 효율은 AsCas12a (p> 0.05)의 효율과 거의 비슷했으며 SpCas9의 효율보다 약간 낮았다.
이러한 대규모 분석에 대한 box-and-whisker 플롯(도 36)을 통해 다음과 같은 결론을 도출했습니다: 1) canonical CRISPR/Cas14a1 system 자체는 인간 세포에서 평균 인델 효율이 0.1 % 미만으로 게놈 편집기로의 사용이 어려움; 2) gRNA 엔지니어링에 의한 인델 효율의 평균 증가는 540 배임; 3) geCas14a1_3.0 system은 진핵 세포에서 CRISPR/SpCas9 system 및 CRISPR/AsCas12a system와 함께 게놈 편집기로 사용할 수 있음, 특히 CRISPR/SpCas9 system 및 CRISPR/AsCas12a system에 비해 geCas14a1_3.0 system이 더 높은 효율을 보인 표적(26 %, 23/88)이 있었음; 4) geCas14a1_3.0 system은 CRISPR/SpCas9 system 및 CRISPR/AsCas12a system과 달리 Gaussian 분포를 보여주지 않았으며 오히려 표적이 전체 범위의 indel 효율에 더 고르게 분포되어 있음 (도 36).
실시예 11. Canonical gRNA 및 engineered gRNA의 cleavage pattern 비교
canonical gRNA 및 engineered gRNA를 이용하여 target strand (TS)와 non-target strand (NTS)의 cleavage pattern을 NGS로 분석하였다. 그 결과, canonical gRNA는 NTS의 cleavage가 상대적으로 덜 되는 것을 확인하였다. 그에 반해 engineered gRNA의 경우, gRNA가 engineering이 되어 가면서 NTS의 cleavage가 점점 증가하는 것을 확인하였다. 또한, TS의 cleavage도 약간씩 증가하는 것도 확인하였다. 이러한 결과를 통해, engineered gRNA가 NTS와 TS에서 발생되는 cleavage 차이를 줄임으로 double-strand cleavage를 높이는 것으로 이해될 수 있다 (도 37).
<110> Genkore <120> An engineered guide RNA for the optimized CRISPR/Cas12f1(Cas14a1) system and use thereof <130> CP20-226 <150> KR 10-2020-0129937 <151> 2020-10-08 <150> KR 10-2020-0185528 <151> 2020-12-29 <160> 737 <170> KoPatentIn 3.0 <210> 1 <211> 161 <212> RNA <213> Unknown <220> <223> wildtype tracrRNA for CRISPR/Cas12f1 system <400> 1 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca a 161 <210> 2 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (9) <223> N is (N)a, wherein the each N is independently A, C, G or U, wherein the a is an integer of 0 to 4. <400> 2 caaauucanc cucuccaauu cugcacaa 28 <210> 3 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> V is (V)a, wherein the each V is independently A, C or G, wherein the a is an integer of 0 to 4. <400> 3 caaauucavn nnnvccucuc caauucugca caa 33 <210> 4 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)b, wherein the each N is independently A, C, G or U, wherein the b is an integer of 0 to 1. <400> 4 caaauucanv nnnnccucuc caauucugca caa 33 <210> 5 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)c, wherein the each N is independently A, C, G or U, wherein the c is an integer of 0 to 2. <400> 5 caaauucann vnnnccucuc caauucugca caa 33 <210> 6 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)d, wherein the each N is independently A, C, G or U, wherein the d is an integer of 0 to 3. <400> 6 caaauucann nvnnccucuc caauucugca caa 33 <210> 7 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)a, wherein the each N is independently A, C, G or U, wherein the a is an integer of 0 to 4. <400> 7 caaauucann nnvnccucuc caauucugca caa 33 <210> 8 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> a part of first sequence for engineered tracrRNA <400> 8 ccucuccaau ucugcacaa 19 <210> 9 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 9 caaauucacc ucuccaauuc ugcacaa 27 <210> 10 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 10 caaauucanc cucuccaauu cugcacaa 28 <210> 11 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 11 caaauucaac cucuccaauu cugcacaa 28 <210> 12 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 12 caaauucacc cucuccaauu cugcacaa 28 <210> 13 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 13 caaauucagc cucuccaauu cugcacaa 28 <210> 14 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 14 caaauucauc cucuccaauu cugcacaa 28 <210> 15 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 15 caaauucann ccucuccaau ucugcacaa 29 <210> 16 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 16 caaauucaau ccucuccaau ucugcacaa 29 <210> 17 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 17 caaauucacu ccucuccaau ucugcacaa 29 <210> 18 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 18 caaauucagu ccucuccaau ucugcacaa 29 <210> 19 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 19 caaauucauu ccucuccaau ucugcacaa 29 <210> 20 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 20 caaauucann nccucuccaa uucugcacaa 30 <210> 21 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 21 caaauucauu uccucuccaa uucugcacaa 30 <210> 22 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 22 caaauucagu gccucuccaa uucugcacaa 30 <210> 23 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 23 caaauucagu uccucuccaa uucugcacaa 30 <210> 24 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 24 caaauucaua uccucuccaa uucugcacaa 30 <210> 25 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 25 caaauucann nnccucucca auucugcaca a 31 <210> 26 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 26 caaauucauu uuccucucca auucugcaca a 31 <210> 27 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 27 caaauucagu gcccucucca auucugcaca a 31 <210> 28 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 28 caaauucagu ucccucucca auucugcaca a 31 <210> 29 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 29 caaauucagu guccucucca auucugcaca a 31 <210> 30 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 30 caaauucauu gcccucucca auucugcaca a 31 <210> 31 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 31 caaauucauu ucccucucca auucugcaca a 31 <210> 32 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> V is (V)a, wherein the each V is independently A, C or G, wherein the a is an integer of 0 to 4. <400> 32 caaauucaan nnnvccucuc caauucugca caa 33 <210> 33 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 33 caaauucaan nnnccucucc aauucugcac aa 32 <210> 34 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 34 caaauucaan nnnvccucuc caauucugca caa 33 <210> 35 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 35 caaauucaan nnnvvccucu ccaauucugc acaa 34 <210> 36 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 36 caaauucaan nnnvvvccuc uccaauucug cacaa 35 <210> 37 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 37 caaauucaan nnnvvvvccu cuccaauucu gcacaa 36 <210> 38 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 38 caaauucaau uuuccucucc aauucugcac aa 32 <210> 39 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 39 caaauucaau ucuccucucc aauucugcac aa 32 <210> 40 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 40 caaauucaau gcuccucucc aauucugcac aa 32 <210> 41 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 41 caaauucaau gcuaccucuc caauucugca caa 33 <210> 42 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> V is (V)a, wherein the each V is independently A, C or G, wherein the a is an integer of 0 to 4. <400> 42 caaauucacn nnnvccucuc caauucugca caa 33 <210> 43 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 43 caaauucacn nnnccucucc aauucugcac aa 32 <210> 44 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 44 caaauucacn nnnvccucuc caauucugca caa 33 <210> 45 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 45 caaauucacn nnnvvccucu ccaauucugc acaa 34 <210> 46 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 46 caaauucacn nnnvvvccuc uccaauucug cacaa 35 <210> 47 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 47 caaauucacn nnnvvvvccu cuccaauucu gcacaa 36 <210> 48 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 48 caaauucacu uuuccucucc aauucugcac aa 32 <210> 49 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 49 caaauucacu ucuccucucc aauucugcac aa 32 <210> 50 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 50 caaauucacu gcuccucucc aauucugcac aa 32 <210> 51 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 51 caaauucacu gcucccucuc caauucugca caa 33 <210> 52 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> V is (V)a, wherein the each V is independently A, C or G, wherein the a is an integer of 0 to 4. <400> 52 caaauucagn nnnvccucuc caauucugca caa 33 <210> 53 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 53 caaauucagn nnnccucucc aauucugcac aa 32 <210> 54 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 54 caaauucagn nnnvccucuc caauucugca caa 33 <210> 55 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 55 caaauucagn nnnvvccucu ccaauucugc acaa 34 <210> 56 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 56 caaauucagn nnnvvvccuc uccaauucug cacaa 35 <210> 57 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 57 caaauucagn nnnvvvvccu cuccaauucu gcacaa 36 <210> 58 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 58 caaauucagu uuuccucucc aauucugcac aa 32 <210> 59 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 59 caaauucagu ucuccucucc aauucugcac aa 32 <210> 60 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 60 caaauucagu gcuccucucc aauucugcac aa 32 <210> 61 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 61 caaauucagu gcugccucuc caauucugca caa 33 <210> 62 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)b, wherein the each N is independently A, C, G or U, wherein the b is an integer of 0 to 1. <400> 62 caaauucana nnnnccucuc caauucugca caa 33 <210> 63 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 63 caaauucana nnnccucucc aauucugcac aa 32 <210> 64 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 64 caaauucana nnnnccucuc caauucugca caa 33 <210> 65 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 65 caaauucaua uuuccucucc aauucugcac aa 32 <210> 66 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 66 caaauucaua ucuccucucc aauucugcac aa 32 <210> 67 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 67 caaauucaua gcuccucucc aauucugcac aa 32 <210> 68 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)b, wherein the each N is independently A, C, G or U, wherein the b is an integer of 0 to 1. <400> 68 caaauucanc nnnnccucuc caauucugca caa 33 <210> 69 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 69 caaauucanc nnnccucucc aauucugcac aa 32 <210> 70 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 70 caaauucanc nnnnccucuc caauucugca caa 33 <210> 71 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 71 caaauucagc ucuccucucc aauucugcac aa 32 <210> 72 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 72 caaauucauc uccccucucc aauucugcac aa 32 <210> 73 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 73 caaauucauc ucuccucucc aauucugcac aa 32 <210> 74 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 74 caaauucauc gcuccucucc aauucugcac aa 32 <210> 75 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)b, wherein the each N is independently A, C, G or U, wherein the b is an integer of 0 to 1. <400> 75 caaauucang nnnnccucuc caauucugca caa 33 <210> 76 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 76 caaauucang nnnccucucc aauucugcac aa 32 <210> 77 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 77 caaauucang nnnnccucuc caauucugca caa 33 <210> 78 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 78 caaauucaug uuuccucucc aauucugcac aa 32 <210> 79 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 79 caaauucaug ucuccucucc aauucugcac aa 32 <210> 80 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 80 caaauucaug gcuccucucc aauucugcac aa 32 <210> 81 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)c, wherein the each N is independently A, C, G or U, wherein the c is an integer of 0 to 2. <400> 81 caaauucann annnccucuc caauucugca caa 33 <210> 82 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 82 caaauucann annccucucc aauucugcac aa 32 <210> 83 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 83 caaauucann annnccucuc caauucugca caa 33 <210> 84 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 84 caaauucann annnnccucu ccaauucugc acaa 34 <210> 85 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 85 caaauucauu auuccucucc aauucugcac aa 32 <210> 86 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 86 caaauucauu acuccucucc aauucugcac aa 32 <210> 87 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 87 caaauucauc acuccucucc aauucugcac aa 32 <210> 88 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)c, wherein the each N is independently A, C, G or U, wherein the c is an integer of 0 to 2. <400> 88 caaauucann cnnnccucuc caauucugca caa 33 <210> 89 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 89 caaauucann cnnccucucc aauucugcac aa 32 <210> 90 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 90 caaauucann cnnnccucuc caauucugca caa 33 <210> 91 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 91 caaauucann cnnnnccucu ccaauucugc acaa 34 <210> 92 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 92 caaauucauu cuuccucucc aauucugcac aa 32 <210> 93 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 93 caaauucauu ccuccucucc aauucugcac aa 32 <210> 94 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 94 caaauucagu cuuccucucc aauucugcac aa 32 <210> 95 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)c, wherein the each N is independently A, C, G or U, wherein the c is an integer of 0 to 2. <400> 95 caaauucann gnnnccucuc caauucugca caa 33 <210> 96 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 96 caaauucann gnnccucucc aauucugcac aa 32 <210> 97 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 97 caaauucann gnnnccucuc caauucugca caa 33 <210> 98 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 98 caaauucann gnnnnccucu ccaauucugc acaa 34 <210> 99 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 99 caaauucauu gcuccucucc aauucugcac aa 32 <210> 100 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 100 caaauucauc gccccucucc aauucugcac aa 32 <210> 101 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 101 caaauucagc gccccucucc aauucugcac aa 32 <210> 102 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)d, wherein the each N is independently A, C, G or U, wherein the d is an integer of 0 to 3. <400> 102 caaauucann nannccucuc caauucugca caa 33 <210> 103 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 103 caaauucann nanccucucc aauucugcac aa 32 <210> 104 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 104 caaauucann nannccucuc caauucugca caa 33 <210> 105 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 105 caaauucann nannnccucu ccaauucugc acaa 34 <210> 106 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 106 caaauucann nannnnccuc uccaauucug cacaa 35 <210> 107 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 107 caaauucauu uauccucucc aauucugcac aa 32 <210> 108 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 108 caaauucagu uauccucucc aauucugcac aa 32 <210> 109 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 109 caaauucauu gauccucucc aauucugcac aa 32 <210> 110 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)d, wherein the each N is independently A, C, G or U, wherein the d is an integer of 0 to 3. <400> 110 caaauucann ncnnccucuc caauucugca caa 33 <210> 111 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 111 caaauucann ncnccucucc aauucugcac aa 32 <210> 112 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 112 caaauucann ncnnccucuc caauucugca caa 33 <210> 113 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 113 caaauucann ncnnnccucu ccaauucugc acaa 34 <210> 114 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 114 caaauucann ncnnnnccuc uccaauucug cacaa 35 <210> 115 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 115 caaauucauu ucuccucucc aauucugcac aa 32 <210> 116 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 116 caaauucagu gccccucucc aauucugcac aa 32 <210> 117 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 117 caaauucagc gcuccucucc aauucugcac aa 32 <210> 118 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 118 caaauucauu gccccucucc aauucugcac aa 32 <210> 119 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 119 caaauucagc uccccucucc aauucugcac aa 32 <210> 120 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)d, wherein the each N is independently A, C, G or U, wherein the d is an integer of 0 to 3. <400> 120 caaauucann ngnnccucuc caauucugca caa 33 <210> 121 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 121 caaauucann ngnccucucc aauucugcac aa 32 <210> 122 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 122 caaauucann ngnnccucuc caauucugca caa 33 <210> 123 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 123 caaauucann ngnnnccucu ccaauucugc acaa 34 <210> 124 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 124 caaauucann ngnnnnccuc uccaauucug cacaa 35 <210> 125 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 125 caaauucauu uguccucucc aauucugcac aa 32 <210> 126 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 126 caaauucauu gguccucucc aauucugcac aa 32 <210> 127 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 127 caaauucagu cguccucucc aauucugcac aa 32 <210> 128 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)a, wherein the each N is independently A, C, G or U, wherein the a is an integer of 0 to 4. <400> 128 caaauucann nnanccucuc caauucugca caa 33 <210> 129 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 129 caaauucann nnaccucucc aauucugcac aa 32 <210> 130 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 130 caaauucann nnanccucuc caauucugca caa 33 <210> 131 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 131 caaauucann nnannccucu ccaauucugc acaa 34 <210> 132 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 132 caaauucann nnannnccuc uccaauucug cacaa 35 <210> 133 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 133 caaauucann nnannnnccu cuccaauucu gcacaa 36 <210> 134 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 134 caaauucauu uuaccucucc aauucugcac aa 32 <210> 135 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 135 caaauucauu ucaccucucc aauucugcac aa 32 <210> 136 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 136 caaauucauu gcaccucucc aauucugcac aa 32 <210> 137 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)a, wherein the each N is independently A, C, G or U, wherein the a is an integer of 0 to 4. <400> 137 caaauucann nncnccucuc caauucugca caa 33 <210> 138 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 138 caaauucann nncccucucc aauucugcac aa 32 <210> 139 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 139 caaauucann nncnccucuc caauucugca caa 33 <210> 140 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 140 caaauucann nncnnccucu ccaauucugc acaa 34 <210> 141 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 141 caaauucann nncnnnccuc uccaauucug cacaa 35 <210> 142 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 142 caaauucann nncnnnnccu cuccaauucu gcacaa 36 <210> 143 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 143 caaauucauc uccccucucc aauucugcac aa 32 <210> 144 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 144 caaauucagu uccccucucc aauucugcac aa 32 <210> 145 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 145 caaauucauu uccccucucc aauucugcac aa 32 <210> 146 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <220> <221> misc_difference <222> (14) <223> N is (N)a, wherein the each N is independently A, C, G or U, wherein the a is an integer of 0 to 4. <400> 146 caaauucann nngnccucuc caauucugca caa 33 <210> 147 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 147 caaauucann nngccucucc aauucugcac aa 32 <210> 148 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 148 caaauucann nngnccucuc caauucugca caa 33 <210> 149 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 149 caaauucann nngnnccucu ccaauucugc acaa 34 <210> 150 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 150 caaauucann nngnnnccuc uccaauucug cacaa 35 <210> 151 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 151 caaauucann nngnnnnccu cuccaauucu gcacaa 36 <210> 152 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 152 caaauucauu ucgccucucc aauucugcac aa 32 <210> 153 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 153 caaauucagu gcgccucucc aauucugcac aa 32 <210> 154 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 154 caaauucagu ucgccucucc aauucugcac aa 32 <210> 155 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 155 caaauucann nn 12 <210> 156 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 156 caaauucann nnccucucca auucugcac 29 <210> 157 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 157 caaauucann nnccucucca auucugc 27 <210> 158 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 158 caaauucann nnccucucca auucu 25 <210> 159 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 159 caaauucann nnccucucca auu 23 <210> 160 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 160 caaauucann nnccucucca a 21 <210> 161 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 161 caaauucann nnccucucc 19 <210> 162 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 162 caaauucann nnccucu 17 <210> 163 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 163 caaauucann nnccu 15 <210> 164 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 164 caaauucann nnc 13 <210> 165 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 165 caaauucavn nnn 13 <210> 166 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 166 caaauucavn nnnccucucc aauucugcac aa 32 <210> 167 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 167 caaauucavn nnnccucucc aauucugca 29 <210> 168 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 168 caaauucavn nnnccucucc aauucug 27 <210> 169 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 169 caaauucavn nnnccucucc aauucu 26 <210> 170 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 170 caaauucavn nnnccucucc aauu 24 <210> 171 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 171 caaauucavn nnnccucucc aa 22 <210> 172 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 172 caaauucavn nnnccucucc 20 <210> 173 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 173 caaauucavn nnnccucu 18 <210> 174 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 174 caaauucavn nnnccu 16 <210> 175 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 175 caaauucanv nnn 13 <210> 176 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 176 caaauucanv nnnccucucc aauucugcac aa 32 <210> 177 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 177 caaauucanv nnnccucucc aauucugca 29 <210> 178 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 178 caaauucanv nnnccucucc aauucu 26 <210> 179 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 179 caaauucanv nnnccucucc aauu 24 <210> 180 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 180 caaauucanv nnnccucucc aa 22 <210> 181 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 181 caaauucanv nnnccucucc 20 <210> 182 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 182 caaauucanv nnnccucu 18 <210> 183 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 183 caaauucanv nnncc 15 <210> 184 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 184 caaauucann vnn 13 <210> 185 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 185 caaauucann vnnccucucc aauucugcac aa 32 <210> 186 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 186 caaauucann vnnccucucc aauucugca 29 <210> 187 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 187 caaauucann vnnccucucc aauucu 26 <210> 188 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 188 caaauucann vnnccucucc aauu 24 <210> 189 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 189 caaauucann vnnccucucc aa 22 <210> 190 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 190 caaauucann vnnccucucc 20 <210> 191 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 191 caaauucann vnnccucu 18 <210> 192 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 192 caaauucann vnncc 15 <210> 193 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 193 caaauucann nvn 13 <210> 194 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 194 caaauucann nvnccucucc aauucugcac aa 32 <210> 195 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 195 caaauucann nvnccucucc aauucugca 29 <210> 196 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 196 caaauucann nvnccucucc aauucu 26 <210> 197 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 197 caaauucann nvnccucucc aauu 24 <210> 198 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 198 caaauucann nvnccucucc aa 22 <210> 199 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 199 caaauucann nvnccucucc 20 <210> 200 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 200 caaauucann nvnccucu 18 <210> 201 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 201 caaauucann nvncc 15 <210> 202 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 202 caaauucann nnv 13 <210> 203 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 203 caaauucann nnvccucucc aauucugcac aa 32 <210> 204 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 204 caaauucann nnvccucucc aauucugca 29 <210> 205 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 205 caaauucann nnvccucucc aauucu 26 <210> 206 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 206 caaauucann nnvccucucc aauu 24 <210> 207 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 207 caaauucann nnvccucucc aa 22 <210> 208 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 208 caaauucann nnvccucucc 20 <210> 209 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 209 caaauucann nnvccucu 18 <210> 210 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 210 caaauucann nnvcc 15 <210> 211 <211> 39 <212> RNA <213> Artificial Sequence <220> <223> second sequence for engineered tracrRNA <400> 211 augucgagaa gugcuuucuu cggaaaguaa cccucgaaa 39 <210> 212 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> third sequence for engineered tracrRNA <400> 212 ggcugcuugc aucagccua 19 <210> 213 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 213 ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug 50 <210> 214 <211> 48 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 214 ccgcuucacc aaaagcuguc cuuagggauu agaacuugag ugaaggug 48 <210> 215 <211> 46 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 215 ccgcuucacc aaaagcuguc uuaggauuag aacuugagug aaggug 46 <210> 216 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 216 ccgcuucacc aaaagcuguu uagauuagaa cuugagugaa ggug 44 <210> 217 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 217 ccgcuucacc aaaagcuguu aguuagaacu ugagugaagg ug 42 <210> 218 <211> 40 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 218 ccgcuucacc aaaagcguua guugaacuug agugaaggug 40 <210> 219 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 219 ccgcuucacc aaaagguuag uuaacuugag ugaaggug 38 <210> 220 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 220 ccgcuucacc aaagguuagu uaacugagug aaggug 36 <210> 221 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 221 ccgcuucacc aagguuaguu aacgagugaa ggug 34 <210> 222 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 222 ccgcuucaca agguuaguua acagugaagg ug 32 <210> 223 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 223 ccgcuucaaa gguuaguuaa caugaaggug 30 <210> 224 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 224 ccgcuucaag guuaguuaac agaaggug 28 <210> 225 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 225 ccgcuuaagg uuaguuaaca aaggug 26 <210> 226 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 226 ccgcuaaggu uaguuaacaa ggug 24 <210> 227 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 227 ccgcaagguu aguuaacagg ug 22 <210> 228 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 228 ccgaagguua guuaacagug 20 <210> 229 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 229 cgaagguuag uuaacaug 18 <210> 230 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 230 gaagguuagu uaacau 16 <210> 231 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 231 ccgcuucacc aaaagcuguu aguagaacuu gagugaaggu g 41 <210> 232 <211> 39 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 232 ccgcuucacc aaaagcuuua gagaacuuga gugaaggug 39 <210> 233 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 233 ccgcuucacc aaaagcuuag gaacuugagu gaaggug 37 <210> 234 <211> 35 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 234 ccgcuucacc aaaaguuaga acuugaguga aggug 35 <210> 235 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 235 ccgcuucacc aaaauuagac uugagugaag gug 33 <210> 236 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 236 ccgcuucacc aaauuagcuu gagugaaggu g 31 <210> 237 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 237 ccgcuucacc aauuaguuga gugaaggug 29 <210> 238 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 238 ccgcuucacc auuagugagu gaaggug 27 <210> 239 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 239 ccgcuucacc uuaggaguga aggug 25 <210> 240 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 240 ccgcuucacu uagagugaag gug 23 <210> 241 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 241 ccgcuucacu uaggugaagg ug 22 <210> 242 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 242 ccgcuucauu agugaaggug 20 <210> 243 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 243 ccgcuucuua ggaaggug 18 <210> 244 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 244 ccgcuuuuag aaggug 16 <210> 245 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 245 ccgcuuuaga ggug 14 <210> 246 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 246 ccgcuuaggg ug 12 <210> 247 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> fourth sequence for engineered tracrRNA <400> 247 ccguuaggug 10 <210> 248 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 248 cuucacugau aaaguggaga a 21 <210> 249 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 249 aaguggagaa 10 <210> 250 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 250 aaaguggaga a 11 <210> 251 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 251 uaaaguggag aa 12 <210> 252 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 252 auaaagugga gaa 13 <210> 253 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 253 gauaaagugg agaa 14 <210> 254 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 254 ugauaaagug gagaa 15 <210> 255 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 255 cugauaaagu ggagaa 16 <210> 256 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 256 acugauaaag uggagaa 17 <210> 257 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 257 cacugauaaa guggagaa 18 <210> 258 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 258 ucacugauaa aguggagaa 19 <210> 259 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> fifth sequence for engineered tracrRNA <400> 259 uucacugaua aaguggagaa 20 <210> 260 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> additional sequence for engineered gRNA <400> 260 auaaagguga 10 <210> 261 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> hammerhead ribozyme nucleotide seqeunce <400> 261 cugaugaguc cgugaggacg aaacgaguaa gcucguc 37 <210> 262 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> hammerhead ribozyme nucleotide seqeunce <400> 262 cugcucgaau gagcaaagca ggagugccug aguaguc 37 <210> 263 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 263 ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60 aauucannnc nccucuccaa uucugcacaa 90 <210> 264 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 264 ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60 aauucagugc uccucuccaa uucugcacaa 90 <210> 265 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 265 ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60 aauucauuuc uccucuccaa uucugcacaa 90 <210> 266 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 266 ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc 120 nccucuccaa uucugcacaa 140 <210> 267 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 267 ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucuccaa uucugcacaa 140 <210> 268 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 268 ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaau uucuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucuccaa uucugcacaa 140 <210> 269 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 269 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn cnccucucca auucugcaca a 161 <210> 270 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 270 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucugcaca a 161 <210> 271 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 271 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu cuccucucca auucugcaca a 161 <210> 272 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 272 caaauucann ncn 13 <210> 273 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 273 caaauucann ncnccucucc aauucugcac a 31 <210> 274 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 274 caaauucann ncnccucucc aauucugcac 30 <210> 275 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 275 caaauucann ncnccucucc aauucugca 29 <210> 276 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 276 caaauucann ncnccucucc aauucugc 28 <210> 277 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 277 caaauucann ncnccucucc aauucug 27 <210> 278 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 278 caaauucann ncnccucucc aauucu 26 <210> 279 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 279 caaauucann ncnccucucc aauuc 25 <210> 280 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 280 caaauucann ncnccucucc aauu 24 <210> 281 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 281 caaauucann ncnccucucc aau 23 <210> 282 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 282 caaauucann ncnccucucc aa 22 <210> 283 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 283 caaauucann ncnccucucc a 21 <210> 284 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 284 caaauucann ncnccucucc 20 <210> 285 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 285 caaauucann ncnccucuc 19 <210> 286 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 286 caaauucann ncnccucu 18 <210> 287 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 287 caaauucann ncnccuc 17 <210> 288 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 288 caaauucann ncnccu 16 <210> 289 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 289 caaauucann ncncc 15 <210> 290 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 290 caaauucann ncnc 14 <210> 291 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 291 ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60 aauucannnc nccucuc 77 <210> 292 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 292 ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60 aauucagugc uccucuc 77 <210> 293 <211> 77 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 293 ggcugcuugc aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca 60 aauucauuuc uccucuc 77 <210> 294 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 294 ccgcuucacc uuaggaguga aggugggcug cuugcaucag ccuaaugucg agaagugcuu 60 ucuucggaaa guaacccucg aaacaaauuc annncnccuc uc 102 <210> 295 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 295 ccgcuucacc gaaagaguga aggugggcug cuugcaucag ccuaaugucg agaagugcuu 60 ucuucggaaa guaacccucg aaacaaauuc annncnccuc uc 102 <210> 296 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 296 ccgcuuuuag aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa 60 aguaacccuc gaaacaaauu cannncnccu cuccaauucu gcacaa 106 <210> 297 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 297 ccgcuugaaa aaggugggcu gcuugcauca gccuaauguc gagaagugcu uucuucggaa 60 aguaacccuc gaaacaaauu cannncnccu cuccaauucu gcacaa 106 <210> 298 <211> 119 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 298 ccgcuucacc aauuaguuga gugaaggugg gcugcuugca ucagccuaau gucgagaagu 60 gcuuucuucg gaaaguaacc cucgaaacaa auucagugcu ccucuccaau ucugcacaa 119 <210> 299 <211> 119 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 299 ccgcuucacc aagaaauuga gugaaggugg gcugcuugca ucagccuaau gucgagaagu 60 gcuuucuucg gaaaguaacc cucgaaacaa auucagugcu ccucuccaau ucugcacaa 119 <210> 300 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 300 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuc 107 <210> 301 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 301 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120 120 <210> 302 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 302 accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuc 107 <210> 303 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 303 accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120 120 <210> 304 <211> 141 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 304 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucca auucugcaca a 141 <210> 305 <211> 128 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 305 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucuc 128 <210> 306 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 306 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 120 <210> 307 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 307 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuc 107 <210> 308 <211> 141 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 308 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca a 141 <210> 309 <211> 128 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 309 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucuc 128 <210> 310 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 310 accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 120 <210> 311 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 311 accgcuucac caagaaauug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuc 107 <210> 312 <211> 37 <212> RNA <213> Unknown <220> <223> wildtype repeat sequence of wildtype crRNA for CRISPR/Cas12f1 system <400> 312 guugcagaac ccgaauagac gaaugaagga augcaac 37 <210> 313 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <220> <221> misc_difference <222> (19) <223> N is (N)a, wherein the each N is independently A, C, G or U, and the a is an integer of 0 to 4. <400> 313 guugcagaac ccgaauagnu gaagga 26 <210> 314 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <220> <221> misc_difference <222> (19) <223> B is (B)a, wherein the each B is independently C, G or U, and the a is an integer of 0 to 4. <400> 314 guugcagaac ccgaauagbn nnnbugaagg a 31 <210> 315 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <220> <221> misc_difference <222> (19) <223> N is (N)b, wherein the each N is independently A, C, G or U, and the b is an integer of 0 to 1. <400> 315 guugcagaac ccgaauagnn nnbnugaagg a 31 <210> 316 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <220> <221> misc_difference <222> (19) <223> N is (N)c, wherein the each N is independently A, C, G or U, and the c is an integer of 0 to 2. <400> 316 guugcagaac ccgaauagnn nbnnugaagg a 31 <210> 317 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <220> <221> misc_difference <222> (19) <223> N is (N)d, wherein the each N is independently A, C, G or U, and the d is an integer of 0 to 3. <400> 317 guugcagaac ccgaauagnn bnnnugaagg a 31 <210> 318 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <220> <221> misc_difference <222> (19) <223> N is (N)a, wherein the each N is independently A, C, G or U, and the a is an integer of 0 to 4. <400> 318 guugcagaac ccgaauagnb nnnnugaagg a 31 <210> 319 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> a part of sixth sequence for engineered crRNA <400> 319 guugcagaac ccgaauag 18 <210> 320 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 320 caaauucauu cuccucucca auucugcaca a 31 <210> 321 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 321 guugcagaac ccgaauagug ccugaagga 29 <210> 322 <211> 33 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 322 caaauucaca uuccccucuc caauucugca caa 33 <210> 323 <211> 31 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 323 guugcagaac ccgaauagga aagcugaagg a 31 <210> 324 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 324 caaauucagu gcuccucucc aauucugcac aa 32 <210> 325 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 325 guugcagaac ccgaauagag caaugaagga 30 <210> 326 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 326 caaauucauu ucuccucucc aauucugcac aa 32 <210> 327 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 327 guugcagaac ccgaauagag gaaugaagga 30 <210> 328 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 328 caaauucacu gccuuccucu ccaauucugc acaa 34 <210> 329 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 329 guugcagaac ccgaauagaa ggcagugaag ga 32 <210> 330 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> first sequence for engineered tracrRNA <400> 330 caaauucaca uugauccucu ccaauucugc acaa 34 <210> 331 <211> 32 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 331 guugcagaac ccgaauagac gaaagugaag ga 32 <210> 332 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 332 guugcagaac ccgaauagnn nnugaagga 29 <210> 333 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 333 nnnnugaagg a 11 <210> 334 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 334 ugcagaaccc gaauagnnnn ugaagga 27 <210> 335 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 335 cagaacccga auagnnnnug aagga 25 <210> 336 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 336 gaacccgaau agnnnnugaa gga 23 <210> 337 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 337 acccgaauag nnnnugaagg a 21 <210> 338 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 338 ccgaauagnn nnugaagga 19 <210> 339 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 339 gaauagnnnn ugaagga 17 <210> 340 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 340 auagnnnnug aagga 15 <210> 341 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 341 agnnnnugaa gga 13 <210> 342 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 342 nnnnbugaag ga 12 <210> 343 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 343 guugcagaac ccgaauagnn nnbugaagga 30 <210> 344 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 344 ugcagaaccc gaauagnnnn bugaagga 28 <210> 345 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 345 cagaacccga auagnnnnbu gaagga 26 <210> 346 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 346 gaacccgaau agnnnnbuga agga 24 <210> 347 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 347 acccgaauag nnnnbugaag ga 22 <210> 348 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 348 ccgaauagnn nnbugaagga 20 <210> 349 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 349 gaauagnnnn bugaagga 18 <210> 350 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 350 auagnnnnbu gaagga 16 <210> 351 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 351 agnnnnbuga agga 14 <210> 352 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 352 nnnbnugaag ga 12 <210> 353 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 353 guugcagaac ccgaauagnn nbnugaagga 30 <210> 354 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 354 ugcagaaccc gaauagnnnb nugaagga 28 <210> 355 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 355 cagaacccga auagnnnbnu gaagga 26 <210> 356 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 356 gaacccgaau agnnnbnuga agga 24 <210> 357 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 357 acccgaauag nnnbnugaag ga 22 <210> 358 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 358 ccgaauagnn nbnugaagga 20 <210> 359 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 359 gaauagnnnb nugaagga 18 <210> 360 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 360 auagnnnbnu gaagga 16 <210> 361 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 361 agnnnbnuga agga 14 <210> 362 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 362 nnbnnugaag ga 12 <210> 363 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 363 guugcagaac ccgaauagnn bnnugaagga 30 <210> 364 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 364 ugcagaaccc gaauagnnbn nugaagga 28 <210> 365 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 365 cagaacccga auagnnbnnu gaagga 26 <210> 366 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 366 gaacccgaau agnnbnnuga agga 24 <210> 367 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 367 acccgaauag nnbnnugaag ga 22 <210> 368 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 368 ccgaauagnn bnnugaagga 20 <210> 369 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 369 gaauagnnbn nugaagga 18 <210> 370 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 370 auagnnbnnu gaagga 16 <210> 371 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 371 agnnbnnuga agga 14 <210> 372 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 372 nbnnnugaag ga 12 <210> 373 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 373 guugcagaac ccgaauagnb nnnugaagga 30 <210> 374 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 374 ugcagaaccc gaauagnbnn nugaagga 28 <210> 375 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 375 cagaacccga auagnbnnnu gaagga 26 <210> 376 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 376 gaacccgaau agnbnnnuga agga 24 <210> 377 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 377 acccgaauag nbnnnugaag ga 22 <210> 378 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 378 ccgaauagnb nnnugaagga 20 <210> 379 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 379 gaauagnbnn nugaagga 18 <210> 380 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 380 auagnbnnnu gaagga 16 <210> 381 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 381 agnbnnnuga agga 14 <210> 382 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 382 bnnnnugaag ga 12 <210> 383 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 383 guugcagaac ccgaauagbn nnnugaagga 30 <210> 384 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 384 ugcagaaccc gaauagbnnn nugaagga 28 <210> 385 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 385 cagaacccga auagbnnnnu gaagga 26 <210> 386 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 386 gaacccgaau agbnnnnuga agga 24 <210> 387 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 387 acccgaauag bnnnnugaag ga 22 <210> 388 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 388 ccgaauagbn nnnugaagga 20 <210> 389 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 389 gaauagbnnn nugaagga 18 <210> 390 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 390 auagbnnnnu gaagga 16 <210> 391 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 391 agbnnnnuga agga 14 <210> 392 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 392 uuuuuuuuuu 10 <210> 393 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 393 uuuauuuauu uau 13 <210> 394 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 394 uguguguuuu 10 <210> 395 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 395 uuuguuuguu uu 12 <210> 396 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 396 uuuucuuuuc uuuu 14 <210> 397 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 397 uuucuauuuu 10 <210> 398 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 398 uuauguuuuu 10 <210> 399 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 399 uuuauucugu u 11 <210> 400 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 400 uucucuuucu uu 12 <210> 401 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 401 uguuauuuau u 11 <210> 402 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 402 uuucuuuaug uuu 13 <210> 403 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 403 uauuuguuuc 10 <210> 404 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 404 uucuuguuuu auu 13 <210> 405 <211> 57 <212> RNA <213> Unknown <220> <223> wildtype crRNA for CRISPR/Cas12f1 system <400> 405 guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 406 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 406 guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60 uauuuu 66 <210> 407 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 407 guugcagaac ccgaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60 u 61 <210> 408 <211> 30 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 408 guugcagaac ccgaauagng nnnugaagga 30 <210> 409 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 409 guugcagaac ccgaauagng nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 410 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 410 guugcagaac ccgaauagag caaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 411 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 411 gaauagacga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 412 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 412 ngnnnugaag ga 12 <210> 413 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 413 uugcagaacc cgaauagngn nnugaagga 29 <210> 414 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 414 ugcagaaccc gaauagngnn nugaagga 28 <210> 415 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 415 gcagaacccg aauagngnnn ugaagga 27 <210> 416 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 416 cagaacccga auagngnnnu gaagga 26 <210> 417 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 417 agaacccgaa uagngnnnug aagga 25 <210> 418 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 418 gaacccgaau agngnnnuga agga 24 <210> 419 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 419 aacccgaaua gngnnnugaa gga 23 <210> 420 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 420 acccgaauag ngnnnugaag ga 22 <210> 421 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 421 cccgaauagn gnnnugaagg a 21 <210> 422 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 422 ccgaauagng nnnugaagga 20 <210> 423 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 423 cgaauagngn nnugaagga 19 <210> 424 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 424 gaauagngnn nugaagga 18 <210> 425 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 425 aauagngnnn ugaagga 17 <210> 426 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 426 auagngnnnu gaagga 16 <210> 427 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 427 uagngnnnug aagga 15 <210> 428 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> sixth sequence for engineered crRNA <400> 428 agngnnnuga agga 14 <210> 429 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 429 gaauagngnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 430 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 430 gaauagagca augaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 431 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 431 gaauagacga augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuu 49 <210> 432 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 432 guugcagaac ccgaauagng nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60 u 61 <210> 433 <211> 61 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 433 guugcagaac ccgaauagag caaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60 u 61 <210> 434 <211> 66 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 434 guugcagaac ccgaauagag caaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 60 uauuuu 66 <210> 435 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 435 gaauagngnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuu 49 <210> 436 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 436 gaauagagca augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuu 49 <210> 437 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 437 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222 <210> 438 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 438 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222 <210> 439 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 439 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 n 181 <210> 440 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 440 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nn 202 <210> 441 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 441 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 n 181 <210> 442 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 442 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nn 202 <210> 443 <211> 185 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 443 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 nuuuu 185 <210> 444 <211> 206 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 444 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nnuuuu 206 <210> 445 <211> 185 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 445 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agacgaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 nuuuu 185 <210> 446 <211> 206 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 446 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca agaaaguugc agaacccgaa uagacgaaug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nnuuuu 206 <210> 447 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 447 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226 <210> 448 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 448 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226 <210> 449 <211> 177 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 449 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucga aagaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnn 177 <210> 450 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 450 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucga aagaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180 u 181 <210> 451 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 451 accgcuucac cuuaggagug aaggugggcu gcuugcauca gccuaauguc gagaagugcu 60 uucuucggaa aguaacccuc gaaacaaauu cagugcuccu cucgaaagaa uagacgaaug 120 aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 156 <210> 452 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 452 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucga aagaauagac gaaugaagga augcaacnnn nnnnnnnnnn nnnnnnnuuu 180 u 181 <210> 453 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 453 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agngnnnuga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 n 181 <210> 454 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 454 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucca auucugcaca agaaaguugc agaacccgaa uagngnnnug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nn 202 <210> 455 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 455 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agagcaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 n 181 <210> 456 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 456 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nn 202 <210> 457 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 457 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180 uagngnnnug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222 <210> 458 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 458 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagagcaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nn 222 <210> 459 <211> 185 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 459 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc nccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agngnnnuga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 nuuuu 185 <210> 460 <211> 206 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 460 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 cnccucucca auucugcaca agaaaguugc agaacccgaa uagngnnnug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nnuuuu 206 <210> 461 <211> 185 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 461 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agagcaauga aggaaugcaa cnnnnnnnnn nnnnnnnnnn 180 nuuuu 185 <210> 462 <211> 206 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 462 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180 acnnnnnnnn nnnnnnnnnn nnuuuu 206 <210> 463 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 463 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn cnccucucca auucugcaca agaaaguugc agaacccgaa 180 uagngnnnug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226 <210> 464 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA <400> 464 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagagcaaug aaggaaugca acnnnnnnnn nnnnnnnnnn nnuuuu 226 <210> 465 <211> 529 <212> PRT <213> Unknown <220> <223> Uncultured archaeon Cas12f1 protein <400> 465 Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg 1 5 10 15 Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn 20 25 30 Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu 35 40 45 Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val 50 55 60 Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys 65 70 75 80 Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln 85 90 95 Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile 100 105 110 Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly 115 120 125 Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val 130 135 140 Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser 145 150 155 160 Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys 165 170 175 Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile 180 185 190 Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser 195 200 205 Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln 210 215 220 Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe 225 230 235 240 Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr 245 250 255 Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu 260 265 270 Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile 275 280 285 Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu 290 295 300 Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser 305 310 315 320 Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala 325 330 335 Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe 340 345 350 His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys 355 360 365 Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro 370 375 380 Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile 385 390 395 400 Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val 405 410 415 Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp 420 425 430 Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met 435 440 445 Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg 450 455 460 Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His 465 470 475 480 Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro 485 490 495 His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn 500 505 510 Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu 515 520 525 Pro <210> 466 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Cas12f1 fusion protein with CBE (N terminal -Cytidine deaminase) <400> 466 Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val 1 5 10 15 Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe 20 25 30 Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile 35 40 45 Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr 50 55 60 Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg 65 70 75 80 Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp 85 90 95 Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg 100 105 110 Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His 115 120 125 Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly 130 135 140 Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg 145 150 155 160 Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr 165 170 175 Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile 180 185 190 Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln 195 200 205 Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu 210 215 220 Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser 225 230 235 240 Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr 245 250 255 Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Lys Asn Thr 260 265 270 Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala 275 280 285 Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile 290 295 300 Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His 305 310 315 320 Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys 325 330 335 Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu 340 345 350 Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile 355 360 365 Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu 370 375 380 Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn 385 390 395 400 Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala 405 410 415 Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys 420 425 430 Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly 435 440 445 Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln 450 455 460 Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp 465 470 475 480 Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile 485 490 495 Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys 500 505 510 Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg 515 520 525 Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys 530 535 540 Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly 545 550 555 560 Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp 565 570 575 Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile 580 585 590 Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe 595 600 605 Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys 610 615 620 Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg 625 630 635 640 Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr 645 650 655 Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys 660 665 670 Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met 675 680 685 Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile 690 695 700 Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu 705 710 715 720 Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn 725 730 735 Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe 740 745 750 Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu 755 760 765 Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile 770 775 780 Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser 785 790 795 800 Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 805 810 815 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu 820 825 830 Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val 835 840 845 His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr 850 855 860 Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser 865 870 875 880 Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser 885 890 895 Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys 900 905 910 Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu 915 920 925 Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala 930 935 940 Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala 945 950 955 960 Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu 965 970 975 Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly 980 985 990 Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val 995 1000 <210> 467 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Cas12f1 fusion protein with CBE (C terminal -Cytidine deaminase) <400> 467 Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr 1 5 10 15 Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys 20 25 30 Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys 35 40 45 Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala 50 55 60 Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys 65 70 75 80 Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe 85 90 95 Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu 100 105 110 Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr 115 120 125 Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val 130 135 140 Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe 145 150 155 160 Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn 165 170 175 Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr 180 185 190 Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln 195 200 205 Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys 210 215 220 Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg 225 230 235 240 Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro 245 250 255 Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp 260 265 270 Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly 275 280 285 Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly 290 295 300 Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile 305 310 315 320 Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val 325 330 335 Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser 340 345 350 Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg 355 360 365 Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly 370 375 380 Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu 385 390 395 400 Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp 405 410 415 Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu 420 425 430 Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly 435 440 445 Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys 450 455 460 Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys 465 470 475 480 Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr 485 490 495 Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe 500 505 510 Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys 515 520 525 Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser 530 535 540 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 545 550 555 560 Ser Gly Gly Ser Ser Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala 565 570 575 Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val 580 585 590 Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu 595 600 605 Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn 610 615 620 Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu 625 630 635 640 Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser 645 650 655 Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser 660 665 670 Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His 675 680 685 His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser 690 695 700 Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp 705 710 715 720 Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg 725 730 735 Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile 740 745 750 Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro 755 760 765 Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg 770 775 780 Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser 785 790 795 800 Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 805 810 815 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu 820 825 830 Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val 835 840 845 His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr 850 855 860 Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser 865 870 875 880 Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser 885 890 895 Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys 900 905 910 Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu 915 920 925 Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala 930 935 940 Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala 945 950 955 960 Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu 965 970 975 Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly 980 985 990 Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val 995 1000 <210> 468 <211> 941 <212> PRT <213> Artificial Sequence <220> <223> Cas12f1 fusion protein with ABE (N terminal-Adenine deaminase) <400> 468 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn 385 390 395 400 Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser 405 410 415 Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys 420 425 430 Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys 435 440 445 His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala 450 455 460 Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys 465 470 475 480 Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu 485 490 495 Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser 500 505 510 Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala 515 520 525 Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg 530 535 540 Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser 545 550 555 560 Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser 565 570 575 Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys 580 585 590 Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser 595 600 605 Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu 610 615 620 Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln 625 630 635 640 Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys 645 650 655 Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys 660 665 670 Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg 675 680 685 Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile 690 695 700 Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly 705 710 715 720 Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala 725 730 735 Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys 740 745 750 Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys 755 760 765 Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu 770 775 780 Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala 785 790 795 800 Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln 805 810 815 Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn 820 825 830 Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile 835 840 845 Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro 850 855 860 Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr 865 870 875 880 Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys 885 890 895 Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn 900 905 910 Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Lys Arg Pro 915 920 925 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 930 935 940 <210> 469 <211> 941 <212> PRT <213> Artificial Sequence <220> <223> Cas12f1 fusion protein with ABE (C terminal-Adenine deaminase) <400> 469 Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg 1 5 10 15 Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn 20 25 30 Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu 35 40 45 Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val 50 55 60 Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys 65 70 75 80 Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln 85 90 95 Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile 100 105 110 Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly 115 120 125 Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val 130 135 140 Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser 145 150 155 160 Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys 165 170 175 Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile 180 185 190 Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser 195 200 205 Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln 210 215 220 Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe 225 230 235 240 Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr 245 250 255 Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu 260 265 270 Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile 275 280 285 Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu 290 295 300 Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser 305 310 315 320 Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala 325 330 335 Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe 340 345 350 His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys 355 360 365 Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro 370 375 380 Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile 385 390 395 400 Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val 405 410 415 Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp 420 425 430 Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met 435 440 445 Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg 450 455 460 Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His 465 470 475 480 Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro 485 490 495 His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn 500 505 510 Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu 515 520 525 Pro Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly 530 535 540 Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly 545 550 555 560 Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 565 570 575 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 580 585 590 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 595 600 605 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 610 615 620 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 625 630 635 640 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 645 650 655 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 660 665 670 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 675 680 685 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 690 695 700 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 705 710 715 720 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 725 730 735 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 740 745 750 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 755 760 765 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 770 775 780 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 785 790 795 800 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 805 810 815 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 820 825 830 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 835 840 845 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 850 855 860 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 865 870 875 880 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 885 890 895 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 900 905 910 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Lys Arg Pro 915 920 925 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 930 935 940 <210> 470 <211> 1267 <212> PRT <213> Artificial Sequence <220> <223> Cas12f1 fusion protein with MLV <400> 470 Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr 1 5 10 15 Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys 20 25 30 Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys 35 40 45 Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala 50 55 60 Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys 65 70 75 80 Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe 85 90 95 Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu 100 105 110 Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr 115 120 125 Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val 130 135 140 Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe 145 150 155 160 Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn 165 170 175 Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr 180 185 190 Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln 195 200 205 Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys 210 215 220 Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg 225 230 235 240 Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro 245 250 255 Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp 260 265 270 Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly 275 280 285 Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly 290 295 300 Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile 305 310 315 320 Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val 325 330 335 Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser 340 345 350 Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg 355 360 365 Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly 370 375 380 Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu 385 390 395 400 Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp 405 410 415 Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu 420 425 430 Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly 435 440 445 Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys 450 455 460 Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys 465 470 475 480 Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr 485 490 495 Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe 500 505 510 Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys 515 520 525 Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser 530 535 540 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 545 550 555 560 Ser Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu 565 570 575 Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser 580 585 590 Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met 595 600 605 Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr 610 615 620 Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg 625 630 635 640 Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu 645 650 655 Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys Lys 660 665 670 Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn 675 680 685 Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu 690 695 700 Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu 705 710 715 720 Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu 725 730 735 Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu 740 745 750 Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe 755 760 765 Asn Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro 770 775 780 Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr 785 790 795 800 Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu 805 810 815 Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln 820 825 830 Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp 835 840 845 Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys 850 855 860 Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg 865 870 875 880 Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu 885 890 895 Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala 900 905 910 Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu 915 920 925 Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly 930 935 940 Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro 945 950 955 960 Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro 965 970 975 Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala 980 985 990 Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala 995 1000 1005 Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala 1010 1015 1020 Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln 1025 1030 1035 1040 Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro 1045 1050 1055 Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His 1060 1065 1070 Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His 1075 1080 1085 Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys 1090 1095 1100 Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala 1105 1110 1115 1120 Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr 1125 1130 1135 Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp 1140 1145 1150 Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg 1155 1160 1165 Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp 1170 1175 1180 Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser 1185 1190 1195 1200 Ile Ile His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg 1205 1210 1215 Gly Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu 1220 1225 1230 Thr Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly 1235 1240 1245 Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys 1250 1255 1260 Arg Lys Val 1265 <210> 471 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 471 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 472 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 472 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 473 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 473 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 474 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 474 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 475 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 475 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 476 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 476 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 477 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 477 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 478 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 478 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 479 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 479 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 480 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 480 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 481 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 481 Asp Arg Leu Arg Arg 1 5 <210> 482 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 482 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 483 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 483 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 484 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 484 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 485 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 485 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 486 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Sequence <400> 486 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 487 <211> 1587 <212> DNA <213> Artificial Sequence <220> <223> human codon optimized nucleic acid encoding Cas12f1 protein <400> 487 atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60 gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120 aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180 accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240 ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300 atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360 tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420 ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480 gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540 ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600 cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660 ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720 gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780 aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840 ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900 gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960 atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020 ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080 cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140 aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200 gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260 atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320 gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380 attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440 ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500 gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560 aagctgaaga gcactaagga ggagccc 1587 <210> 488 <211> 24 <212> DNA <213> Homo sapiens <400> 488 tttgcacaca cacagtgggc tacc 24 <210> 489 <211> 24 <212> DNA <213> Homo sapiens <400> 489 tttgcatccc caggacacac acac 24 <210> 490 <211> 24 <212> DNA <213> Homo sapiens <400> 490 tttaagaaca catacccctg ggcc 24 <210> 491 <211> 24 <212> DNA <213> Homo sapiens <400> 491 tttgactcag caatcctatt actg 24 <210> 492 <211> 24 <212> DNA <213> Homo sapiens <400> 492 tttatattcc tgtgggtata tgcc 24 <210> 493 <211> 24 <212> DNA <213> Homo sapiens <400> 493 tttaagaggt gattaggtca tggc 24 <210> 494 <211> 24 <212> DNA <213> Homo sapiens <400> 494 tttaatccat tcatgagggt ggtg 24 <210> 495 <211> 24 <212> DNA <213> Homo sapiens <400> 495 tttagctcaa atctgtacta ctaa 24 <210> 496 <211> 24 <212> DNA <213> Homo sapiens <400> 496 tttattatta tagtgtgtac ttga 24 <210> 497 <211> 24 <212> DNA <213> Homo sapiens <400> 497 tttatgtcct catagcttac cttc 24 <210> 498 <211> 24 <212> DNA <213> Homo sapiens <400> 498 tttaattgta tgttctcact cata 24 <210> 499 <211> 24 <212> DNA <213> Homo sapiens <400> 499 tttgggtctg tggctgttgg gctg 24 <210> 500 <211> 24 <212> DNA <213> Homo sapiens <400> 500 tttagagccc atctcagatc cctg 24 <210> 501 <211> 24 <212> DNA <213> Homo sapiens <400> 501 tttaccagtg aagatataac atta 24 <210> 502 <211> 24 <212> DNA <213> Homo sapiens <400> 502 tttagtgagg cttcttaaga tgtc 24 <210> 503 <211> 24 <212> DNA <213> Homo sapiens <400> 503 tttgctgctg gtaacaaggt cata 24 <210> 504 <211> 24 <212> DNA <213> Homo sapiens <400> 504 tttagatctg agacccagct gctc 24 <210> 505 <211> 24 <212> DNA <213> Homo sapiens <400> 505 tttgtccttg accacggcat cagc 24 <210> 506 <211> 24 <212> DNA <213> Homo sapiens <400> 506 tttaagtggg aataatatag ttcc 24 <210> 507 <211> 24 <212> DNA <213> Homo sapiens <400> 507 tttgaagaca tcttgctgtc agac 24 <210> 508 <211> 24 <212> DNA <213> Homo sapiens <400> 508 tttgtgtata attattcaga gtag 24 <210> 509 <211> 24 <212> DNA <213> Homo sapiens <400> 509 tttggcatca agttaacatc acac 24 <210> 510 <211> 24 <212> DNA <213> Homo sapiens <400> 510 tttagcactg aggcttgaga cttg 24 <210> 511 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 511 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaauu uuccucucca auucugcaca a 161 <210> 512 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 512 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaguu uuccucucca auucugcaca a 161 <210> 513 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 513 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucacuu uuccucucca auucugcaca a 161 <210> 514 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 514 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauau uuccucucca auucugcaca a 161 <210> 515 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 515 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaugu uuccucucca auucugcaca a 161 <210> 516 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 516 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaucu uuccucucca auucugcaca a 161 <210> 517 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 517 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauua uuccucucca auucugcaca a 161 <210> 518 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 518 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauug uuccucucca auucugcaca a 161 <210> 519 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 519 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuc uuccucucca auucugcaca a 161 <210> 520 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 520 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu auccucucca auucugcaca a 161 <210> 521 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 521 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu guccucucca auucugcaca a 161 <210> 522 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 522 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uaccucucca auucugcaca a 161 <210> 523 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 523 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu ugccucucca auucugcaca a 161 <210> 524 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 524 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu ucccucucca auucugcaca a 161 <210> 525 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 525 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaguu cuccucucca auucugcaca a 161 <210> 526 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 526 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaucu cuccucucca auucugcaca a 161 <210> 527 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 527 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauug cuccucucca auucugcaca a 161 <210> 528 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 528 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu ccccucucca auucugcaca a 161 <210> 529 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 529 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagcu cuccucucca auucugcaca a 161 <210> 530 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 530 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaguu ccccucucca auucugcaca a 161 <210> 531 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 531 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaucg cuccucucca auucugcaca a 161 <210> 532 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 532 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaucu ccccucucca auucugcaca a 161 <210> 533 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 533 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauug ccccucucca auucugcaca a 161 <210> 534 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 534 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagcg cuccucucca auucugcaca a 161 <210> 535 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 535 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagcu ccccucucca auucugcaca a 161 <210> 536 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 536 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug ccccucucca auucugcaca a 161 <210> 537 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 537 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucaucg ccccucucca auucugcaca a 161 <210> 538 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 538 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagcg ccccucucca auucugcaca a 161 <210> 539 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> repeat sequence of engineered crRNA <400> 539 guugcagaac ccgaauagag caaugaagga augcaac 37 <210> 540 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 540 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagagcaaug aaggaaugca ac 202 <210> 541 <211> 189 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 541 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucca auucgaaaga acccgaauag agcaaugaag 180 gaaugcaac 189 <210> 542 <211> 177 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 542 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cuccucucga aagaauagag caaugaagga augcaac 177 <210> 543 <211> 165 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 543 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucagug cugaaaagca augaaggaau gcaac 165 <210> 544 <211> 196 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 544 cuucacugau aaaguggaga accgcuucac caaaagcugu uuagauuaga acuugaguga 60 aggugggcug cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg 120 aaacaaauuc agugcuccuc uccaauucug cacaagaaag uugcagaacc cgaauagagc 180 aaugaaggaa ugcaac 196 <210> 545 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 545 gaauagagca augaaggaau gcaacnnnnn nnnnnnnnnn nnnnnuuuua uuuu 54 <210> 546 <211> 189 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 546 cuucacugau aaaguggaga accgcuucac caaaagcuua ggaacuugag ugaagguggg 60 cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120 uucagugcuc cucuccaauu cugcacaaga aaguugcaga acccgaauag agcaaugaag 180 gaaugcaac 189 <210> 547 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 547 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucuccaa uucugcacaa gaaaguugca gaacccgaau agagcaauga aggaaugcaa 180 c 181 <210> 548 <211> 154 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 548 gauaaagugg agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa 60 ggugggcugc uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga 120 aacaaauuca gugcuccucu ccaauucugc acaa 154 <210> 549 <211> 147 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 549 uggagaaccg cuucaccaaa agcugucccu uaggggauua gaacuugagu gaaggugggc 60 ugcuugcauc agccuaaugu cgagaagugc uuucuucgga aaguaacccu cgaaacaaau 120 ucagugcucc ucuccaauuc ugcacaa 147 <210> 550 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 550 uuuuauuuuu 10 <210> 551 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 551 uuuuauuuuu u 11 <210> 552 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 552 uuuuauuuuu uu 12 <210> 553 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 553 uuuuauuuuu uuu 13 <210> 554 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 554 uuuuauuuuu uuuu 14 <210> 555 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 555 uuuuauuuuu uuuuu 15 <210> 556 <211> 149 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 556 aguggagaac cgcuucacca aaagcugucc cuuaggggau uagaacuuga gugaaggugg 60 gcugcuugca ucagccuaau gucgagaagu gcuuucuucg gaaaguaacc cucgaaacaa 120 auucagugcu ccucuccaau ucugcacaa 149 <210> 557 <211> 148 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 557 guggagaacc gcuucaccaa aagcuguccc uuaggggauu agaacuugag ugaagguggg 60 cugcuugcau cagccuaaug ucgagaagug cuuucuucgg aaaguaaccc ucgaaacaaa 120 uucagugcuc cucuccaauu cugcacaa 148 <210> 558 <211> 146 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 558 ggagaaccgc uucaccaaaa gcugucccuu aggggauuag aacuugagug aaggugggcu 60 gcuugcauca gccuaauguc gagaagugcu uucuucggaa aguaacccuc gaaacaaauu 120 cagugcuccu cuccaauucu gcacaa 146 <210> 559 <211> 145 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 559 gagaaccgcu ucaccaaaag cugucccuua ggggauuaga acuugaguga aggugggcug 60 cuugcaucag ccuaaugucg agaagugcuu ucuucggaaa guaacccucg aaacaaauuc 120 agugcuccuc uccaauucug cacaa 145 <210> 560 <211> 144 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 560 agaaccgcuu caccaaaagc ugucccuuag gggauuagaa cuugagugaa ggugggcugc 60 uugcaucagc cuaaugucga gaagugcuuu cuucggaaag uaacccucga aacaaauuca 120 gugcuccucu ccaauucugc acaa 144 <210> 561 <211> 143 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 561 gaaccgcuuc accaaaagcu gucccuuagg ggauuagaac uugagugaag gugggcugcu 60 ugcaucagcc uaaugucgag aagugcuuuc uucggaaagu aacccucgaa acaaauucag 120 ugcuccucuc caauucugca caa 143 <210> 562 <211> 142 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 562 aaccgcuuca ccaaaagcug ucccuuaggg gauuagaacu ugagugaagg ugggcugcuu 60 gcaucagccu aaugucgaga agugcuuucu ucggaaagua acccucgaaa caaauucagu 120 gcuccucucc aauucugcac aa 142 <210> 563 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 563 ccgcuucacc aaaagcuguc ccuuagggga uuagaacuug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucuccaa uucugcacaa 140 <210> 564 <211> 182 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 564 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca agaaaguugc agaacccgaa uagagcaaug aaggaaugca 180 ac 182 <210> 565 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 565 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca gaaaccgaau agagcaauga aggaaugcaa c 161 <210> 566 <211> 157 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 566 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucga aagaauagag caaugaagga augcaac 157 <210> 567 <211> 145 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 567 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cugaaaagca augaaggaau gcaac 145 <210> 568 <211> 181 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 568 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaca gaaaguugca gaacccgaau agagcaauga aggaaugcaa 180 c 181 <210> 569 <211> 179 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 569 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcacg aaauugcaga acccgaauag agcaaugaag gaaugcaac 179 <210> 570 <211> 177 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 570 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcaga aaugcagaac ccgaauagag caaugaagga augcaac 177 <210> 571 <211> 175 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 571 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugcgaa agcagaaccc gaauagagca augaaggaau gcaac 175 <210> 572 <211> 173 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 572 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucuggaaa cagaacccga auagagcaau gaaggaaugc aac 173 <210> 573 <211> 171 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 573 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucugaaaa gaacccgaau agagcaauga aggaaugcaa c 171 <210> 574 <211> 169 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 574 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auucgaaaga acccgaauag agcaaugaag gaaugcaac 169 <210> 575 <211> 167 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 575 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca auugaaaaac ccgaauagag caaugaagga augcaac 167 <210> 576 <211> 165 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 576 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca augaaaaccc gaauagagca augaaggaau gcaac 165 <210> 577 <211> 163 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 577 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca agaaacccga auagagcaau gaaggaaugc aac 163 <210> 578 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 578 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucucca gaaaccgaau agagcaauga aggaaugcaa c 161 <210> 579 <211> 159 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 579 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucuccg aaacgaauag agcaaugaag gaaugcaac 159 <210> 580 <211> 155 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 580 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucugaa aaauagagca augaaggaau gcaac 155 <210> 581 <211> 153 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 581 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccucgaaa auagagcaau gaaggaaugc aac 153 <210> 582 <211> 151 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 582 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccugaaau agagcaauga aggaaugcaa c 151 <210> 583 <211> 149 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 583 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cuccgaaaag agcaaugaag gaaugcaac 149 <210> 584 <211> 147 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 584 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cucgaaagag caaugaagga augcaac 147 <210> 585 <211> 145 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence and U-rich tail sequence <400> 585 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucagug 120 cugaaaagca augaaggaau gcaac 145 <210> 586 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> wildtype gRNA <400> 586 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca ac 202 <210> 587 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 587 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucucgaa agaauagagc aaugaaggaa ugcaac 156 <210> 588 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 588 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucuccaa uucugcacaa 120 gaaaguugca gaacccgaau agagcaauga aggaaugcaa c 161 <210> 589 <211> 136 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA without guide sequence <400> 589 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc uccucucgaa agaauagagc 120 aaugaaggaa ugcaac 136 <210> 590 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 590 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc 120 nccucuccaa uucugcacaa 140 <210> 591 <211> 37 <212> RNA <213> Artificial Sequence <220> <223> repeat sequence of engineered crRNA <400> 591 guugcagaac ccgaauagng nnnugaagga augcaac 37 <210> 592 <211> 148 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 592 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn cnccucuc 148 <210> 593 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 593 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnc 120 nccucuc 127 <210> 594 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> repeat sequence of engineered crRNA <400> 594 gaauagngnn nugaaggaau gcaac 25 <210> 595 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 595 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucuccaa uucugcacaa 140 <210> 596 <211> 147 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 596 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucgugc uccucuc 147 <210> 597 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 597 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucagugc 120 uccucuc 127 <210> 598 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> repeat sequence of engineered crRNA <400> 598 gaauagagca augaaggaau gcaac 25 <210> 599 <211> 210 <212> RNA <213> Artificial Sequence <220> <223> engineered gRNA including hammerhead ribozyme nucleotide sequence without guide sequence <400> 599 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauug cuccucuccu gaugaguccg ugaggacgaa acgaguaagc 180 ucgucgaaua gagcaaugaa ggaaugcaac 210 <210> 600 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA including hammerhead ribozyme nucleotide sequence without guide sequence <400> 600 cugaugaguc cgugaggacg aaacgaguaa gcucgucgaa uagagcaaug aaggaaugca 60 ac 62 <210> 601 <211> 89 <212> DNA <213> Homo sapiens <400> 601 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccgg gcatggtggc 60 tcacgcctgt aatcccagca ctttgggaa 89 <210> 602 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 602 ttcctcagga gcacctgggg tgcttttaag aacacatacc catggtggct cacgcctgta 60 atcccagcac tttgggaa 78 <210> 603 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 603 ttcctcagga gcacctgggg tgcttttaag aacacatacc ccatggtggc tcacgcctgt 60 aatcccagca ctttgggaa 79 <210> 604 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 604 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgtaatcc cagcactttg 60 ggaa 64 <210> 605 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 605 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctatggtgg ctcacgcctg 60 taatcccagc actttgggaa 80 <210> 606 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 606 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgatggtg gctcacgcct 60 gtaatcccag cactttggga a 81 <210> 607 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 607 ttcctcagga gcacctgggg tgcttttaag aacacatacc atggtggctc acgcctgtaa 60 tcccagcact ttgggaa 77 <210> 608 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 608 ttcctcagga gcacctgggg tgcttttaag aacacatacg cctgtaatcc cagcactttg 60 ggaa 64 <210> 609 <211> 82 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 609 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctggatggt ggctcacgcc 60 tgtaatccca gcactttggg aa 82 <210> 610 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 610 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctggtggct cacgcctgta 60 atcccagcac tttgggaa 78 <210> 611 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 611 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctcacgcct gtaatcccag 60 cactttggga a 71 <210> 612 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 612 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctggctcac gcctgtaatc 60 ccagcacttt gggaa 75 <210> 613 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 613 ttcctcagga gcacctgtaa tcccagcact ttgggaa 37 <210> 614 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 614 ttcctcagga gcacctgggg tgcttttaag aacacatacc ctgtaatccc agcactttgg 60 gaa 63 <210> 615 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 615 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccgt ggtggctcac 60 gcctgtaatc ccagcacttt gggaa 85 <210> 616 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 616 ttcctcagga gcacctgggg tgcttttaag aacacatacc tgtaatccca gcactttggg 60 aa 62 <210> 617 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 617 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggcatg gtggctcacg 60 cctgtaatcc cagcactttg ggaa 84 <210> 618 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 618 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccga tggtggctca 60 cgcctgtaat cccagcactt tgggaa 86 <210> 619 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence modified by engineered CRISPR/Cas12f1 system <400> 619 ttcctcagga gcacctgggg tgcttttaag aacacatacc cctgggccca tggtggctca 60 cgcctgtaat cccagcactt tgggaa 86 <210> 620 <211> 20 <212> DNA <213> Homo sapiens <400> 620 ccttaataaa gtataacttc 20 <210> 621 <211> 20 <212> DNA <213> Homo sapiens <400> 621 aagaaggaat ggtagttgag 20 <210> 622 <211> 20 <212> DNA <213> Homo sapiens <400> 622 atttccaagt caaccttatg 20 <210> 623 <211> 20 <212> DNA <213> Homo sapiens <400> 623 caacagcctc accaggaaca 20 <210> 624 <211> 20 <212> DNA <213> Homo sapiens <400> 624 ggcaagggtc ttgatgcatc 20 <210> 625 <211> 20 <212> DNA <213> Homo sapiens <400> 625 ccctggctac ctcccctacc 20 <210> 626 <211> 20 <212> DNA <213> Homo sapiens <400> 626 gattcattct cagtgccatg 20 <210> 627 <211> 20 <212> DNA <213> Homo sapiens <400> 627 aggcaattgc aaccactgaa 20 <210> 628 <211> 20 <212> DNA <213> Homo sapiens <400> 628 tactttgtcc tccggttctg 20 <210> 629 <211> 20 <212> DNA <213> Homo sapiens <400> 629 ggttctctct atagccattg 20 <210> 630 <211> 20 <212> DNA <213> Homo sapiens <400> 630 actttagtga ctagccgcca 20 <210> 631 <211> 20 <212> DNA <213> Homo sapiens <400> 631 gtgggtaggt ccagtttggg 20 <210> 632 <211> 20 <212> DNA <213> Homo sapiens <400> 632 acaaagaaac cagcagtggc 20 <210> 633 <211> 20 <212> DNA <213> Homo sapiens <400> 633 cctggtggct gagaccaggg 20 <210> 634 <211> 20 <212> DNA <213> Homo sapiens <400> 634 cagagtcccg ggaacaagcc 20 <210> 635 <211> 20 <212> DNA <213> Homo sapiens <400> 635 ccaaagtgat gggccagcac 20 <210> 636 <211> 20 <212> DNA <213> Homo sapiens <400> 636 agagcagcga ttgtaaggag 20 <210> 637 <211> 20 <212> DNA <213> Homo sapiens <400> 637 gaaatatgac tggaagtaaa 20 <210> 638 <211> 20 <212> DNA <213> Homo sapiens <400> 638 cttccagtca tatttctaaa 20 <210> 639 <211> 20 <212> DNA <213> Homo sapiens <400> 639 cccttattac aatcctgtgg 20 <210> 640 <211> 20 <212> DNA <213> Homo sapiens <400> 640 cccccacagg attgtaataa 20 <210> 641 <211> 20 <212> DNA <213> Homo sapiens <400> 641 atctccataa caatctttgg 20 <210> 642 <211> 20 <212> DNA <213> Homo sapiens <400> 642 ctatccccat tttacagatg 20 <210> 643 <211> 20 <212> DNA <213> Homo sapiens <400> 643 ctgagatttg cgaagagtta 20 <210> 644 <211> 20 <212> DNA <213> Homo sapiens <400> 644 attaaataga gtcttttgaa 20 <210> 645 <211> 20 <212> DNA <213> Homo sapiens <400> 645 atattaattg caagtttggg 20 <210> 646 <211> 20 <212> DNA <213> Homo sapiens <400> 646 ggccaagtgc gaagtcagag 20 <210> 647 <211> 20 <212> DNA <213> Homo sapiens <400> 647 ggggtgaaca cccaagatcc 20 <210> 648 <211> 20 <212> DNA <213> Homo sapiens <400> 648 gggtgggctc ctggcagggc 20 <210> 649 <211> 20 <212> DNA <213> Homo sapiens <400> 649 agaagcatgc aaaaccggca 20 <210> 650 <211> 20 <212> DNA <213> Homo sapiens <400> 650 aagaggggag gttgactttg 20 <210> 651 <211> 20 <212> DNA <213> Homo sapiens <400> 651 gtcaaataaa gaaaaatacg 20 <210> 652 <211> 20 <212> DNA <213> Homo sapiens <400> 652 atgcatctca gtggttaaca 20 <210> 653 <211> 20 <212> DNA <213> Homo sapiens <400> 653 catacagggc tctgtaccca 20 <210> 654 <211> 20 <212> DNA <213> Homo sapiens <400> 654 caaagacact caccctgttg 20 <210> 655 <211> 20 <212> DNA <213> Homo sapiens <400> 655 agaacacata cccctgggcc 20 <210> 656 <211> 20 <212> DNA <213> Homo sapiens <400> 656 ataataaaag tatttcctca 20 <210> 657 <211> 20 <212> DNA <213> Homo sapiens <400> 657 agccgtggtc agtgagaggc 20 <210> 658 <211> 20 <212> DNA <213> Homo sapiens <400> 658 gagctcatta gcttggggag 20 <210> 659 <211> 20 <212> DNA <213> Homo sapiens <400> 659 gaaaataact aaacttccca 20 <210> 660 <211> 20 <212> DNA <213> Homo sapiens <400> 660 aattctttaa gtaatttaag 20 <210> 661 <211> 20 <212> DNA <213> Homo sapiens <400> 661 cttagtagtc tcagaaccaa 20 <210> 662 <211> 20 <212> DNA <213> Homo sapiens <400> 662 aaaggagcac aagtacaaac 20 <210> 663 <211> 20 <212> DNA <213> Homo sapiens <400> 663 aatgatgcag taatcgtgta 20 <210> 664 <211> 20 <212> DNA <213> Homo sapiens <400> 664 ataaaaggaa ctatttacaa 20 <210> 665 <211> 20 <212> DNA <213> Homo sapiens <400> 665 gagagaccgc tcaggctgga 20 <210> 666 <211> 20 <212> DNA <213> Homo sapiens <400> 666 attttgaagt gaccgtacga 20 <210> 667 <211> 20 <212> DNA <213> Homo sapiens <400> 667 ataatacact ctttacactg 20 <210> 668 <211> 20 <212> DNA <213> Homo sapiens <400> 668 aagagttatt gtcaatagaa 20 <210> 669 <211> 20 <212> DNA <213> Homo sapiens <400> 669 caaagaaatg tactgcctta 20 <210> 670 <211> 20 <212> DNA <213> Homo sapiens <400> 670 aaataaccgt cggtttctta 20 <210> 671 <211> 20 <212> DNA <213> Homo sapiens <400> 671 caaacaaaat aattggctca 20 <210> 672 <211> 20 <212> DNA <213> Homo sapiens <400> 672 gccatggtga aggtgaaatc 20 <210> 673 <211> 20 <212> DNA <213> Homo sapiens <400> 673 gcagtacacc tgagggaaca 20 <210> 674 <211> 20 <212> DNA <213> Homo sapiens <400> 674 aagaaagcta caggaaagca 20 <210> 675 <211> 20 <212> DNA <213> Homo sapiens <400> 675 ctttaaaatg aggtactagg 20 <210> 676 <211> 20 <212> DNA <213> Homo sapiens <400> 676 ccaaccaggt accctgtgcc 20 <210> 677 <211> 20 <212> DNA <213> Homo sapiens <400> 677 attgaaacat atacgtggta 20 <210> 678 <211> 20 <212> DNA <213> Homo sapiens <400> 678 ggaaagcgca gaaaagtaaa 20 <210> 679 <211> 20 <212> DNA <213> Homo sapiens <400> 679 agggaatgaa agtgaagatg 20 <210> 680 <211> 20 <212> DNA <213> Homo sapiens <400> 680 gatcaattta catcaaacta 20 <210> 681 <211> 20 <212> DNA <213> Homo sapiens <400> 681 atttcacagg actttgttaa 20 <210> 682 <211> 20 <212> DNA <213> Homo sapiens <400> 682 agacaagctg tcttccttca 20 <210> 683 <211> 20 <212> DNA <213> Homo sapiens <400> 683 atctgaagat cattgaaaca 20 <210> 684 <211> 20 <212> DNA <213> Homo sapiens <400> 684 gtctaataga aatatagtac 20 <210> 685 <211> 20 <212> DNA <213> Homo sapiens <400> 685 gagggagaca caagttgata 20 <210> 686 <211> 20 <212> DNA <213> Homo sapiens <400> 686 gtctcagtct tccttgtggg 20 <210> 687 <211> 20 <212> DNA <213> Homo sapiens <400> 687 ggggtagagg tactctacag 20 <210> 688 <211> 20 <212> DNA <213> Homo sapiens <400> 688 ggggtagagg tagtctacag 20 <210> 689 <211> 20 <212> DNA <213> Homo sapiens <400> 689 acaagttcag aatcacctta 20 <210> 690 <211> 20 <212> DNA <213> Homo sapiens <400> 690 gcattaaggc cagcgctggg 20 <210> 691 <211> 20 <212> DNA <213> Homo sapiens <400> 691 cacataggcc attcagaaac 20 <210> 692 <211> 20 <212> DNA <213> Homo sapiens <400> 692 gaaactgccc caaaaccggc 20 <210> 693 <211> 20 <212> DNA <213> Homo sapiens <400> 693 aggactatgt gtggccagtg 20 <210> 694 <211> 20 <212> DNA <213> Homo sapiens <400> 694 aacaaatcac tgactaacca 20 <210> 695 <211> 20 <212> DNA <213> Homo sapiens <400> 695 ataatgcctt ttaggtgata 20 <210> 696 <211> 20 <212> DNA <213> Homo sapiens <400> 696 attttcaaaa cagccctatg 20 <210> 697 <211> 20 <212> DNA <213> Homo sapiens <400> 697 cacaagggat ctgagacttg 20 <210> 698 <211> 20 <212> DNA <213> Homo sapiens <400> 698 actcatacat cacctcctcc 20 <210> 699 <211> 20 <212> DNA <213> Homo sapiens <400> 699 aaggaaaggc ttcctggagg 20 <210> 700 <211> 20 <212> DNA <213> Homo sapiens <400> 700 atataggatt tagaaaccaa 20 <210> 701 <211> 20 <212> DNA <213> Homo sapiens <400> 701 gctctaatgt aagtatatcc 20 <210> 702 <211> 20 <212> DNA <213> Homo sapiens <400> 702 gatccgatgc aattttggga 20 <210> 703 <211> 20 <212> DNA <213> Homo sapiens <400> 703 cctgaactcg ggactcgacc 20 <210> 704 <211> 20 <212> DNA <213> Homo sapiens <400> 704 gaacccagtg aaaaatacca 20 <210> 705 <211> 20 <212> DNA <213> Homo sapiens <400> 705 gtaggctgct gttggacaga 20 <210> 706 <211> 20 <212> DNA <213> Homo sapiens <400> 706 aataagtctt accacgtgtc 20 <210> 707 <211> 20 <212> DNA <213> Homo sapiens <400> 707 attcccacaa taaccctatg 20 <210> 708 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 708 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn vnccucucca auucugcaca a 161 <210> 709 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 709 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 710 <211> 148 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 710 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn vnccucuc 148 <210> 711 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 711 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 712 <211> 140 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 712 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv 120 nccucuccaa uucugcacaa 140 <210> 713 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 713 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 714 <211> 127 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 714 cuucacugau aaaguggaga accgcuucac caauuaguug agugaaggug ggcugcuugc 60 aucagccuaa ugucgagaag ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv 120 nccucuc 127 <210> 715 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 715 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 716 <211> 141 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 716 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 vnccucucca auucugcaca a 141 <210> 717 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 717 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 718 <211> 128 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 718 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 vnccucuc 128 <210> 719 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 719 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 720 <211> 161 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 720 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn vnccucucca auucugcaca a 161 <210> 721 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA without U-rich tail sequence <400> 721 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 722 <211> 148 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 722 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucannn vnccucuc 148 <210> 723 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA without U-rich tail sequence <400> 723 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 724 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 724 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuccaa uucugcacaa 120 120 <210> 725 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 725 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 726 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 726 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuc 107 <210> 727 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA <400> 727 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 728 <211> 141 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 728 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 vnccucucca auucugcaca a 141 <210> 729 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA without U-rich tail sequence <400> 729 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 730 <211> 128 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 730 accgcuucac caaaagcugu cccuuagggg auuagaacuu gagugaaggu gggcugcuug 60 caucagccua augucgagaa gugcuuucuu cggaaaguaa cccucgaaac aaauucannn 120 vnccucuc 128 <210> 731 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA without U-rich tail sequence <400> 731 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 732 <211> 120 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 732 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuccaa uucugcacaa 120 120 <210> 733 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA without U-rich sequence <400> 733 guugcagaac ccgaauagnb nnnugaagga augcaacnnn nnnnnnnnnn nnnnnnn 57 <210> 734 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 734 accgcuucac caauuaguug agugaaggug ggcugcuugc aucagccuaa ugucgagaag 60 ugcuuucuuc ggaaaguaac ccucgaaaca aauucannnv nccucuc 107 <210> 735 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> engineered crRNA without U-rich tail sequence <400> 735 gaauagnbnn nugaaggaau gcaacnnnnn nnnnnnnnnn nnnnn 45 <210> 736 <211> 148 <212> RNA <213> Artificial Sequence <220> <223> engineered tracrRNA <400> 736 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauug cuccucuc 148 <210> 737 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> a sequence comprising a protospacer and a site recognized by ApaI restriction enzyme <400> 737 gggcgaattg ggccctctag atgcatgctc gagcggccgc cagtgtgatg gatatctgca 60 gaattcgccc tttgcattta agaacacata cccctgggcc aggatgcatg catgcatgca 120 tg 122

Claims (25)

  1. CRISPR/Cas12f1(Cas14a1) 시스템을 위한 엔지니어링된 가이드 RNA로서,
    엔지니어링된 tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함하고,
    상기 엔지니어링된 tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형된 것이고, 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3'말단에서 5'말단 방향으로 순서대로 포함하고,
    상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열이고, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 V는 A, C 또는 G이며, 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
    상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 REC 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
    상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 WED 도메인, ZF 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
    상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열이고, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열이고,
    상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열이고, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열이며,
    상기 crRNA은 야생형 crRNA 또는 엔지니어링된 crRNA이며,
    상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고, 상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이며,
    상기 엔지니어링된 crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
    상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열이고, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 B는 U, C 또는 G이며, 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
    상기 제7 서열은 5'-AUGCAAC-3' 서열 또는 5'-AUGCAAC-3' 서열에 적어도 80% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열이고,
    상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열이고, 15 내지 30 nt(nucleotide) 서열인,
    엔지니어링된 가이드 RNA.
  2. 제1항에 있어서,
    상기 제1 서열은 5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 111) 서열 또는 SEQ ID NO: 111 서열의 일부 서열이고,
    상기 SEQ ID NO: 111 서열의 일부 서열은
    5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCACA-3' (SEQ ID NO: 273) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCAC-3' (SEQ ID NO: 274) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUUCUGCA-3' (SEQ ID NO: 275) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUUCUGC-3' (SEQ ID NO: 276) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUUCUG-3' (SEQ ID NO: 277) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUUCU-3' (SEQ ID NO: 278) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUUC-3' (SEQ ID NO: 279) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAUU-3' (SEQ ID NO: 280) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAAU-3' (SEQ ID NO: 281) 서열,
    5'-CAAAUUCANNNCNCCUCUCCAA-3' (SEQ ID NO: 282) 서열,
    5'-CAAAUUCANNNCNCCUCUCCA-3' (SEQ ID NO: 283) 서열,
    5'-CAAAUUCANNNCNCCUCUCC-3' (SEQ ID NO: 284) 서열,
    5'-CAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 285) 서열,
    5'-CAAAUUCANNNCNCCUCU-3' (SEQ ID NO: 286) 서열,
    5'-CAAAUUCANNNCNCCUC-3' (SEQ ID NO: 287) 서열,
    5'-CAAAUUCANNNCNCCU-3' (SEQ ID NO: 288) 서열,
    5'-CAAAUUCANNNCNCC-3' (SEQ ID NO: 289) 서열,
    5'-CAAAUUCANNNCNC-3' (SEQ ID NO: 290) 서열, 또는
    5'-CAAAUUCANNNCN-3' (SEQ ID NO: 272) 서열이며,
    상기 각각의 N은 독립적으로 A, C, G 또는 U인,
    엔지니어링된 가이드 RNA.
  3. 제1항에 있어서,
    상기 SEQ ID NO: 213 서열의 일부 서열은
    5'-CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 214) 서열,
    5'-CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 215) 서열,
    5'-CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 216) 서열,
    5'-CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 217) 서열,
    5'-CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 231) 서열,
    5'-CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 232) 서열,
    5'-CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 233) 서열,
    5'-CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 234) 서열,
    5'-CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG-3' (SEQ ID NO: 235) 서열,
    5'-CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG-3' (SEQ ID NO: 236) 서열,
    5'-CCGCUUCACCAAUUAGUUGAGUGAAGGUG-3' (SEQ ID NO: 237) 서열,
    5'-CCGCUUCACCAUUAGUGAGUGAAGGUG-3' (SEQ ID NO: 238) 서열,
    5'-CCGCUUCACCUUAGGAGUGAAGGUG-3' (SEQ ID NO:239) 서열,
    5'-CCGCUUCACUUAGAGUGAAGGUG-3' (SEQ ID NO: 240) 서열,
    5'-CCGCUUCACUUAGGUGAAGGUG-3' (SEQ ID NO: 241) 서열,
    5'-CCGCUUCAUUAGUGAAGGUG-3' (SEQ ID NO: 242) 서열,
    5'-CCGCUUCUUAGGAAGGUG-3' (SEQ ID NO: 243) 서열,
    5'-CCGCUUUUAGAAGGUG-3' (SEQ ID NO: 244) 서열,
    5'-CCGCUUUAGAGGUG-3' (SEQ ID NO: 245) 서열,
    5'-CCGCUUAGGGUG-3' (SEQ ID NO: 246) 서열,
    5'-CCGUUAGGUG-3' (SEQ ID NO: 247) 서열,
    5'-CCUUAGGUG-3' 서열,
    5'-CUUAGUG-3' 서열,
    5'-CUUAGG-3' 서열, 또는
    5'-UUAG-3' 서열이고,
    상기 SEQ ID NO: 213 서열의 일부 서열 내에 포함된 5'-UUAG-3' 서열은 선택적으로 5'-GAAA-3' 서열로 치환되는,
    엔지니어링된 가이드 RNA.
  4. 제1항에 있어서,
    상기 SEQ ID NO: 248 서열의 일부 서열은 5'-A-3' 서열, 5'-AA-3' 서열, 5'-GAA-3' 서열, 5'-AGAA-3' 서열, 5'-GAGAA-3' 서열, 5'-GGAGAA-3' 서열, 5'-UGGAGAA-3' 서열, 5'-GUGGAGAA-3' 서열, 5'-AGUGGAGAA-3' 서열, 5'-AAGUGGAGAA-3' (SEQ ID NO: 249) 서열, 5'-AAAGUGGAGAA-3' (SEQ ID NO: 250) 서열, 5'-UAAAGUGGAGAA-3' (SEQ ID NO: 251) 서열, 5'-AUAAAGUGGAGAA-3' (SEQ ID NO: 252) 서열, 5'-GAUAAAGUGGAGAA-3' (SEQ ID NO: 253) 서열, 5'-UGAUAAAGUGGAGAA-3' (SEQ ID NO: 254) 서열, 5'-CUGAUAAAGUGGAGAA-3' (SEQ ID NO: 255) 서열, 5'-ACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 256) 서열, 5'-CACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 257) 서열, 5'-UCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 258) 서열 또는 5'-UUCACUGAUAAAGUGGAGAA-3' (SEQ ID NO: 259) 서열인,
    엔지니어링된 가이드 RNA.
  5. 제1항에 있어서,
    상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 408) 서열 또는 SEQ ID NO: 408 서열의 일부 서열이고,
    이때, 상기 SEQ ID NO: 408 서열의 일부 서열은
    5'-UUGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 413) 서열,
    5'-UGCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 414) 서열,
    5'-GCAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 415) 서열,
    5'-CAGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 416) 서열,
    5'-AGAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 417) 서열,
    5'-GAACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 418) 서열,
    5'-AACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 419) 서열,
    5'-ACCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 420) 서열,
    5'-CCCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 421) 서열,
    5'-CCGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 422) 서열,
    5'-CGAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 423) 서열,
    5'-GAAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 424) 서열,
    5'-AAUAGNGNNNUGAAGGA-3' (SEQ ID NO: 425) 서열,
    5'-AUAGNGNNNUGAAGGA-3' (SEQ ID NO: 426) 서열,
    5'-UAGNGNNNUGAAGGA-3' (SEQ ID NO: 427) 서열,
    5'-AGNGNNNUGAAGGA-3' (SEQ ID NO: 428) 서열, 또는
    5'-NGNNNUGAAGGA-3' (SEQ ID NO: 412) 서열이며,
    상기 각각의 N은 독립적으로 A, C, G 또는 U인,
    엔지니어링된 가이드 RNA.
  6. 제1항에 있어서,
    상기 crRNA는 U-rich tail 서열을 추가로 더 포함하고,
    상기 U-rich tail 서열은 상기 crRNA의 3'말단에 위치하는,
    엔지니어링된 가이드 RNA.
  7. 제6항에 있어서,
    상기 U-rich tail 서열은 5'-(UaN)dUe-3' 서열, 5'-UaVUaVUe-3' 서열 또는 5'-UaVUaVUaVUe-3' 서열이며,
    상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 독립적으로 A, C 또는 G이며, 상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 0 내지 10의 정수인,
    엔지니어링된 가이드 RNA.
  8. 제1항에 있어서,
    상기 엔지니어링된 가이드 RNA는 듀얼 가이드 RNA 또는 싱글 가이드 RNA이고,
    상기 엔지니어링된 가이드 RNA가 싱글 가이드 RNA일 때, 상기 엔지니어링된 가이드 RNA는 링커 서열을 더 포함하며, 상기 링커 서열은 상기 엔지니어링된 tracrRNA와 상기 crRNA 사이에 위치하는,
    엔지니어링된 가이드 RNA.
  9. 제1항에 있어서,
    상기 엔지니어링된 tracrRNA는 5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 269) 서열,
    5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 304) 서열,
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 590) 서열,
    5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 301) 서열,
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 592) 서열,
    5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 305) 서열,
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 593) 서열, 또는
    5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCANNNCNCCUCUC-3' (SEQ ID NO: 300) 서열을 포함하며,
    상기 각각의 N은 독립적으로 A, C, G 또는 U인,
    엔지니어링된 가이드 RNA.
  10. 제9항에 있어서,
    상기 엔지니어링된 crRNA는 5'-GUUGCAGAACCCGAAUAGNGNNNUGAAGGAAUGCAAC-3' (SEQ ID NO: 591) 서열 및 가이드 서열을 포함하거나, 또는 5'-GAAUAGNGNNNUGAAGGAAUGCAAC-3' (SEQ ID NO: 594) 서열 및 가이드 서열을 포함하며,
    상기 각각의 N은 독립적으로 A, C, G 또는 U인,
    엔지니어링된 가이드 RNA.
  11. 제2항에 있어서,
    상기 제1 서열 내에 존재하는 5'-NNNCN-3' 서열이 5'-UUUCU-3' 서열, 5'-GUUCU-3' 서열, 5'-UCUCU-3' 서열, 5'-UUGCU-3' 서열, 5'-UUUCC-3' 서열, 5'-GCUCU-3' 서열, 5'-GUUCC-3' 서열, 5'-UCGCU-3' 서열, 5'-UCUCC-3' 서열, 5'-UUGCC-3' 서열, 5'-GCGCU-3' 서열, 5'-GCUCC-3' 서열, 5'-GUGCC-3' 서열, 5'-UCGCC-3' 서열, 5'-GCGCC-3' 서열 또는 5'-GUGCU-3' 서열인,
    엔지니어링된 가이드 RNA.
  12. 제5항에 있어서,
    상기 제6 서열 내에 존재하는 5'-NGNNN-3' 서열이 5'-AGGAA-3' 서열, 5'-AGCAA-3' 서열, 5'-AGAAA-3' 서열, 5'-AGCAU-3' 서열, 5'-AGCAG-3' 서열, 5'-AGCAC-3' 서열, 5'-AGCUA-3' 서열, 5'-AGCGA-3' 서열, 5'-AGCCA-3' 서열, 5'-UGCAA-3' 서열, 5'-UGCUA-3' 서열, 5'-UGCGA-3' 서열, 5'-UGCCA-3' 서열, 5'-GGCAA-3' 서열, 5'-GGCUA-3' 서열, 5'-GGCGA-3' 서열, 5'-GGCCA-3' 서열, 5'-CGCAA-3' 서열, 5'-CGCUA-3' 서열, 5'-CGCGA-3' 서열 또는 5'-CGCCA-3' 서열인,
    엔지니어링된 가이드 RNA.
  13. 제11항에 있어서,
    상기 엔지니어링된 tracrRNA는
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 270) 서열,
    5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 308) 서열,
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 595) 서열,
    5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 306) 서열,
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCGUGCUCCUCUC-3' (SEQ ID NO: 596) 서열,
    5'-ACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 309) 서열,
    5'-CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 597) 서열, 또는
    5'-ACCGCUUCACCAAUUAGUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAGUGCUCCUCUC-3' (SEQ ID NO: 307) 서열을 포함하는,
    엔지니어링된 가이드 RNA.
  14. 제13항에 있어서,
    상기 엔지니어링된 crRNA는 5'-GUUGCAGAACCCGAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 539) 서열 및 가이드 서열을 포함하거나, 또는 5'-GAAUAGAGCAAUGAAGGAAUGCAAC-3' (SEQ ID NO: 598) 서열 및 가이드 서열을 포함하는,
    엔지니어링된 가이드 RNA.
  15. CRISPR/Cas12f1(Cas14a1) 시스템을 위한, 엔지니어링된 가이드 RNA를 암호화하는 핵산을 포함하는 벡터로서,
    상기 엔지니어링된 가이드 RNA는 엔지니어링된 tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함하고,
    상기 엔지니어링된 tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5 서열을 3'말단에서 5'말단 방향으로 순서대로 포함하고,
    상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 V는 A, C 또는 G이며, 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
    상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 REC 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
    상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 WED 도메인, ZF 도메인 또는 RuvC 도메인과 상호작용하는 서열이고
    상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열이며, 이때, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열이고,
    상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열로, 이때, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열이며,
    상기 crRNA은 야생형 crRNA 또는 엔지니어링된 crRNA이며,
    상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
    상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이며,
    상기 엔지니어링된 crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
    이때, 상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 B는 U, C 또는 G이며, 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이며,
    이때, 상기 제7 서열은 5'-AUGCAAC-3' 서열 또는 5'-AUGCAAC-3' 서열에 적어도 80% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열이고,
    상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열이고, 15 내지 30 nt(nucleotide) 서열인,
    벡터.
  16. 제15항에 있어서,
    상기 벡터는 상기 엔지니어링된 가이드 RNA를 암호화하는 핵산을 위한 프로모터를 더 포함하는, 벡터.
  17. 제16항에 있어서,
    상기 프로모터는 U6 프로모터, H1 프로모터 또는 7SK 프로모터인, 벡터.
  18. 제15항에 있어서,
    상기 벡터는 플라스미드, PCR 엠플리콘 또는 바이러스 벡터인, 벡터.
  19. 엔지니어링된 CRISPR/Cas12f1(Cas14a1) 시스템을 포함하는 조성물로서,
    상기 엔지니어링된 CRISPR/Cas12f1(Cas14a1) 시스템은 엔지니어링된 가이드 RNA 또는 이를 암호화하는 핵산; 및 Cas12f1(Cas14a1)단백질 또는 이를 암호화하는 핵산을 포함하며,
    상기 엔지니어링된 가이드 RNA는 엔지니어링된 tracrRNA(trans-activating crispr RNA) 및 crRNA(crispr RNA)를 포함하고,
    상기 엔지니어링된 tracrRNA는 연속된 다섯 개 이상의 유리딘 서열을 포함하지 않도록 변형되고, 제1 서열, 제2 서열, 제3 서열, 제4 서열 및 제5서열을 3'말단에서 5'말단 방향으로 순서대로 포함하고,
    상기 제1 서열은 5'-CAAAUUCANNNVNCCUCUCCAAUUCUGCACAA-3' (SEQ ID NO: 194) 서열 또는 SEQ ID NO: 194 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 V는 A, C 또는 G이며, 상기 SEQ ID NO: 194 서열의 일부 서열은 상기 SEQ ID NO: 194 서열 중 5'-CAAAUUCANNNVN-3' (SEQ ID NO: 193) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이고,
    상기 제2 서열은 5'-AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA-3'(SEQ ID NO: 211) 서열 또는 SEQ ID NO: 211 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 REC 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
    상기 제3 서열은 5'-GGCUGCUUGCAUCAGCCUA-3'(SEQ ID NO: 212) 서열 또는 SEQ ID NO: 212 서열에 적어도 90% 이상의 서열 동일성 또는 서열 유사성을 가지고, Cas12f1 단백질의 WED 도메인, ZF 도메인 또는 RuvC 도메인과 상호작용하는 서열이고,
    상기 제4 서열은 5'-CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG-3' (SEQ ID NO: 213) 서열 또는 SEQ ID NO: 213 서열의 일부 서열이며, 상기 SEQ ID NO: 213 서열의 일부 서열은 SEQ ID NO: 213 서열에서 상보적 결합을 형성하는 적어도 한 쌍 이상의 뉴클레오타이드 및/또는 상보적 결합을 형성하지 않는 적어도 하나 이상의 뉴클레오타이드가 삭제된 서열이고,
    상기 제5 서열은 5'-CUUCACUGAUAAAGUGGAGAA-3'(SEQ ID NO: 248) 서열 또는 SEQ ID NO: 248 서열의 일부 서열이고, 상기 SEQ ID NO: 248 서열의 일부 서열은 SEQ ID NO: 248 서열의 3' 말단부에서 순차적인 일부 서열이며,
    상기 crRNA은 야생형 crRNA 또는 엔지니어링된 crRNA이며,
    상기 야생형 crRNA는 야생형 반복 서열(repeat sequence) 및 가이드 서열(guide sequence)을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
    상기 야생형 반복 서열은 5'-GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC-3'(SEQ ID NO: 312) 서열이며,
    상기 엔지니어링된 crRNA는 제6 서열, 제7 서열 및 가이드 서열을 5' 말단에서 3' 말단 방향으로 순서대로 포함하고,
    상기 제6 서열은 5'-GUUGCAGAACCCGAAUAGNBNNNUGAAGGA-3' (SEQ ID NO: 373) 서열 또는 SEQ ID NO: 373 서열의 일부 서열이며, 상기 각각의 N은 독립적으로 A, C, G 또는 U이고, 상기 B는 U, C 또는 G이며, 상기 SEQ ID NO: 373 서열의 일부 서열은 상기 SEQ ID NO: 373 서열 중 5'-NBNNNUGAAGGA-3' (SEQ ID NO: 372) 서열을 포함하면서 3' 말단부의 일부 서열이 포함하지 않는 서열이며,
    상기 제7 서열은 5'-AUGCAAC-3' 서열 또는 5'-AUGCAAC-3' 서열에 적어도 80% 이상의 서열 동일성 또는 서열 유사성을 가지는 서열이고,
    상기 가이드 서열은 표적 서열과 혼성화(hybridizing)할 수 있는 서열 또는 표적 서열과 상보적인 결합을 형성하는 서열로, 15 내지 30 nt(nucleotide) 서열인,
    조성물.
  20. 제19항에 있어서,
    상기 조성물은 상기 엔지니어링된 가이드 RNA를 암호화하는 핵산 및 Cas12f1(Cas14a1)단백질을 암호화하는 핵산을 하나의 벡터에 포함하는, 조성물.
  21. 제20항에 있어서,
    상기 벡터는 상기 엔지니어링된 가이드 RNA를 암호화하는 핵산을 위한 프로모터 및 상기 Cas12f1(Cas14a1)단백질을 암호화하는 핵산을 위한 프로모터를 더 포함하는, 조성물.
  22. 제21항에 있어서,
    상기 프로모터는 U6 프로모터, H1 프로모터, 7SK 프로모터, CMV 프로모터, LTR 프로모터, Ad MLP 프로모터, HSV 프로모터, SV40 프로모터, CBA 프로모터 또는 RSV 프로모터인, 조성물.
  23. 제20항에 있어서,
    상기 벡터는 플라스미드, mRNA(전사물), PCR 엠플리콘 또는 바이러스 벡터인, 조성물.
  24. 제19항에 있어서,
    상기 조성물은 핵산 및 단백질 혼합 형태로, 엔지니어링된 가이드 RNA 및 Cas14a1 단백질이 결합된 엔지니어링된 CRISPR/Cas14a1 복합체 형태로 포함하는, 조성물.
  25. 제1항 내지 제14항 중 어느 한 항의 엔지니어링된 가이드 RNA를 암호화하는 핵산.
KR1020210044152A 2020-10-08 2021-04-05 CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 KR102638799B1 (ko)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN202180082971.3A CN116568806A (zh) 2020-10-08 2021-10-08 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途
US18/030,575 US20230416784A1 (en) 2020-10-08 2021-10-08 Engineered guide rna for optimized crispr/cas12f1 (cas14a1) system and use thereof
CA3198435A CA3198435A1 (en) 2020-10-08 2021-10-08 Engineered guide rna for optimized crispr/cas12f1 (cas14a1) system and use thereof
AU2021358805A AU2021358805A1 (en) 2020-10-08 2021-10-08 Engineered guide RNA for optimized CRISPR/Cas12f1 (Cas14a1) system and use thereof
JP2023521490A JP2023544826A (ja) 2020-10-08 2021-10-08 CRISPR/Cas12f1(Cas14a1)システム効率化のためのエンジニアリングされたガイドRNAおよびその用途
PCT/KR2021/013933 WO2022075816A1 (ko) 2020-10-08 2021-10-08 Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
EP21878066.6A EP4227412A1 (en) 2020-10-08 2021-10-08 Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof
KR1020240019104A KR20240023081A (ko) 2020-10-08 2024-02-07 CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020200129937 2020-10-08
KR20200129937 2020-10-08
KR1020200185528 2020-12-29
KR20200185528 2020-12-29

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020240019104A Division KR20240023081A (ko) 2020-10-08 2024-02-07 CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도

Publications (2)

Publication Number Publication Date
KR20220047502A KR20220047502A (ko) 2022-04-18
KR102638799B1 true KR102638799B1 (ko) 2024-02-22

Family

ID=81390843

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210044152A KR102638799B1 (ko) 2020-10-08 2021-04-05 CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
KR1020210065125A KR20220047503A (ko) 2020-10-08 2021-05-20 CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위한, cas12f1의 페어드 가이드 RNA(paired gRNA) 설계 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020210065125A KR20220047503A (ko) 2020-10-08 2021-05-20 CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위한, cas12f1의 페어드 가이드 RNA(paired gRNA) 설계 방법

Country Status (1)

Country Link
KR (2) KR102638799B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116622810A (zh) * 2023-01-10 2023-08-22 南华大学 一种新型的工程化CRISPR-Cas14a1检测系统、方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200172886A1 (en) 2017-11-01 2020-06-04 The Regents Of The University Of California Casz compositions and methods of use
US20200190494A1 (en) 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
CN111363763A (zh) 2020-03-31 2020-07-03 海南大学 一种RNA激活Cas14a酶附带切割效应的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200172886A1 (en) 2017-11-01 2020-06-04 The Regents Of The University Of California Casz compositions and methods of use
US20200190494A1 (en) 2018-12-14 2020-06-18 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
CN111363763A (zh) 2020-03-31 2020-07-03 海南大学 一种RNA激活Cas14a酶附带切割效应的方法

Also Published As

Publication number Publication date
KR20220047502A (ko) 2022-04-18
KR20220047503A (ko) 2022-04-18

Similar Documents

Publication Publication Date Title
US11560555B2 (en) Engineered proteins
US20220307018A1 (en) ENGINEERED GUIDE RNA FOR THE OPTIMIZED CRISPR/Cas12f1 SYSTEM AND USE THEREOF
Montiel-Gonzalez et al. Current strategies for site-directed RNA editing using ADARs
CN110612353A (zh) 经由抑制性tRNAs和脱氨酶对突变进行RNA靶向
CN107922949A (zh) 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法
GB2617658A (en) Class II, type V CRISPR systems
CN109415729A (zh) 具有降低毒性的基因编辑试剂
KR20240023081A (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
WO2018172798A1 (en) Argonaute system
CN116438313A (zh) 用于真核生物基因组工程的合成微型crispr-cas(casmini)系统
KR20220144343A (ko) CRISPR/Cas12f1 시스템 효율화를 위한 U-rich tail을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도
KR102638799B1 (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
JP2023544817A (ja) CRISPR/Cas12f1システム効率化のためのエンジニアリングされたガイドRNAおよびその用途
KR20230121569A (ko) 상동지정복구를 위한 TaRGET 시스템 및 이를 이용한 유전자 편집 방법
CN114144519A (zh) 单碱基置换蛋白以及包含其的组合物
KR20230051095A (ko) 유전자 편집을 위한 TaRGET 시스템 및 이의 용도
US20230374500A1 (en) Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof
KR20230007218A (ko) 초소형 염기교정 시스템 및 이의 용도
CA3219187A1 (en) Class ii, type v crispr systems
CN116568806A (zh) 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途
KR20230142365A (ko) 어셔 증후군 치료를 위한 유전자 편집 시스템
KR20230134097A (ko) Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법
KR20220145438A (ko) CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
KR20240034661A (ko) 캄필로박터 제주니 유래 Cas9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템
KR20230166041A (ko) 확장된 표적 범위를 갖는 엔지니어링된 Cas12f 단백질 및 이의 용도

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right