KR20210053228A - CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 - Google Patents

CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 Download PDF

Info

Publication number
KR20210053228A
KR20210053228A KR1020200142308A KR20200142308A KR20210053228A KR 20210053228 A KR20210053228 A KR 20210053228A KR 1020200142308 A KR1020200142308 A KR 1020200142308A KR 20200142308 A KR20200142308 A KR 20200142308A KR 20210053228 A KR20210053228 A KR 20210053228A
Authority
KR
South Korea
Prior art keywords
sequence
cas12f1
crispr
engineered
guide rna
Prior art date
Application number
KR1020200142308A
Other languages
English (en)
Other versions
KR102455623B1 (ko
Inventor
김용삼
김도연
고정헌
Original Assignee
주식회사 진코어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 진코어 filed Critical 주식회사 진코어
Publication of KR20210053228A publication Critical patent/KR20210053228A/ko
Priority to KR1020220129329A priority Critical patent/KR20220141777A/ko
Application granted granted Critical
Publication of KR102455623B1 publication Critical patent/KR102455623B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/33Chemical structure of the base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 명세서에서는 CRISPR/Cas12f1 시스템의 편집 효율을 향상시킨 엔지니어링 된 CRISPR/Cas12f1 시스템 및 그 용도를 제공한다. 구체적으로, 본 명세서에서는 CRISPR/Cas12f1 시스템의 편집 효율을 향상시키기 위한 엔지니어링 된 가이드 RNA에 도입할 수 있는 U-rich tail 서열을 제공한다. 상기 U-rich tail 서열은 기본적으로 유리딘을 풍부하게 포함하고 있는 것을 특징으로 하며, 상기 가이드 RNA의 실제 사용 환경 및 발현 환경에 따라 유리딘 외 추가적인 핵산을 더 포함할 수 있다. 본 발명자들은 U-rich tail 서열의 구조, 도입 위치, 및 그 효과에 대해 실험적으로 자세히 밝혀 명세서에 개시하였다.

Description

CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도{An engineered guide RNA for the optimized CRISPR/Cas12f1 system and use thereof}
본 명세서에서는 CRISPR/Cas 시스템, 특히 CRISPR/Cas12f1 시스템을 유전자 편집에 사용하는 분야에 대한 기술을 개시한다.
CRISPR/Cas12f1 시스템은 Class 2, Type V로 분류되는 CRISPR/Cas 시스템이다. 선행연구(Harington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 최초로 고균 유래의 CRISPR/Cas 시스템인 CRISPR/Cas14 시스템에 대해 밝혀졌다. 그 후 후속 연구(Karvelis et al., Nucleic Acids Research, Vol. 48, No. 9 5017 (2020))에서 상기 CRISPR/Cas14 시스템을 CRISPR/Cas12f 시스템으로 분류하였다. CRISPR/Cas12f1 시스템은 상기 Class 2, Type V로 분류되는 CRISPR/Cas 시스템 중 하나의 Subtype인 V-F1 시스템에 속하며, 이는 Cas14a를 이펙터 단백질로 가지는 CRISPR/Cas14a 시스템을 포함한다. 상기 CRISPR/Cas12f1 시스템은 CRISPR/Cas9 시스템에 비하여 이펙터 단백질의 크기가 현저히 작다는 특징이 있다. 다만, 선행 연구(Harington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018), US 2020/0190494 A1)에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템, 특히 CRISPR/Cas14a 시스템은 단일가닥 DNA의 절단 능력은 보이나, 이중가닥 DNA에 대해서는 절단 활성이 없거나, 극히 낮아 유전자 편집 기술에 응용하는 데 한계가 있었다.
본 명세서에서는 유전자 편집 효율이 증가된 엔지니어링 된 CRISPR/Cas12f1 시스템을 제공하고자 한다.
본 명세서에서는 유리딘(U)-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas12f1 시스템을 제공하고자 한다.
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 시스템을 위한 U-rich tail 서열을 가지는 엔지니어링 된 crRNA를 제공하고자 한다.
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 시스템을 위한 U-rich tail 서열을 가지는 엔지니어링 된 가이드 RNA를 제공하고자 한다.
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 시스템을 위한 U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공하고자 한다.
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 시스템의 각 구성요소를 암호화하는 핵산 서열을 가지는 벡터를 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas12f1 시스템을 사용한 유전자 편집 방법을 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas12f1 시스템의 용도를 제공하고자 한다.
일 실시예로, 본 명세서에서는 다음 서열을 가지는, 표적 서열을 포함하는 핵산을 편집할 수 있는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 CRISPR RNA(crRNA)를 제공한다:
CRISPR RNA 반복 서열;
상기 표적 서열에 상보적인 스페이서 서열; 및
상기 스페이서 서열의 3'말단에 연결된 U-rich tail 서열,
이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1에서 4까지의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1에서 10 까지의 한 정수이고,
이때, 상기 엔지니어링 된 crRNA의 서열은 그 5'말단에서 3'말단 순서로, 상기 CRISPR RNA 반복 서열, 상기 스페이서 서열, 및 상기 U-rich tail 서열이 순차적으로 연결됨.
일 실시예로, 본 명세서에서는 상기 엔지니어링 된 crRNA를 암호화하는 서열을 가지는 DNA를 제공한다.
일 실시예로, 상기 U-rich tail 서열은 UUUUUU, UUUUAUUUUUU, 또는 UUUUGUUUUUU일 수 있다.
일 실시예로, 상기 CRISPR RNA 반복 서열은 서열번호 58의 서열일 수 있다.
일 실시예로, 본 명세서에서는 다음 서열을 가지는, 표적 서열을 포함하는 핵산을 편집할 수 있는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA를 제공한다:
tracrRNA 서열;
CRISPR RNA 반복 서열, 및 상기 표적 서열과 상보적인 스페이서 서열을 포함하는 crRNA서열; 및
CRISPR RNA 서열의 3' 말단에 연결된 U-rich tail 서열,
이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
일 실시예로, 상기 엔지니어링 된 가이드 RNA의 서열은 링커 서열을 추가적으로 더 포함하고, 상기 tracrRNA 서열 및 crRNA 서열은 링커 서열을 통해 연결될 수 있다.
일 실시예로, 상기 링커 서열은 5'-gaaa-3' 일 수 있다.
일 실시예로, 상기 U-rich tail 서열은 UUUUUU, UUUUAUUUUUU, 또는 UUUUGUUUUUU일 수 있다.
일 실시예로, 본 명세서는 상기 엔지니어링 된 가이드 RNA를 암호화하는 서열을 가지는 DNA를 제공한다.
일 실시예로, 본 명세서에서는 다음을 포함하는, 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공한다:
Cas14 패밀리에 속하는 Cas12f1 단백질; 및
상기 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 U-rich tail 서열을 가지는 엔지니어링 된 가이드 RNA,
이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
일 실시예로, 본 명세서에서는 다음 서열을 가지는, 세포 내에서 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체를 발현하는 벡터를 제공한다:
Cas12f1 단백질을 암호화하는 서열을 포함하는 제1 서열;
상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 제2 서열,
이때, 상기 엔지니어링 된 가이드 RNA는 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 상기 스페이서 서열의 3' 말단에 연결된 U-rich tail 서열을 가지며,
이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수인 것; 및
상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열,
이때, 상기 벡터는 세포 내에서 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 발현하도록 구성되며,
이로 인해 세포 내에서 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA가 CRISPR/Cas12f1 복합체를 형성할 수 있고,
이로 인해 상기 표적 서열을 포함하는 핵산이 상기 CRISPR/Cas12f1 복합체에 의해 편집될 수 있음.
일 실시예로, 상기 제2 프로모터 서열은 U6 프로모터 서열일 수 있다.
일 실시예로, 상기 벡터는 플라스미드 벡터인 것을 특징으로 할 수 있다.
일 실시예로, 상기 벡터는 바이러스 벡터인 것을 특징으로 할 수 있다.
일 실시예로, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 할 수 있다.
일 실시예로, 상기 벡터는 선형의 PCR 앰플리콘인 것을 특징으로 할 수 있다.
본 명세서에서는 다음 서열을 가지는, 세포 내에서 제1 표적 서열 및 제2 표적 서열을 가지는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 시스템을 발현하는 벡터를 제공한다:
Cas12f1 단백질을 암호화하는 서열을 포함하는 제1 서열;
상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
제1 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 제2 서열,
이때, 상기 제1 엔지니어링 된 가이드 RNA는 상기 Cas12f1 단백질과 상호작용할 수 있는 제1 스캐폴드 서열, 상기 제1 표적 서열과 상보적인 제1 스페이서 서열, 및 제1 U-rich tail 서열을 가지며,
이때, 상기 제1 U-rich tail 서열은 (UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임;
상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열;
제2 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 제3 서열,
이때, 상기 제2 엔지니어링 된 가이드 RNA는 상기 Cas12f1 단백질과 상호작용할 수 있는 제2 스캐폴드 서열, 상기 제2 표적 서열과 상보적인 제2 스페이서 서열, 및 제2 U-rich tail 서열을 가지며,
이때, 상기 제2 U-rich tail 서열은 (UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임; 및
상기 제3 서열과 작동 가능하게 연결된 제3 프로모터 서열.
일 실시예로, 상기 제2 프로모터 서열 및 상기 제3 프로모터 서열은 동일한 프로모터 서열인 것을 특징으로 할 수 있다.
일 실시예로, 상기 제2 프로모터 서열은 H1 프로모터이고, 상기 제3 프로모터 서열은 U6 프로모터인 것을 특징으로 할 수 있다.
일 실시예로, 본 명세서에서는 다음을 포함하는, 세포 내에서 표적 서열을 포함하는 핵산을 편집하는 방법을 제공한다:
Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것,
이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
이로 인해 상기 표적 서열을 포함하는 핵산이 CRISPR/Cas12f1 복합체에 의해 편집될 수 있고,
이때, 상기 엔지니어링 된 가이드 RNA는 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 상기 스페이서 서열의 3'말단에 연결된 U-rich tail 서열을 가지며,
이때, 상기 U-rich tail 서열은(UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
일 실시예로, 상기 전달은 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 CRISPR/Cas12f1 복합체로써 세포 내에 주입하는 것일 수 있다.
일 실시예로, 상기 전달은 상기 Cas12f1 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 벡터를 세포 내에 주입하는 것일 수 있다.
일 실시예로, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택될 수 있다.
일 실시예로, 본 명세서에서는 다음을 포함하는, 세포 내에서 표적 서열을 포함하는 핵산을 편집하는 방법을 제공한다:
CRISPR/Cas12f1 복합체 상기 표적 서열을 포함하는 핵산에 접촉시키는 것,
이때, 상기 CRISPR/Cas12f1 복합체는 Cas12f1 단백질, 및 엔지니어링 된 가이드 RNA를 포함하고,
이때, 상기 엔지니어링 된 가이드 RNA는 상기 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 U-rich tail 서열을 포함하고,
이때, 상기 U-rich tail 서열은(UaN)nUb로 표현되고,
상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
본 명세서에서 제공하는 U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas12f1 시스템을 유전자 편집에 사용하는 경우, 야생형의 CRISPR/Cas12f1 시스템을 사용할 때와 비교해 높은 유전자 편집 효율을 나타낸다.
도1은 본 발명에서 제공하는 엔지니어링 된 가이드 RNA의 예시 구조를 나타낸다. (a) 듀얼 가이드 RNA의 구조를 예시적으로 나타낸다, tracrRNA의 일부 및 crRNA의 CRISPR RNA 반복 서열 부분이 상보적으로 결합하여 이중가닥 RNA를 형성하며, crRNA 각 부분의 명칭(CRISPR RNA 반복 서열부, 스페이서 서열부, U-rich tail 서열부)가 도시되어 있다. (b) 싱글 가이드 RNA의 구조를 예시적으로 나타낸다. 듀얼 가이드 RNA의 tracrRNA 및 crRNA가 링커를 통해 연결되어 있으며, CRISPR RNA 반복 서열부, 스페이서 서열부, 및 U-rich tail 서열부의 위치가 도시되어 있다. 도면에 도시된 각 서열은 예시적인 서열이다.
도2는 실험예 3의 실험 결과를 나타낸 그래프이다. (a) U4AU6 구조의 U-rich tail 서열이 도입된 엔지니어링 된 CRISPR/Cas12f1 시스템이 HEK293 T세포 내의 DYTarget2, DYtarget10 및 DYtarget13에 대해 인델을 발생시키는 비율을 나타낸 그래프이다. 이때, 야생형의 CRISPR/Cas12f1 시스템의 인델 효율과 비교하여 U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율이 현저히 높은 것을 볼 수 있다. (b) U6, 또는 U4AU6 구조의 U-rich tail 서열이 도입된 엔지니어링 된 CRISRP/Cas12f1 시스템이 HEK293 T세포 내의 Intergenic-22에 대해 인델을 발생시키는 비율을 나타낸 그래프이다.
도3은 실험예 4의 실험 결과를 나타낸 그래프이다. HEK293 T세포 내의 Target 1(DYtarget2), Target 2(DYtarget10), Target 3(Intergenic-22)에 대한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 발생 효율을 나타낸다. No crRNA는 crRNA를 넣지 않은 실험군의 인델 효율, Canonical gRNA는 야생형의 CRISPR/Cas12f1 시스템의 인델 효율, gRNA(MS1)은 U4AU6 구조의 U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 효율을 나타낸다.
도4는 실험예 7의 실험 결과를 나타낸 그래프이다. HEK293 T세포 내의 DYtarget2, 또는 DYtarget10에 대한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 발생 효율을 나타낸다. (a) HEK293 T세포 내의 DYtarget2에 대한 실험으로, WT는 sgRNA를 넣지 않은 실험군의 인델 효율이고, Ux는 U를 전혀 부가하지 않은 sgRNA를 사용한 실험군의 인델 효율, U6, U4AU6, U3AU6, U3AU3AU6는 각각 U6, U4AU6, U3AU6, U3AU3AU6 구조를 가지는 U-rich tail을 포함하는 sgRNA를 사용한 실험군의 인델 효율을 나타낸다.
도5는 실험예 8의 실험 결과를 나타낸 그래프이다. HEK293 T세포 내의 DYtarget2에 대한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 발생 효율을 나타낸다. none은 U를 전혀 부가하지 않은 sgRNA를 사용한 실험군의 인델 효율, T, T2, T3, T4, T4A, T4AT, T4AT2, T4AT3, T4AT4, T4AT5, T4AT6, T4AT7, T4AT8, T4AT4AT, 및 T4AT4AT2는 각각 U, U2, U3, U4, U4A, U4AU, U4AU2, U4AU3, U4AU4, U4AU5, U4AU6, U4AU7, U4AU8, U4AU4AU, 및 U4AU4AU2 구조의 3' 말단 서열을 가지는 엔지니어링 된 sgRNA를 사용한 실험군의 인델 효율을 나타낸다.
도6는 실험예 9의 실험 결과를 나타낸 그래프이다. HEK293 T세포 내의 CSMD1에 대한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 발생 효율을 나타낸다. none은 U를 전혀 부가하지 않은 sgRNA를 사용한 실험군의 인델 효율, U, U2, U3, U4, U5, U6, U4A, U4AU, U4AU2, U4AU3, U4AU4, U4AU5, U4AU6, U4AU7, U4AU8, U4AU9, 및 U4AU10은 각각에 해당하는 구조의 3'말단 서열을 가지는 엔지니어링 된 sgRNA를 사용한 실험군의 인델 효율을 나타낸다.
도7은 실험예 10의 실험 결과를 나타낸 그래프이다. HEK293 T세포 내의 DYtarget2에 대한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 발생 효율을 나타낸다. none은 U-rich tail 서열을 갖지 않는 sgRNA를 사용한 실험군의 인델 효율, T4AT6는 U4AU6 구조의 U-rich tail 서열을 가지는 엔지니어링 된 sgRNA를 사용한 실험군의 인델 효율, T4GT6는 U4GU6 구조의 U-rich tail 서열을 가지는 엔지니어링 된 sgRNA를 사용한 실험군의 인델 효율을 나타낸다.
도8은 실험예 11의 실험 결과를 나타낸 그래프이다. HEK293 T 세포 내의 DYtarget2 및 DYtarget10에 대한 엔지니어링 된 CRISPR/Cas12f1 시스템의 인델 발생 효율을 나타낸다. (a) HEK293 T 세포 내의 DYtarget2에 대한 실험으로, 도시된 모든 실험군에 사용된 sgRNA는 U4AU6구조의 U-rich tail 서열을 가진다. 이때, 그래프 가로축의 18mer, 19mer, 20mer, 21mer, 25mer, 및 30mer는 각 실험군의 sgRNA에 포함된 스페이서 서열의 길이를 나타낸다. 구체적인 스페이서 서열은 실험예 11의 표25에 나타냈다. (b) HEK293 T 세포 내의 DYtarget10에 대한 실험으로, 도시된 모든 실험군에 사용된 sgRNA는 U4AU6구조의 U-rich tail 서열을 가진다. 이때, 그래프 가로축의 17mer, 18mer, 19mer, 20mer, 21mer, 25mer, 및 30mer는 각 실험군의 sgRNA에 포함된 스페이서 서열의 길이를 나타낸다. 구체적인 스페이서 서열은 실험예 11의 표24에 나타냈다.
도9는 실험예 12-1의 HA antibody western blot 결과를 나타낸다. 이때, SpCas12f1의 분자량은 64.65kDa, AsCas12f1의 분자량은 56.55kDa로, HEK293 T세포 내에서 SpCas12f1 및 AsCas12f1 단백질이 발현되었음을 확인할 수 있다.
이하, 첨부된 도면을 참조하여, 발명의 내용을 특정한 구현예와 예시들을 통해 더욱 상세하게 설명한다. 상기 첨부된 도면은 발명의 일부 구현예를 포함하지만, 모든 구현예를 포함하고 있지는 않다는 점에 유의해야 한다. 본 명세서에 의해 개시되는 발명의 내용은 다양하게 구현될 수 있으며, 여기에 설명되는 특정 구현예로 제한되지 않는다. 이러한 구현예들은 본 명세서에 적용되는 법적 요건을 만족시키기 위해 제공되는 것으로 보아야 한다. 본 명세서에 개시된 발명이 속한 기술분야에 있어 통상의 기술자라면, 본 명세서에 개시된 발명의 내용에 대한 많은 변형 및 다른 구현예들을 떠올릴 수 있을 것이다. 따라서, 본 명세서에서 개시된 발명의 내용은 여기에 기재된 특정 구현예로 제한되지 않으며, 이에 대한 변형 및 다른 구현예들도 청구범위 내에 포함되는 것으로 이해되어야 한다.
용어의 정의
본 명세서에서 사용되는 “약”이라는 용어는 참조 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1% 정도로 변하는 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다.
작동 가능하게 연결된(operably linked)
본 명세서에서 사용되는 "작동 가능하게 연결된"이라는 용어는 유전자 발현 기술에 있어서, 특정 구성이 다른 구성과 연결되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 암호화 서열과 작동적으로 연결되었다고 할 때, 상기 프로모터가 상기 암호화 서열의 세포 내에서의 전사 및/또는 발현에 영향을 미칠 수 있도록 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 유전자 또는 표적 핵산
본 명세서에서 사용되는 "표적 유전자" 또는 "표적 핵산"은 기본적으로, 유전자 편집의 대상이 되는 세포 내 유전자, 또는 핵산을 의미한다. 상기 표적 유전자 또는 표적 핵산은 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 상기 표적 유전자 또는 표적 핵산은 달리 기재되지 않은 한, 대상 세포가 가진 고유한 유전자 또는 핵산, 혹은 외부 유래의 유전자 또는 핵산 모두를 의미할 수 있으며, 유전자 편집의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 유전자 또는 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열
본 명세서에서 사용되는 "표적 서열"은 CRISPR/Cas 복합체가 표적 유전자 또는 표적 핵산을 절단하기 위해 인식하는 특정 서열을 의미한다. 상기 표적 서열은 그 목적에 따라 적절히 선택될 수 있다. 구체적으로, "표적 서열"은 표적 유전자 또는 표적 핵산 서열 내에 포함된 서열이며, 본 명세서에서 제공하는 가이드 RNA, 또는 엔지니어링 된 가이드 RNA에 포함된 스페이서 서열과 상보성을 가지는 서열을 의미한다. 일반적으로, 상기 스페이서 서열은 표적 유전자 또는 표적 핵산의 서열 및 CRISPR/Cas 시스템의 이펙터 단백질이 인식하는 PAM 서열을 고려하여 결정된다. 상기 표적 서열은 CRISPR/Cas 복합체의 가이드 RNA와 상보적으로 결합하는 특정 가닥만을 지칭할 수 있으며, 상기 특정 가닥 부분을 포함하는 표적 이중 가닥 전체를 지칭할 수도 있으며, 이는 문맥에 따라 적절히 해석된다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
벡터
본 명세서에서 사용되는 "벡터"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어 CRISPR/Cas 시스템의 이펙터 단백질을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
엔지니어링 된
본 명세서에서 사용되는 "엔지니어링 된"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 가이드 RNA"의 경우, 자연계에 존재하는 가이드 RNA의 구성에 인위적인 변경이 가해진 가이드 RNA를 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS(Nuclear Localization Sequence, or Signal)
본 명세서에서 "NLS"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 구체적으로, 상기 NLS는 아미노산 서열 PKKKRKV(서열번호: 237)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호: 238)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호: 239) 또는 RQRRNELKRSP(서열번호: 240)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 241)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호: 242); 마이오 마(myoma) T 단백질의 서열 VSRKRPRP(서열번호: 243) 및 PPKKARED(서열번호: 244); 인간 p53의 서열 PQPKKKPL(서열번호: 245); 마 우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호: 246); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호: 247) 및 PKQKKRK(서열번호: 248); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호: 249); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호: 250); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호: 251); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호: 252)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
NES(Nuclear Export Sequence, or Signal)
본 명세서에서 "NES"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 내부의 물질을 핵 외부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NES"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
태그
본 명세서에서 "태그"라 함은, 펩타이드, 또는 단백질의 추적 및/또는 분리정제를 쉽게 하기 위하여 부가되는 기능적 도메인을 통틀어 일컫는다. 구체적으로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형관 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 자가형광 단백질, 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 유전자를 포함하나, 이에 제한되는 것은 아니다. 본 명세서에서 사용되는 "태그"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
배경기술 - CRISPR/Cas12f1 시스템
개괄
자연계에는 다양한 종류의 CRISPR/Cas 시스템이 존재하고, 현재도 계속 새로운 CRISPR/Cas 시스템이 발견되고 있다. 이 중 본 명세서에서 제공하는 CRISPR/Cas12f1 시스템은 구체적으로 Class 2, Type V 분류에 속하며, Cas14 패밀리(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에 속하는 CRISPR/Cas 시스템이다. 이하 본 명세서에서 제공하는 CRISPR/Cas12f1 시스템이 어떤 분류에 속하는 지 설명한다.
Class 2 CRISPR/Cas 시스템
CRISPR/Cas 시스템은 크게 Class 1, Class 2로 나뉜다. 이 중 Class 2 CRISPR/Cas 시스템은 그 이펙터 복합체(effector complex)가 멀티 도메인을 가진 커다란 단일 단백질을 포함하는 것이 특징이다. 상기 Class 2 CRISPR/Cas 시스템 중 대표적인 것이 Type II의 CRISPR/Cas9 시스템이며, CRISPR/Cpf1 시스템 등 유전자 편집 용도로 활발하게 연구되고 있는 CRISPR/Cas 시스템이 대체로 Class 2에 속한다.
Type V CRISPR/Cas 시스템
Class 2 CRISPR/Cas 시스템은 Type II, V, 및 VI로 나뉜다. 이 중 본 명세서에서 제공하는 CRISPR/Cas12f1 시스템은 Type V CRISPR/Cas 시스템에 속한다. Type V CRISPR/Cas 시스템의 이펙터 단백질은 Cas12로 명명되며, 세부 분류에 따라 Cas12a, Cas12b, 등으로 명명된다. 상기 Cas12 단백질은 하나의 뉴클레이즈 도메인(RuvC-like nuclease)을 가지는데, 이는 두 개의 뉴클레이즈 도메인(HNH, 및 RuvC domain)을 가지는 Type II 이펙터 단백질(예를 들어, Cas9 단백질)과 구분되는 특징이다. 현재까지 밝혀진 바, type V CRISPR/Cas 시스템은 11개의 서브타입으로 나뉘며, 이 중 본 명세서에서 제공하는 CRISPR/Cas12f1 시스템은 서브타입 V-F 중 하나의 베리언트인 V-F1에 속한다(Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)).
CRISPR/Cas12f1 시스템
CRISPR/Cas12f 시스템은 type V CRISPR/Cas 시스템 중 V-F 서브타입에 속하고, 이는 다시 V-F1 내지 V-F3의 베리언트로 나뉜다. CRISPR/Cas12f 시스템은 선행연구(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중, Cas14a, Cas14b, 및 Cas14c 변이체를 포함하는 CRISPR/Cas14 시스템을 포함한다. 이 중, Cas14a 이펙터 단백질을 포함하는 CRISPR/Cas14a 시스템은 CRISPR/Cas12f1 시스템으로 분류된다(Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)). 다만, 상기 CRISPR/Cas12f1은 Cas14a 패밀리(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에 속하는 시스템 뿐 아니라, 이펙터 단백질이 c2c10으로 명명되는 CRISPR/Cas 시스템도 포함한다(Karvelis et al., Nucleic Acids Research, Vol. 48, No. 9 5017 (2020), Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)). 따라서, 본 명세서에서 CRISPR/Cas12f1 시스템이라 함은, 달리 서술하지 않는 한 CRISPR/Cas14a 시스템 및, CRISPR/c2c10 시스템을 모두 포괄하는 개념이며, 이 중 CRISPR/Cas14a 시스템을 지칭할 때는 "CRISPR/Cas14a 시스템" 혹은, "Cas14 패밀리에 속하는 CRISPR/Cas12f1 시스템"이라 지칭한다. 상기 용어는 통상의 기술자가 문맥에 따라 적절히 해석할 수 있는 의미를 가진다.
배경기술 - CRISPR/Cas 시스템 발현 벡터 설계
개괄
CRISPR/Cas 시스템을 유전자 편집에 사용하기 위해서, 상기 CRISPR/Cas 시스템의 각 구성을 암호화하는 서열을 가지는 벡터를 세포 내에 도입시켜, 세포 내에서 상기 CRISPR/Cas 시스템의 각 구성이 발현되도록 하는 방법이 널리 이용되고 있다. 이하, CRISPR/Cas 시스템이 세포 내에서 발현되도록 하는 벡터의 구성 요소에 대해 설명한다.
CRISPR/Cas 시스템 구성 요소를 암호화하는 핵산
상기 벡터의 목적이 CRISPR/Cas 시스템 각 구성요소를 세포 내에서 발현되도록 하는 것이므로, 상기 벡터의 서열은 CRISPR/Cas 시스템의 각 구성요소를 암호화하는 핵산 서열 중 하나 이상을 필수적으로 포함해야 한다. 구체적으로, 상기 벡터의 서열은 발현하고자 하는 CRISPR/Cas 시스템에 포함된 가이드 RNA, 및/또는 Cas 단백질을 암호화하는 핵산 서열을 포함한다. 이때, 상기 벡터의 서열은 야생형의 가이드 RNA 및 야생형의 Cas 단백질을 암호화하는 핵산 서열 뿐 아니라 그 목적에 따라 엔지니어링 된 가이드 RNA 및 코돈 최적화된 Cas 단백질을 암호화하는 핵산 서열 또는 엔지니어링 된 Cas 단백질을 암호화하는 핵산 서열을 포함할 수 있다.
조절/제어 구성요소
상기 벡터를 세포 내에서 발현시키기 위해서는, 하나 이상의 조절/제어 구성요소를 포함해야 한다. 구체적으로, 상기 조절/제어 구성요소는 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)을 포함할 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
프로모터
상기 벡터의 발현 대상을 세포 내에서 발현시키려면, 각 구성 요소를 암호화하는 서열에 프로모터 서열을 작동적으로 연결시켜 세포 내에서 RNA 전사 인자가 활성화될 수 있도록 해야 한다. 상기 프로모터 서열은 대응하는 RNA 전사 인자, 또는 발현 환경에 따라 달리 설계할 수 있으며, CRISPR/Cas 시스템의 구성 요소를 세포 내에서 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 상기 프로모터 서열은 RNA 중합효소(예를 들어,RNA Pol I, Pol II, 또는 Pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), 및 human H1 프로모터 (H1) 중 하나 수 있으나, 이에 제한되는 것은 아니다.
종결 신호
상기 벡터 서열이 상기 프로모터 서열을 포함하는 경우, RNA 전사 인자에 의해 상기 프로모터와 작동 가능하게 연결된 서열의 전사가 유도되는데, 이러한 RNA 전사 인자의 전사 종결을 유도하는 서열을 종결 신호라고 일컫는다. 상기 종결 신호는, 프로모터 서열의 종류에 따라 달라질 수 있다. 예를 들어, 상기 프로모터가 U6, 또는 H1 프로모터일 경우, 상기 프로모터는 티미딘 연속 서열(예를 들어, TTTTTT (T6) 서열)을 종결 신호로 인식한다.
부가 발현 요소
상기 벡터는 야생형의 CRISPR/Cas 시스템 구성, 및/또는 엔지니어링 된 CRISPR/Cas 시스템 외 통상의 기술자가 필요에 의해 발현시키고자 하는 부가 발현 요소를 암호화하는 핵산 서열을 포함하고 있을 수 있다. 예를 들어, 상기 부가 발현 요소는, <용어의 설명> 섹션 중 "태그" 부분에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저 항성 유전자, 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin), 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
발현 벡터의 형태
상기 발현 벡터는 선형, 또는 원형 벡터 형태로 설계될 수 있다.
종래 기술의 한계점
상기 CRISPR/Cas12f1 시스템, 그 중에서도 Cas14 패밀리에 속하는 CRISPR/Cas14a 시스템의 가장 큰 한계점은, 세포 내에서 유전자 편집 활성이 나타나지 않거나, 지나치게 낮다는 데 있었다. CRISPR/Cas14 시스템에 대해 처음으로 보고한 선행 문헌(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서, 선행 연구자들은 CRISPR/Cas14 시스템이 원핵세포 내에서 단일가닥 DNA에 대한 절단 활성을 보인다는 점은 보였으나, 세포 내에서 이중가닥 DNA에 대한 절단 활성을 보이는 데는 실패했다. 이에 대해, 선행 연구자들은, CRISPR/Cas14 시스템이 고균(archaeon)에서 발견된 시스템임을 감안할 때, 진화 초기의 CRISPR/Cas 시스템은 단일가닥 DNA에 대한 절단 활성 만을 보이고, 이후 진화를 거치면서 이중가닥 DNA에 대한 절단 활성을 획득(예를 들어, CRISPR/Cas9 시스템)한 것으로 보고 있다. 또 다른 선행 문헌(US 2020/0190494 A1)에서, 선행 연구자들은 CRISPR/Cas14 시스템이 진핵 세포 내에서 이중가닥 DNA에 대한 절단 활성을 보인다는 사실을 보고하고 있으나, 그 절단 효율이 0.1% 이하로 현저히 낮은 것으로 보인다. 따라서, 선행 문헌에 따르면, Cas14 패밀리에 속하는 CRISPR/Cas12f1 시스템은 세포 내에서 이중가닥 DNA에 대한 절단 활성을 보이지 않거나, 절단 활성을 보이더라도 그 효율이 매우 낮아 이를 적극적으로 유전자 편집에 활용하기 힘들다는 한계를 가지고 있었다.
U-rich tail 서열
U-rich tail 서열 - 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템의 유전자 편집 효율 향상을 위해 도입할 수 있는 U-rich tail 서열을 제공한다. 상기 U-rich tail 서열은 기본적으로 유리딘을 풍부하게 포함하고 있는 것을 특징으로 하며, 유리딘이 하나 이상 연속된 서열을 포함한다. 일 구현예로, 상기 U-rich tail 서열은 1 내지 10개의 유리딘 반복 서열을 포함할 수 있다. 상기 U-rich tail 서열은 엔지니어링 된 CRISPR/Cas12f1 시스템의 실제 사용 환경 및 발현 환경(예를 들어, 진핵 세포 또는 원핵 세포 내부 환경)에 따라 유리딘 외 추가적인 염기를 더 포함할 수 있다. 일 구현예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, 및/또는 UUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다. 상기 U-rich tail 서열은 CRISPR/Cas12f1 시스템에 포함된 crRNA 서열의 3'말단에 연결된 것을 특징으로 한다. 상기 U-rich tail 서열은 본 발명에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체의 표적 핵산에 대한 절단 효율을 높이는 역할을 한다. 이때, 상기 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 본 명세서에서 사용되는 “U-rich tail 서열”이라는 용어는, 유리딘이 풍부하게 포함된 RNA서열 그 자체뿐 아니라, 이를 암호화하는 DNA 서열을 의미할 수도 있으며, 이는 문맥에 따라서 적절하게 해석된다. 본 발명자들은 U-rich tail 서열의 구조 및 그 효과에 대해 실험적으로 자세히 밝혔으며, 이하 단락에서 더 자세히 설명한다.
U-rich tail 서열 도입 배경 - CRISPR/Cpf1 관련 연구
본 발명자들은 선행 연구를 통해 CRISPR/Cpf1 시스템에 포함된 crRNA 서열의 3'말단에 U-rich tail 서열을 연결하는 경우 CRISPR/Cpf1 복합체의 핵산 절단 효율이 현저하게 상승하는 것을 발견한 바 있다(Moon et al., Highly efficient genome editing by CRISPR-Cpf1 using CRISPR RNA with a uridinylate-rich 3'-overhang. Nature Commun 9, 3651 (2018)). 본 발명자들은 Cpf1 단백질이 Type V CRISPR/Cas 시스템(이하, CRISPR/Cas12 시스템)에 속하며, 상기 CRISPR/Cas12 시스템이 몇 가지 공통적인 특징을 공유한다는 것에 착안하여, CRISPR/Cas12 시스템에 포함된 crRNA 3'말단에 유리딘 연속 서열을 추가하여 CRISPR/Cas12 복합체의 유전자 편집 효율이 상승되는지 여부를 실험하였다.
U-rich tail 서열 도입 배경 - CRISPR/Cas12f1 시스템에서는 효과가 있음
본 발명자들은 실험을 통해 Cas12f1, 그 중에서도 Cas14 패밀리에 속하는 CRISPR/Cas12f1 시스템의 crRNA의 3'말단에 U-rich tail 서열을 연결하는 경우 그 유전자 편집 효율이 현저하게 높아지는 것을 발견하였다. 추가적으로, 본 발명자들은 상기 U-rich tail 서열의 구조를 조금씩 달리하여 실험하였으며, CRISPR/Cas12f1 시스템의 핵산 절단 효율을 높일 수 있는 U-rich tail 서열의 구조를 실험적으로 밝혀냈다.
U-rich tail 서열 도입 배경 - 모든 CRISPR/Cas12 시스템에 적용되지는 않음
하지만, 상기 U-rich tail 서열을 다른 CRISPR/Cas12 시스템에 도입해 본 결과, Type V CRISPR/Cas 시스템에 속한다는 사실 만으로 U-rich tail 서열이 CRISPR/Cas12 복합체의 유전자 편집 효율을 높이지는 않는다는 사실을 발견하였다(실험예 00 참조). 이는, 동일한 Type V 그룹이라 하더라도, tracrRNA 존재 여부, Cas 단백질 구조 등이 상이하기 때문에 U-rich tail 서열에 대해서 각기 다른 결과를 가져온 것이라 추측할 수 있다. 본 발명자들이 아는 한, 현재까지 crRNA의 3'말단에 추가된 U-rich tail 서열이 CRISPR/Cas 시스템 내에서 어떠한 기능 및 메커니즘으로 핵산 절단 효율을 높이는지 명확히 밝혀지지 않았고, 가이드 RNA, 및/또는 Cas 단백질의 구조 만으로 crRNA 3'말단에 추가된 U-rich tail 서열이 유전자 절단 활성에 영향을 미칠 지 여부를 판단하는 것도 어렵다. 따라서, U-rich tail 서열의 역할 및 CRISPR/Cas 시스템에 미치는 영향을 밝히는 것은 추후 연구 과제가 될 것이다. 이하, CRISPR/Cas12f1 시스템, 그 중에서도 Cas14 패밀리에 속하는 시스템에 도입된 U-rich tail 서열에 대해 더 자세히 설명한다.
U-rich tail 서열 구조 - 유리딘 연속 서열
U-rich tail 서열을 설계하는 데 있어 중요한 점 중 하나는, 유리딘이 하나 이상 연속된 서열을 풍부하게 포함시키는 것이다. 본 발명자들은 실험을 통해 유리딘이 1개 이상 연속된 서열인 U-rich tail 서열을 CRISPR/Cas12f1 시스템에 도입한 경우, 상기 CRISPR/Cas12f1 복합체의 유전자 편집 효율이 향상되는 것을 발견했다. 따라서, 본 명세서에서 제공하는 U-rich tail 서열은 유리딘이 하나 이상 연속된 서열을 포함한다. 일 구현예로, 상기 U-rich tail 서열은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 유리딘이 연속된 서열을 포함할 수 있다.
U-rich tail 서열 구조 - 유리딘 연속 서열만 포함할 경우 발생할 수 있는 문제점
상기 U-rich tail 서열에 길이가 긴(예를 들어, 유리딘 5개 이상이 연속된 서열), 유리딘 연속 서열이 포함된 경우, 세포 내에 벡터 등을 도입하여 통해 상기 crRNA를 발현시키고자 할 때 문제가 발생할 수 있는데, 그 이유는 다음과 같다. 상기한 유리딘 연속 서열을 발현하는 벡터를 설계할 때, 필연적으로 상기 유리딘 연속 서열에 대응한 티미딘 연속 서열이 벡터 내에 포함되게 된다. 이때, 진핵 세포 내에서 상기 벡터를 발현시킬 때 사용하는 프로모터 중 일부(예를 들어, U6 프로모터 등)는 티미딘 연속 서열, 예를 들어 T6 서열을 종결 신호로 사용하기 때문에, 상기 유리딘 연속 서열에 대응한 티미딘 연속 서열이 종결 신호로 인식될 수 있다. 상기 유리딘 연속 서열이 1 내지 4개의 유리딘을 포함하는 경우, 벡터 내에는 1 내지 4개의 티미딘 연속 서열이 포함되게 되고, 이는 종결 신호로 작용하지는 않으므로, 유리딘이 연속하여 네 개까지 포함된 U-rich tail 서열을 발현시키는 데는 별 문제가 없다. 하지만, 상기 유리딘 연속 서열이 6개 이상의 유리딘을 포함하는 경우, 상기 벡터 내에는 T6 서열이 포함되게 되고, 이는 종결 신호로 작용하므로, 유리딘이 연속하여 다섯개 이상 포함된 U-rich tail 서열은 의도한 바대로 발현되지 않을 가능성이 크다. 따라서, 티미딘 연속 서열을 종결 신호로 인식하는 프로모터를 사용하면서, U-rich tail 서열에 유리딘을 풍부하게 포함시키기 위해서는, 유리딘이 6개 이상 연속으로 오는 구조를 피할 필요가 있다.
U-rich tail 서열 구조 - 변형된 유리딘 연속 서열
위와 같은 문제점을 해결하기 위해, 본 명세서에서 제공하는 U-rich tail 서열은 유리딘이 1개 내지 5개 반복될 때마다, 유리딘이 아닌 다른 리보뉴클레오사이드(A, C, G)가 하나씩 포함된 변형된 유리딘 반복 서열을 포함할 수 있다. 일 구현예로, 상기 U-rich tail 서열은 UV, UUV, UUUV, UUUUV, 및/또는 UUUUUV가 하나 이상 반복된 서열을 포함할 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다. 상기 변형된 유리딘 연속 서열은 특히 엔지니어링 된 crRNA를 발현하는 벡터를 설계할 때 유용하다.
U-rich tail 서열 구현예 - Ux 형태
일 구현예로, 상기 U-rich tail 서열은 Ux로 표현될 수 있다. 일 구현예로, 상기 x는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 일 구현예로, 상기 x는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 x는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 x는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 x는 20 이상의 정수일 수 있다.
U-rich tail 서열 구현예 - (UaN)nUb 형태
일 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 내지 5 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 0 내지 2 사이의 정수일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10일 수 있다. 일 구현예로, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다.
U-rich tail 서열 구현예 - (UaV)n 형태
일 구현예로, 상기 U-rich tail 서열은 (UaV)n으로 표현될 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaM)n으로 표현될 수 있다. 이때, 상기 M은 아데노신(A), 또는 사이티딘(C)이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaR)n으로 표현될 수 있다. 이때, 상기 R은 아데노신(A), 또는 구아노신(G)이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaS)n으로 표현될 수 있다. 이때, 상기 S는 사이티딘(C), 또는 구아노신(G)이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaA)n으로 표현될 수 있다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaC)n으로 표현될 수 있다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaG)n으로 표현될 수 있다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 1 이상의 정수일 수 있다.
U-rich tail 서열 구현예 - (UaV)nUb 형태
일 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있다. 이때, 상기 V는 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 일 구현예로, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaM)n으로 표현될 수 있다. 이때, 상기 M은 아데노신(A), 또는 사이티딘(C)이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 일 구현예로, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaR)n으로 표현될 수 있다. 이때, 상기 R은 아데노신(A), 또는 구아노신(G)이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 일 구현예로, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaS)n으로 표현될 수 있다. 이때, 상기 S는 사이티딘(C), 또는 구아노신(G)이다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 이때, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaA)nUb로 표현될 수 있다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 이때, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaC)nUb로 표현될 수 있다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 이때, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaG)nUb로 표현될 수 있다. 이때, 상기 a는 1 내지 4 사이의 정수이고, n은 0 이상의 정수이다. 일 구현예로, 상기 n은 1 또는 2일 수 있다. 일 구현예로, 상기 b는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20일 수 있다. 이때, 상기 b는 바로 이전 문장에서 선택된 두 수치범위 내의 정수일 수 있다. 예를 들어, 상기 b는 1 내지 6 사이의 정수일 수 있다. 또 다른 예를 들어, 상기 b는 1 내지 20 사이의 정수일 수 있다. 일 구현예로, 상기 b는 20 이상의 정수일 수 있다.
U-rich tail 서열 구현예 - Ux 및 (UaV)n 조합 형태
일 구현예로, 상기 U-rich tail 서열은 Ux로 표현되는 서열 및 (UaV)n로 표현되는 서열이 조합된 형태일 수 있다. 일 구현예로, 상기 U-rich tail 서열은 (U)n1-V1-(U)n2-V2-Ux로 표현될 수 있다. 이때, 상기 V1 및 V2는 각각 아데노신(A), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 n1, 및 n2는 각각 1 내지 4 사이의 정수일 수 있다. 이때, 상기 x는 1 내지 20 사이의 정수일 수 있다.
U-rich tail 서열 - 전체 길이
일 구현예로, 상기 U-rich tail 서열의 길이는 1nt, 2nt, 3nt, 4nt, 5nt, 6nt, 7nt, 8nt, 9nt, 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 또는 20nt일 수 있다. 일 구현예로, 상기 U-rich tail 서열의 길이는 20nt 이상일 수 있다.
U-rich tail 서열 - 예시 서열
일 구현예로, 상기 U-rich tail 서열은 U, UU, UUU, UUUU, UUUUU, UUUUUU, UUUAUUU, UUUAUUUAUUU(서열번호: 11), UUUUAU, UUUUAUU, UUUUAUUU, UUUUAUUUU, UUUUAUUUUU(서열번호: 4), UUUUAUUUUUU(서열번호: 5), UUUGUUU, UUUGUUUGUUU(서열번호: 29), UUUUGU, UUUUGUU, UUUUGUUU, UUUUGUUUU, UUUUGUUUUU(서열번호: 22), 또는 UUUUGUUUUUU(서열번호: 23)일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 서열번호 3 내지 57으로 이뤄진 군에서 선택된 어느 하나일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 UUUUUU, UUUUAUUUUUU, 또는 UUUUGUUUUUU 일 수 있다.
U-rich tail 서열 도입의 장점 1 - 유전자 편집 효율 증가
본 명세서에서 제공하는 U-rich tail 서열을 CRISPR/Cas12f1 시스템에 도입하는 경우, 이로 인해 엔지니어링 된 CRISPR/Cas12f1 복합체의 유전자 편집 효율이 현저히 향상되는 효과가 있다. 구체적으로, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 진핵 세포 내에서 야생형의 CRISPR/Cas12f1 복합체가 절단하지 못하는 이중가닥 DNA에 대해 절단 활성을 보이거나, 야생형 CRISPR/Cas12f1 복합체에 비해 진핵 세포 내에서 이중가닥 DNA 절단 활성이 현저히 높아지는 것으로 나타났다. 이는 본 발명자들이 실험적으로 밝혀낸 것으로, 본 명세서의 실험예 부분에 자세히 설명되어 있다.
U-rich tail 서열 도입의 장점 2 - Cas12f1의 장점 활용 가능
전술한 바, Cas12f1 단백질은 현재 활발히 연구되고 있는 Cas9, 및 Cpf1과 비교해 현저히 작은 크기를 가지고 있다. 따라서, 상기 Cas12f1 단백질 및 이에 대한 가이드 RNA를 암호화하는 서열의 길이가 매우 짧아 하나의 AAV 벡터에 모두 포함시킬 수 있다. 더 나아가, Cas12f1 단백질에 베이스 에디터, 또는 프라임 에디터 등의 기능적인 도메인를 추가한다 해도, 하나의 AAV 벡터에 모두 포함시킬 수 있다. 상기 AAV 벡터는 세포 내 전달 효율이 높고, 인간에 대한 유전자 치료제로써 승인된 벡터이므로, 하나의 AAV 벡터에 CRISPR/Cas 시스템, 또는 적절한 기능적 도메인이 추가된 CRISPR/Cas 시스템을 전부 포함시킬 수 있다면, 이를 유전자 편집 기술에 활용할 수 있는 범위가 매우 넓어진다는 장점이 있다. 현재 CRISPR/Cas9 시스템 사용의 걸림돌 중 하나가 시스템 전체 서열이 너무 길어 하나의 AAV 벡터에 모두 포함시키기 힘들다는 점임을 감안하면, CRISPR/Cas12f1 시스템은 유전자 편집 도구로서 상당히 매력적이라 할 수 있다. 다만, 선행 연구에 따르면, Cas12f1 단백질, 특히 Cas14 패밀리에 속하는 단백질은 이중가닥 DNA를 절단하지 못하거나, 절단 효율이 현저히 떨어지는 것으로 나타나 이용 가치가 떨어지는 것으로 여겨졌다. 하지만, 본 발명자들은 CRISPR/Cas12f1 시스템에 U-rich tail 서열을 도입하여, CRISPR/Cas12f1 복합체의 유전자 편집 효율을 크게 증가시킬 수 있음을 보였다. 결론적으로, 본 명세서에서 제공하는 U-rich tail 서열을 도입한 엔지니어링 된 CRISPR/Cas12f1 복합체는 상기한 Cas12f1 단백질의 장점을 그대로 가지면서도 높은 핵산 절단 효율을 보이므로, 다양한 유전자 편집 기술에 응용할 수 있다.
CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 CRISPR RNA(crRNA)
엔지니어링 된 crRNA - 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 CRISPR RNA(이하, crRNA)를 제공한다. 상기 엔지니어링 된 crRNA는 CRISPR/Cas12f1 시스템의 crRNA 서열의 3'말단에 U-rich tail 서열이 연결된 것이다. 이때, 본 명세서에서 달리 수식하지 않고 "CRISPR RNA", 또는 "crRNA"라고 기재하는 경우, 이는 엔지니어링 된 crRNA와는 구분되는 개념으로, 기본적으로 자연계에 존재하는 구성을 가진 CRISPR RNA, 특히 CRISPR/Cas12f1 시스템에 포함된 CRISPR RNA를 의미한다. 상기 U-rich tail 서열은 <U-rich tail 서열> 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다. 상기 crRNA는 CRISPR RNA 반복 서열 및 스페이서 서열을 포함한다. 상기 스페이서 서열은 상기 엔지니어링 된 CRISPR/Cas12f1 복합체가 편집하고자 하는 표적 핵산에 포함된 표적 서열과 관련된 서열이다. 본 명세서에서 제공하는 엔지니어링 된 crRNA의 서열은 CRISPR RNA 반복 서열, 스페이서 서열, 및 U-rich tail 서열을 포함한다.
일 구현예로, 상기 엔지니어링 된 crRNA의 서열은 그 5'말단에서 3'말단 순서로, CRISPR RNA 반복 서열, 스페이서 서열, 및 U-rich tail 서열이 순차적으로 연결된 것일 수 있다.
일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 표적 서열에 상보적인 서열일 수 있다.
일 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1에서 4 까지의 한 정수이고, n은 0, 1, 2 중의 한 정수이며, 상기 b는 1에서 10 까지의 한 정수이다.
또 다른 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있다. 이때, a, n, 및 b는 정수이며, a는 1이상 4 이하, n은 0 이상이며, b는 1이상 10이하일 수 있다. 추가적으로, 본 명세서에서는 상기 엔지니어링 된 crRNA를 암호화하는 DNA를 제공한다. 이하 상기 엔지니어링 된 crRNA의 구성에 대해 더 자세히 설명한다.
CRISPR RNA 반복 서열 - 정의
CRISPR RNA 반복 서열은 CRISPR/Cas12f1 시스템의 Cas12f1 단백질 종류에 따라 결정되는 서열로, 스페이서 서열의 5'말단에 연결된 서열을 의미한다. 상기 CRISPR RNA 반복 서열은 상기 CRISPR/Cas12f1 시스템에 포함된 Cas12f1 단백질의 종류에 따라 달라질 수 있다. 상기 CRISPR RNA 반복 서열은 CRISPR/Cas12f1 시스템의 tracrRNA의 적어도 일부와 상호작용할 수 있고, Cas12f1 단백질과도 상호작용할 수 있다.
CRISPR RNA 반복 서열 - 서열 예시
일 구현예로, 상기 CRISPR RNA 반복 서열은 서열번호 58의 서열일 수 있다.
CRISPR RNA 반복 서열 - 서열 변형 가능
본 명세서에서 “CRISPR RNA 반복 서열”이라 함은 일반적으로 자연계에서 발견되는 CRISPR RNA 반복 서열을 의미하지만, 이에 한정되는 것은 아니며, CRISPR/Cas12f1 시스템의 기능을 해치지 않는 범위에서 자연계에서 발견되는 CRISPR RNA 반복 서열의 일부 또는 전부 서열이 변형된 것을 의미할 수 있다.
일 구현예로, 상기 CRISPR RNA 반복 서열은 야생형의 CRISPR RNA 반복 서열의 전부 또는 일부가 변형된 것일 수 있다.
일 구현예로, 상기 CRISPR RNA 반복 서열은 야생형의 CRISPR RNA 반복 서열과 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 또는 50% 일치하는, 또는 상동성 있는 서열일 수 있다. 일 구현예로, 상기 CRISPR RNA 반복 서열은 야생형의 CRISPR RNA 반복 서열과 바로 이전 문장에서 선택된 두 수치 범위 내 일치하는 서열일 수 있다. 예를 들어, 상기 CRISPR RNA 반복 서열은 야생형의 CRISPR RNA 반복 서열과 90% 내지 100% 일치하는 서열일 수 있다. 또 다른 예를 들어, 상기 CRISPR RNA 반복 서열은 야생형의 CRISPR RNA 반복 서열과 60% 내지 80% 일치하는 서열일 수 있다.
일 구현예로, 상기 야생형의 CRISPR RNA 반복 서열은 서열번호 58의 서열일 수 있다.
스페이서 서열 - 정의
스페이서 서열은 CRISPR/Cas 복합체가 표적 특이적인 유전자 편집 활성을 나타내도록 하는 데 핵심적인 역할을 하는 서열이다. 본 명세서에서 스페이서 서열이라 함은, 달리 명시되지 않는 한, CRISPR/Cas12f1 복합체에 포함된 crRNA(또는, 엔지니어링 된 crRNA) 내의 스페이서 서열을 의미한다. 상기 스페이서 서열은 CRISPR/Cas12f1 복합체를 사용하여 편집하고자 하는 표적 핵산의 서열에 포함된 표적 서열에 대응하여 설계된다. 달리 표현하면, 본 명세서에서 제공하는 엔지니어링된 crRNA의 서열은 표적 서열에 따라 다양한 스페이서 서열을 가질 수 있다. 이때, 상기 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 또는 RNA일 수 있다.
스페이서 서열 - 표적 핵산 및 표적 서열과의 관계
상기 스페이서 서열은 표적 서열과 상보적인 서열이며, CRISPR RNA 반복 서열의 3'말단 쪽에 연결된다. 상기 스페이서 서열은 Cas12f1 단백질이 인식하는 PAM(Protospacer Adjacent Motif) 서열과 인접한 프로토스페이서 서열(protospacer sequence)과 상동성있는 서열로, 상기 프로토스페이서 서열의 티미딘이 유리딘으로 치환된 서열을 가진다. 이때, 상기 표적 서열 및 상기 프로토스페이서 서열은 상기 표적 핵산 내 포함된 상기 PAM 서열과 인접한 서열 내에서 결정되고, 이에 따라 상기 스페이서 서열이 결정된다.
일 구현예로, 상기 crRNA의 스페이서 서열 부분은 상기 표적 핵산과 상보적으로 결합할 수 있다. 일 구현예로, 상기 crRNA의 스페이서 서열 부분은 상기 표적 핵산의 표적 서열 부분과 상보적으로 결합할 수 있다. 일 구현예로, 상기 표적 핵산이 이중가닥 DNA인 경우, 상기 스페이서 서열은 상기 이중가닥 DNA의 표적가닥(Target strand)에 포함된 표적 서열과 상보적인 서열일 수 있다. 일 구현예로, 표적 핵산이 이중가닥 DNA인 경우, 상기 스페이서 서열은 상기 이중가닥 DNA의 비-표적가닥(Non-traget strand)에 포함된 프로토스페이서 서열과 상동성인 서열일 수 있다. 구체적으로, 상기 스페이서 서열은 상기 프로토스페이서 서열과 동일한 염기 서열을 가지되, 상기 염기 서열에 포함된 티미딘(T) 각각이 모두 유리딘(U)으로 치환된 서열을 가질 수 있다. 일 구현예로, 상기 스페이서 서열은 상기 프로토스페이서의 DNA 서열에 상응하는 RNA 서열일 수 있다.
스페이서 서열 - 서열 길이
일 구현예로, 상기 스페이서 서열의 길이는 10nt, 11nt, 12nt, 13nt, 14nt, 15nt, 16nt, 17nt, 18nt, 19nt, 20nt, 21nt, 22nt, 23nt, 24nt, 25nt, 26nt, 27nt, 28nt, 29nt, 30nt, 31nt, 32nt, 33nt, 34nt, 35nt, 36nt, 37nt, 38nt, 39nt, 40nt일 수 있다. 일 구현예로, 상기 스페이서 서열은 바로 이전 문장에서 선택된 두 개의 수치범위 내 길이를 가질 수 있다. 예를 들어, 상기 스페이서 서열의 길이는 17nt 내지 23nt일 수 있다. 또 다른 예를 들어, 상기 스페이서 서열의 길이는 17nt 내지 30nt일 수 있다.
U-rich tail 서열
상기 엔지니어링 된 crRNA는 crRNA 서열에 포함된 스페이서 서열의 3'말단부에 U-rich tail 서열이 연결된 것을 특징으로 한다. 상기 U-rich tail 서열은 <U-rich tail 서열> 섹션에서 설명된 것과 동일한 구성 및 특징을 가진다.
엔지니어링 된 crRNA를 암호화하는 DNA
본 명세서에서는 상기 엔지니어링 된 crRNA를 암호화하는 DNA를 제공한다. 일 구현예로, 상기 DNA 서열은 상기 엔지니어링 된 crRNA의 서열에서 유리딘이 모두 티미딘으로 치환된 서열을 가질 수 있다.
엔지니어링 된 crRNA의 용도
상기 엔지니어링 된 crRNA는 Cas12f1에 대한 tracrRNA와 함께 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA를 구성할 수 있다. 상기 엔지니어링 된 crRNA를 포함하는 상기 엔지니어링 된 가이드 RNA는 Cas12f1 단백질과 결합하여 CRISPR/Cas12f1 복합체를 이룰 수 있다.
CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA
엔지니어링 된 가이드 RNA - 개괄
본 명세서에서는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA를 제공한다. 상기 엔지니어링 된 가이드 RNA의 서열은 tracrRNA 서열, crRNA 서열, 및 U-rich tail 서열을 포함한다. 이때, 상기 U-rich tail 서열은 상기 crRNA 서열의 3'말단에 연결되어 있다. 달리 표현하면, 상기 엔지니어링 된 가이드 RNA의 서열은 tracrRNA 서열, 및 엔지니어링 된 crRNA 서열을 포함한다. 상기 crRNA는 CRISPR RNA 반복 서열, 및 스페이서 서열을 포함한다. 이때, 상기 CRISPR RNA 반복 서열, 및 스페이서 서열은 <CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 CRISPR RNA> 섹션에서 설명된 각 구성과 동일한 특징 및 구조를 가진다. 상기 U-rich tail 서열은 상기 <U-rich tail 서열> 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
일 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유리딘(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수다.
또 다른 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있으며, 이때, a, n, 및 b는 정수이며, a는 1 이상 4 이하, n은 0 이상이며, b는 1 이상 10 이하일 수 있다.
상기 엔지니어링 된 가이드 RNA에 포함된 상기 tracrRNA의 적어도 일부, 및 상기 crRNA의 적어도 일부는 서로 상보적인 서열을 가져 이중가닥 RNA를 형성할 수 있다. 구체적으로, 상기 tracrRNA의 적어도 일부, 및 상기 crRNA 서열에 포함된 CRISPR RNA 반복 서열의 적어도 일부는 서로 상보적인 서열을 가져 이중가닥 RNA를 형성할 수 있다. 상기 엔지니어링 된 가이드 RNA는 Cas12f1 단백질과 결합하여 CRISPR/Cas12f1 복합체를 형성할 수 있으며, 상기 crRNA 서열에 포함된 스페이서 서열과 상보적인 표적 서열을 인식하여 CRISRP/Cas12f1 복합체로 하여금 상기 표적 서열을 포함하는 표적 핵산을 편집할 수 있도록 한다.
tracrRNA - 정의
tracrRNA는 crRNA와 함께 CRISPR/Cas 시스템의 가이드 RNA를 구성하는 중요 구성 요소이다. 본 명세서에서 tracrRNA라 함은, 달리 기재되지 않는 한, CRISPR/Cas12f1 시스템의 가이드 RNA를 구성하는 tracrRNA를 일컫는다. 상기 tracrRNA의 적어도 일부는 crRNA의 적어도 일부와 상보적으로 결합하여 이중 가닥을 형성할 수 있다. 더 구체적으로, 상기 tracrRNA의 일부 서열은 상기 crRNA에 포함된 CRISPR RNA 반복 서열의 전부 또는 일부와 상보적 서열을 가진다.
tracrRNA - tracrRNA 및 CRISPR RNA 반복 서열의 상보성
일 구현예로, 상기 tracrRNA의 서열은 상기 CRISPR RNA 반복 서열과 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 상보적인 서열을 포함할 수 있다. 일 구현예로, 상기 tracrRNA의 서열은 상기 CRISPR RNA 반복 서열과 바로 이전 문장에서 선택된 수치 범위 내 상보적인 서열을 포함할 수 있다. 예를 들어, 상기 tracrRNA의 서열은 상기 CRISPR RNA 반복 서열과 60% 내지 90% 상보적인 서열을 포함할 수 있다. 또 다른 예를 들어, 상기 tracrRNA의 서열은 상기 CRISPR RNA 반복 서열과 70% 내지 100% 상보적인 서열을 포함할 수 있다.
tracrRNA - tracrRNA 및 CRISPR RNA 반복 서열의 미스매치 개수
일 구현예로, 상기 tracrRNA의 서열은 상기 CRISPR RNA 반복 서열과 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 또는 20개의 미스매치가 있는 상보적인 서열을 포함할 수 있다. 일 구현예로, 상기 tracrRNA의 상보적인 서열은 상기 CRISPR RNA 반복 서열과 바로 이전 문장에서 선택된 수치 범위 내의 미스매치가 있을 수 있다. 예를 들어, 상기 tracrRNA 서열은 상기 CRISPR RNA 반복 서열과 0개 내지 8개의 미스매치가 있는 상보적인 서열을 포함할 수 있다. 또 다른 예를 들어, 상기 tracrRNA 서열은 상기 CRISPR RNA 반복 서열과 8개 내지 12개의 미스매치가 있는 상보적인 서열을 포함할 수 있다.
tracrRNA - 서열 예시
일 구현예로, 상기 tracrRNA 서열은 서열번호60의 서열일 수 있다.
tracrRNA - 서열 변형 가능
본 명세서에서 “tracrRNA”라 함은 일반적으로 자연계에서 발견되는 tracrRNA를 의미하지만, 이에 한정되는 것은 아니며, CRISRP/Cas12f1 시스템의 기능을 해치지 않는 범위에서 자연계에서 발견되는 tracrRNA 서열의 일부 또는 전부 서열이 변형된 것을 의미할 수 있다.
일 구현예로, 상기 tracrRNA 서열은 야생형의 tracrRNA 서열의 전부 또는 일부가 변형된 것일 수 있다.
일 구현예로, 상기 tracrRNA 반복 서열은 야생형의 tracrRNA 반복 서열과 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 또는 50% 일치하는, 또는 상동성 있는 서열일 수 있다. 일 구현예로, 상기 tracrRNA 서열은 야생형의 tracrRNA 서열과 바로 이전 문장에서 선택된 두 수치 범위 내 일치하는 서열일 수 있다. 예를 들어, 상기 tracrRNA 서열은 야생형의 tracrRNA 서열과 90% 내지 100% 일치하는 서열일 수 있다. 또 다른 예를 들어, 상기 tracrRNA 서열은 야생형의 tracrRNA 서열과 60% 내지 80% 일치하는 서열일 수 있다.
일 구현예로, 상기 야생형의 tracrRNA 서열은 서열번호 60의 서열일 수 있다.
듀얼 가이드 RNA - 정의 및 구조
본 명세서에서 제공되는 엔지니어링 된 가이드 RNA는 듀얼 가이드 RNA일 수 있다. 이는, 상기 tracrRNA 및 상기 crRNA가 별개의 RNA 분자를 이루고 있는 것을 의미한다. 상기 tracrRNA의 일부 및 상기 crRNA의 일부는 상보적으로 결합하여 이중가닥을 이룬다. 구체적으로, 상기 듀얼 가이드 RNA에서 상기 tracrRNA의 3'말단을 포함하는 일부, 및 상기 crRNA의 CRISPR RNA 반복 서열을 포함하는 일부가 이중가닥을 형성할 수 있다.
일 구현예로, 상기 엔지니어링 된 가이드 RNA는 듀얼 가이드 RNA일 수 있다. 일 구현예로, 상기 엔지니어링 된 가이드 RNA가 듀얼 가이드 RNA인 경우, 상기 tracrRNA 및 상기 crRNA는 별개의 RNA 분자이다.
듀얼 가이드 RNA - 서열 예시
일 구현예로, 상기 tracrRNA는 서열번호 60의 서열일 수 있다. 일 구현예로, 상기 crRNA에 포함된 CRISPR RNA 반복 서열은 서열번호 58의 서열일 수 있다. 일 구현예로, 서열번호 60의 서열을 가지는 tracrRNA의 적어도 일부, 및 상기 서열번호 58의 서열을 가지는 CRISPR RNA 반복 서열이 상보적으로 결합하여 이중가닥을 형성하고 있을 수 있다.
싱글 가이드 RNA - 정의
가이드 RNA 형성이 용이하도록 상기 tracrRNA 및 상기 crRNA를 한 분자로 설계한 것을 싱글 가이드 RNA라 한다. 본 명세서에서 제공되는 엔지니어링 된 가이드 RNA는 싱글 가이드 RNA일 수 있다. 상기 엔지니어링 된 가이드 RNA가 싱글 가이드 RNA인 경우, 상기 싱글 가이드 RNA는 상기 tracrRNA, 상기 crRNA, 및 상기 U-rich tail을 모두 포함하는 한 분자의 RNA이다. 일 구현예로, 상기 엔지니어링 된 가이드 RNA가 싱글 가이드 RNA인 경우, 상기 tracrRNA의 서열 및 상기 crRNA의 서열은 한 분자의 RNA 서열에 모두 포함되어 있을 수 있다.
싱글 가이드 RNA - 링커 및 서열 예시
일 구현예로, 상기 엔지니어링 된 가이드 RNA가 싱글 가이드 RNA인 경우, 상기 엔지니어링 된 가이드 RNA의 서열은 링커 서열을 추가적으로 더 포함하고, 상기 tracrRNA 서열, 및 crRNA 서열은 링커 서열을 통해 연결될 수 있다. 일 구현예로, 상기 링커 서열은 5'-gaaa-3' 일 수 있다.
싱글 가이드 RNA - 구조
상기 싱글 가이드 RNA의 서열은 5'말단에서 3'말단 방향으로, tracrRNA 서열, 링커 서열, crRNA 서열, 및 U-rich tail 서열이 순차적으로 연결되어 있다. 상기 tracrRNA 서열의 일부, 및 상기 crRNA 서열에 포함된 CRISPR RNA 반복 서열의 전부 및 일부는 서로 상보적인 서열을 가진다. 따라서, 상기 tracrRNA의 일부, 및 상기 crRNA 중 CRISPR RNA 반복 서열 부분은 서로 상보적으로 결합하여 이중가닥 RNA를 형성한다.
싱글 가이드 RNA - 서열 예시
상기 싱글 가이드 RNA는 서열번호 75 내지 125, 및 261 내지 280으로 이뤄진 군에서 선택된 서열을 가질 수 있다.
스캐폴드 서열
본 명세서에서 제공하는 상기 엔지니어링 된 가이드 RNA의 서열을 기능적으로 나누어 보면, 1) Cas12f1 단백질과 상호작용하여 CRISPR/Cas12f1 복합체를 형성하도록 하는 서열 부분, 2) CRISPR/Cas12f1 복합체가 표적 핵산을 찾아갈 수 있도록 하는 서열 부분, 및 3) U-rich tail 서열 부분으로 나눌 수 있다. 이때, 상기 Cas12f1 단백질과 상호작용하여 CRISPR/Cas12f1 복합체를 형성하도록 하는 서열 부분을 스캐폴드 서열이라 할 수 있다. 이때, 상기 스캐폴드 서열은 Cas12f1 단백질과 상호작용할 수 있는 부분을 통틀어 일컬으며, 한 분자의 RNA 서열로 제한되지 않는다. 구체적으로, 상기 스캐폴드 서열은 두 분자 이상의 RNA의 서열을 포함할 수 있다.
일 구현예로, 상기 엔지니어링 된 가이드 RNA가 듀얼 가이드 RNA인 경우, 상기 스캐폴드 서열은 상기 엔지니어링 된 가이드 RNA 서열 중 tracrRNA 서열 및 crRNA에 포함된 CRISPR RNA반복 서열을 포함할 수 있다. 일 구현예로, 상기 tracrRNA 서열은 자연계에서 발견되는 tracrRNA 서열의 전부 또는 일부가 변형된 것일 수 있다. 일 구현예로, 상기 CRISPR RNA 반복 서열은 자연계에서 발견되는 CRISPR RNA 반복 서열의 전부 또는 일부가 변형된 것일 수 있다.
일 구현예로, 상기 엔지니어링 된 가이드 RNA가 싱글 가이드 RNA인 경우, 상기 스캐폴드 서열은 상기 tracrRNA 서열, 상기 링커 서열, 및 상기 crRNA 서열에 포함된 CRISPR RNA 반복 서열을 포함할 수 있다. 일 구현예로, 상기 tracrRNA 서열은 자연계에서 발견되는 tracrRNA 서열의 전부 또는 일부가 변형된 것일 수 있다. 일 구현예로, 상기 CRISPR RNA 반복 서열은 자연계에서 발견되는 CRISPR RNA 반복 서열의 전부 또는 일부가 변형된 것일 수 있다.
일 구현예로, 상기 스캐폴드 서열은 서열번호 253 내지 254로 이뤄진 그룹에서 선택된 서열일 수 있다. 일 구현예로, 상기 스캐폴드 서열은 서열번호 253 내지 254로 이뤄진 그룹에서 선택된 서열과 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 75%, 74%, 73%, 72%, 71%, 70%, 69%, 68%, 67%, 66%, 65%, 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 또는 50% 일치하는, 또는 상동성 있는 서열일 수 있다. 일 구현예로, 상기 스캐폴드 서열은 서열번호 253 내지 254로 이뤄진 그룹에서 선택된 서열과 바로 이전 문장에서 선택된 두 수치 범위 내 일치하는 서열일 수 있다. 예를 들어, 상기 스캐폴드 서열은 서열번호 253 내지 254로 이뤄진 그룹에서 선택된 스캐폴드 서열과 90% 내지 100% 일치하는 서열일 수 있다. 또 다른 예를 들어, 상기 스캐폴드 서열은 서열번호 253 내지 254로 이뤄진 그룹에서 선택된 스캐폴드 서열과 60% 내지 80% 일치하는 서열일 수 있다.
엔지니어링 된 CRISPR/Cas12f1 복합체
CRISPR/Cas12f1 복합체 - 개괄
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 복합체를 제공한다. 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 단백질 및 엔지니어링 된 가이드 RNA를 포함한다. 일 구현예로, 상기 Cas12f1 단백질은 Cas14 패밀리에서 유래한 것일 수 있다. 상기 엔지니어링 된 가이드 RNA 서열은 tracrRNA 서열, crRNA 서열, 및 U-rich tail 서열을 포함한다. 달리 표현하여, 상기 엔지니어링 된 가이드 RNA 서열은 스캐폴드 서열, 스페이서 서열, 및 U-rich tail 서열을 포함한다. 상기 U-rich tail 서열은 상기 crRNA 서열의 3'말단에 연결되어 있다. 상기 U-rich tail 서열은 상기 <U-rich tail 서열> 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
일 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수다.
또 다른 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있으며, 이때, a, n, 및 b는 정수이며, a는 1 이상 4 이하, n은 0 이상이며, b는 1 이상 10 이하일 수 있다.
상기 스캐폴드 서열은 상기 Cas12f1 단백질과 상호작용할 수 있으며, 상기 엔지니어링 된 가이드 RNA 및 상기 Cas12f1 단백질이 복합체를 형성하는 데 중요한 역할을 한다.
Cas12f1 단백질 - 개괄
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 단백질이 포함된다. 기본적으로, 상기 Cas12f1 단백질은 자연계에 존재하는 야생형 Cas12f1 단백질일 수 있다. 상기 Cas12f1 단백질을 암호화하는 서열은 야생형 Cas12f1 단백질에 대해 인간 코돈-최적화된 Cas12f1 서열일 수 있다. 또한, 상기 Cas12f1 단백질은 자연계에 존재하는 야생형 Cas12f1 단백질과 동일한 기능을 가질 수 있다. 하지만, 특별히 한정하지 않는 한, 본 명세서에서 "Cas12f1 단백질"이라고 할 때, 이는 야생형, 또는 코돈 최적화된 Cas12f1 단백질 뿐 아니라, 변형된 Cas12f1 단백질 내지 Cas12f1 융합 단백질도 포괄하여 의미할 수 있다. 또한, 자연계에 존재하는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 것 뿐 아니라, 상기 기능의 전부 또는 일부가 변형된 것, 상기 기능의 전부 또는 일부가 상실된 것, 및/또는 추가적인 기능이 부가된 것을 통틀어 일컬을 수 있다. Cas12f1 단백질의 의미는 문맥에 따라 적절히 해석될 수 있고, 특별한 경우가 아닌 한 가장 넓은 의미로 해석된다. 이하 Cas12f1 단백질의 구성, 또는 기능에 대해 자세히 설명한다.
Cas12f1 단백질 - 야생형 Cas12f1 단백질
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 단백질을 포함할 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 야생형의 Cas12f1 단백질일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 유래한 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a 단백질(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 Cas14a1 단백질일 수 있다.
Cas12f1 단백질 - 변형된 Cas12f1 단백질
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 변형된 Cas12f1 단백질을 포함할 수 있다. 상기 변형된 Cas12f1은 야생형, 또는 코돈 최적화된 Cas12f1 단백질 서열에서 적어도 일부 서열이 변형된 것을 의미한다. 상기 Cas12f1 단백질 변형은 개별 아미노산 단위로 이루어진 것일 수 있고, 단백질의 기능적 도메인 단위로 이루어진 것일 수 있다. 일 구현예로, 상기 단백질의 변형은 야생형, 또는 코돈 최적화된 Cas12f1 단백질 서열에서 하나 이상의 아미노산, 펩타이드, 폴리펩타이드, 단백질, 및/또는 도메인이 개별적으로 치환, 제거, 및/또는 부가된 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 하나 이상의 아미노산, 펩타이드, 및/또는 폴리펩타이드가 치환, 제거, 및/또는 부가된 것일 수 있다.
Cas12f1 단백질 - Cas12f1 융합 단백질
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체는 Cas12f1 융합 단백질을 포함할 수 있다. 이때, 상기 Cas12f1 융합 단백질은 야생형, 또는 변형된 Cas12f1 단백질에 추가적인 아미노산, 펩타이드, 폴리펩타이드, 단백질, 및/또는 도메인이 융합된 단백질을 의미한다.
일 구현예로, Cas12f1 단백질은 야생형의 Cas12f1 단백질에 베이스 에디터, 및/또는 역전사 효소(reverse transcriptase)가 융합된 것일 수 있다. 일 구현예로, 상기 베이스 에디터는 adenosine deaminase, 및/또는 cytosine deaminase일 수 있다. 일 구현예로, 상기 역전사 효소는 Moloney Murine Leukemia Virus(M-MLV) 역전사 효소, 및/또는 그 변이체일 수 있다. 이때, 상기 역전사 효소가 융합된 Cas12f1 단백질은 프라임 에디터로 기능할 수 있다.
일 구현예로, Cas12f1 단백질은 야생형의 Cas12f1 단백질에, 세포 내의 유전자 발현 과정에 관여할 수 있는 다양한 효소가 융합된 것일 수 있다. 이때, 상기 효소가 융합된 Cas12f1 단백질은 세포 내 유전자 발현에 다양한 양적, 질적 변화를 초래할 수 있다. 일 구현예로, 상기 효소는 DNMT, TET, KRAB, DHAC, LSD, 및/또는 p300일 수 있다.
Cas12f1 단백질 - 기능의 변경
본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체에 포함된 Cas12f1 단백질은 야생형의 Cas12f1 단백질과 동일한 기능을 가질 수 있다. 본 명세서에서 제공하는 엔지니어링 된 CRISPR/Cas12f1 복합체에 포함된 Cas12f1 단백질은 야생형의 Cas12f1 단백질과 비교할 때, 기능이 변경된 것일 수 있다. 구체적으로, 상기 변경은 전부 또는 일부 기능의 변형, 전부 또는 일부 기능의 상실, 및/또는 부가적인 기능의 추가일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 당업계 통상의 기술자가 CRISPR/Cas 시스템의 Cas 단백질에 적용할 수 있는 변경이라면, 특별히 제한되지 않는다. 이때 상기 변경은 공지의 기술을 이용한 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 더 나아가, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없도록 변경된 것일 수 있다. 더 나아가, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 것일 수 있다.
Cas12f1 단백질 - 기타 변형 예시
일 구현예로, 상기 Cas12f1 단백질은 NLS(Nuclear Localization Sequence), 또는 NES(Nuclear Export Sequence)를 포함할 수 있다. 구체적으로, 상기 NLS는 <용어의 정의> 중 NLS 섹션에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 Cas12f1 단백질은 태그를 포함할 수 있다. 구체적으로, 상기 태그는 <용어의 정의> 중 태그 섹션에 예시된 것 중 어느 하나일 수 있으나, 이에 제한되는 것은 아니다.
Cas12f1 단백질 - PAM 서열
CRISPR/Cas12f1 복합체가 표적 유전자, 또는 표적 핵산을 절단하기 위해서는 두 가지 조건이 필요하다. 첫째로, 표적 유전자, 또는 표적 핵산 내에 Cas12f1 단백질이 인식할 수 있는 일정 길이의 염기 서열이 있어야 한다. 둘째로, 상기 일정 길이의 염기 서열 주변에 가이드 RNA에 포함된 스페이서 서열과 상보적으로 결합할 수 있는 서열이 있어야 한다. 위 두 가지 조건이 만족되어 1) Cas12f1 단백질이 상기 일정 길이의 염기 서열을 인식하고, 2) 상기 스페이서 서열 부분이 상기 일정 길이의 염기 서열 주변 서열 부분과 상보적으로 결합하는 경우, 표적 유전자, 또는 표적 핵산이 절단된다. 이때, 상기 Cas12f1 단백질에 의해 인식되는 일정 길이의 염기 서열을 Protospacer Adjacent Motif(PAM) 서열이라 한다. 상기 PAM 서열은 상기 Cas12f1 단백질에 따라 정해지는 고유한 서열이며, 상기 CRISPR/Cas12f1 복합체의 표적 서열을 결정할 때, 상기 PAM 서열과 인접한 서열 내에서 상기 표적 서열을 결정해야 한다는 제약이 따른다.
Cas12f1 단백질 - PAM 서열 예시
일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 T-rich 서열일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, TTTN일 수 있다. 이때, 상기 N은 디옥시티미딘(T), 디옥시아데노신(A), 디옥시사이티딘(C), 또는 디옥시구아노신(G) 중 하나이다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5'말단에서 3'말단 순서로, TTTA, TTTT, TTTC, 또는 TTTG일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 5' 말단에서 3' 말단 군서로, TTTA 또는 TTTG일 수 있다. 일 구현예로, 상기 Cas12f1 단백질의 PAM 서열은 야생형 Cas12f1 단백질의 PAM 서열과는 다른 것일 수 있다.
Cas12f1 단백질 - 서열 예시
일 구현예로, 상기 Cas12f1 단백질은 서열번호 281, 317, 319, 321, 및 323으로 이루어진 군에서 선택된 아미노산 서열을 가질 수 있다.
일 구현예로, 상기 Cas12f1 단백질을 암호화하는 DNA 서열은 인간 코돈-최적화된 서열일 수 있다.
일 구현예로, 상기 Cas12f1 단백질을 암호화하는 DNA 서열은 서열번호 1, 2, 316, 318, 320 및 322로 이루어진 군에서 선택된 DNA 서열일 수 있다.
엔지니어링 된 가이드 RNA
본 명세서에서 제공되는 CRISPR/Cas12f1 복합체를 구성하는 엔지니어링 된 가이드 RNA는 <CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA> 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
CRISPR/Cas12f1 복합체 - 구성 예시
일 구현예로, 상기 Cas12f1 단백질은 서열번호 281의 아미노산 서열을 가지고, 상기 엔지니어링 된 가이드 RNA는 서열번호 75 내지 125로 이루어진 군에서 선택된 아미노산 서열을 가지며, 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA가 결합하여 CRISPR/Cas12f1 복합체를 이루고 있을 수 있다.
일 구현예로, 상기 Cas12f1 단백질은 서열번호 317, 319, 321, 및 323로 이뤄진 군에서 선택된 아미노산 서열을 가지고, 상기 엔지니어링 된 가이드 RNA는 서열번호 75 내지 125, 및 261 내지 280으로 이루어진 군에서 선택된 서열을 가지며, 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA가 결합하여 이루어진 CRISPR/Cas12f1 복합체는 베이스 에디팅 기능을 가질 수 있다.
CRISPR/Cas12f1 시스템을 발현시키기 위한 벡터
개괄
본 명세서에서는 CRISPR/Cas12f1 시스템의 구성 요소를 발현시키기 위한 벡터를 제공한다. 상기 벡터는 Cas12f1 단백질, 및/또는 엔지니어링 된 가이드 RNA를 발현시키도록 구성된다. 상기 벡터의 서열은 상기 CRISPR/Cas12f1 시스템의 구성요소 중 하나를 암호화하는 핵산 서열을 포함하거나, 둘 이상의 구성요소를 암호화하는 핵산 서열을 포함할 수 있다. 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열 및/또는 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함한다. 상기 벡터의 서열은 하나 이상의 프로모터 서열을 포함한다. 상기 프로모터는 Cas12f1 단백질을 암호화하는 핵산 서열 및/또는 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열과 작동적으로 연결되어, 세포 내에서 상기 핵산 서열의 전사가 촉진될 수 있도록 한다. 상기 Cas12f1 단백질은 <엔지니어링 된 CRISPR/Cas12f1 복합체> 섹션에서 설명된 Cas12f1 단백질, 변형된 Cas12f1 단백질, 및/또는 Cas12f1 융합 단백질과 동일한 특징 및 구성을 가진다. 상기 엔지니어링 된 가이드 RNA는 <CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA> 섹션에서 설명된 엔지니어링 된 가이드 RNA와 동일한 특징 및 구성을 가진다.
상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열 및 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열, 및 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열을 포함할 수 있다. 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열을 세포 내에서 발현시키기 위한 프로모터 서열, 및 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 세포 내에서 발현시키기 위한 프로모터 서열을 포함하고, 상기 프로모터들은 각 발현 대상과 작동적으로 연결(operably linked)되어 있다. 일 구현예로, 상기 벡터의 서열은 상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열, 및 상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열을 포함할 수 있다.
상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열 및 둘 이상의 서로 다른 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제1 서열, 제1 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제2 서열, 제2 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제3 서열을 포함할 수 있다. 더 나아가, 상기 벡터의 서열은 상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열, 상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열, 상기 제3 서열과 작동 가능하게 연결된 제3 프로모터 서열을 포함할 수 있다.
발현 대상 - Cas12f1 단백질
상기 벡터는 Cas12f1 단백질을 발현하도록 구성된 것일 수 있다. 이때, 상기 Cas12f1 단백질은 <엔지니어링 된 CRISPR/Cas12f1 복합체> 섹션에서 설명된 것과 동일한 구성 및 특징을 가진다. 일 구현예로, 상기 벡터는 야생형의 Cas12f1 단백질을 발현하도록 구성된 것일 수 있다. 이때, 상기 야생형의 Cas12f1 단백질은 Cas14a1일 수 있다. 일 구현예로, 상기 벡터는 표적 핵산의 이중가닥 중 하나의 가닥만 절단하도록 변경된 Cas12f1 단백질을 발현하도록 구성된 것일 수 있다. 더 나아가, 상기 변경된 Cas12f1 단백질은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 것일 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없도록 변경된 것일 수 있다. 더 나아가, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 것일 수 있다.
발현 대상 - 엔지니어링 된 가이드 RNA
상기 벡터는 엔지니어링 된 가이드 RNA를 발현하도록 구성된 것일 수 있다. 상기 엔지니어링 된 가이드 RNA는 <CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA> 섹션에서 설명한 엔지니어링 된 가이드 RNA와 동일한 특징 및 구성을 가진다. 일 구현예로, 상기 벡터는 엔지니어링 된 가이드 RNA를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 엔지니어링 된 가이드 RNA 서열은 스캐폴드 서열, 스페이서 서열, 및 U-rich tail 서열을 포함할 수 있다. 일 구현예로, 상기 엔지니어링 된 가이드 RNA 서열은 tracrRNA 서열, crRNA 서열, 및 U-rich tail 서열을 포함할 수 있다. 일 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수다. 또 다른 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있다. 이때, a, n, 및 b는 정수이며, a는 1 이상 4 이하, n은 0 이상이며, b는 1 이상 10 이하일 수 있다.
상기 벡터는 둘 이상의 엔지니어링 된 가이드 RNA를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 벡터는 제1 엔지니어링 된 가이드 RNA 및 제2 엔지니어링 된 가이드 RNA를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 제1 엔지니어링 된 가이드 RNA 서열은 제1 스캐폴드 서열, 제1 스페이서 서열, 및 제1 U-rich tail 서열을 포함하고, 상기 제2 엔지니어링 된 가이드 RNA 서열은 제2 스캐폴드 서열, 제2 스페이서 서열, 및 제2 U-rich tail 서열을 포함할 수 있다.
발현 대상 - 부가 구성 요소
상기 벡터는 전술한 발현 대상 외, NLS, 태그 단백질 등의 부가 구성 요소를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 부가 구성 요소는 상기 Cas12f1, 변형된 Cas12f1, 및/또는 엔지니어링 된 가이드 RNA와는 독립적으로 발현될 수 있다. 또 다른 구현예로, 상기 부가 구성 요소는 상기 Cas12f1, 변형된 Cas12f1, 및/또는 엔지니어링 된 가이드 RNA와 연결되어 발현될 수 있다. 이때, 상기 부가 구성 요소는 CRISPR/Cas 시스템을 발현시키고자 할 때 일반적으로 발현시키는 구성 요소일 수 있으며, 공지기술을 참조할 수 있다. 상기 부가 구성 요소는 <배경기술 - CRISPR/Cas 시스템 발현 벡터 설계> 섹션에서 설명된 구성 요소 중 하나 이상일 수 있다.
벡터 구성 - Cas12f1 단백질 발현 서열
상기 벡터 서열은 상기 Cas12f1 단백질을 암호화하는 핵산 서열을 포함할 수 있다. 이때, 상기 Cas12f1 단백질은 <엔지니어링 된 CRISPR/Cas12f1 복합체> 섹션에서 설명된 것과 동일한 구성 및 특징을 가진다. 일 구현예로, 상기 벡터의 서열은 야생형의 Cas12f1 단백질을 암호화하는 서열을 포함할 수 있다. 이때, 상기 야생형의 Cas12f1 단백질은 Cas14a1일 수 있다. 일 구현예로, 상기 벡터의 서열은 Cas12f1 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열을 포함할 수 있다. 이때, 상기 Cas12f1 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열은 Cas14a1 단백질을 암호화하는 인간 코돈 최적화된 핵산 서열일 수 있다. 일 구현예로, 상기 벡터의 서열은 변형된 Cas12f1 단백질 또는 Cas12f1 융합 단백질을 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 표적 핵산의 이중가닥 중 하나의 가닥만 절단할 수 있고, 절단하지 않는 가닥에 대해 베이스 에디팅(Base editing) 또는 프라임 에디팅(Prime editing)을 할 수 있도록 변경된 Cas12f1 단백질을 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 Cas12f1 단백질은 표적 핵산의 이중가닥 전부를 절단할 수 없고, 표적 핵산에 대해 베이스 에디팅(Base editing), 프라임 에디팅(Prime editing), 또는 유전자 발현 조절 기능을 할 수 있도록 변경된 Cas12f1 단백질을 암호화하는 서열을 포함할 수 있다.
벡터 구성 - 엔지니어링 된 가이드 RNA 발현 서열
일 구현예로, 상기 벡터의 서열은 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 엔지니어링 된 가이드 RNA의 서열은 스캐폴드 서열, 스페이서 서열, 및 U-rich tail 서열을 포함할 수 있다. 일 구현예로, 상기 엔지니어링 된 가이드 RNA의 서열은 tracrRNA 서열, crRNA 서열, 및 U-rich tail 서열을 포함할 수 있다. 일 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수다. 또 다른 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있다. 이때, a, n, 및 b는 정수이며, a는 1 이상 4 이하, n은 0 이상이며, b는 1 이상 10 이하일 수 있다.
일 구현예로, 상기 벡터의 서열은 둘 이상의 서로 다른 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 일 구현예로, 상기 벡터의 서열은 제1 엔지니어링 된 가이드 RNA를 암호화하는 서열, 및 제2 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함할 수 있다. 이때, 상기 제1 엔지니어링 된 가이드 RNA 서열에 포함된 스페이서 서열은 상기 제2 엔지니어링 된 가이드 RNA 서열에 포함된 스페이서 서열과 서로 다를 수 있다. 더 나아가, 상기 제1 엔지니어링 된 가이드 RNA 서열에 포함된 U-richt tail 서열은 상기 제2 엔지니어링 된 가이드 RNA 서열에 포함된 U-rich tail 서열과 서로 다를 수 있다. 일 구현예로, 상기 제1 엔지니어링 된 가이드 RNA 서열은 제1 스캐폴드 서열, 제1 스페이서 서열, 및 제1 U-rich tail 서열을 포함하고, 상기 제2 엔지니어링 된 가이드 RNA 서열은 제2 스캐폴드 서열, 제2 스페이서 서열, 및 제2 U-rich tail 서열을 포함할 수 있다.
벡터 구성 - 프로모터 서열
상기 벡터 서열은 각 구성요소를 암호화하는 서열에 작동 가능하게 연결된 프로모터 서열을 포함한다. 구체적으로, 상기 프로모터 서열은 <배경기술 - CRISPR/Cas 시스템 발현 벡터 설계> 섹션 중 프로모터 부분에 개시된 프로모터 중 하나일 수 있으나, 이에 제한되지 않는다.
일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 Cas12f1 단백질을 암호화하는 서열과 작동 가능하게 연결된이다. 일 구현예로, 상기 벡터 서열은 엔지니어링 된 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 엔지니어링 된 가이드 RNA를 암호화하는 서열과 작동 가능하게 연결된이다. 일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 서열, 엔지니어링 된 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 Cas12f1 단백질을 암호화하는 서열, 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 서열과 작동적으로 연결되며, 상기 프로모터 서열로 인해 활성화된 전사 인자가 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 발현시킨다.
벡터 구성 - 둘 이상의 프로모터 서열 포함 가능
일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 제1 서열, 제1 프로모터 서열, 엔지니어링 된 가이드 RNA를 암호화하는 제2 서열, 및 제2 프로모터 서열을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상지 제2 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도된다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 동일한 종류의 프로모터일 수 있다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 상이한 종류의 프로모터일 수 있다.
일 구현예로, 상기 벡터 서열은 Cas12f1 단백질을 암호화하는 제1 서열, 제1 프로모터 서열, 제1 엔지니어링 된 가이드 RNA를 암호화하는 제2 서열, 제2 프로모터 서열, 제2 엔지니어링 된 가이드 RNA를 암호화하는 제3 서열, 및 제3 프로모터 서열 을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상기 제2 서열과 작동적으로 연결되고, 상기 제3 프로모터 서열은 상기 제3 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도되며, 상기 제3 프로모터 서열에 의해 상기 제3 서열의 전사가 유도된다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 동일한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터 서열 및 상기 제3 프로모터 서열은 U6 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 상이한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터는 U6 프로모터 서열, 상기 제3 프로모터는 H1 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다.
벡터 구성 - 종결 신호
상기 벡터는 상기 프로모터 서열과 작동 가능하게 연결된 종결 신호를 포함할 수 있다. 이때, 상기 종결 신호는 <배경기술 - CRISPR/Cas 시스템 발현 벡터 설계> 섹션의 종결 신호 부분에서 개시된 종결 신호 중 하나일 수 있으나, 이에 제한되지 않는다. 상기 종결 신호는, 프로모터 서열의 종류에 따라 달라질 수 있다. 일 구현예로, 상기 벡터 서열이 U6 프로모터 서열을 포함하는 경우, 상기 U6 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다. 일 구현예로, 상기 벡터 서열이 H1 프로모터 서열을 포함하는 경우, 상기 H1 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다.
벡터 구성 - U-rich tail을 암호화하는 서열 및 종결 신호의 관계
본 명세서에서 제공하는 엔지니어링 된 가이드 RNA의 서열은 그 3'말단에 U-rich tail 서열을 포함한다. 이에 따라, 상기 엔지니어링 된 가이드 RNA를 암호화하는 서열은 그 3'말단에 U-rich tail 서열에 대응하는 T-rich 서열을 포함하게 된다. 전술한 바, 일부 프로모터 서열은 티미딘 연속 서열, 예를 들어 티미딘이 5개 이상 연속으로 연결된 서열을 종결 신호로 인식하므로, 경우에 따라 상기 T-rich 서열을 종결 신호로 인식하게 될 수 있다. 달리 표현하면, 본 명세서에서 제공하는 벡터 서열이 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 경우, 상기 엔지니어링 된 가이드 RNA 서열에 포함된 U-rich tail 서열을 암호화하는 서열이 종결 신호로 사용될 수 있다. 일 구현예로, 상기 벡터 서열이 U6 또는 H1 프로모터 서열을 포함하고, 이와 작동 가능하게 연결된 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함할 때, 상기 엔지니어링 된 가이드 RNA 서열에 포함된 U-rich tail 서열을 암호화하는 서열 부분이 종결 신호로 인식될 수 있다. 이때, 상기 U-rich tail 서열은 유리딘이 5개 이상 연속으로 연결된 서열을 포함한다.
벡터 구성 - 기타 구성
상기 벡터 서열은 상기 구성 외, 목적에 따라 필요한 구성요소를 포함할 수 있다. 일 구현예로, 상기 벡터 서열은 조절/제어 구성요소 서열, 및/또는 부가 구성 요소 서열을 포함할 수 있다. 일 구현예로, 상기 부가 구성 요소는 형질주입된 세포를 비형질주입 세포로부터 구별하기 위한 목적으로 부가된 것일 수 있다. 이때, 상기 조절/제어 구성요소 서열 및 부가 구성 요소는 <배경기술 - CRISPR/Cas 시스템 발현 벡터 설계> 섹션에 개시된 것 중 하나일 수 있으나, 이에 제한되는 것은 아니다.
벡터 종류 - 바이러스 벡터
상기 벡터는 바이러스 벡터일 수 있다. 일 구현예로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상일 수 있다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
벡터 종류 - 비바이러스 벡터
상기 벡터는 비바이러스 벡터일 수 있다. 일 구현예로, 상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, 및 mRNA로 구성된 군에서 선택되는 1 이상일 수 있다. 일 구현예로, 상기 플라스미드는 pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 파지는 λλλλΔ및 M13으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 벡터는 PCR 앰플리콘(amplicon)일 수 있다.
벡터 형태 - 원형 또는 선형 벡터
상기 벡터는 원형 또는 선형 형태일 수 있다. 상기 벡터가 선형 벡터인 경우, 상기 선형 벡터 서열이 종결 신호를 따로 포함하지 않더라도, 그 3'말단에서 RNA 전사가 종결된다. 이와 비교하여, 상기 벡터가 원형 벡터인 경우, 상기 원형 벡터 서열이 종결 신호를 따로 포함하지 않는다면, RNA 전사가 종결되지 않게 된다. 따라서, 상기 벡터로 원형 벡터를 사용하는 경우, 의도한 대상을 발현하기 위해서는 각 프로모터 서열과 관련된 전사 인자에 대응하는 종결 신호가 포함되어야 한다. 일 구현예로, 상기 벡터는 선형 벡터일 수 있다. 일 구현예로, 상기 벡터는 선형의 앰플리콘일 수 있다. 일 구현예로, 상기 벡터는 서열번호 1 내지 2, 127 내지 177로 이뤄진 군에서 선택된 서열을 포함하는 선형 벡터일 수 있다. 일 구현예로, 상기 벡터는 원형 벡터일 수 있다. 일 구현예로, 상기 벡터는 서열번호 1 내지 2, 127 내지 177로 이뤄진 군에서 선택된 서열을 포함하는 원형 벡터일 수 있다.
벡터 - 서열 예시
일 구현예로, 상기 벡터 서열은 서열번호 1 내지 2, 127 내지 177로 이뤄진 군에서 선택된 하나 이상의 서열을 포함할 수 있다. 일 구현예로, 상기 벡터 서열은 서열번호 1, 2, 316, 318, 320, 및 322로 이뤄진 군에서 선택된 하나 이상의 서열을 포함할 수 있다.
핵산의 화학적인 변형
본 명세서에서는 엔지니어링 된 crRNA 또는 이를 암호화하는 핵산, 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및/또는 CRISPR/Cas12f1 시스템의 구성 요소를 발현시키기 위한 벡터 등 핵산을 포함하거나, 핵산으로 이뤄진 구성 요소를 제공한다. 이때, 상기 구성 요소에서 "핵산"이라 함은, 자연계에 존재하는 DNA, 또는 RNA일 수 있고, 상기 구성 핵산의 일부 또는 전부에 화학적 변형이 일어난, 변형된 핵산일 수 있다. 일 구현예로, 상기 구성 핵산은 자연계에 존재하는 DNA, 및/또는 RNA일 수 있다. 일 구현예로, 상기 구성 핵산은 하나 이상의 뉴클레오타이드가 화학적으로 변형된 것일 수 있다. 이때, 상기 화학적 변형은 당업자에게 알려진 핵산의 변형을 모두 포함한다. 구체적으로, 상기 화학적 변형은 (WO 2019/089820 A1)에 기재된 핵산의 변형을 모두 포함할 수 있으나, 이에 제한되는 것은 아니다.
엔지니어링 된 crRNA를 이용한 유전자 편집 방법
개괄
본 명세서에서는 엔지니어링 된 crRNA를 이용하여 대상 세포 내의 표적 유전자, 또는 표적 핵산을 편집하는 방법을 제공한다. 상기 표적 유전자, 또는 표적 핵산은 표적 서열을 포함한다. 상기 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 상기 유전자 편집 방법은, 엔지니어링 된 가이드 RNA, 및 Cas12f1 단백질, 또는 각각을 암호화하는 핵산을 표적 유전자, 또는 표적 핵산을 포함하고 있는 대상 세포 내에 전달하는 것을 포함한다. 그 결과, 상기 대상 세포 내에 엔지니어링 된 CRISPR/Cas12f1 복합체가 주입되거나, 엔지니어링 된 CRISPR/Cas12f1 복합체의 형성이 유도되며, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체에 의해 표적 유전자가 편집된다. 상기 엔지니어링 된 가이드 RNA는 <CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA> 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다. 상기 Cas12f1 단백질은 <엔지니어링 된 CRISPR/Cas12f1 복합체> 섹션에서 설명된 Cas12f1 단백질, 및/또는 변형된 Cas12f1 단백질과 동일한 특징 및 구성을 가진다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 엔지니어링 된 가이드 RNA 서열은 스캐폴드 서열, 스페이서 서열, 및 U-rich tail 서열을 포함한다. 이때, 상기 스페이서 서열은 상기 대상 세포 내에 포함된 표적 유전자, 또는 표적 핵산과 상보적으로 결합할 수 있다. 일 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있다. 이때, a, n, 및 b는 정수이며, a는 1 이상 4 이하, n은 0 이상이며, b는 1 이상 10 이하다. 또 다른 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수다.
대상 세포
일 구현예로, 상기 대상 세포는 원핵 세포일 수 있다. 일 구현예로, 상기 대상 세포는 진핵 세포일 수 있다. 구체적으로, 상기 진핵 세포는 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
표적 서열 결정
CRISPR/Cas12f1 복합체로 편집하고자 하는 표적 유전자, 또는 표적 핵산, 및 표적 서열은 유전자 편집의 목적, 대상 세포 환경, Cas12f1 단백질이 인식하는 PAM 서열, 및/또는 기타 변수를 고려하여 결정할 수 있다. 이때, 적절한 길이의 표적 서열을 결정할 수 있다면, 그 방법은 특별히 제한되지 않으며, 공지된 기술을 활용할 수 있다.
표적 서열에 따른 스페이서 서열 결정
상기 표적 서열이 결정되고 나면, 이에 대응하는 스페이서 서열을 설계한다. 상기 스페이서 서열은 상기 표적 서열과 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 유전자와 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산과 상보적으로 결합할 수 있도록 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 표적 가닥 서열에 포함된 표적 서열과 상보적인 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 비표적 가닥 서열에 포함된 프로토스페이서의 DNA 서열에 상응하는 RNA 서열로 설계된다. 구체적으로, 상기 스페이서 서열은, 상기 프로토스페이서 서열과 동일한 염기 서열을 가지되, 상기 염기 서열에 포함된 티미딘 각각이 모두 유리딘으로 치환된 서열로 설계된다.
표적 서열과 스페이서 서열의 상보성
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 바로 이전 문장에서 선택된 수치 범위 내 상보적인 서열일 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 60% 내지 90% 상보적인 서열일 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 90% 내지 100% 상보적인 서열일 수 있다.
표적 서열과 스페이서 서열 간 미스매치 개수
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 미스매치를 가지는 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 바로 이전 문장에서 선택된 수치 범위 내의 미스매치를 가질 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 1개 내지 5개의 미스매치를 가질 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 6개 내지 10개의 미스매치를 기질 수 있다.
CRISPR/Cas12f1 복합체 이용
본 명세서에서 제공하는 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 표적 특이적으로 유전자, 또는 핵산을 절단하는 활성을 가지는 점을 이용한다. 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 <엔지니어링 된 CRISPR/Cas12f1 복합체> 섹션에서 설명된 엔지니어링 된 CRISPR/Cas12f1 복합체와 동일한 특징 및 구성을 가진다.
CRISRP/Cas12f1 복합체 각 구성 요소의 세포 내 전달
본 명세서에서 제공하는 유전자 편집 방법은 대상 세포 내에서 엔지니어링 된 CRISPR/Cas12f1 복합체가 표적 유전자 또는 표적 핵산과 접촉하는 것을 전제로 한다. 따라서, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체가 상기 표적 유전자, 또는 표적 핵산과 접촉하는 것을 유도하기 위해, 상기 유전자 편집 방법은 상기 엔지니어링 된 CRISPR/Cas12f1 복합체의 각 구성요소를 대상 세포 내에 전달하는 것을 포함한다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 및 Cas12f1 단백질을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 및 Cas12f1 단백질을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산은 다양한 전달 형태로, 다양한 전달 방법을 이용하여 대상 세포 내에 전달될 수 있다.
전달 형태 - RNP
상기 전달 형태로, 엔지니어링 된 가이드 RNA 및 Cas12f1 단백질이 결합한 리보뉴클레오프로틴 입자(Ribonucleoprotein particle, RNP)를 이용할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 및 Cas12f1 단백질이 결합한 CRISPR/Cas12f1 복합체를 대상 세포 내에 주입하는 것을 포함할 수 있다.
전달 형태 - 비바이러스 벡터
또 다른 전달 형태로, 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 비바이러스 벡터는 플라스미드, 네이키드 DNA, DNA 복합체, 또는 mRNA일 수 있으나, 이에 제한되는 것은 아니다. 또 다른 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 비바이러스 벡터, 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제2 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 비바이러스 벡터 및 상기 제2 비바이러스 벡터는 각각 플라스미드, 네이키드 DNA, DNA 복합체, 및 mRNA로 이뤄진 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 - 바이러스 벡터
또 다른 전달 형태로, 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
또 다른 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 바이러스 벡터, 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제2 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 바이러스 벡터 및 제2 바이러스 벡터는 각각 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 방법 - 일반적인 전달 수단
상기 전달 방법은, 세포 내로 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 적절한 전달 형태로 세포 내로 전달할 수 있는 것이라면 특별히 제한되지 않는다. 일 구현예로, 상기 전달 방법은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 및/또는 일시적인 세포 압축 또는 스퀴징일 수 있다.
전달 방법 - 나노파티클
상기 전달 방법은, 상기 CRISPR/Cas12f1 시스템에 포함된 적어도 하나의 구성요소를 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 당업계 통상의 기술자가 적절히 선택할 수 있는 공지된 방법일 수 있다. 예를 들어, 상기 나노파티클 전달 방법은 (WO 2019/089820 A1)에 개시된 방법일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 전달 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산 및/또는 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 일 구현예로, 상기 전달 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및/또는 제2 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et., al Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 CRISPR/Cas12f1 시스템의 구성 요소는 RNP, 비바이러스 벡터, 및/또는 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 CRISPR/Cas12f1 시스템의 구성 요소는 각 구성요소를 암호화하는 mRNA 형태일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 및 방법 - 조합 가능
상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성의 전달 형태 및/또는 전달 방법은 서로 동일하거나 상이할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 형태로 전달하고, Cas12f1 단백질 또는 이를 암호화하는 핵산은 제2 전달 형태로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 형태 및 상기 제2 전달 형태는 각각 전술한 전달 형태 중 어느 하나일 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 방법으로 전달하고, Cas12f1 단백질 또는 이를 암호화하는 핵산은 제2 전달 방법으로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 방법 및 상기 제2 전달 방법은 각각 전술한 전달 방법 중 어느 하나일 수 있다.
전달 순서
상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성이 세포 내에 동시에 전달될 수 있지만, 시간차를 두고 순차적으로 전달될 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 동시에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 엔지니어링 된 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질을 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 엔지니어링 된 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다.
복수의 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산 전달
본 명세서에서 제공하는 유전자 편집 방법은 대상 세포 내에 Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 둘 이상의 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 전달하는 것을 포함할 수 있다. 상기 방법을 통해, 서로 다른 서열을 표적하는 둘 이상의 CRISPR/Cas12f1 복합체가 대상 세포 내에 주입되거나, 대상 세포 내에서 형성될 수 있다. 그 결과, 세포 내에 포함된 둘 이상의 표적 유전자, 또는 표적 핵산이 편집될 수 있다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 제2 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하고 있는 대상 세포 내에 전달하는 것을 포함한다. 이때, 상기 각 구성요소는 전술한 전달 형태 및 전달 방법 중 하나 이상을 사용하여 세포 내로 전달될 수 있다. 이때, 둘 이상의 구성요소가 세포 내에 동시에 전달될 수 있고, 시간차를 두고 순차적으로 전달될 수 있다.
CRISPR/Cas12f1 복합체가 표적 핵산과 접촉
본 명세서에서 제공하는 유전자 편집 방법에서, 표적 유전자, 또는 표적 핵산의 편집은 대상 세포 내에서 엔지니어링 된 CRISPR/Cas12f1 복합체가 표적 유전자 또는 표적 핵산과 접촉하면서 이뤄진다. 따라서, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 접촉하도록 하거나, 접촉을 유도하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 표적 핵산과 접촉하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 표적 핵산과 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 엔지니어링 된 CRISPR/Cas12f1 복합체가 세포 내에서 표적 핵산과 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 일 구현예로, 상기 유도는 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
유전자 편집 결과 - 인델(indel)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산에 인델이 발생할 수 있다. 이때, 상기 인델은 표적 서열 부분 및/또는 프로토스페이서 서열 부분의 내부 및/또는 외부에서 일어날 수 있다. 상기 인델은, 유전자 편집 전 핵산의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 결실되거나, 임의의 뉴클레오타이드가 삽입되거나, 및/또는 상기 삽입과 결실이 혼입된 변이를 일컫는다. 일반적으로, 표적 유전자 또는 표적 핵산 서열 내 인델이 일어나면, 해당 유전자 또는 핵산이 불활성화된다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 뉴클레오타이드가 결실 및/또는 추가될 수 있다.
유전자 편집 결과 - 베이스 에디팅(base editing)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 베이스 에디팅이 일어날 수 있다. 이는 표적 유전자 또는 표적 핵산 내 임의의 염기가 결실, 또는 추가되는 인델과는 달리, 핵산 내 하나 이상의 특정 염기를 의도한 대로 변경하는 것을 의미한다. 달리 표현하면, 표적 유전자 또는 표적 핵산 내 특정 위치에서, 미리 의도한 점 돌연변이(point mutation)를 일으키는 것이다. 일 구현예로, 상기 유전자 편집 방법의 수행 결과, 표적 유전자 또는 표적 핵산 내 하나 이상의 염기가 다른 염기로 치환될 수 있다.
유전자 편집 결과 - 삽입(insertion)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 내 넉인이 발생할 수 있다. 상기 넉인은 표적 유전자 또는 표적 핵산 서열 내에 추가적인 핵산 서열을 삽입하는 것을 의미한다. 상기 넉인이 일어나려면, CRISPR/Cas12f1 복합체 외에 상기 추가적인 핵산 서열을 포함하는 도너가 더 필요하다. 세포 내에서 CRISPR/Cas12f1 복합체가 표적 유전자 또는 표적 핵산을 절단하는 경우, 상기 절단된 표적 유전자 또는 표적 핵산의 수복이 일어나게 된다. 이때, 상기 도너가 상기 수복 과정에 관여하여 상기 추가적인 핵산 서열이 표적 유전자 또는 표적 핵산 내에 삽입될 수 있도록 한다. 일 구현예로, 상기 유전자 편집 방법은 대상 세포 내로 도너를 전달하는 것을 추가적으로 포함할 수 있다. 이때, 상기 도너는 추가 대상 핵산을 포함하며, 상기 도너에 의해 상기 표적 유전자 또는 상기 표적 핵산 내 상기 추가 대상 핵산의 삽입이 유도된다. 이때, 상기 도너를 대상 세포 내로 전달할 때, 전술한 전달 형태 및/또는 전달 방법이 사용될 수 있다.
유전자 편집 결과 - 제거(deletion)
본 명세서에서 제공하는 유전자 편집 방법의 수행 결과로, 표적 유전자 또는 표적 핵산 서열의 전부 또는 일부를 제거할 수 있다. 상기 제거는 상기 표적 유전자 또는 상기 표적 핵산 내 일부 염기 서열을 제거하는 것을 의미한다. 일 구현예로, 상기 유전자 편집 방법은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 제2 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 표적 유전자 또는 표적 핵산을 포함하는 세포내에 도입하는 것을 포함한다. 이로 인해, 상기 유전자 편집 결과 표적 유전자 또는 표적 핵산 내에 특정 서열 부분의 제거가 일어난다.
유전자 편집 방법 예시
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA 및 Cas12f1 단백질이 결합한 리보뉴클레오프로틴 입자 형태의 CRISPR/Cas12f1 복합체를 진핵 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 전달은 전기천공법, 또는 lipofection을 이용한 것일 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 및 Cas12f1 단백질을 암호화하는 핵산을 진핵 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 전달은 전기천공법, 또는 lipofection을 이용한 것일 수 있다.
일 구현예로, 상기 유전자 편집 방법은 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터를 진핵세포 내에 전달하는 것을 포함할 수 있다.
일 구현예로, 상기 유전자 편집 방법은 제1 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열, 제2 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열, 및 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 아데노-연관 바이러스(AAV) 벡터를 진핵세포 내에 전달하는 것을 포함할 수 있다.
엔지니어링 된 crRNA의 용도
엔지니어링 된 crRNA의 유전자 편집 용도
일 구현예로, 상기 엔지니어링 된 crRNA를 표적 서열을 포함하는 표적 유전자 또는 핵산의 유전자 편집 용도로 사용할 수 있다.
일 구현예로, 상기 엔지니어링 된 가이드 RNA를 표적 서열을 포함하는 표적 유전자 또는 핵산의 유전자 편집 용도로 사용할 수 있다.
일 구현예로, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체를 표적 서열을 포함하는 표적 유전자 또는 핵산의 유전자 편집 용도로 사용할 수 있다.
이때, 상기 엔지니어링 된 crRNA, 상기 엔지니어링 된 가이드 RNA, 및 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 각 섹션에서 설명된 것과 동일한 특징 및 구성을 가진다.
일 구현예로, 상기 표적 유전자 또는 핵산의 유전자 편집 용도는 <엔지니어링 된 crRNA를 이용한 유전자 편집 방법> 섹션에서 설명된 방법을 수행하기 위한 용도일 수 있다.
일 구현예로, 상기 용도는 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 이때, 상기 엔지니어링 된 가이드 RNA 서열은 스캐폴드 서열, 스페이서 서열, 및 U-rich tail 서열을 포함한다. 이때, 상기 스페이서 서열은 상기 대상 세포 내에 포함된 표적 유전자, 또는 표적 핵산과 상보적으로 결합할 수 있다. 일 구현예로, 상기 U-rich tail 서열은 (UaV)nUb로 표현될 수 있다. 이때, a, n, 및 b는 정수이며, a는 1 이상 4 이하, n은 0 이상이며, b는 1 이상 10 이하다. 또 다른 구현예로, 상기 U-rich tail 서열은 (UaN)nUb로 표현될 수 있다. 이때, 상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이다. 이때, 상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수다.
일 구현예로, 상기 용도는 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 표적 핵산과 접촉하는 것을 포함할 수 있다.
이때, 상기 엔지니어링 된 CRISPR/Cas12f1 복합체는 <엔지니어링 된 CRISPR/Cas12f1 복합체> 섹션에서 설명된 것과 동일한 특징 및 구조를 가진다.
일 구현예로, 상기 용도는 엔지니어링 된 CRISPR/Cas12f1 복합체가 대상 세포 내에서 표적 핵산과 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 엔지니어링 된 CRISPR/Cas12f1 복합체가 세포 내에서 표적 핵산과 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 일 구현예로, 상기 유도는 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산, 및 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
엔지니어링 된 crRNA를 유전자 편집용 조성물을 제조하기 위한 용도
일 구현예로, 엔지니어링 된 crRNA를 유전자 편집용 조성물을 제조하기 위한 용도로 사용할 수 있다.
일 구현예로, 엔지니어링 된 가이드 RNA를 유전자 편집용 조성물을 제조하기 위한 용도로 사용할 수 있다.
일 구현예로, 엔지니어링 된 CRISPR/Cas12f1 복합체를 유전자 편집용 조성물을 제조하기 위한 용도로 사용할 수 있다.
일 구현예로, 상기 유전자 편집용 조성물은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 엔지니어링 된 crRNA 또는 이를 암호화하는 핵산, 및 tracrRNA 또는 이를 암호화하는 핵산을 포함할 수 있다.
일 구현예로, 상기 유전자 편집용 조성물은 Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 포함할 수 있다.
일 구현예로, 상기 유전자 편집용 조성물은 CRISPR/Cas12f1 복합체를 포함할 수 있다.
일 구현예로, 상기 유전자 편집용 조성물은 Cas12f1 단백질을 암호화하는 핵산 서열 및 엔지니어링 된 가이드 RNA를 암호화하는 핵산 서열을 가지는 벡터를 포함할 수 있다.
실험예
이하, 실험예 및 실시예를 통해 본 명세서가 제공하는 발명에 대해 더욱 상세히 설명한다. 이들 실시예는 오로지 본 명세서에 의해 개시되는 내용을 예시하기 위한 것으로, 본 명세서에 의해 개시되는 내용의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실험예 1 실험 재료 준비 및 실험 방법
실험예 1-1 인간 코돈-최적화된 Cas14a1 서열
Cas14 패밀리에 속하는 Cas12f1 단백질(이하 Cas14a1, Doudna et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))을 코돈 최적화 프로그램을 이용하여 코돈 최적화하고, 5'- 말단 및3'- 말단에 NLS sequecne를 추가한 해당 서열을 유전자 합성하여 CDS를 확보하였다. 합성된 유전자를 주형으로 PCR 증폭을 진행하고, Gibson assembly 방법을 통하여 Eukaryotic system에서 발현이 가능한 프로모터와 polyA signal sequence를 가지는 벡터에 원하는 cloning 서열에 맞게 cloning을 진행하였다. Cloning 완료하여 얻어진 플라스미드 벡터의 서열은 Sanger sequencing 방법을 통하여 최종 확인하였다. 상기 Cas14a1 단백질의 아미노산 서열 및 상기 Cas14a1 단백질을 암호화하는 인간 코돈-최적화된 핵산 서열은 표1에 나타냈다.
NLS-Cas14a1-NLS 단백질의 서열 정보
대상 서열 정보 서열번호
Cas14a1
(아미노산)
PKKKRKVGIHGVPAAMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEPKRPAATKKAGQAKKKK 281
Cas14a1(인간 코돈-최적화된 핵산) ccaaagaagaagcggaaggtcggtatccacggagtcccagcagccATGGCCAAGAACACAATTACAAAGACACTGAAGCTGAGGATCGTGAGACCATACAACAGCGCTGAGGTCGAGAAGATTGTGGCTGATGAAAAGAACAACAGGGAAAAGATCGCCCTCGAGAAGAACAAGGATAAGGTGAAGGAGGCCTGCTCTAAGCACCTGAAAGTGGCCGCCTACTGCACCACACAGGTGGAGAGGAACGCCTGTCTGTTTTGTAAAGCTCGGAAGCTGGATGATAAGTTTTACCAGAAGCTGCGGGGCCAGTTCCCCGATGCCGTCTTTTGGCAGGAGATTAGCGAGATCTTCAGACAGCTGCAGAAGCAGGCCGCCGAGATCTACAACCAGAGCCTGATCGAGCTCTACTACGAGATCTTCATCAAGGGCAAGGGCATTGCCAACGCCTCCTCCGTGGAGCACTACCTGAGCGACGTGTGCTACACAAGAGCCGCCGAGCTCTTTAAGAACGCCGCTATCGCTTCCGGGCTGAGGAGCAAGATTAAGAGTAACTTCCGGCTCAAGGAGCTGAAGAACATGAAGAGCGGCCTGCCCACTACAAAGAGCGACAACTTCCCAATTCCACTGGTGAAGCAGAAGGGGGGCCAGTACACAGGGTTCGAGATTTCCAACCACAACAGCGACTTTATTATTAAGATCCCCTTTGGCAGGTGGCAGGTCAAGAAGGAGATTGACAAGTACAGGCCCTGGGAGAAGTTTGATTTCGAGCAGGTGCAGAAGAGCCCCAAGCCTATTTCCCTGCTGCTGTCCACACAGCGGCGGAAGAGGAACAAGGGGTGGTCTAAGGATGAGGGGACCGAGGCCGAGATTAAGAAAGTGATGAACGGCGACTACCAGACAAGCTACATCGAGGTCAAGCGGGGCAGTAAGATTGGCGAGAAGAGCGCCTGGATGCTGAACCTGAGCATTGACGTGCCAAAGATTGATAAGGGCGTGGATCCCAGCATCATCGGAGGGATCGATGTGGGGGTCAAGAGCCCCCTCGTGTGCGCCATCAACAACGCCTTCAGCAGGTACAGCATCTCCGATAACGACCTGTTCCACTTTAACAAGAAGATGTTCGCCCGGCGGAGGATTTTGCTCAAGAAGAACCGGCACAAGCGGGCCGGACACGGGGCCAAGAACAAGCTCAAGCCCATCACTATCCTGACCGAGAAGAGCGAGAGGTTCAGGAAGAAGCTCATCGAGAGATGGGCCTGCGAGATCGCCGATTTCTTTATTAAGAACAAGGTCGGAACAGTGCAGATGGAGAACCTCGAGAGCATGAAGAGGAAGGAGGATTCCTACTTCAACATTCGGCTGAGGGGGTTCTGGCCCTACGCTGAGATGCAGAACAAGATTGAGTTTAAGCTGAAGCAGTACGGGATTGAGATCCGGAAGGTGGCCCCCAACAACACCAGCAAGACCTGCAGCAAGTGCGGGCACCTCAACAACTACTTCAACTTCGAGTACCGGAAGAAGAACAAGTTCCCACACTTCAAGTGCGAGAAGTGCAACTTTAAGGAGAACGCCGATTACAACGCCGCCCTGAACATCAGCAACCCTAAGCTGAAGAGCACTAAGGAGGAGCCCaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag 1
실험예 1-2 플라스미드 벡터 제조
본 실험에 사용된 인간 코돈-최적화된 Cas14a1 DNA서열을 포함하는 올리고뉴클레오타이드(Bionics)가 합성되었다. 상기 Cas14a1 단백질 서열에 대한 올리고뉴클레오타이드는 Chicken β프로모터, 5'말단 및 3'말단의 NLS, 및 T2A-linked eGFP를 포함하는 플라스미드에 cloning되었다. 본 실험에 사용된 canonical가이드 RNA에 대한 주형 DNA는 합성되었고(Twist Bioscience) pTwist Amp 플라스미드에 클로닝되어 복제되었다. 엔지니어링 된 가이드 RNA에 대한 주형 DNA는 엔자임 클로닝 기법을 이용하여 제작되었으며 pTwist Amp 플라스미드에 클로닝되어 복제되었다. 필요한 경우 상기 플라스미드를 주형으로 하여 U6-complementary forward primer 및 protospacer sequence-complementary reverse primer를 사용하여 가이드 RNA 또는 엔지니어링 된 가이드 RNA의 앰플리콘을 제조하였다. 또한 필요한 경우 제조한 앰플리콘을 T-blunt 플라스미드 (Biofact)에 클로닝하여 복제하였다. (엔지니어링 된) 듀얼 가이드 RNA를 제조하기 위해, tracrRNA 및 (엔지니어링 된) crRNA를 암호화하는 올리고뉴클레오타이드가 BamHI 및 HindIII 제한 효소(New England Biolabs)를 사용하여 pSilencer 2.0 (ThermoFisher Scientific)내로 복제되었다.
실험예 1-3 바이러스 벡터 제조
가이드 RNA(또는 엔지니어링 된 가이드 RNA) 서열, 및 NLS와 자가-절단 T2A 서열(self-cleaving T2A sequence)를 통해 강화된 녹색 형광 단백질(eGFP, enhanced green fluorescent protein)과 연결된 Cas12f1 단백질 서열을 포함하는 아데노-연관 바이러스 역 말단 반복 플라스미드 벡터(AAV inverted terminal repeat vector)가 제조되었다. Cas12f1 및 가이드 RNA 전사는 각각 chicken β및 U6 프로모터에 의해 촉진되었다. rAAV2 벡터를 제조하기 위해, pAAV-ITR-sgRNA-Cas12f1, pAAVED2/9 및 helper plasmid를 HEK293 T세포에 형질주입하였다. 상기 형질주입된 HEK293 T세포를 2% FBS를 포함하는 DMEM 배지에서 배양하였다. PEIpro(Polyplus-transfection) 및 동일 몰 비율에서 플라스미드에 대한 삼중-형질주입(triple-transfection)를 사용한 PEI 공침(coprecipitation)을 사용하여 재조합 pseudotyped AAV vector 스톡이 생성되었다. 72시간의 배양 후, 상기 세포들을 용해시켰고, 용해물은 iodixanol (Sigma-Aldrich) stepgradient ultracentrifugation에 의해 정제되었다.
실험예 1-4 가이드 RNA 앰플리콘 제조
가이드 RNA 및 엔지니어링 된 가이드 RNA 앰플리콘을 제조하기 위해, KAPA HiFi HotStart DNA polymerase(Roche) 또는 Pfu DNA polymerase(Biofact)를 이용하여, canonical가이드 RNA의 주형 DNA 플라스미드 및 엔지니어링된 가이드 RNA 주형 DNA 플라스미드를 U6-complementary forward primer 및 protospacer sequence-complementary reverse primer를 사용하여 PCR 증폭을 수행하였다. 상기 PCR 증폭 결과물을 Higene Gel&PCR purification system (Biofact)를 사용하여 정제하여 가이드 RNA 및 엔지니어링 된 가이드 RNA 앰플리콘을 수득하였다.
실험예 1-5 가이드 RNA 제조
가이드 RNA(또는 엔지니어링 된 가이드 RNA)를 제조하기 위해 다음 방법 중 어느 하나를 사용했다.
미리 설계한 가이드 RNA를 화학적으로 합성하여 가이드 RNA를 제조했다.
미리 설계한 가이드 RNA 서열 및 T7 프로모터 서열을 포함하는 PCR 앰플리콘을 제조했다. 상기 PCR 앰플리콘을 주형으로, NEB T7polymerase를 사용하여 in vitro transcription을 수행했다. 상기 in vitro transcription 수행 결과물에 NEB DNase I을처리한 후 Monarch RNA Cleanup Kit (NEB)를 이용하여 정제한 후, 가이드 RNA를 수득했다.
미리 설계한 가이드 RNA 서열 및 T7 프로모터 서열을 포함하는 플라스미드 벡터를 실험예 1-2에 Tblunt 플라스미드 클로닝방법에 따라 제조했다. 상기 벡터를 T7 프로모터 서열을 포함하는 가이드 RNA 서열 양 끝을 double cut 하여 정제한 후, 그 결과물에 NEB T7polymerase를 사용하여 in vitro transcription을 수행했다. 상기 in vitro transcription 수행 결과물에 NEB DNaseI를 처리한 후 Monarch RNA Cleanup Kit (NEB)를 이용하여 정제한 후, 가이드 RNA를 수득했다.
실험예 1-6 재조합 Cas12f1 단백질 제조
본 실험에 사용된 인간 코돈-최적화된 Cas14a1 DNA 서열을 pMAL-c2 플라스미드 벡터에 에 복제시켰다. 상기 플라스미드 벡터는 BL21(DE3) E. coli 세포의 형질전환에 사용되었다. 상기 형질전환된 E. coli 콜로니를 광학 밀도가 0.7에 도달할 때까지 37°C의 LB broth에서 성장시켰다. 상기 형질전환된 E. coli 세포들은 0.1 mM isopropylthio-β존재 하 18°C에서 하룻밤 배양되었다. 그 후, 상기 세포들은 3,500g에서 30분간 원심분리되고 수집되었다. 상기 세포들은 20 mM Tris-HCl (pH 7.6), 500 mM NaCl, 5mM β5% glycerol에서 재현탁되었다. 상기 세포는 용해되었고, 용해된 세포들은 sonication을 통하여 파쇄되었다. 파쇄된 세포가 포함된 샘플은15,000g로 30분 간 원심분리 된 후, 상측액은0.4-μm 주사기 필터(Millipore)를 통해 여과 되었다. 여과된 상층액은 FPLC 정제 시스템(
Figure pat00001
KTA Purifier, GE Healthcare)을 사용하여, Ni2+-친화성 컬럼에 로드되었다. The bound fractions는 80-400 mM imidazole, 20 mM Tris-HCl (pH 7.5) 구배에서 용출되었다. 상기 용출된 단백질은 TEV 프로테아제로 16시간 동안 처리되었다. 상기 절단된 단백질은 0.15-1.6 M NaCl 선형 농도구배의 Heparin 컬럼에서 정제되었다. Heparin 컬럼에서 정제된 재조합 Cas12f1 단백질은 20mM Tris pH7.6, 150mM NaCl, 5mM β5% glycerol에 대해 투석되었다. 상기 투석된 단백질은 MBP 컬럼을 통과시켜 정제후 0.5-1.2M NaCl의 선형 구배로 monoS 컬럼(GE Healthcare) 또는 EnrichS에서 재정재되었다. 상기 재정재된 단백질들을 모아, 20mM Tris pH7.6, 150mM NaCl, 5mM β5% glycerol에 대해 투석하여 Cas12f1 단백질을 제조하였다. 상기 생산된 단백질의 농도는 소 혈청 알부민을 표준으로 사용하여 Bradford 정량법을 이용하여 정량하여coomassie blue-stained SDS-PAGE 겔에서 전기 구형 적으로 측정되었다.
실험예 1-7 RNP 제조
실험예 1-6에 따라 제조한 재조합 Cas12f1 단백질, 및 실험예 1-5에 따라 제조한 가이드 RNA(또는 엔지니어링 된 가이드 RNA)를 각각 300nM 및 900nM을 10분 동안 실온에서 인큐베이션하여 리보뉴클레오프로틴 입자(RNP)를 제조하였다.
실험예 1-8 세포 배양
HEK-293 T세포(ATCC CRL-11269)를 DMEM 배지에서, 10% 열-비활성화 FBS(Corning) 및 1% 페니실린/스트렙토마이신을 첨가하고, 37°C, 5% CO2 조건에서 배양하였다.
실험예 1-9 세포 내 플라스미드 벡터 또는 PCR 앰플리콘 형질주입(transfection)
세포 형질주입은 전기천공법(electroporation) 또는 lipofection으로 수행되었다. 전기천공법의 경우, 각 2-5 μg의 실험예1-2에서 제조된 Cas12f1 단백질을 암호화하는 플라스미드 벡터및 가이드 RNA(및 엔지니어링 된 가이드 RNA)를 암호화하는 DNA가 Neon transfection system (Invitrogen)을 사용해 4X105 HEK-293 T세포에 형질주입(transfection) 하였다. 상기 전기천공법은 1300V, 10 mA, 3 pulse 조건 하 수행하였다. lipofection을 위해, 3-15 μL FuGene 시약을 (Promega) 1-5 μg의 Cas12f1 단백질을 암호화하는 플라스미드 벡터 및 0.3-2 μg의 PCR 앰플리콘과 15분동안 혼합하였다. 상기 혼합물이 형질주입 1일 전에 1X106개의 세포가 플레이팅 된 1 ml DMEM 배지에 첨가되었다. 상기 세포들을 상기 혼합물의 존재 하 72-96시간 배양시켰다. 배양 후, 상기 세포들이 수집되었고, 상기 세포의 게놈 DNA가 PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하거나, Maxwell RSC Cultured cells DNA Kit (Promega)를 사용하여 수작업으로 분리되었다.
실험예 1-10 세포 내 RNP 형질주입(transfection)
실험예 1-7에 따라 제조된 리보뉴클레오프로틴 입자(RNP)를 실험예 1-9의 전기천공법을 이용하여 형질주입하거나, 실험예1-2에서 제조된 Cas12f1 단백질을 암호화하는 플라스미드를 가이드RNA (및 엔지니어링된 가이드RNA)를 형질주입하기 1일 전 실험예 1-9의 lipofection 방법을 통하여 형질 주입 후 1일 후 실험예 1-5에 따라 제조된 가이드RNA (및 엔지니어링된 가이드 RNA)를 실험예 1-9의 전기천공법을 사용하여 형질주입하였다.
실험예 1-11 세포 내 바이러스 벡터 형질주입(transfection)
정량적 PCR에 의해 결정한 1, 5, 10, 50, 및 100의 상이한 감염 다중도(MOI, multiplicity of Infection)에서 인간 HEK293T 세포를 rAAV2-Cas12f1-sgRNA로 감염시켰다. 상기 형질감염된 HEK293T 세포는 2% FBS를 포함하는 DMEM 배지에서 배양되었다. 서로 다른 시점에서, 게놈 DNA의 분리를 위해 세포를 수집하였다.
실험예 1-12 정량적 real-time PCR (quantitative rtPCR)
HEK293 T세포에 RNeasy Miniprep kit (Qiagen) 또는 Maxwell RSC miRNA Tissue Kit (Promega)또는 DNeasy Blood & Tissue Kit(Qiagen)를 사용하여 가이드 RNA(또는 엔지니어링 된 가이드 RNA) 또는 게놈 DNA를 각각 추출하였다. 가이드 RNA를 정량화하기 위해서, RNA특이적 프라이머를 ligation 하고, crRNA-특이적 프라이머를 사용해 cDNA를 합성하였다. 상기 cDNA는 주형으로써 정량적 real-time PCR에 사용되었다. real-time PCR은 KAFA SYBR FAST qPCR Master Mix(2X) Kit (KAPAbiosystems)를 사용하여 분석되었다.
실험예 1-13 Cas 단백질 발현 확인을 위한 웨스턴 블롯(Western Blot)
실험예 1-2에 따라 제조된 Cas 단백질을 암호화하는 플라스미드 벡터를 제조했다. 이때, 상기 플라스미드는 Cas 단백질이 세포 내에서 발현될 때, HA 태그가 연결되어 발현될 수 있도록 HA 태그를 암호화하는 서열(5'-TACCCATACGATGTTCCAGATTACGCTTATCCCTACGACGTGCCTGATTATGCATACCCATATGATGTCCCCGACTATGCC-3', 서열번호: 315)을 추가로 가졌다. 상기 플라스미드 벡터를 실험예 1-8에서 배양한 HEK 293 T세포에 실험예 1-9에 개시된 방법에 따라 형질주입(transfection)했다. 상기 HEK 293 T세포를 페니실린/스트렙토마이신이 함유된 DMEM 배지에 접종하고, 37℃및 5% CO2 인큐베이터에서 48시간 동안 정치배양했다. 그 후 상기 HEK 293 T 세포를 PBS로 희석한 후, sonication 하여 파쇄하였다. 파쇄된 세포가 포함된 샘플은15,000g, 4도에서 로 10분 간 원심분리 된 후, 상측액을 Bradford 정량법을 이용하여 정량하였다. 정량된 HA antibody western blot을 통해 in vivo에서 발현되었는지를 테스트했다.
실험예 1-14 인델 효율 분석
HEK-293 T세포로부터 분리된 게놈 DNA 중, 프로토스페이서를 포함하는 영역을 표적-특이적 프라이머를 사용하여 KAPA HiFi HotStart DNA polymerase (Roche)의 존재 하 PCR을 수행하였다. 상기 증폭 방법은 제조사의 지시를 따랐다. Illumina TruSeq HT dual indexes를 포함하는 상기 증폭의 결과물인 PCR 앰플리콘을 Illumina iSeq 100를 사용하여 150-bp 페어 엔드 시퀀싱을 수행하였다. 인델 빈도는 MAUND를 사용하여 계산되었다. 상기 MAUND는 https://github.com/ibscge/maund 에서 제공된다.
실험예 1-15 T7 엔도뉴클레아제I(T7E1) 분석
BioFACTTM Lamp Pfu DNA polymerase를 사용하여 PCR 산물을 얻었다. 상기 PCR 산물(100-300㎍)을 25㎍반응 혼합물에서 10 유닛(units)의 T7E1 효소(New England Biolabs)와 함께 37℃에서 30분 동안 반응시켰다. 20㎕ 반응 혼합물을 10% 아크릴아마이드(acrylamide) 겔에 직접 로딩시키고, 절단된 PCR 산물을 TBE 버퍼 시스템에서 작동시켰다. 겔 이미지를 브롬화에티듐(ethidium bromide) 용 액으로 염색시킨 후, Printgraph 2M gel imaging system(Atto)을 이용하여 디지털화하였다. 상기 디지털화한 결과물을 분석하여 유전자 편집 효율을 평가하였다.
실험예 1-16 통계 분석
two-tailed Student's t-test에 의한 통계적 유의성 검증이 Sigma Plot software (ver. 14.0)에 의해 수행되었다. 0.05 미만의 p-value가 나타나는 경우 통계적으로 유의한 것으로 간주하였으며, p-value는 각 도면에 도시되어 있다. 박스 플롯(box plot) 및 점 플롯(dot plot)에서 데이터 포인트들은 전체 값 범위를 나타내며, 각 박스는은 4분위 범위 (25-75 percentile)에 걸쳐 있다. 중위값 및 평균값은 각각 검은색 및 빨간색 평행선으로 표시되었다. 모든 점 플롯(dot plot) 및 바 플롯(bar plot) 데이터의 에러바들은 Sigmaplot (v. 41.0)을 사용하여 도시되었으며, 각 데이터의 표준편차 값을 의미한다. 통계적 방법을 기반으로 샘플 크기를 미리 결정하지는 않았다.
실험예 2 U-rich tail을 갖는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율 비교 1
다양한 유전자 서열을 표적 핵산으로 하여, U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 각각의 PAM 서열이1 표2에 개시되어 있다.
실험예 2의 표적 핵산
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
RNF2 CACGTCTCATATGCCCCTTG (서열번호: 62) TTTA
DYtarget2 CACACACACAGTGGGCTACC (서열번호: 63) TTTG
DYtarget9 GACGTGGGAGACACACACAC (서열번호: 64) TTTA
DYtarget10 CATCCCCAGGACACACACAC (서열번호: 65) TTTG
DYtarget13 AGCACATGTGCACACACACA (서열번호: 66) TTTG
1) 실험예 1-2에 따라 Cas14a1 단백질을 암호화하는 인간 코돈-최적화된 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-4에 따라 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 제조했다. 상기 싱글 가이드 RNA를 암호화하는 DNA 서열 및 앰플리콘 제조에 사용한 프라이머 서열은 표3 내지 표5에 개시되어 있다.
실험예 2에 사용된 야생형(WT) sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
WT RNF2 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) CACGTCTCATATGCCCCTTG - 127
DYtarget2 CACACACACAGTGGGCTACC 129
DYtarget9 GACGTGGGAGACACACACAC 156
DYtarget10 CATCCCCAGGACACACACAC 158
DYtarget13 AGCACATGTGCACACACACA 171
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 DNA 서열은 은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 2에 사용된 엔지니어링 된 sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
Engineered sgRNA RNF2 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) CACGTCTCATATGCCCCTTG TTTTATTTTTT
128
DYtarget2 CACACACACAGTGGGCTACC 142
DYtarget9 GACGTGGGAGACACACACAC 157
DYtarget10 CATCCCCAGGACACACACAC 159
DYtarget13 AGCACATGTGCACACACACA 172
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 2에 사용된 프라이머 서열
sgRNA 표적핵산 Forward primer (5' to 3') Reverse primer(5' to 3') 서열번호
WT RNF2 GAGGGCCTATTTCCCATGATT (서열번호: 183) CAAGGGGCATATGAGACGTGGTTGCATTCCTTCATTCGTCTATTC 185
DYtarget2 GGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 187
DYtarget9 GTGTGTGTGTCTCCCACGTCGTTGCATTCCTTCATTCGTCTATTC 214
DYtarget10 GTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 216
DYtarget13 TGTGTGTGTGCACATGTGCTGTTGCATTCCTTCATTCGTCTATTC 229
Engineered sgRNA RNF2 aaaaaataaaa CAAGGGGCATATGAGACGTGGTTGCATTCCTTCATTCGTCTATTC 186
DYtarget2 aaaaaataaaaGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 200
DYtarget9 aaaaaataaaaTGTGTGTGTCTCCCACGTCGTTGCATTCCTTCATTCGTCTATTC 215
DYtarget10 aaaaaataaaaTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 217
DYtarget13 aaaaaataaaaGTGTGTGTGCACATGTGCTGTTGCATTCCTTCATTCGTCTATTC 230
3) 상기 Cas14a1 서열을 포함하는 플라스미드 벡터 및 상기 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9에 개시된 방법에 따라 형질주입(transfection) 시켰다.
4) 실험예 1-12 내지 실험예 1-15에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 다음 표6에 나타냈다.
실험예 2의 인델 효율 분석 결과
표적핵산 Control WT Engineered sgRNA
RNF2 0 0 0.029
DYtarget2 0 0.028 0.749
DYtarget9 0 0 0.238
DYtarget10 0.029 0.031 1.076
DYtarget13 0.529 0.526 1.176
이때, sgRNA 없이 Cas14a1 단백질 서열을 포함하는 플라스미드 벡터만을 형질주입한 것을 Control로 사용하였다.
실험예 3 U-rich tail을 갖는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율 비교 2
상기 DYtarget2, DYtarget10, DYtarget13, 및 Intergenic-22를 표적 핵산으로 하여, U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 각각의 PAM 서열이 표7에 개시되어 있다.
실험예 3에 사용된 표적 핵산 서열
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
Intergenic-22 AGAACACATACCCCTGGGCC (서열번호: 67) TTTA
DYtarget2 CACACACACAGTGGGCTACC (서열번호: 63) TTTG
DYtarget10 CATCCCCAGGACACACACAC (서열번호: 65) TTTG
DYtarget13 AGCACATGTGCACACACACA (서열번호: 66) TTTG
1) 실험예 1-2에 따라 인간 코돈-최적화된 Cas14a1 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-2에 따라 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 제조했다. 상기 싱글 가이드 RNA를 암호화하는 DNA 서열 및 앰플리콘 제조에 사용한 프라이머 서열은 표8 내지 표9에 나타냈다.
실험예 3의 sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
Inter22 Intergenic-22 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) AGAACACATACCCCTGGGCC 173
Inter22-U6 Intergenic-22 AGAACACATACCCCTGGGCC TTTTTT 174
Inter22-U4aU6 Intergenic-22 AGAACACATACCCCTGGGCC TTTTATTTTTT 175
DYtarget2 DYtarget2 CACACACACAGTGGGCTACC 129
DYtarget2U4aU6 DYtarget2 CACACACACAGTGGGCTACC TTTTATTTTTT 142
DYtarget10 DYtarget10 CACACACACAGTGGGCTACC 158
DYtarget10U4aU6 DYtarget10 CATCCCCAGGACACACACAC TTTTATTTTTT 159
DYtarget13 DYtarget13 CACACACACAGTGGGCTACC 171
DYtarget13U4aU6 DYtarget13 AGCACATGTGCACACACACA TTTTATTTTTT 172
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 3에 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
Inter22 Intergenic-22 GAGGGCCTATTTCCCATGATT (서열번호: 183) GGCCCAGGGGTATGTGTTCTGTTGCATTCCT 231
Inter22-U6 Intergenic-22 aaaaaaGGCCCAGGGGTATGTGTTCTGTTGCATTCCT 232
Inter22-U4aU6 Intergenic-22 aaaaaataaaaGGCCCAGGGGTATGTGTTCTGTTGCATTCCT 233
DYtarget2 DYtarget2 GGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 187
DYtarget2U4aU6 DYtarget2 aaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 200
DYtarget10 DYtarget10 GTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 216
DYtarget10U4aU6 DYtarget10 aaaaataaaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCaTATTC 217
DYtarget13 DYtarget13 TGTGTGTGTGCACATGTGCTGTTGCATTCCTTCATTCGTCTATTC 229
DYtarget13U4aU6 DYtarget13 aaaaaataaaaTGTGTGTGTGCACATGTGCTGTTGCATTCCTTCATTCGTCTATTC 230
3) 상기 Cas14a1 서열을 포함하는 플라스미드 벡터 및 상기 싱글 가이드 RNA의 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9 에 개시된 방법에 따라 형질주입(transfection) 시켰다.
4) 실험예 1-12 내지 실험예 1-13에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도2에 나타냈다.
도2에 개시된 바와 같이, U-rich tail 서열이 3'말단에 연결된 엔지니어링 된 가이드 RNA를 포함하는 CRISPR/Cas14a1 시스템이 야생형에 비해 높은 인델 효율을 보였다.
실험예 4 U-rich tail을 갖는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율 비교 3
DYtarget2, DYtarget10, 및 Intergenic-22를 표적 핵산으로 하여, U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 각각의 PAM 서열이 표10에 개시되어 있다.
실험예 4에 사용된 표적 핵산 서열
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
DYtarget2 CACACACACAGTGGGCTACC (서열번호: 63) TTTG
DYtarget10 CATCCCCAGGACACACACAC (서열번호: 65) TTTG
Intergenic-22 AGAACACATACCCCTGGGCC (서열번호: 67) TTTA
1) 실험예 1-2에 따라 인간 코돈-최적화된 Cas14a1 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-2 및 실험예 1-4에 따라, tracrRNA를 발현할 수 있는 플라스미드 벡터 및 앰플리콘, 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) crRNA를 발현할 수 있는 플라스미드 벡터 및 앰플리콘을 제조했다. 상기 tracrRNA 및 crRNA를 암호화하는 DNA 서열, 및 플라스미드 벡터와 앰플리콘 제조에 사용한 프라이머 서열은 표11 내지 표13에 나타냈다.
실험예 4의 tracrRNA를 암호화하는 DNA 서열
tracrRNA를 암호화하는 앰플리콘 서열
(5' to 3')
서열번호
CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAA 61
이때, 상기 tracrRNA를 발현할 수 있는 앰플리콘 서열, 또는 플라스미드 벡터 서열은 상기 tracrRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 4의 crRNA를 암호화하는 DNA 서열
Label 표적핵산 crRNA 공통 서열 (5' to 3') 프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
Canonical crRNA DYtarget2
(Target 1)
GTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 255) CACACACACAGTGGGCTACC 149
gRNA (MS1) CACACACACAGTGGGCTACC TTTTATTTTTT 150
Canonical crRNA DYtarget10
(Target 2)
CATCCCCAGGACACACACAC 163
gRNA (MS1) CATCCCCAGGACACACACAC TTTTATTTTTT 164
Canonical crRNA Intergenic-22
(Target 3)
AGAACACATACCCCTGGGCC 176
gRNA (MS1) AGAACACATACCCCTGGGCC TTTTATTTTTT 177
상기 표에서, 각 표적 핵산에 대한 crRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, crRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 crRNA 공통 서열에 포함된 CRISPR RNA 반복 서열은 서열번호 58의 서열이다. 상기 (엔지니어링 된) crRNA를 발현할 수 있는 앰플리콘 서열, 또는 플라스미드 서열은 상기 crRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 4에 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
tracrRNA - GAGGGCCTATTTCCCATGATT (서열번호: 183) TTGTGCAGAATTGGAGAGGA 236
Canonical crRNA DYtarget2 GGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 207
gRNA (MS1) DYtarget2 aaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 208
Canonical crRNA DYtarget10 GTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 221
gRNA (MS1) DYtarget10 aaaaataaaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCaTATTC 222
Canonical crRNA Intergenic-22 GGCCCAGGGGTATGTGTTCTGTTGCATTCCT 234
gRNA (MS1) Intergenic-22 aaaaaataaaaGGCCCAGGGGTATGTGTTCTGTTGCATTCCT 235
3) 상기 Cas14a1 서열을 포함하는 플라스미드 벡터, 상기 tracrRNA의 플라스미드 벡터 내지 앰플리콘, 및 상기 crRNA의 플라스미드 벡터 내지 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9 에 개시된 방법에 따라 형질주입(transfection) 시켰다. 이때, crRNA를 주입하지 않은 것을 컨트롤로 사용하였다 (도3의 No crRNA 데이터).
4) 실험예 1-12 내지 실험예 1-14에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도3에 나타냈다.
도3에 개시된 바와 같이, U-rich tail 서열이 3'말단에 연결된 엔지니어링 된 가이드 RNA를 포함하는 CRISPR/Cas14a1 시스템이 야생형에 비해 높은 인델 효율을 보였다.
실험예 5 U-rich tail을 갖는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율 비교 4
다양한 타겟 서열을 표적 핵산으로 하여, U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행한다.
상기 실험예 3 또는 실험예 4에 개시된 표적 핵산을 대상으로 실험을 진행하되, Cas14a1 서열을 포함하는 플라스미드 벡터 및 싱글 가이드 RNA의 앰플리콘을 HEK-293 T세포에 형질주입하는 대신, 다음과 같은 방법을 따른다.
1) 실험예 3 및 실험예 4에 개시된 sgRNA 서열을 가지는 싱글 가이드 RNA를 실험예 1-5에 따라 제조한다.
2) 실험예 1-6에 따라 Cas14a1 단백질을 제조한다.
3) 1) 및 2)의 결과물을 가지고 실험예 1-7에 따라 RNP를 제조한다.
4) 실험예 1-8에 따라 제조된 HEK-293 T세포에 실험예 1-10에 따라 상기 RNP를 형질주입한다.
5) 이하 인델 효율 분석 방법은 실험예 2 또는 실험예 3에 기재된 바와 같다.
실험예 6 U-rich tail을 갖는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율 비교 5
다양한 타겟 유전자를 표적 핵산으로 하여, U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행한다.
상기 실험예 3 또는 실험예 4에 개시된 표적 핵산을 대상으로 실험을 진행하되, Cas14a1 서열을 포함하는 플라스미드 벡터 및 싱글 가이드 RNA의 앰플리콘을 HEK-293 T세포에 형질주입하는 대신, 다음과 같은 방법을 따른다.
1) 실험예 3 및 실험예 4에 개시된 sgRNA 서열 및 Cas14a1 단백질을 암호화하는 서열을 가지는 바이러스 벡터를 실험예 1-3에 따라 제조한다.
4) 실험예 1-8에 따라 제조된 HEK-293 T세포에 실험예 1-11에 따라 상기 바이러스 벡터를 형질주입한다.
5) 이하 인델 효율 분석 방법은 실험예 2 또는 실험예 3에 기재된 바와 같다.
실험예 7 U-rich tail의 구조에 따른 인델 효율 비교 1
상기 DYtarget2, DYtarget10를 표적 핵산으로 하여, U-rich tail 서열의 구조에 따른 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 각각의 PAM 서열이 표14에 개시되어 있다.
실험예 7에 사용된 표적 핵산 서열
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
DYtarget2 CACACACACAGTGGGCTACC (서열번호: 63) TTTG
DYtarget10 CATCCCCAGGACACACACAC (서열번호: 65) TTTG
1) 실험예 1-2에 따라 인간 코돈-최적화된 Cas14a1 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-4에 따라 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 제조했다. 상기 싱글 가이드 RNA를 암호화하는 DNA 서열 및 앰플리콘 제조에 사용한 프라이머 서열은 표15 및 표16에 나타냈다.
실험예 7의 sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
Ux DYtarget2 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) CACACACACAGTGGGCTACC 129
U6 TTTTTT 135
U4AU6 TTTTATTTTTT 142
U3AU6 TTTATTTTTT 147
U3AU3AU6 TTTATTTATTTTTT 148
Ux DYtarget10 CATCCCCAGGACACACACAC 158
U6 TTTTTT 160
U4AU6 TTTTATTTTTT 159
U3AU6 TTTATTTTTT 161
U3AU3AU6 TTTATTTATTTTTT 162
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 7에 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
Ux DYtarget2 GAGGGCCTATTTCCCATGATT (서열번호: 183) GGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 187
U6 aaaaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 193
U4AU6 aaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 200
U3AU6 aaaaaataaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 205
U3AU3AU6 aaaaaataaataaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 206
Ux DYtarget10 GTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 216
U6 aaaaaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 218
U4AU6 aaaaaataaaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 217
U3AU6 aaaaaataaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 219
U3AU3AU6 aaaaaataaataaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCTTCATTCGTCTATTC 220
3) 상기 Cas14a1 서열을 포함하는 플라스미드 벡터 및 상기 싱글 가이드 RNA의 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9에 개시된 방법에 따라 형질주입(transfection) 시켰다.
4) 실험예 1-12 내지 실험예 1-14에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도4에 나타냈다. 이때, 어떠한 처리도 하지 않은 HEK-293 T세포를 컨트롤로 사용하였다(도4의 WT 데이터 참조).
실험예 8 U-rich tail의 구조에 따른 인델 효율 비교 2
상기 DYTarget2를 표적 핵산으로 하여, U-rich tail 서열의 구조에 따른 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 PAM 서열은 실험예 7의 표 14에 나타난 “DYTarget2”와 같다.
1) 실험예 1-2에 따라 인간 코돈-최적화된 Cas14a1 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-4에 따라 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 제조했다. 상기 싱글 가이드 RNA를 암호화하는 DNA 서열 및 앰플리콘 제조에 사용한 프라이머 서열을 표17 및 표18에 나타냈다.
실험예 8의 sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
None DYtarget2 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) CACACACACAGTGGGCTACC 129
T T 130
T2 TT 131
T3 TTT 132
T4 TTTT 133
T4A TTTTA 136
T4AT TTTTAT 137
T4AT2 TTTTATT 138
T4AT3 TTTTATTT 139
T4AT4 TTTTATTTT 140
T4AT5 TTTTATTTTT 141
T4AT6 TTTTATTTTTT 142
T4AT7 TTTTATTTTTTT 143
T4AT8 TTTTATTTTTTTT 144
T4AT4AT TTTTATTTTAT 256
T4AT4AT2 TTTTATTTTATT 257
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 앰플리콘 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 8에 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
None DYtarget2 GAGGGCCTATTTCCCATGATT (서열번호: 183) GGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 187
T aGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 188
T2 aaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 189
T3 aaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 190
T4 aaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 191
T4A taaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 194
T4AT ataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 195
T4AT2 aataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 196
T4AT3 aaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 197
T4AT4 aaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 198
T4AT5 aaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 199
T4AT6 aaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 200
T4AT7 aaaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 201
T4AT8 aaaaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 202
T4AT4AT ataaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 258
T4AT4AT2 aataaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 259
1) 상기 Cas14a1 서열을 포함하는 플라스미드 벡터 및 상기 싱글 가이드 RNA의 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9에 개시된 방법에 따라 형질주입(transfection) 시켰다.
2) 실험예 1-12 내지 실험예 1-14에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도5에 나타냈다.
실험예 9 U-rich tail의 구조에 따른 인델 효율 비교 3
CSMD1을 표적 핵산으로 하여, U-rich tail 서열의 구조에 따른 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 PAM 서열을 표19에 나타내었다.
실험예 9에 사용된 표적 핵산 서열
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
CSMD1 GAATACCCCCATTCTTCAGG (서열번호: 260) TTTA
1) 실험예 1-6에 따라 재조합 Cas12f1 단백질을 제조했다.
2) 실험예 1-5에 따라 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) 싱글 가이드 RNA를 합성했다. 상기 싱글 가이드 RNA의 서열은 다음 표20에 나타냈다.
실험예 9의 sgRNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
None CSMD1 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAAgaaaGUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC (서열번호: 74) GAAUACCCCCAUUCUUCAGG 261
U U 262
U2 UU 263
U3 UUU 264
U4 UUUU 265
U5 UUUUU 266
U6 UUUUUU 267
U4A UUUUA 268
U4AU UUUUAU 269
U4AU2 UUUUAUU 270
U4AU3 UUUUAUUU 271
U4AU4 UUUUAUUUU 272
U4AU5 UUUUAUUUUU 273
U4AU6 UUUUAUUUUUU 274
U4AU7 UUUUAUUUUUUU 275
U4AU8 UUUUAUUUUUUUU 276
U4AU9 UUUUAUUUUUUUUU 277
U4AU10 UUUUAUUUUUUUUUU 278
상기 표에서, 각 표적 핵산에 대한 sgRNA 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 253의 서열 부분이다.
3) 상기 재조합 Cas14a1 단백질 및 상기 싱글 가이드 RNA를 이용하여 실험예 1-7에 따라 RNP를 제조하고, 상기 RNP를 실험예 1-8에 따라 배양한 HEK293 T세포에 실험예 1-7에 개시된 방법에 따라 형질주입(transfection) 시켰다.
2) 실험예 1-12 내지 실험예 1-13에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도6에 나타냈다.
실험 결과, 3' 말단에 U-rich tail 서열이 연결된 엔지니어링 된 가이드 RNA가 야생형의, U-rich tail 서열이 없는 가이드 RNA보다 현저하게 높은 인델 효율을 보임을 알 수 있었다.
특히, 10개 이상의 유리딘 연속 서열이 연결된 엔지니어링 된 가이드 RNA도 야생형의 가이드 RNA에 비해 뛰어난 인델 효율을 보임을 알 수 있었다.
실험예 10 U-rich tail의 구조에 따른 인델 효율 비교 3
상기 DYtarget2를 표적 핵산으로 하여, U-rich tail 서열 중 변형된 유리딘 연속 서열의 구조에 따른 엔지니어링 된 CRISPR/Cas14a1 시스템의 인델 효율을 평가하기 위한 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 PAM 서열은 실험예 7의 표14에 나타나난 “DYTarget2”와 같다.
1) 실험예 1-2에 따라 인간 코돈-최적화된 Cas14a1 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-4에 따라 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 제조했다. 상기 싱글 가이드 RNA를 암호화하는 DNA 서열 및 앰플리콘 제조에 사용한 프라이머 서열을 표21 및 표22에 나타냈다.
실험예 10의 sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
None DYtarget2 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) CACACACACAGTGGGCTACC - 129
T4AT6 TTTTATTTTTT 142
T4GT6 TTTTGTTTTTT 324
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 10에 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
None DYtarget2 GAGGGCCTATTTCCCATGATT (서열번호: 183) GGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 187
T4AT6 aaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 200
T4GT6 aaaaaacaaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCTTCATTCGTCTATTC 325
3) 상기 Cas14a1 단백질을 암호화하는 핵산 서열을 포함하는 플라스미드 벡터 및 상기 싱글 가이드 RNA의 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9 에 개시된 방법에 따라 형질주입(transfection) 시켰다.
4) 실험예 1-12 내지 실험예 1-14에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도7에 나타냈다.
실험 결과, 엔지니어링 된 가이드 RNA가 (UaV)nUb(이때, V는 사이티딘(C), 구아노신(G), 아데노신(A) 중 어느 하나임)로 표현될 수 있는 변형된 유리딘 연속 서열 구조를 가지는 경우 U-rich tail 서열이 없는 야생형 가이드 RNA에 비해 진핵 세포 내에서 현저히 높은 인델 효율을 보이는 것으로 나타났다.
실험예 11 스페이서 서열 길이에 따른 인델 효율 비교
스페이서 서열의 길이에 따른 인델 효율을 비교하기 위해, 상기 DYtarget2, 및 DYtarget10을 표적 핵산으로 하고, U-rich tail 서열을 U4AU6로 고정한 후, 스페이서 서열의 길이를 달리 하여 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 각각의 PAM 서열이 표23에 개시되어 있다.
실험예 11에서 사용된 표적 핵산 서열
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
DYtarget2 CACACACACAGTGGGCTACC (서열번호: 63) TTTG
DYtarget10 CATCCCCAGGACACACACAC (서열번호: 65) TTTG
1) 실험예 1-2에 따라 인간 코돈-최적화된 Cas14a1 단백질을 암호화하는 핵산 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-4에 따라 각기 다른 스페이서 서열의 길이를 가지는 엔지니어링 된 싱글 가이드 RNA를 발현할 수 있는 앰플리콘을 제조했다. 상기 싱글 가이드 RNA를 암호화하는 DNA 서열 및 앰플리콘 제조에 사용한 프라이머 서열은 표24 내지 표25에 나타냈다.
실험예 11에서 사용된 sgRNA를 암호화하는 DNA 서열
Label 표적핵산 sgRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
18mer DYtarget2 CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAAgaaaGTTGCAGAACCCGAATAGACGAATGAAGGAATGCAAC (서열번호: 126) CACACACACAGTGGGCTA TTTTATTTTTT 151
19mer CACACACACAGTGGGCTAC 152
20mer CACACACACAGTGGGCTACC 142
21mer CACACACACAGTGGGCTACCA 153
25mer CACACACACAGTGGGCTACCATTTA 154
30mer CACACACACAGTGGGCTACCATTTAAGGAG 155
17mer DYtarget10 CATCCCCAGGACACACA 165
18mer CATCCCCAGGACACACAC 166
19mer CATCCCCAGGACACACACA 167
20mer CATCCCCAGGACACACACAC 159
21mer CATCCCCAGGACACACACACA 168
25mer CATCCCCAGGACACACACACATTTC 169
30mer CATCCCCAGGACACACACACATTTCAAAAG 170
상기 표에서, 각 표적 핵산에 대한 sgRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, sgRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이며, 상기 sgRNA 공통 서열 중 스캐폴드 서열은 서열번호 254의 서열 부분이다. 상기 (엔지니어링 된) 싱글 가이드 RNA를 발현할 수 있는 앰플리콘 서열은 상기 sgRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 11에서 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
18mer DYtarget2 GAGGGCCTATTTCCCATGATT (서열번호: 183) aaaaaataaaaTAGCCCACTGTGTGTGTGGTTGCATTCCT 209
19mer aaaaaataaaaGTAGCCCACTGTGTGTGTGGTTGCATTCCT 210
20mer aaaaaataaaaGGTAGCCCACTGTGTGTGTGGTTGCATTCCT 200
21mer aaaaaataaaaTGGTAGCCCACTGTGTGTGTGGTTGCATTCCT 211
25mer aaaaaataaaaTAAATGGTAGCCCACTGTGTGTGTGGTTGCATTCCT 212
30mer aaaaaataaaaCTCCTTAAATGGTAGCCCACTGTGTGTGTGGTTGCATTCCT 213
17mer DYtarget10 aaaaaataaaaTGTGTGTCCTGGGGATGGTTGCATTCCT 223
18mer aaaaaataaaaGTGTGTGTCCTGGGGATGGTTGCATTCCT 224
19mer aaaaaataaaaTGTGTGTGTCCTGGGGATGGTTGCATTCCT 225
20mer aaaaaataaaaGTGTGTGTGTCCTGGGGATGGTTGCATTCCT 217
21mer aaaaaataaaaTGTGTGTGTGTCCTGGGGATGGTTGCATTCCT 226
25mer aaaaaataaaaGAAATGTGTGTGTGTCCTGGGGATGGTTGCATTCCT 227
30mer aaaaaataaaaCTTTTGAAATGTGTGTGTGTCCTGGGGATGGTTGCATTCCT 228
3) 상기 Cas14a1 서열을 포함하는 플라스미드 벡터 및 상기 싱글 가이드 RNA의 앰플리콘을 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9에 개시된 방법에 따라 형질주입(transfection) 시켰다.
4) 실험예 1-12 내지 실험예 1-14에 개시된 방법에 따라 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 도8에 나타냈다.
실험예 12 U-rich tail을 갖는 Type V CRISPR/Cas 시스템의 세포 내 유전자 절단 활성 확인
상기 실험예에 사용한 엔지니어링 된 CRISPR/Cas14a 시스템 외 다른 Type V CRISPR/Cas 시스템에도 U-rich tail 서열을 도입하는 경우 유전자 절단 활성이 높아지는지 여부를 확인하기 위하여, CRISPR/Cas12f1 시스템으로 분류되는 CRISPR/SpCas12f1 시스템 및 CRISPR/AsCas12f1 시스템(Karvelis et al., Nucleic Acids Research, Vol. 48, No. 9 5017 (2020))을 대상으로 다음과 같은 실험을 진행하였다.
실험예 12-1. SpCas12f1 및 AsCas12f1 단백질의 세포 내 발현 확인
SpCas12f1 및 AsCas12f1 단백질을 암호화하는 벡터를 진핵 세포 내에 도입했을 때, 상기 단백질이 진핵 세포 내에서 제대로 발현되는 지 확인하기 위해 실험예 1-13에 개시된 방법에 따라 SpCas12f1 및 AsCas12f1 단백질의 발현을 확인하였다. 이때, 상기 SpCas12f1 및 AsCas12f1 단백질의 아미노산 서열 및 이를 암호화하는 인간 코돈-최적화된 핵산 서열을 표26에 나타냈다.
SpCas12f1 및 AsCas12f1 단백질의 서열 정보
대상 서열 정보 서열번호
SpCas12f1
(아미노산)
MGESVKAIKLKILDMFLDPECTKQDDNWRKDLSTMSRFCAEAGNMCLRDLYNYFSMPKEDRISSKDLYNAMYHKTKLLHPELPGKVANQIVNHAKDVWKRNAKLIYRNQISMPTYKITTAPIRLQNNIYKLIKNKNKYIIDVQLYSKEYSKDSGKGTHRYFLVAVRDSSTRMIFDRIMSKDHIDSSKSYTQGQLQIKKDHQGKWYCIIPYTFPTHETVLDPDKVMGVDLGVAKAVYWAFNSSYKRGCIDGGEIEHFRKMIRARRVSIQNQIKHSGDARKGHGRKRALKPIETLSEKEKNFRDTINHRYANRIVEAAIKQGCGTIQIENLEGIADTTGSKFLKNWPYYDLQTKIVNKAKEHGITVVAINPQYTSQRCSMCGYIEKTNRSSQAVFECKQCGYGSRTICINCRHVQVSGDVCEECGGIVKKENVNADYNAAKNISTPYIDQIIMEKCLELGIPYRSITCKECGHIQASGNTCEVCGSTNILKPKKIRKAK 282
SpCas12f1(인간 코돈-최적화된 핵산) ATGGGCGAGAGCGTTAAAGCAATCAAACTGAAGATCCTGGACATGTTCCTGGACCCGGAGTGCACTAAACAGGACGATAACTGGCGTAAAGACCTGTCTACCATGTCTCGTTTCTGCGCAGAGGCGGGTAACATGTGCCTGCGCGACCTGTACAATTACTTTTCTATGCCGAAAGAAGACCGTATTAGCTCCAAGGATCTGTACAACGCCATGTACCACAAAACTAAACTGCTGCACCCGGAACTGCCGGGTAAAGTGGCGAACCAGATCGTCAACCACGCTAAAGATGTGTGGAAACGCAACGCGAAGCTGATCTATCGTAATCAGATCTCTATGCCGACTTACAAGATCACCACCGCACCGATTCGCCTGCAAAACAACATCTATAAACTGATCAAAAACAAGAACAAATATATCATCGATGTCCAGCTGTACAGCAAAGAATACTCTAAAGACAGCGGCAAAGGCACCCACCGCTACTTCCTGGTTGCAGTGCGCGATTCTAGCACGCGTATGATCTTCGACCGCATCATGAGCAAAGACCACATCGATAGCTCCAAATCCTACACCCAGGGTCAGCTGCAGATTAAAAAAGACCATCAGGGCAAATGGTACTGTATCATTCCGTACACCTTCCCGACTCATGAGACCGTCCTGGATCCGGACAAAGTTATGGGTGTGGACCTGGGCGTGGCTAAAGCAGTGTATTGGGCGTTCAACTCCTCTTACAAACGCGGTTGTATCGATGGTGGTGAAATTGAACACTTCCGCAAAATGATCCGTGCTCGTCGTGTCTCCATTCAGAACCAGATTAAACATTCTGGCGACGCGCGCAAGGGTCATGGTCGTAAACGTGCACTGAAGCCGATTGAAACCCTGTCTGAAAAAGAAAAAAACTTCCGCGATACTATCAACCATCGTTACGCAAACCGTATCGTGGAGGCAGCGATTAAGCAGGGCTGCGGCACCATCCAGATCGAAAATCTGGAGGGTATCGCCGATACTACGGGTTCCAAATTTCTGAAAAACTGGCCATACTATGACCTGCAGACCAAAATCGTGAACAAAGCGAAGGAACATGGCATCACCGTCGTTGCGATCAACCCGCAGTATACTTCTCAACGTTGCTCCATGTGTGGTTACATTGAAAAAACCAACCGTTCCTCTCAGGCAGTGTTCGAGTGCAAACAGTGCGGCTATGGTTCCCGTACCATCTGCATCAACTGCCGCCACGTTCAGGTAAGCGGTGATGTCTGCGAAGAATGCGGCGGCATCGTTAAAAAAGAAAACGTTAACGCGGACTATAACGCGGCGAAAAACATCTCCACCCCATATATCGATCAGATCATCATGGAGAAATGTCTGGAGCTGGGTATCCCGTACCGTAGCATCACTTGCAAAGAATGCGGTCATATCCAGGCGTCTGGTAACACTTGTGAGGTGTGCGGTTCCACCAACATTCTGAAACCGAAAAAAATCCGTAAAGCTAAA 284
AsCas12f1(아미노산) MIKVYRYEIVKPLDLDWKEFGTILRQLQQETRFALNKATQLAWEWMGFSSDYKDNHGEYPKSKDILGYTNVHGYAYHTIKTKAYRLNSGNLSQTIKRATDRFKAYQKEILRGDMSIPSYKRDIPLDLIKENISVNRMNHGDYIASLSLLSNPAKQEMNVKRKISVIIIVRGAGKTIMDRILSGEYQVSASQIIHDDRKNKWYLNISYDFEPQTRVLDLNKIMGIDLGVAVAVYMAFQHTPARYKLEGGEIENFRRQVESRRISMLRQGKYAGGARGGHGRDKRIKPIEQLRDKIANFRDTTNHRYSRYIVDMAIKEGCGTIQMEDLTNIRDIGSRFLQNWTYYDLQQKIIYKAEEAGIKVIKIDPQYTSQRCSECGNIDSGNRIGQAIFKCRACGYEANADYNAARNIAIPNIDKIIAESIK 283
AsCas12f1(인간 코돈-최적화된 핵산) ATGATCAAGGTTTATCGCTATGAAATTGTGAAACCGCTGGACCTGGACTGGAAAGAGTTCGGTACTATCCTGCGTCAGCTGCAGCAGGAAACGCGTTTCGCACTGAACAAAGCGACGCAGCTGGCTTGGGAATGGATGGGCTTCAGCTCTGATTACAAAGACAACCACGGCGAATACCCTAAATCCAAAGATATCCTGGGTTACACCAACGTGCACGGTTATGCGTACCACACCATCAAAACTAAAGCGTACCGCCTGAACTCCGGTAATCTGTCTCAGACCATCAAGCGTGCGACCGACCGTTTCAAAGCGTACCAGAAGGAAATCCTGCGCGGTGACATGAGCATCCCGTCCTATAAGCGTGACATCCCGCTGGATCTGATCAAAGAAAACATCAGCGTAAACCGCATGAACCACGGTGACTACATCGCCTCCCTGTCTCTGCTGTCTAACCCGGCAAAGCAAGAGATGAACGTTAAACGCAAAATCTCCGTTATCATTATCGTTCGTGGCGCAGGCAAAACCATCATGGATCGTATTCTGTCCGGTGAATATCAAGTGTCCGCAAGCCAGATCATCCATGACGATCGTAAAAATAAATGGTATCTGAACATCTCTTATGATTTCGAACCGCAGACCCGCGTACTGGACCTGAACAAAATCATGGGTATCGATCTGGGCGTTGCAGTAGCGGTGTACATGGCTTTCCAGCACACCCCGGCACGCTACAAACTGGAAGGTGGTGAGATCGAAAACTTCCGTCGTCAAGTGGAATCTCGTCGCATCTCTATGCTGCGTCAGGGTAAATATGCAGGTGGTGCGCGTGGTGGTCATGGTCGTGACAAACGTATTAAACCAATCGAACAGCTGCGCGATAAAATCGCCAACTTCCGTGATACCACCAACCACCGCTACTCTCGTTATATCGTTGATATGGCAATCAAAGAGGGTTGTGGTACTATCCAGATGGAAGACCTGACGAACATCCGCGATATCGGTTCTCGTTTCCTGCAGAACTGGACCTACTACGATCTGCAGCAGAAAATTATCTACAAAGCGGAGGAAGCAGGTATCAAAGTCATTAAAATCGATCCGCAGTATACTAGCCAGCGCTGCAGCGAATGTGGTAACATTGATAGCGGCAACCGCATTGGTCAGGCAATCTTTAAATGCCGCGCTTGTGGCTACGAAGCGAACGCAGACTACAACGCGGCGCGTAACATCGCCATCCCGAATATTGACAAAATCATTGCCGAATCTATTAAA 285
실험 결과 SpCas12f1 단백질 및 AsCas12f1 단백질이 HEK293 T세포 내에서 제대로 발현되는 것을 확인하였다(도9).
실험예 12-2. U-rich tail을 갖는 엔지니어링 된 CRISPR/SpCas12f1 및 CRISPR/AsCas12f1 시스템의 세포 내 유전자 절단 활성 확인
U-rich tail 서열을 가지는 엔지니어링 된 CRISPR/SpCas12f1 시스템 및 CRISPR/AsCas12f1 시스템의 유전자 절단 활성을 확인하기 위해, 다양한 유전자 서열을 표적 핵산으로 하여 실험을 진행하였다. 상기 표적 핵산의 프로토스페이서 서열 및 각각의 PAM 서열이 표27에 개시되어 있다.
실험예 12에 사용한 표적 핵산
표적 핵산 표적 핵산의 프로토스페이서 서열(5' to 3') PAM
DYtarget2 CACACACACAGTGGGCTACC (서열번호: 63) TTTG
VEGFA-3 GGGGTGACCGCCGGAGCGCG (서열번호: 286) TTTG
1) 실험예 1-2에 따라 SpCas12f1 및 AsCas12f1 단백질을 암호화하는 인간 코돈-최적화된 서열을 포함하는 플라스미드 벡터를 제조했다.
2) 실험예 1-2 에 따라, tracrRNA를 발현하는 플라스미드 벡터, 야생형의, 또는 U-rich tail 서열을 가지는 (엔지니어링 된) crRNA를 발현하는 플라스미드 벡터를 제조했다. 상기 tracrRNA 및 crRNA를 암호화하는 DNA 서열, 및 플라스미드 벡터 제조에 사용한 프라이머 서열은 표28 내지 표30에 나타나 있다.
실험예 12의 tracrRNA를 암호화하는 DNA 서열
tracrRNA 서열
(5' to 3')
서열번호
CTTCACTGATAAAGTGGAGAACCGCTTCACCAAAAGCTGTCCCTTAGGGGATTAGAACTTGAGTGAAGGTGGGCTGCTTGCATCAGCCTAATGTCGAGAAGTGCTTTCTTCGGAAAGTAACCCTCGAAACAAATTCATTTTTCCTCTCCAATTCTGCACAA 287
CRISPR/SpCas12f1 시스템 및 CRISPR/AsCas12f1 시스템은 동일한 tracrRNA 서열을 가진다. 상기 tracrRNA를 발현하는 플라스미드 벡터 서열은 tracrRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 12의 crRNA를 암호화하는 DNA 서열
Label 표적핵산 crRNA 공통 서열
(5' to 3')
프로토스페이서 서열
(5' to 3')
U-rich tail 서열
(5' to 3')
서열번호
SpCas12f1-DYtarget2(WT) DYtargete GTCGCATCTTGCGTAAGCGCGTGGATTGAAAC (서열번호: 288) CACACACACAGTGGGCTACC 290
SpCas12f1-DYtarget2(U6) TTTTTT 291
SpCas12f1-DYtarget2(U4AU6) TTTTATTTTTT 292
SpCas12f1-
VEGFA-3(WT)
VEGFA-3 GGGGTGACCGCCGGAGCGCG 293
SpCas12f1-
VEGFA-3(U6)
TTTTTT 294
SpCas12f1-
VEGFA-3(U4AU6)
TTTTATTTTTT 295
AsCas12f1-DYtarget2(WT) DYtarget2 GTTTGCGAGCTAGCTTGTGGAGTGTGAAC (서열번호: 289) CACACACACAGTGGGCTACC 296
AsCas12f1-DYtarget2(U6) TTTTTT 297
AsCas12f1-DYtarget2(U4AU6) TTTTATTTTTT 298
AsCas12f1-
VEGFA-3(WT)
VEGFA-3 GGGGTGACCGCCGGAGCGCG 299
AsCas12f1-
VEGFA-3(U6)
TTTTTT 300
AsCas12f1-
VEGFA-3(U4AU6)
TTTTATTTTTT 301
상기 표에서, 각 표적 핵산에 대한 crRNA를 암호화하는 DNA 서열은 5’부터 3’순서로, crRNA 공통 서열 - 프로토스페이서 서열 - U-rich tail 서열이 연결된 것이다. 상기 crRNA를 발현하는 플라스미드 벡터 서열은 상기 crRNA를 암호화하는 DNA 서열에 U6 프로모터가 작동 가능하게 연결된 것이다.
실험예 12에 사용된 프라이머 서열
Label 표적핵산 Forward primer
(5' to 3')
Reverse primer
(5' to 3')
서열번호
tracrRNA - GAGGGCCTATTTCCCATGATT (서열번호: 183) TTGTGCAGAATTGGAGAGGA 302
SpCas12f1-DYtarget2(WT) DYtarget2 GGTAGCCCACTGTGTGTGTGgtttcaatcca 303
SpCas12f1-DYtarget2(U6) aaaaaaGGTAGCCCACTGTGTGTGTGgtttcaatcca 304
SpCas12f1-DYtarget2(U4AU6) aaaaaataaaaGGTAGCCCACTGTGTGTGTGgtttcaatcca 305
SpCas12f1-
VEGFA-3(WT)
VEGFA-3 CGCGCTCCGGCGGTCACCCCgtttcaatcca 306
SpCas12f1-
VEGFA-3(U6)
aaaaaaCGCGCTCCGGCGGTCACCCCgtttcaatcca 307
SpCas12f1-
VEGFA-3(U4AU6)
aaaaaataaaaCGCGCTCCGGCGGTCACCCCgtttcaatcca 308
AsCas12f1-DYtarget2(WT) DYtarget2 GGTAGCCCACTGTGTGTGTGgttcacactcc 309
AsCas12f1-DYtarget2(U6) aaaaaaGGTAGCCCACTGTGTGTGTGgttcacactcc 310
AsCas12f1-DYtarget2(U4AU6) aaaaaataaaaGGTAGCCCACTGTGTGTGTGgttcacactcc 311
AsCas12f1-
VEGFA-3(WT)
VEGFA-3 CGCGCTCCGGCGGTCACCCCgttcacactcc 312
AsCas12f1-
VEGFA-3(U6)
aaaaaaCGCGCTCCGGCGGTCACCCCgttcacactcc 313
AsCas12f1-
VEGFA-3(U4AU6)
aaaaaataaaaCGCGCTCCGGCGGTCACCCCgttcacactcc 314
3) 상기 SpCas12f1 단백질 및 AsCas12f1 단백질을 암호화하는 핵산 서열을 포함하는 플라스미드 벡터, 상기 tracrRNA의 플라스미드 벡터, 및 상기 crRNA의 플라스미드 벡터를 실험예 1-8에 따라 배양한 HEK-293 T세포에 실험예 1-9에 개시된 방법에 따라 형질주입(transfection) 시켰다.
4) 실험예 1-12 내지 실험예 1-14에 개시된 방법에 따라, 각 실시예의 표적 핵산에 대한 인델 효율을 분석하였다. 상기 인델 효율 분석 결과는 표31에 나타냈다.
실험예 12의 인델 효율 분석 결과
Label 표적 핵산 인델 효율(%)
SpCas12f1-DYtarget2(WT) DYtarget2 0.00
SpCas12f1-DYtarget2(U6) 0.06
SpCas12f1-DYtarget2(U4AU6) 0.07
SpCas12f1-VEGFA-3(WT) VEGFA-3 0.00
SpCas12f1-VEGFA-3(U6) 0.00
SpCas12f1-VEGFA-3(U4AU6) 0.00
AsCas12f1-DYtarget2(WT) DYtarget2 0.00
AsCas12f1-DYtarget2(U6) 0.06
AsCas12f1-DYtarget2(U4AU6) 0.03
AsCas12f1-VEGFA-3(WT) VEGFA-3 0.00
AsCas12f1-VEGFA-3(U6) 0.01
AsCas12f1-VEGFA-3(U4AU6) 0.00
실험 결과, U-rich tail 서열을 도입한 엔지니어링 된 CRISPR/SpCas12f1 시스템 및 엔지니어링 된 CRISPR/AsCas12f1 시스템 모두 유의미한 인델 효율이 나타나지 않았다. 결론적으로, 진핵 세포 내에서 SpCas12f1 단백질 및 AsCas12f1 단백질이 발현되는 것은 확인되었으나(도9), 유의미한 인델 효율이 나타나지 않았으므로, CRISPR/SpCas12f1 시스템 및 CRISPR/AsCas12f1 시스템에는 U-rich tail 서열을 도입해도 유전자 절단 활성에 영향이 없다고 볼 수 있다.
<110> GenKOre <120> An engineered guide RNA for CRISPR/Cas12f1 system and use thereof <130> CP20-201 <160> 325 <170> KoPatentIn 3.0 <210> 1 <211> 1680 <212> DNA <213> Artificial Sequence <220> <223> Human codon-optimized Cas14a1 <400> 1 ccaaagaaga agcggaaggt cggtatccac ggagtcccag cagccatggc caagaacaca 60 attacaaaga cactgaagct gaggatcgtg agaccataca acagcgctga ggtcgagaag 120 attgtggctg atgaaaagaa caacagggaa aagatcgccc tcgagaagaa caaggataag 180 gtgaaggagg cctgctctaa gcacctgaaa gtggccgcct actgcaccac acaggtggag 240 aggaacgcct gtctgttttg taaagctcgg aagctggatg ataagtttta ccagaagctg 300 cggggccagt tccccgatgc cgtcttttgg caggagatta gcgagatctt cagacagctg 360 cagaagcagg ccgccgagat ctacaaccag agcctgatcg agctctacta cgagatcttc 420 atcaagggca agggcattgc caacgcctcc tccgtggagc actacctgag cgacgtgtgc 480 tacacaagag ccgccgagct ctttaagaac gccgctatcg cttccgggct gaggagcaag 540 attaagagta acttccggct caaggagctg aagaacatga agagcggcct gcccactaca 600 aagagcgaca acttcccaat tccactggtg aagcagaagg ggggccagta cacagggttc 660 gagatttcca accacaacag cgactttatt attaagatcc cctttggcag gtggcaggtc 720 aagaaggaga ttgacaagta caggccctgg gagaagtttg atttcgagca ggtgcagaag 780 agccccaagc ctatttccct gctgctgtcc acacagcggc ggaagaggaa caaggggtgg 840 tctaaggatg aggggaccga ggccgagatt aagaaagtga tgaacggcga ctaccagaca 900 agctacatcg aggtcaagcg gggcagtaag attggcgaga agagcgcctg gatgctgaac 960 ctgagcattg acgtgccaaa gattgataag ggcgtggatc ccagcatcat cggagggatc 1020 gatgtggggg tcaagagccc cctcgtgtgc gccatcaaca acgccttcag caggtacagc 1080 atctccgata acgacctgtt ccactttaac aagaagatgt tcgcccggcg gaggattttg 1140 ctcaagaaga accggcacaa gcgggccgga cacggggcca agaacaagct caagcccatc 1200 actatcctga ccgagaagag cgagaggttc aggaagaagc tcatcgagag atgggcctgc 1260 gagatcgccg atttctttat taagaacaag gtcggaacag tgcagatgga gaacctcgag 1320 agcatgaaga ggaaggagga ttcctacttc aacattcggc tgagggggtt ctggccctac 1380 gctgagatgc agaacaagat tgagtttaag ctgaagcagt acgggattga gatccggaag 1440 gtggccccca acaacaccag caagacctgc agcaagtgcg ggcacctcaa caactacttc 1500 aacttcgagt accggaagaa gaacaagttc ccacacttca agtgcgagaa gtgcaacttt 1560 aaggagaacg ccgattacaa cgccgccctg aacatcagca accctaagct gaagagcact 1620 aaggaggagc ccaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 1680 1680 <210> 2 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Deaminase fusion Cas14a1 <400> 2 ccaaagaaga agcggaaagt ctcctcagag actgggcctg tcgccgtcga tccaaccctg 60 cgccgccgga ttgaacctca cgagtttgaa gtgttctttg acccccggga gctgagaaag 120 gagacatgcc tgctgtacga gatcaactgg ggaggcaggc actccatctg gaggcacacc 180 tctcagaaca caaataagca cgtggaggtg aacttcatcg agaagtttac cacagagcgg 240 tacttctgcc ccaataccag atgtagcatc acatggtttc tgagctggtc cccttgcgga 300 gagtgtagca gggccatcac cgagttcctg tccagatatc cacacgtgac actgtttatc 360 tacatcgcca ggctgtatca ccacgcagac ccaaggaata ggcagggcct gcgcgatctg 420 atcagctccg gcgtgaccat ccagatcatg acagagcagg agtccggcta ctgctggcgg 480 aacttcgtga attattctcc tagcaacgag gcccactggc ctaggtaccc acacctgtgg 540 gtgcgcctgt acgtgctgga gctgtattgc atcatcctgg gcctgccccc ttgtctgaat 600 atcctgcgga gaaagcagcc ccagctgacc ttctttacaa tcgccctgca gtcttgtcac 660 tatcagaggc tgccacccca catcctgtgg gccacaggcc tgaagtctgg aggatctagc 720 ggaggatcct ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt 780 ggcggcagca gcggcggcag catggccaag aacacaatta caaagacact gaagctgagg 840 atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900 agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960 ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020 gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080 ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140 aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200 gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260 aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320 gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380 ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440 tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500 ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560 ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620 gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680 agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740 gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800 gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860 tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920 gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980 aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040 aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100 tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160 tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220 acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280 aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340 gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400 ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460 ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520 aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580 atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640 aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700 aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760 ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820 gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880 ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940 atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000 aggaaagtc 3009 <210> 3 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 3 uuuuuuuuuu 10 <210> 4 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 4 uuuuauuuuu 10 <210> 5 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 5 uuuuauuuuu u 11 <210> 6 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 6 uuuuauuuuu uu 12 <210> 7 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 7 uuuuauuuuu uuu 13 <210> 8 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 8 uuuuauuuuu uuuu 14 <210> 9 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 9 uuuuauuuuu uuuuu 15 <210> 10 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 10 uuuauuuauu 10 <210> 11 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 11 uuuauuuauu u 11 <210> 12 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 12 uuuauuuauu uu 12 <210> 13 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 13 uuuauuuauu uuu 13 <210> 14 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 14 uuuauuuauu uuuu 14 <210> 15 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 15 uuuuauuuua 10 <210> 16 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 16 uuuuauuuua u 11 <210> 17 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 17 uuuuauuuua uu 12 <210> 18 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 18 uuuuauuuua uuu 13 <210> 19 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 19 uuuuauuuua uuuu 14 <210> 20 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 20 uuuuauuuua uuuuu 15 <210> 21 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 21 uuuuauuuua uuuuuu 16 <210> 22 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 22 uuuuguuuuu 10 <210> 23 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 23 uuuuguuuuu u 11 <210> 24 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 24 uuuuguuuuu uu 12 <210> 25 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 25 uuuuguuuuu uuu 13 <210> 26 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 26 uuuuguuuuu uuuu 14 <210> 27 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 27 uuuuguuuuu uuuuu 15 <210> 28 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 28 uuuguuuguu 10 <210> 29 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 29 uuuguuuguu u 11 <210> 30 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 30 uuuguuuguu uu 12 <210> 31 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 31 uuuguuuguu uuu 13 <210> 32 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 32 uuuguuuguu uuuu 14 <210> 33 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 33 uuuuguuuug 10 <210> 34 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 34 uuuuguuuug u 11 <210> 35 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 35 uuuuguuuug uu 12 <210> 36 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 36 uuuuguuuug uuu 13 <210> 37 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 37 uuuuguuuug uuuu 14 <210> 38 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 38 uuuuguuuug uuuuu 15 <210> 39 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 39 uuuuguuuug uuuuuu 16 <210> 40 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 40 uuuucuuuuu 10 <210> 41 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 41 uuuucuuuuu u 11 <210> 42 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 42 uuuucuuuuu uu 12 <210> 43 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 43 uuuucuuuuu uuu 13 <210> 44 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 44 uuuucuuuuu uuuu 14 <210> 45 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 45 uuuucuuuuu uuuuu 15 <210> 46 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 46 uuucuuucuu 10 <210> 47 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 47 uuucuuucuu u 11 <210> 48 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 48 uuucuuucuu uu 12 <210> 49 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 49 uuucuuucuu uuu 13 <210> 50 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 50 uuucuuucuu uuuu 14 <210> 51 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 51 uuuucuuuuc 10 <210> 52 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 52 uuuucuuuuc u 11 <210> 53 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 53 uuuucuuuuc uu 12 <210> 54 <211> 13 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 54 uuuucuuuuc uuu 13 <210> 55 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 55 uuuucuuuuc uuuu 14 <210> 56 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 56 uuuucuuuuc uuuuu 15 <210> 57 <211> 16 <212> RNA <213> Artificial Sequence <220> <223> U-rich tail sequence <400> 57 uuuucuuuuc uuuuuu 16 <210> 58 <211> 37 <212> RNA <213> unidentified archaeon <400> 58 guugcagaac ccgaauagac gaaugaagga augcaac 37 <210> 59 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> CRISPR RNA Repeat sequence encoding DNA sequence for CRISPR/Cas14a1 system <400> 59 gttgcagaac ccgaatagac gaatgaagga atgcaac 37 <210> 60 <211> 161 <212> RNA <213> unidentified archaeon <400> 60 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca a 161 <210> 61 <211> 161 <212> DNA <213> Artificial Sequence <220> <223> tracrRNA sequence encoding DNA sequence for CRISPR/Cas14a1 system <400> 61 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca a 161 <210> 62 <211> 20 <212> DNA <213> Homo sapiens <400> 62 cacgtctcat atgccccttg 20 <210> 63 <211> 20 <212> DNA <213> Homo sapiens <400> 63 cacacacaca gtgggctacc 20 <210> 64 <211> 20 <212> DNA <213> Homo sapiens <400> 64 gacgtgggag acacacacac 20 <210> 65 <211> 20 <212> DNA <213> Homo sapiens <400> 65 catccccagg acacacacac 20 <210> 66 <211> 20 <212> DNA <213> Homo sapiens <400> 66 agcacatgtg cacacacaca 20 <210> 67 <211> 20 <212> DNA <213> Homo sapiens <400> 67 agaacacata cccctgggcc 20 <210> 68 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> spacer sequence for RNF2 <400> 68 cacgucucau augccccuug 20 <210> 69 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> spacer sequence for DYtarget2 <400> 69 cacacacaca gugggcuacc 20 <210> 70 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> spacer sequence for DYtarget9 <400> 70 gacgugggag acacacacac 20 <210> 71 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> spacer sequence for DYtarget10 <400> 71 cauccccagg acacacacac 20 <210> 72 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> spacer sequence for DYtarget13 <400> 72 agcacaugug cacacacaca 20 <210> 73 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> spacer sequence for Intergenic-22 <400> 73 agaacacaua ccccugggcc 20 <210> 74 <211> 202 <212> RNA <213> Artificial Sequence <220> <223> common sgRNA sequence except spacer sequence and U-rich tail sequence <400> 74 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca ac 202 <210> 75 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for RNF2(WT) <400> 75 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacgucuc auaugccccu ug 222 <210> 76 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for RNF2(U4AU6) <400> 76 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacgucuc auaugccccu uguuuuauuu uuu 233 <210> 77 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(WT) <400> 77 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua cc 222 <210> 78 <211> 223 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U) <400> 78 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccu 223 <210> 79 <211> 224 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U2) <400> 79 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuu 224 <210> 80 <211> 225 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U3) <400> 80 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuu 225 <210> 81 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4) <400> 81 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuu 226 <210> 82 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U5) <400> 82 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuu 227 <210> 83 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U6) <400> 83 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuuu 228 <210> 84 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4A) <400> 84 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuua 227 <210> 85 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU) <400> 85 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuau 228 <210> 86 <211> 229 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU2) <400> 86 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauu 229 <210> 87 <211> 230 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU3) <400> 87 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu 230 <210> 88 <211> 231 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU4) <400> 88 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu u 231 <210> 89 <211> 232 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU5) <400> 89 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uu 232 <210> 90 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU6) <400> 90 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuu 233 <210> 91 <211> 234 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU7) <400> 91 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuu 234 <210> 92 <211> 235 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU8) <400> 92 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuu 235 <210> 93 <211> 236 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU9) <400> 93 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuuu 236 <210> 94 <211> 237 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U4AU10) <400> 94 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuuuu 237 <210> 95 <211> 232 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U3AU6) <400> 95 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuauuuu uu 232 <210> 96 <211> 236 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(U3AU3AU6) <400> 96 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuauuua uuuuuu 236 <210> 97 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> crRNA for DYtarget2(WT) <400> 97 guugcagaac ccgaauagac gaaugaagga augcaaccac acacacagug ggcuacc 57 <210> 98 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> crRNA for DYtarget2(U4AU6) <400> 98 guugcagaac ccgaauagac gaaugaagga augcaaccac acacacagug ggcuaccuuu 60 uauuuuuu 68 <210> 99 <211> 231 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(spacer 18nt, U4AU6) <400> 99 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua uuuuauuuuu u 231 <210> 100 <211> 232 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(spacer 19nt, U4AU6) <400> 100 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua cuuuuauuuu uu 232 <210> 101 <211> 234 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(spacer 21nt, U4AU6) <400> 101 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuuauu uuuu 234 <210> 102 <211> 238 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(spacer 25nt, U4AU6) <400> 102 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuauuu uauuuuuu 238 <210> 103 <211> 243 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget2(spacer 30nt, U4AU6) <400> 103 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuaagg aguuuuauuu 240 uuu 243 <210> 104 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget9(WT) <400> 104 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgacguggg agacacacac ac 222 <210> 105 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget9(U4AU6) <400> 105 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgacguggg agacacacac acuuuuauuu uuu 233 <210> 106 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(WT) <400> 106 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac ac 222 <210> 107 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(U4AU6) <400> 107 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acuuuuauuu uuu 233 <210> 108 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(U6) <400> 108 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acuuuuuu 228 <210> 109 <211> 232 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(U3AU6) <400> 109 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acuuuauuuu uu 232 <210> 110 <211> 236 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(U3AU3AU6) <400> 110 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acuuuauuua uuuuuu 236 <210> 111 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> crRNA for DYtarget10(WT) <400> 111 guugcagaac ccgaauagac gaaugaagga augcaaccau ccccaggaca cacacac 57 <210> 112 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> crRNA for DYtarget10(U4AU6) <400> 112 guugcagaac ccgaauagac gaaugaagga augcaaccau ccccaggaca cacacacuuu 60 uauuuuuu 68 <210> 113 <211> 230 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(spacer 17nt, U4AU6) <400> 113 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacau uuuauuuuuu 230 <210> 114 <211> 230 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(spacer 18nt, U4AU6) <400> 114 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacau uuuauuuuuu 230 <210> 115 <211> 232 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(spacer 19nt, U4AU6) <400> 115 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac auuuuauuuu uu 232 <210> 116 <211> 234 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(spacer 21nt, U4AU6) <400> 116 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acauuuuauu uuuu 234 <210> 117 <211> 238 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(spacer 25nt, U4AU6) <400> 117 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acauuucuuu uauuuuuu 238 <210> 118 <211> 243 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget10(spacer 30nt, U4AU6) <400> 118 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accaucccca ggacacacac acauuucaaa aguuuuauuu 240 uuu 243 <210> 119 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget13(WT) <400> 119 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acagcacaug ugcacacaca ca 222 <210> 120 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for DYtarget13(U4AU6) <400> 120 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acagcacaug ugcacacaca cauuuuauuu uuu 233 <210> 121 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for Intergenic-22(WT) <400> 121 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acagaacaca uaccccuggg cc 222 <210> 122 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for Intergenic-22(U6) <400> 122 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acagaacaca uaccccuggg ccuuuuuu 228 <210> 123 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for Intergenic-22(U4AU6) <400> 123 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acagaacaca uaccccuggg ccuuuuauuu uuu 233 <210> 124 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> crRNA for Intergenic-22(WT) <400> 124 guugcagaac ccgaauagac gaaugaagga augcaacaga acacauaccc cugggcc 57 <210> 125 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> crRNA for Intergenic-22(U4AU6) <400> 125 guugcagaac ccgaauagac gaaugaagga augcaacaga acacauaccc cugggccuuu 60 uauuuuuu 68 <210> 126 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> common sgRNA encoding DNA sequence except spacer sequence and U-rich tail sequence <400> 126 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca ac 202 <210> 127 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting RNF2(WT) <400> 127 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacgtctc atatgcccct tg 222 <210> 128 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting RNF2(U4AU6) <400> 128 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacgtctc atatgcccct tgttttattt ttt 233 <210> 129 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(WT) <400> 129 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cc 222 <210> 130 <211> 223 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U) <400> 130 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cct 223 <210> 131 <211> 224 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U2) <400> 131 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cctt 224 <210> 132 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U3) <400> 132 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttt 225 <210> 133 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4) <400> 133 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cctttt 226 <210> 134 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U5) <400> 134 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttt 227 <210> 135 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U6) <400> 135 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cctttttt 228 <210> 136 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4A) <400> 136 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cctttta 227 <210> 137 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU) <400> 137 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttat 228 <210> 138 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU2) <400> 138 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttatt 229 <210> 139 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU3) <400> 139 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt 230 <210> 140 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU4) <400> 140 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt t 231 <210> 141 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU5) <400> 141 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tt 232 <210> 142 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU6) <400> 142 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttt 233 <210> 143 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU7) <400> 143 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tttt 234 <210> 144 <211> 235 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU8) <400> 144 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttttt 235 <210> 145 <211> 236 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU9) <400> 145 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tttttt 236 <210> 146 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U4AU10) <400> 146 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttttttt 237 <210> 147 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U3AU6) <400> 147 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cctttatttt tt 232 <210> 148 <211> 236 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(U3AU3AU6) <400> 148 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cctttattta tttttt 236 <210> 149 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> crRNA encoding DNA sequence, targeting DYtarget2(WT) <400> 149 gttgcagaac ccgaatagac gaatgaagga atgcaaccac acacacagtg ggctacc 57 <210> 150 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> crRNA encoding DNA sequence, targeting DYtarget2(U4AU6) <400> 150 gttgcagaac ccgaatagac gaatgaagga atgcaaccac acacacagtg ggctaccttt 60 tatttttt 68 <210> 151 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(spacer 18nt, U4AU6) <400> 151 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ttttattttt t 231 <210> 152 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(spacer 19nt, U4AU6) <400> 152 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta cttttatttt tt 232 <210> 153 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(spacer 21nt, U4AU6) <400> 153 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccattttatt tttt 234 <210> 154 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(spacer 25nt, U4AU6) <400> 154 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccatttattt tatttttt 238 <210> 155 <211> 243 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget2(spacer 30nt, U4AU6) <400> 155 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccatttaagg agttttattt 240 ttt 243 <210> 156 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget9(WT) <400> 156 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acgacgtggg agacacacac ac 222 <210> 157 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget9(U4AU6) <400> 157 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acgacgtggg agacacacac acttttattt ttt 233 <210> 158 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(WT) <400> 158 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac ac 222 <210> 159 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(U4AU6) <400> 159 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac acttttattt ttt 233 <210> 160 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(U6) <400> 160 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac actttttt 228 <210> 161 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(U3AU6) <400> 161 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac actttatttt tt 232 <210> 162 <211> 236 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(U3AU3AU6) <400> 162 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac actttattta tttttt 236 <210> 163 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> crRNA encoding DNA sequence, targeting DYtarget10(WT) <400> 163 gttgcagaac ccgaatagac gaatgaagga atgcaaccat ccccaggaca cacacac 57 <210> 164 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> crRNA encoding DNA sequence, targeting DYtarget10(U4AU6) <400> 164 gttgcagaac ccgaatagac gaatgaagga atgcaaccat ccccaggaca cacacacttt 60 tatttttt 68 <210> 165 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(spacer 17nt, U4AU6) <400> 165 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacat tttatttttt 230 <210> 166 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(spacer 18nt, U4AU6) <400> 166 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac ttttattttt t 231 <210> 167 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(spacer 19nt, U4AU6) <400> 167 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac attttatttt tt 232 <210> 168 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(spacer 21nt, U4AU6) <400> 168 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac acattttatt tttt 234 <210> 169 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(spacer 25nt, U4AU6) <400> 169 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac acatttcttt tatttttt 238 <210> 170 <211> 243 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget10(spacer 30nt, U4AU6) <400> 170 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accatcccca ggacacacac acatttcaaa agttttattt 240 ttt 243 <210> 171 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget13(WT) <400> 171 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acagcacatg tgcacacaca ca 222 <210> 172 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting DYtarget13(U4AU6) <400> 172 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acagcacatg tgcacacaca cattttattt ttt 233 <210> 173 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting Intergenic-22(WT) <400> 173 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acagaacaca tacccctggg cc 222 <210> 174 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting Intergenic-22(U6) <400> 174 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acagaacaca tacccctggg cctttttt 228 <210> 175 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence, targeting Intergenic-22(U4AU6) <400> 175 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca acagaacaca tacccctggg ccttttattt ttt 233 <210> 176 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> crRNA encoding DNA sequence, targeting Intergenic-22(WT) <400> 176 gttgcagaac ccgaatagac gaatgaagga atgcaacaga acacataccc ctgggcc 57 <210> 177 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> crRNA encoding DNA sequence, targeting Intergenic-22(U4AU6) <400> 177 gttgcagaac ccgaatagac gaatgaagga atgcaacaga acacataccc ctgggccttt 60 tatttttt 68 <210> 178 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> forward primer to synthesize sgRNA for RNF2 <400> 178 gccaacatac agaagtcagg aa 22 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> forward primer to synthesize sgRNA amplicon for DYtarget2 <400> 179 ccaggccatt tctcagggtt 20 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> forward primer to synthesize sgRNA amplicon for DYtarget9 <400> 180 gtacagcttc ccagactccg 20 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> forward primer to synthesize sgRNA amplicon for DYtarget10 <400> 181 tgctccagga acctcaccta 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> forward primer to synthesize sgRNA amplicon for DYtarget13 <400> 182 gccttccccc acctttcttt 20 <210> 183 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> U6 forward primer to synthesize sgRNA <400> 183 gagggcctat ttcccatgat t 21 <210> 184 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> forward primer to synthesize tracrRNA <400> 184 gagggcctat ttcccatgat t 21 <210> 185 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for RNF2(WT) <400> 185 tgtgcagaca aacggaactc 20 <210> 186 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for RNF2(U4AU6) <400> 186 aaaaaataaa atgtgcagac aaacggaact c 31 <210> 187 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(WT) <400> 187 ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 45 <210> 188 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U) <400> 188 aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 46 <210> 189 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U2) <400> 189 aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 47 <210> 190 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U3) <400> 190 aaaggtagcc cactgtgtgt gtggttgcat tccttcattc gtctattc 48 <210> 191 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4) <400> 191 aaaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 49 <210> 192 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U5) <400> 192 aaaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 50 <210> 193 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U6) <400> 193 aaaaaaggta gcccactgtg tgtgtggttg cattccttca ttcgtctatt c 51 <210> 194 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4A) <400> 194 taaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 50 <210> 195 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU) <400> 195 ataaaaggta gcccactgtg tgtgtggttg cattccttca ttcgtctatt c 51 <210> 196 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU2) <400> 196 aataaaaggt agcccactgt gtgtgtggtt gcattccttc attcgtctat tc 52 <210> 197 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU3) <400> 197 aaataaaagg tagcccactg tgtgtgtggt tgcattcctt cattcgtcta ttc 53 <210> 198 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU4) <400> 198 aaaataaaag gtagcccact gtgtgtgtgg ttgcattcct tcattcgtct attc 54 <210> 199 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU5) <400> 199 aaaaataaaa ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 55 <210> 200 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU6) <400> 200 aaaaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56 <210> 201 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU7) <400> 201 aaaaaaataa aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 57 <210> 202 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU8) <400> 202 aaaaaaaata aaaggtagcc cactgtgtgt gtggttgcat tccttcattc gtctattc 58 <210> 203 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU9) <400> 203 aaaaaaaaat aaaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 59 <210> 204 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U4AU10) <400> 204 aaaaaaaaaa taaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 60 60 <210> 205 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U3AU6) <400> 205 aaaaaataaa ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 55 <210> 206 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(U3AU3AU6) <400> 206 aaaaaataaa taaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 59 <210> 207 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize crRNA amplicon for DYtarget2(WT) <400> 207 ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 45 <210> 208 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize crRNA amplicon for DYtarget2(U4AU6) <400> 208 aaaaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56 <210> 209 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(spacer 18nt, U4AU6) <400> 209 aaaaaataaa atagcccact gtgtgtgtgg ttgcattcct 40 <210> 210 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(spacer 19nt, U4AU6) <400> 210 aaaaaataaa agtagcccac tgtgtgtgtg gttgcattcc t 41 <210> 211 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(spacer 21nt, U4AU6) <400> 211 aaaaaataaa atggtagccc actgtgtgtg tggttgcatt cct 43 <210> 212 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(spacer 25nt, U4AU6) <400> 212 aaaaaataaa ataaatggta gcccactgtg tgtgtggttg cattcct 47 <210> 213 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget2(spacer 30nt, U4AU6) <400> 213 aaaaaataaa actccttaaa tggtagccca ctgtgtgtgt ggttgcattc ct 52 <210> 214 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget9(WT) <400> 214 gtgtgtgtgt ctcccacgtc gttgcattcc ttcattcgtc tattc 45 <210> 215 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget9(U4AU6) <400> 215 aaaaaataaa atgtgtgtgt ctcccacgtc gttgcattcc ttcattcgtc tattc 55 <210> 216 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(WT) <400> 216 gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 45 <210> 217 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(U4AU6) <400> 217 aaaaaataaa atgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 55 <210> 218 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(U6) <400> 218 aaaaaatgtg tgtgtcctgg ggatggttgc attccttcat tcgtctattc 50 <210> 219 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(U3AU6) <400> 219 aaaaaataaa tgtgtgtgtc ctggggatgg ttgcattcct tcattcgtct attc 54 <210> 220 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(U3AU3AU6) <400> 220 aaaaaataaa taaatgtgtg tgtcctgggg atggttgcat tccttcattc gtctattc 58 <210> 221 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize crRNA amplicon for DYtarget10(WT) <400> 221 gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 45 <210> 222 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize crRNA amplicon for DYtarget10(U4AU6) <400> 222 aaaaataaaa gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc atattc 56 <210> 223 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(spacer 17nt, U4AU6) <400> 223 aaaaaataaa atgtgtgtcc tggggatggt tgcattcct 39 <210> 224 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(spacer 18nt, U4AU6) <400> 224 aaaaaataaa agtgtgtgtc ctggggatgg ttgcattcct 40 <210> 225 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(spacer 19nt, U4AU6) <400> 225 aaaaaataaa atgtgtgtgt cctggggatg gttgcattcc t 41 <210> 226 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(spacer 21nt, U4AU6) <400> 226 aaaaaataaa atgtgtgtgt gtcctgggga tggttgcatt cct 43 <210> 227 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(spacer 25nt, U4AU6) <400> 227 aaaaaataaa agaaatgtgt gtgtgtcctg gggatggttg cattcct 47 <210> 228 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget10(spacer 30nt, U4AU6) <400> 228 aaaaaataaa acttttgaaa tgtgtgtgtg tcctggggat ggttgcattc ct 52 <210> 229 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget13(WT) <400> 229 tgtgtgtgtg cacatgtgct gttgcattcc ttcattcgtc tattc 45 <210> 230 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for DYtarget13(U4AU6) <400> 230 aaaaaataaa agtgtgtgtg cacatgtgct gttgcattcc ttcattcgtc tattc 55 <210> 231 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for Intergenic-22(WT) <400> 231 ggcccagggg tatgtgttct gttgcattcc t 31 <210> 232 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for Intergenic-22(U6) <400> 232 aaaaaaggcc caggggtatg tgttctgttg cattcct 37 <210> 233 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize sgRNA amplicon for Intergenic-22(U4AU6) <400> 233 aaaaaataaa aggcccaggg gtatgtgttc tgttgcattc ct 42 <210> 234 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize crRNA amplicon for Intergenic-22(WT) <400> 234 ggcccagggg tatgtgttct gttgcattcc t 31 <210> 235 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize crRNA amplicon for Intergenic-22(U4AU6) <400> 235 aaaaaataaa aggcccaggg gtatgtgttc tgttgcattc ct 42 <210> 236 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> reverse primer to synthesize tracrRNA amplicon <400> 236 ttgtgcagaa ttggagagga 20 <210> 237 <211> 7 <212> PRT <213> simian virus 40 <400> 237 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 238 <211> 16 <212> PRT <213> mus musculus <400> 238 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 239 <211> 9 <212> PRT <213> homo sapiens <400> 239 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 240 <211> 11 <212> PRT <213> Homo sapiens <400> 240 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 241 <211> 38 <212> PRT <213> mus musculus <400> 241 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 242 <211> 42 <212> PRT <213> Homo sapiens <400> 242 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 243 <211> 8 <212> PRT <213> Homo sapiens <400> 243 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 244 <211> 8 <212> PRT <213> homo sapiens <400> 244 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 245 <211> 8 <212> PRT <213> homo sapiens <400> 245 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 246 <211> 12 <212> PRT <213> mus musculus <400> 246 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 247 <211> 5 <212> PRT <213> Influenza virus <400> 247 Asp Arg Leu Arg Arg 1 5 <210> 248 <211> 7 <212> PRT <213> influenza virus <400> 248 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 249 <211> 10 <212> PRT <213> Hepatitis D virus <400> 249 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 250 <211> 10 <212> PRT <213> mus musculus <400> 250 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 251 <211> 20 <212> PRT <213> homo sapiens <400> 251 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 252 <211> 17 <212> PRT <213> Homo sapiens <400> 252 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 253 <211> 69 <212> RNA <213> Artificial Sequence <220> <223> scaffold sequence for sgRNA <400> 253 uucauuuuuc cucuccaauu cugcacaaga aaguugcaga acccgaauag acgaaugaag 60 gaaugcaac 69 <210> 254 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> scaffold sequence encoding DNA sequence, for sgRNA <400> 254 ttcatttttc ctctccaatt ctgcacaaga aaguugcaga acccgaauag acgaaugaag 60 gaaugcaac 69 <210> 255 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> common crRNA sequence <400> 255 gttgcagaac ccgaatagac gaatgaagga atgcaac 37 <210> 256 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence for DYtarget2(T4AT4AT) <400> 256 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tat 233 <210> 257 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence for DYtarget2(T4AT4AT2) <400> 257 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tatt 234 <210> 258 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> reverse primer for sgRNA amplicon for DYtarget2(T4AT4AT) <400> 258 ataaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56 <210> 259 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for sgRNA amplicon for DYtarget2(T4AT4AT2) <400> 259 aataaaataa aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 57 <210> 260 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence for CSMD1 <400> 260 gaataccccc attcttcagg 20 <210> 261 <211> 222 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(WT) <400> 261 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gg 222 <210> 262 <211> 223 <212> RNA <213> Artificial Sequence <220> <223> sgRNA for CSMD1(U) <400> 262 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca ggu 223 <210> 263 <211> 224 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U2) <400> 263 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguu 224 <210> 264 <211> 225 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U3) <400> 264 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuu 225 <210> 265 <211> 226 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4) <400> 265 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuu 226 <210> 266 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U5) <400> 266 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuu 227 <210> 267 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U6) <400> 267 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuuu 228 <210> 268 <211> 227 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4A) <400> 268 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuua 227 <210> 269 <211> 228 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU) <400> 269 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuau 228 <210> 270 <211> 229 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU) <400> 270 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauu 229 <210> 271 <211> 230 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU3) <400> 271 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu 230 <210> 272 <211> 231 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU5) <400> 272 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu u 231 <210> 273 <211> 232 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU5) <400> 273 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uu 232 <210> 274 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU6) <400> 274 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuu 233 <210> 275 <211> 234 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU7) <400> 275 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuu 234 <210> 276 <211> 235 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU8) <400> 276 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuu 235 <210> 277 <211> 236 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU9) <400> 277 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuuu 236 <210> 278 <211> 237 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for CSMD1(U4AU10) <400> 278 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuuuu 237 <210> 279 <211> 233 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for DYtarget2(U4AU4AU) <400> 279 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uau 233 <210> 280 <211> 234 <212> RNA <213> Artificial Sequence <220> <223> sgRNA sequence for DYtarget2(U4AU4AU2) <400> 280 cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60 gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120 cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180 uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uauu 234 <210> 281 <211> 560 <212> PRT <213> unidentified archaeon ICHT <400> 281 Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Met 1 5 10 15 Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro 20 25 30 Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn 35 40 45 Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala 50 55 60 Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu 65 70 75 80 Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe 85 90 95 Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu 100 105 110 Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr 115 120 125 Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys 130 135 140 Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys 145 150 155 160 Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly 165 170 175 Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn 180 185 190 Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro 195 200 205 Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn 210 215 220 His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val 225 230 235 240 Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu 245 250 255 Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln 260 265 270 Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala 275 280 285 Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu 290 295 300 Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn 305 310 315 320 Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile 325 330 335 Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile 340 345 350 Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His 355 360 365 Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn 370 375 380 Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile 385 390 395 400 Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu 405 410 415 Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly 420 425 430 Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser 435 440 445 Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln 450 455 460 Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys 465 470 475 480 Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu 485 490 495 Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His 500 505 510 Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala 515 520 525 Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro 530 535 540 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 545 550 555 560 <210> 282 <211> 497 <212> PRT <213> Artificial Sequence <220> <223> polypeptide sequence for effector protein of Syntrophomonas palmitatica <400> 282 Met Gly Glu Ser Val Lys Ala Ile Lys Leu Lys Ile Leu Asp Met Phe 1 5 10 15 Leu Asp Pro Glu Cys Thr Lys Gln Asp Asp Asn Trp Arg Lys Asp Leu 20 25 30 Ser Thr Met Ser Arg Phe Cys Ala Glu Ala Gly Asn Met Cys Leu Arg 35 40 45 Asp Leu Tyr Asn Tyr Phe Ser Met Pro Lys Glu Asp Arg Ile Ser Ser 50 55 60 Lys Asp Leu Tyr Asn Ala Met Tyr His Lys Thr Lys Leu Leu His Pro 65 70 75 80 Glu Leu Pro Gly Lys Val Ala Asn Gln Ile Val Asn His Ala Lys Asp 85 90 95 Val Trp Lys Arg Asn Ala Lys Leu Ile Tyr Arg Asn Gln Ile Ser Met 100 105 110 Pro Thr Tyr Lys Ile Thr Thr Ala Pro Ile Arg Leu Gln Asn Asn Ile 115 120 125 Tyr Lys Leu Ile Lys Asn Lys Asn Lys Tyr Ile Ile Asp Val Gln Leu 130 135 140 Tyr Ser Lys Glu Tyr Ser Lys Asp Ser Gly Lys Gly Thr His Arg Tyr 145 150 155 160 Phe Leu Val Ala Val Arg Asp Ser Ser Thr Arg Met Ile Phe Asp Arg 165 170 175 Ile Met Ser Lys Asp His Ile Asp Ser Ser Lys Ser Tyr Thr Gln Gly 180 185 190 Gln Leu Gln Ile Lys Lys Asp His Gln Gly Lys Trp Tyr Cys Ile Ile 195 200 205 Pro Tyr Thr Phe Pro Thr His Glu Thr Val Leu Asp Pro Asp Lys Val 210 215 220 Met Gly Val Asp Leu Gly Val Ala Lys Ala Val Tyr Trp Ala Phe Asn 225 230 235 240 Ser Ser Tyr Lys Arg Gly Cys Ile Asp Gly Gly Glu Ile Glu His Phe 245 250 255 Arg Lys Met Ile Arg Ala Arg Arg Val Ser Ile Gln Asn Gln Ile Lys 260 265 270 His Ser Gly Asp Ala Arg Lys Gly His Gly Arg Lys Arg Ala Leu Lys 275 280 285 Pro Ile Glu Thr Leu Ser Glu Lys Glu Lys Asn Phe Arg Asp Thr Ile 290 295 300 Asn His Arg Tyr Ala Asn Arg Ile Val Glu Ala Ala Ile Lys Gln Gly 305 310 315 320 Cys Gly Thr Ile Gln Ile Glu Asn Leu Glu Gly Ile Ala Asp Thr Thr 325 330 335 Gly Ser Lys Phe Leu Lys Asn Trp Pro Tyr Tyr Asp Leu Gln Thr Lys 340 345 350 Ile Val Asn Lys Ala Lys Glu His Gly Ile Thr Val Val Ala Ile Asn 355 360 365 Pro Gln Tyr Thr Ser Gln Arg Cys Ser Met Cys Gly Tyr Ile Glu Lys 370 375 380 Thr Asn Arg Ser Ser Gln Ala Val Phe Glu Cys Lys Gln Cys Gly Tyr 385 390 395 400 Gly Ser Arg Thr Ile Cys Ile Asn Cys Arg His Val Gln Val Ser Gly 405 410 415 Asp Val Cys Glu Glu Cys Gly Gly Ile Val Lys Lys Glu Asn Val Asn 420 425 430 Ala Asp Tyr Asn Ala Ala Lys Asn Ile Ser Thr Pro Tyr Ile Asp Gln 435 440 445 Ile Ile Met Glu Lys Cys Leu Glu Leu Gly Ile Pro Tyr Arg Ser Ile 450 455 460 Thr Cys Lys Glu Cys Gly His Ile Gln Ala Ser Gly Asn Thr Cys Glu 465 470 475 480 Val Cys Gly Ser Thr Asn Ile Leu Lys Pro Lys Lys Ile Arg Lys Ala 485 490 495 Lys <210> 283 <211> 422 <212> PRT <213> Artificial Sequence <220> <223> polypeptide sequence for effector protein of acidibacillus sulfuroxidans <400> 283 Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp 1 5 10 15 Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg 20 25 30 Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe 35 40 45 Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp 50 55 60 Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Lys 65 70 75 80 Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys 85 90 95 Arg Ala Thr Asp Arg Phe Lys Ala Tyr Gln Lys Glu Ile Leu Arg Gly 100 105 110 Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile 115 120 125 Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala 130 135 140 Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys 145 150 155 160 Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile 165 170 175 Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile 180 185 190 Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp 195 200 205 Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile 210 215 220 Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro 225 230 235 240 Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln 245 250 255 Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly 260 265 270 Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu 275 280 285 Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg 290 295 300 Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr 305 310 315 320 Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe 325 330 335 Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys 340 345 350 Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Asp Pro Gln Tyr Thr 355 360 365 Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile 370 375 380 Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala 385 390 395 400 Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile 405 410 415 Ile Ala Glu Ser Ile Lys 420 <210> 284 <211> 1491 <212> DNA <213> Artificial Sequence <220> <223> human codon-optimized, SpCas12f1 encoding DNA sequence <400> 284 atgggcgaga gcgttaaagc aatcaaactg aagatcctgg acatgttcct ggacccggag 60 tgcactaaac aggacgataa ctggcgtaaa gacctgtcta ccatgtctcg tttctgcgca 120 gaggcgggta acatgtgcct gcgcgacctg tacaattact tttctatgcc gaaagaagac 180 cgtattagct ccaaggatct gtacaacgcc atgtaccaca aaactaaact gctgcacccg 240 gaactgccgg gtaaagtggc gaaccagatc gtcaaccacg ctaaagatgt gtggaaacgc 300 aacgcgaagc tgatctatcg taatcagatc tctatgccga cttacaagat caccaccgca 360 ccgattcgcc tgcaaaacaa catctataaa ctgatcaaaa acaagaacaa atatatcatc 420 gatgtccagc tgtacagcaa agaatactct aaagacagcg gcaaaggcac ccaccgctac 480 ttcctggttg cagtgcgcga ttctagcacg cgtatgatct tcgaccgcat catgagcaaa 540 gaccacatcg atagctccaa atcctacacc cagggtcagc tgcagattaa aaaagaccat 600 cagggcaaat ggtactgtat cattccgtac accttcccga ctcatgagac cgtcctggat 660 ccggacaaag ttatgggtgt ggacctgggc gtggctaaag cagtgtattg ggcgttcaac 720 tcctcttaca aacgcggttg tatcgatggt ggtgaaattg aacacttccg caaaatgatc 780 cgtgctcgtc gtgtctccat tcagaaccag attaaacatt ctggcgacgc gcgcaagggt 840 catggtcgta aacgtgcact gaagccgatt gaaaccctgt ctgaaaaaga aaaaaacttc 900 cgcgatacta tcaaccatcg ttacgcaaac cgtatcgtgg aggcagcgat taagcagggc 960 tgcggcacca tccagatcga aaatctggag ggtatcgccg atactacggg ttccaaattt 1020 ctgaaaaact ggccatacta tgacctgcag accaaaatcg tgaacaaagc gaaggaacat 1080 ggcatcaccg tcgttgcgat caacccgcag tatacttctc aacgttgctc catgtgtggt 1140 tacattgaaa aaaccaaccg ttcctctcag gcagtgttcg agtgcaaaca gtgcggctat 1200 ggttcccgta ccatctgcat caactgccgc cacgttcagg taagcggtga tgtctgcgaa 1260 gaatgcggcg gcatcgttaa aaaagaaaac gttaacgcgg actataacgc ggcgaaaaac 1320 atctccaccc catatatcga tcagatcatc atggagaaat gtctggagct gggtatcccg 1380 taccgtagca tcacttgcaa agaatgcggt catatccagg cgtctggtaa cacttgtgag 1440 gtgtgcggtt ccaccaacat tctgaaaccg aaaaaaatcc gtaaagctaa a 1491 <210> 285 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> human codon-optimized, AsCas12f1 encoding DNA sequence <400> 285 atgatcaagg tttatcgcta tgaaattgtg aaaccgctgg acctggactg gaaagagttc 60 ggtactatcc tgcgtcagct gcagcaggaa acgcgtttcg cactgaacaa agcgacgcag 120 ctggcttggg aatggatggg cttcagctct gattacaaag acaaccacgg cgaataccct 180 aaatccaaag atatcctggg ttacaccaac gtgcacggtt atgcgtacca caccatcaaa 240 actaaagcgt accgcctgaa ctccggtaat ctgtctcaga ccatcaagcg tgcgaccgac 300 cgtttcaaag cgtaccagaa ggaaatcctg cgcggtgaca tgagcatccc gtcctataag 360 cgtgacatcc cgctggatct gatcaaagaa aacatcagcg taaaccgcat gaaccacggt 420 gactacatcg cctccctgtc tctgctgtct aacccggcaa agcaagagat gaacgttaaa 480 cgcaaaatct ccgttatcat tatcgttcgt ggcgcaggca aaaccatcat ggatcgtatt 540 ctgtccggtg aatatcaagt gtccgcaagc cagatcatcc atgacgatcg taaaaataaa 600 tggtatctga acatctctta tgatttcgaa ccgcagaccc gcgtactgga cctgaacaaa 660 atcatgggta tcgatctggg cgttgcagta gcggtgtaca tggctttcca gcacaccccg 720 gcacgctaca aactggaagg tggtgagatc gaaaacttcc gtcgtcaagt ggaatctcgt 780 cgcatctcta tgctgcgtca gggtaaatat gcaggtggtg cgcgtggtgg tcatggtcgt 840 gacaaacgta ttaaaccaat cgaacagctg cgcgataaaa tcgccaactt ccgtgatacc 900 accaaccacc gctactctcg ttatatcgtt gatatggcaa tcaaagaggg ttgtggtact 960 atccagatgg aagacctgac gaacatccgc gatatcggtt ctcgtttcct gcagaactgg 1020 acctactacg atctgcagca gaaaattatc tacaaagcgg aggaagcagg tatcaaagtc 1080 attaaaatcg atccgcagta tactagccag cgctgcagcg aatgtggtaa cattgatagc 1140 ggcaaccgca ttggtcaggc aatctttaaa tgccgcgctt gtggctacga agcgaacgca 1200 gactacaacg cggcgcgtaa catcgccatc ccgaatattg acaaaatcat tgccgaatct 1260 attaaa 1266 <210> 286 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> protospacer sequence of VEGFA-3 gene <400> 286 ggggtgaccg ccggagcgcg 20 <210> 287 <211> 161 <212> DNA <213> Artificial Sequence <220> <223> tracrRNA encoding DNA sequence for SpCas12f1 and AsCas12f1 <400> 287 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca a 161 <210> 288 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> crRNA repeat sequence encoding DNA sequence for SpCas12f1 <400> 288 gtcgcatctt gcgtaagcgc gtggattgaa ac 32 <210> 289 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> crRNA repeat sequence encoding DNA sequence for AsCas12f1 <400> 289 gtttgcgagc tagcttgtgg agtgtgaac 29 <210> 290 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> SpCas12f1, crRNA encoding DNA for DYtarget2(WT) <400> 290 gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta cc 52 <210> 291 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> SpCas12f1, crRNA encoding DNA for DYtarget2(U6) <400> 291 gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta cctttttt 58 <210> 292 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> SpCas12f1, crRNA encoding DNA for DYtarget2(U4AU6) <400> 292 gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta ccttttattt 60 ttt 63 <210> 293 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> SpCas12f1, crRNA encoding DNA for VEGFA-3(WT) <400> 293 gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cg 52 <210> 294 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> SpCas12f1, crRNA encoding DNA for VEGFA-3(U6) <400> 294 gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cgtttttt 58 <210> 295 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> SpCas12f1, crRNA encoding DNA for VEGFA-3(U4AU6) <400> 295 gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cgttttattt 60 ttt 63 <210> 296 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> AsCas12f1, crRNA encoding DNA for DYtarget2(WT) <400> 296 gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacc 49 <210> 297 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> AsCas12f1, crRNA encoding DNA sequence for DYtarget2(U6) <400> 297 gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacct ttttt 55 <210> 298 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> AsCas12f1, crRNA encoding DNA for DYtarget2(U4AU6) <400> 298 gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacct tttatttttt 60 60 <210> 299 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> AsCas12f1, crRNA encoding DNA for VEGFA-3(WT) <400> 299 gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcg 49 <210> 300 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> AsCas12f1, crRNA encoding DNA for VEGFA-3(U6) <400> 300 gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcgt ttttt 55 <210> 301 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> AsCas12f1, crRNA encoding DNA for VEGFA-3(U4AU6) <400> 301 gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcgt tttatttttt 60 60 <210> 302 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> reverse primer for synthesizing tracrRNA amplicon <400> 302 ttgtgcagaa ttggagagga 20 <210> 303 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of SpCas12f1(DYtarget2, WT) <400> 303 ggtagcccac tgtgtgtgtg gtttcaatcc a 31 <210> 304 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of SpCas12f1(DYtarget2, U6) <400> 304 aaaaaaggta gcccactgtg tgtgtggttt caatcca 37 <210> 305 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of SpCas12f1(DYtarget2, U4AU6) <400> 305 aaaaaataaa aggtagccca ctgtgtgtgt ggtttcaatc ca 42 <210> 306 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of SpCas12f1(VEGFA-3, WT) <400> 306 cgcgctccgg cggtcacccc gtttcaatcc a 31 <210> 307 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of SpCas12f1(VEGFA-3, U6) <400> 307 aaaaaacgcg ctccggcggt caccccgttt caatcca 37 <210> 308 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of SpCas12f1(VEGFA-3, U4AU6) <400> 308 aaaaaataaa acgcgctccg gcggtcaccc cgtttcaatc ca 42 <210> 309 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of AsCas12f1(DYtarget2, WT) <400> 309 ggtagcccac tgtgtgtgtg gttcacactc c 31 <210> 310 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of AsCas12f1(DYtarget2, U6) <400> 310 aaaaaaggta gcccactgtg tgtgtggttc acactcc 37 <210> 311 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of AsCas12f1(DYtarget2, U4AU6) <400> 311 aaaaaataaa aggtagccca ctgtgtgtgt ggttcacact cc 42 <210> 312 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of AsCas12f1(VEGFA-3, WT) <400> 312 cgcgctccgg cggtcacccc gttcacactc c 31 <210> 313 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of AsCas12f1(VEGFA-3, U6) <400> 313 aaaaaacgcg ctccggcggt caccccgttc acactcc 37 <210> 314 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for crRNA of AsCas12f1(VEGFA-3, U4AU6) <400> 314 aaaaaataaa acgcgctccg gcggtcaccc cgttcacact cc 42 <210> 315 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> HA tag sequence <400> 315 tacccatacg atgttccaga ttacgcttat ccctacgacg tgcctgatta tgcataccca 60 tatgatgtcc ccgactatgc c 81 <210> 316 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Cas14a1 and cytidine deaminase fused protein <400> 316 ccaaagaaga agcggaaagt ctcctcagag actgggcctg tcgccgtcga tccaaccctg 60 cgccgccgga ttgaacctca cgagtttgaa gtgttctttg acccccggga gctgagaaag 120 gagacatgcc tgctgtacga gatcaactgg ggaggcaggc actccatctg gaggcacacc 180 tctcagaaca caaataagca cgtggaggtg aacttcatcg agaagtttac cacagagcgg 240 tacttctgcc ccaataccag atgtagcatc acatggtttc tgagctggtc cccttgcgga 300 gagtgtagca gggccatcac cgagttcctg tccagatatc cacacgtgac actgtttatc 360 tacatcgcca ggctgtatca ccacgcagac ccaaggaata ggcagggcct gcgcgatctg 420 atcagctccg gcgtgaccat ccagatcatg acagagcagg agtccggcta ctgctggcgg 480 aacttcgtga attattctcc tagcaacgag gcccactggc ctaggtaccc acacctgtgg 540 gtgcgcctgt acgtgctgga gctgtattgc atcatcctgg gcctgccccc ttgtctgaat 600 atcctgcgga gaaagcagcc ccagctgacc ttctttacaa tcgccctgca gtcttgtcac 660 tatcagaggc tgccacccca catcctgtgg gccacaggcc tgaagtctgg aggatctagc 720 ggaggatcct ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt 780 ggcggcagca gcggcggcag catggccaag aacacaatta caaagacact gaagctgagg 840 atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900 agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960 ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020 gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080 ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140 aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200 gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260 aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320 gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380 ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440 tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500 ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560 ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620 gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680 agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740 gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800 gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860 tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920 gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980 aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040 aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100 tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160 tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220 acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280 aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340 gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400 ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460 ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520 aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580 atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640 aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700 aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760 ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820 gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880 ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940 atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000 aggaaagtc 3009 <210> 317 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Cas14a1 with CBE fusion protein(N terminal -Cytidine deaminase) <400> 317 Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val 1 5 10 15 Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe 20 25 30 Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile 35 40 45 Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr 50 55 60 Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg 65 70 75 80 Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp 85 90 95 Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg 100 105 110 Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His 115 120 125 Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly 130 135 140 Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg 145 150 155 160 Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr 165 170 175 Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile 180 185 190 Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln 195 200 205 Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu 210 215 220 Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser 225 230 235 240 Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr 245 250 255 Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Lys Asn Thr 260 265 270 Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala 275 280 285 Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile 290 295 300 Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His 305 310 315 320 Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys 325 330 335 Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu 340 345 350 Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile 355 360 365 Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu 370 375 380 Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn 385 390 395 400 Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala 405 410 415 Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys 420 425 430 Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly 435 440 445 Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln 450 455 460 Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp 465 470 475 480 Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile 485 490 495 Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys 500 505 510 Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg 515 520 525 Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys 530 535 540 Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly 545 550 555 560 Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp 565 570 575 Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile 580 585 590 Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe 595 600 605 Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys 610 615 620 Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg 625 630 635 640 Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr 645 650 655 Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys 660 665 670 Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met 675 680 685 Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile 690 695 700 Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu 705 710 715 720 Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn 725 730 735 Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe 740 745 750 Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu 755 760 765 Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile 770 775 780 Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser 785 790 795 800 Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 805 810 815 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu 820 825 830 Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val 835 840 845 His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr 850 855 860 Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser 865 870 875 880 Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser 885 890 895 Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys 900 905 910 Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu 915 920 925 Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala 930 935 940 Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala 945 950 955 960 Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu 965 970 975 Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly 980 985 990 Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val 995 1000 <210> 318 <211> 3009 <212> DNA <213> Artificial Sequence <220> <223> Cas14a1 with CBE fusion protein(C terminal -Cytidine deaminase) encoding DNA <400> 318 ccaaagaaga agcggaaagt catggccaag aacacaatta caaagacact gaagctgagg 60 atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120 agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180 ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240 gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300 ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360 aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420 gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480 aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540 gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600 ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660 tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720 ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780 ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840 gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900 agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960 gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020 gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080 tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140 gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200 aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260 aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320 tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380 tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440 acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500 aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560 gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagccctc tggaggatct 1620 agcggaggat cctctggcag cgagacacca ggaacaagcg agtcagcaac accagagagc 1680 agtggcggca gcagcggcgg cagctcctca gagactgggc ctgtcgccgt cgatccaacc 1740 ctgcgccgcc ggattgaacc tcacgagttt gaagtgttct ttgacccccg ggagctgaga 1800 aaggagacat gcctgctgta cgagatcaac tggggaggca ggcactccat ctggaggcac 1860 acctctcaga acacaaataa gcacgtggag gtgaacttca tcgagaagtt taccacagag 1920 cggtacttct gccccaatac cagatgtagc atcacatggt ttctgagctg gtccccttgc 1980 ggagagtgta gcagggccat caccgagttc ctgtccagat atccacacgt gacactgttt 2040 atctacatcg ccaggctgta tcaccacgca gacccaagga ataggcaggg cctgcgcgat 2100 ctgatcagct ccggcgtgac catccagatc atgacagagc aggagtccgg ctactgctgg 2160 cggaacttcg tgaattattc tcctagcaac gaggcccact ggcctaggta cccacacctg 2220 tgggtgcgcc tgtacgtgct ggagctgtat tgcatcatcc tgggcctgcc cccttgtctg 2280 aatatcctgc ggagaaagca gccccagctg accttcttta caatcgccct gcagtcttgt 2340 cactatcaga ggctgccacc ccacatcctg tgggccacag gcctgaagag cggcgggagc 2400 ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460 ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520 aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580 atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640 aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700 aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760 ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820 gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880 ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940 atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000 aggaaagtc 3009 <210> 319 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> Cas14a1 with CBE fusion protein(C terminal -Cytidine deaminase) <400> 319 Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr 1 5 10 15 Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys 20 25 30 Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys 35 40 45 Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala 50 55 60 Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys 65 70 75 80 Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe 85 90 95 Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu 100 105 110 Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr 115 120 125 Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val 130 135 140 Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe 145 150 155 160 Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn 165 170 175 Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr 180 185 190 Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln 195 200 205 Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys 210 215 220 Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg 225 230 235 240 Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro 245 250 255 Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp 260 265 270 Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly 275 280 285 Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly 290 295 300 Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile 305 310 315 320 Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val 325 330 335 Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser 340 345 350 Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg 355 360 365 Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly 370 375 380 Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu 385 390 395 400 Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp 405 410 415 Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu 420 425 430 Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly 435 440 445 Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys 450 455 460 Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys 465 470 475 480 Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr 485 490 495 Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe 500 505 510 Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys 515 520 525 Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser 530 535 540 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 545 550 555 560 Ser Gly Gly Ser Ser Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala 565 570 575 Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val 580 585 590 Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu 595 600 605 Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn 610 615 620 Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu 625 630 635 640 Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser 645 650 655 Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser 660 665 670 Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His 675 680 685 His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser 690 695 700 Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp 705 710 715 720 Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg 725 730 735 Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile 740 745 750 Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro 755 760 765 Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg 770 775 780 Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser 785 790 795 800 Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu 805 810 815 Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu 820 825 830 Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val 835 840 845 His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr 850 855 860 Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser 865 870 875 880 Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser 885 890 895 Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys 900 905 910 Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu 915 920 925 Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala 930 935 940 Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala 945 950 955 960 Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu 965 970 975 Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly 980 985 990 Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val 995 1000 <210> 320 <211> 2823 <212> DNA <213> Artificial Sequence <220> <223> Cas14a1 with ABE fusion protein(N terminal -Adenine deaminase) encoding DNA <400> 320 atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60 agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120 atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180 atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240 tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300 cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360 ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420 tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480 aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 540 cccgggacct cagagtccgc cacacccgaa agttctggtg gttcttctgg tggttcttcc 600 gaagtcgagt tttcccatga gtactggatg agacacgcat tgactctcgc aaagagggct 660 cgagatgaac gcgaggtgcc cgtgggggca gtactcgtgc tcaacaatcg cgtaatcggc 720 gaaggttgga atagggcaat cggactccac gaccccactg cacatgcgga aatcatggcc 780 cttcgacagg gagggcttgt gatgcagaat tatcgactta tcgatgcgac gctgtacgtc 840 acgtttgaac cttgcgtaat gtgcgcggga gctatgattc actcccgcat tggacgagtt 900 gtattcggtg ttcgcaacgc caagacgggt gccgcaggtt cactgatgga cgtgctgcat 960 tacccaggca tgaaccaccg ggtagaaatc acagaaggca tattggcgga cgaatgtgcg 1020 gcgctgttgt gttacttttt tcgcatgccc aggcaggtct ttaacgccca gaaaaaagca 1080 caatcctcta ctgactctgg tggttcttct ggtggttcta gcggcagcga gactcccggg 1140 acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgccaagaac 1200 acaattacaa agacactgaa gctgaggatc gtgagaccat acaacagcgc tgaggtcgag 1260 aagattgtgg ctgatgaaaa gaacaacagg gaaaagatcg ccctcgagaa gaacaaggat 1320 aaggtgaagg aggcctgctc taagcacctg aaagtggccg cctactgcac cacacaggtg 1380 gagaggaacg cctgtctgtt ttgtaaagct cggaagctgg atgataagtt ttaccagaag 1440 ctgcggggcc agttccccga tgccgtcttt tggcaggaga ttagcgagat cttcagacag 1500 ctgcagaagc aggccgccga gatctacaac cagagcctga tcgagctcta ctacgagatc 1560 ttcatcaagg gcaagggcat tgccaacgcc tcctccgtgg agcactacct gagcgacgtg 1620 tgctacacaa gagccgccga gctctttaag aacgccgcta tcgcttccgg gctgaggagc 1680 aagattaaga gtaacttccg gctcaaggag ctgaagaaca tgaagagcgg cctgcccact 1740 acaaagagcg acaacttccc aattccactg gtgaagcaga aggggggcca gtacacaggg 1800 ttcgagattt ccaaccacaa cagcgacttt attattaaga tcccctttgg caggtggcag 1860 gtcaagaagg agattgacaa gtacaggccc tgggagaagt ttgatttcga gcaggtgcag 1920 aagagcccca agcctatttc cctgctgctg tccacacagc ggcggaagag gaacaagggg 1980 tggtctaagg atgaggggac cgaggccgag attaagaaag tgatgaacgg cgactaccag 2040 acaagctaca tcgaggtcaa gcggggcagt aagattggcg agaagagcgc ctggatgctg 2100 aacctgagca ttgacgtgcc aaagattgat aagggcgtgg atcccagcat catcggaggg 2160 atcgatgtgg gggtcaagag ccccctcgtg tgcgccatca acaacgcctt cagcaggtac 2220 agcatctccg ataacgacct gttccacttt aacaagaaga tgttcgcccg gcggaggatt 2280 ttgctcaaga agaaccggca caagcgggcc ggacacgggg ccaagaacaa gctcaagccc 2340 atcactatcc tgaccgagaa gagcgagagg ttcaggaaga agctcatcga gagatgggcc 2400 tgcgagatcg ccgatttctt tattaagaac aaggtcggaa cagtgcagat ggagaacctc 2460 gagagcatga agaggaagga ggattcctac ttcaacattc ggctgagggg gttctggccc 2520 tacgctgaga tgcagaacaa gattgagttt aagctgaagc agtacgggat tgagatccgg 2580 aaggtggccc ccaacaacac cagcaagacc tgcagcaagt gcgggcacct caacaactac 2640 ttcaacttcg agtaccggaa gaagaacaag ttcccacact tcaagtgcga gaagtgcaac 2700 tttaaggaga acgccgatta caacgccgcc ctgaacatca gcaaccctaa gctgaagagc 2760 actaaggagg agcccaaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820 aag 2823 <210> 321 <211> 941 <212> PRT <213> Artificial Sequence <220> <223> Cas14a1 with ABE fusion protein(N terminal -Adenine deaminase) <400> 321 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn 385 390 395 400 Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser 405 410 415 Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys 420 425 430 Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys 435 440 445 His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala 450 455 460 Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys 465 470 475 480 Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu 485 490 495 Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser 500 505 510 Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala 515 520 525 Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg 530 535 540 Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser 545 550 555 560 Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser 565 570 575 Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys 580 585 590 Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser 595 600 605 Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu 610 615 620 Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln 625 630 635 640 Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys 645 650 655 Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys 660 665 670 Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg 675 680 685 Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile 690 695 700 Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly 705 710 715 720 Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala 725 730 735 Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys 740 745 750 Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys 755 760 765 Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu 770 775 780 Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala 785 790 795 800 Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln 805 810 815 Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn 820 825 830 Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile 835 840 845 Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro 850 855 860 Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr 865 870 875 880 Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys 885 890 895 Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn 900 905 910 Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Lys Arg Pro 915 920 925 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 930 935 940 <210> 322 <211> 2823 <212> DNA <213> Artificial Sequence <220> <223> Cas14a1 with ABE fusion protein(C terminal -Adenine deaminase) encoding DNA <400> 322 atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60 gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120 aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180 accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240 ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300 atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360 tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420 ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480 gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540 ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600 cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660 ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720 gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780 aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840 ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900 gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960 atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020 ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080 cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140 aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200 gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260 atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320 gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380 attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440 ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500 gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560 aagctgaaga gcactaagga ggagccctct ggaggatcta gcggaggatc ctctggcagc 1620 gagacaccag gaacaagcga gtcagcaaca ccagagagca gtggcggcag cagcggcggc 1680 agctccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 1740 agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 1800 atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 1860 atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 1920 tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 1980 cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 2040 ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 2100 tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 2160 aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 2220 cccgggacct cagagtccgc cacacccgaa agttcaggtg gatcttcagg tggatcttcg 2280 gaagtggaat tttcgcacga gtattggatg aggcacgctt taactctcgc taagagagca 2340 cgagacgaac gggaagtgcc ggttggggct gtcctcgtac tcaataatcg agttatcgga 2400 gaaggctgga acagggcaat cggactccac gatcccacag ctcatgccga gataatggcg 2460 cttcgacaag gaggcctagt catgcaaaat tatcgtctta ttgacgcgac cctctacgtg 2520 acctttgagc catgcgttat gtgtgcgggt gcaatgatac attcccggat aggacgtgta 2580 gtatttggag ttcgcaacgc gaagaccggt gcggctggtt ctctcatgga tgtcctgcac 2640 taccctggga tgaatcaccg cgttgaaatc actgaaggca ttttggccga tgaatgcgcg 2700 gccctgttat gttacttttt tcgcatgccc aggcaggtct ttaacgcaca gaagaaagcc 2760 caatcgtcca ctgataaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820 aag 2823 <210> 323 <211> 941 <212> PRT <213> Artificial Sequence <220> <223> Cas14a1 with ABE fusion protein(C terminal -Adenine deaminase) <400> 323 Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg 1 5 10 15 Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn 20 25 30 Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu 35 40 45 Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val 50 55 60 Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys 65 70 75 80 Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln 85 90 95 Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile 100 105 110 Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly 115 120 125 Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val 130 135 140 Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser 145 150 155 160 Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys 165 170 175 Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile 180 185 190 Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser 195 200 205 Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln 210 215 220 Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe 225 230 235 240 Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr 245 250 255 Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu 260 265 270 Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile 275 280 285 Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu 290 295 300 Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser 305 310 315 320 Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala 325 330 335 Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe 340 345 350 His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys 355 360 365 Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro 370 375 380 Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile 385 390 395 400 Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val 405 410 415 Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp 420 425 430 Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met 435 440 445 Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg 450 455 460 Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His 465 470 475 480 Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro 485 490 495 His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn 500 505 510 Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu 515 520 525 Pro Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly 530 535 540 Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly 545 550 555 560 Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 565 570 575 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 580 585 590 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 595 600 605 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 610 615 620 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 625 630 635 640 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 645 650 655 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 660 665 670 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 675 680 685 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 690 695 700 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 705 710 715 720 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 725 730 735 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 740 745 750 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 755 760 765 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 770 775 780 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 785 790 795 800 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 805 810 815 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 820 825 830 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 835 840 845 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 850 855 860 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 865 870 875 880 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 885 890 895 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 900 905 910 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Lys Arg Pro 915 920 925 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 930 935 940 <210> 324 <211> 233 <212> DNA <213> Artificial Sequence <220> <223> sgRNA encoding DNA sequence for DYtarget2(T4GT6) <400> 324 cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60 gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120 ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180 tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttgttt ttt 233 <210> 325 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> reverse primer of sgRNA for DYtarget2(T4GT6) <400> 325 aaaaaacaaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56

Claims (24)

  1. 다음 서열을 가지는, 표적 서열을 포함하는 핵산을 편집할 수 있는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 CRISPR RNA(crRNA):
    CRISPR RNA 반복 서열;
    상기 표적 서열에 상보적인 스페이서 서열; 및
    상기 스페이서 서열의 3'말단에 연결된 U-rich tail 서열,
    이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수며,
    이때, 상기 엔지니어링 된 crRNA의 서열은 그 5'말단에서 3'말단 순서로, 상기 CRISPR RNA 반복 서열, 상기 스페이서 서열, 및 상기 U-rich tail 서열이 순차적으로 연결됨.
  2. 제1 항의 엔지니어링 된 crRNA를 암호화하는 서열을 가지는 DNA.
  3. 제1항에 있어서,
    상기 U-rich tail 서열은 UUUUUU, UUUUAUUUUUU, 또는 UUUUGUUUUUU인 엔지니어링 된 crRNA.
  4. 제1항에 있어서,
    상기 CRISPR RNA 반복 서열은 서열번호 58의 서열인 엔지니어링 된 crRNA.
  5. 다음 서열을 가지는, 표적 서열을 포함하는 핵산을 편집할 수 있는 CRISPR/Cas12f1 시스템을 위한 엔지니어링 된 가이드 RNA:
    tracrRNA 서열;
    CRISPR RNA 반복 서열, 및 상기 표적 서열과 상보적인 스페이서 서열을 포함하는 crRNA서열; 및
    CRISPR RNA 서열의 3' 말단에 연결된 U-rich tail 서열,
    이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
  6. 제5항에 있어서,
    상기 엔지니어링 된 가이드 RNA의 서열은 링커 서열을 추가적으로 더 포함하고,
    이때, 상기 tracrRNA 서열 및 crRNA 서열은 링커 서열을 통해 연결된 엔지니어링 된 가이드 RNA.
  7. 제6항에 있어서,
    상기 링커 서열은 5'-gaaa-3'인 엔지니어링 된 가이드 RNA.
  8. 제6항에 있어서,
    상기 U-rich tail 서열은 UUUUUU, UUUUAUUUUUU, 또는 UUUUGUUUUUU인 엔지니어링 된 가이드 RNA.
  9. 제5항 또는 제6항의 엔지니어링 된 가이드 RNA를 암호화하는 서열을 가지는 DNA.
  10. 다음을 포함하는, 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체:
    Cas14 패밀리에 속하는 Cas12f1 단백질; 및
    상기 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 U-rich tail 서열을 가지는 엔지니어링 된 가이드 RNA,
    이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
  11. 다음 서열을 가지는, 세포 내에서 표적 서열을 포함하는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 복합체를 발현하는 벡터:
    Cas12f1 단백질을 암호화하는 서열을 포함하는 제1 서열;
    상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
    엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 제2 서열,
    이때, 상기 엔지니어링 된 가이드 RNA는 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 상기 스페이서 서열의 3' 말단에 연결된 U-rich tail 서열을 가지며,
    이때, 상기 U-rich tail 서열은 (UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수인 것; 및
    상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열,
    이때, 상기 벡터는 세포 내에서 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 발현하도록 구성되며,
    이로 인해 세포 내에서 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA가 CRISPR/Cas12f1 복합체를 형성할 수 있고,
    이로 인해 상기 표적 서열을 포함하는 핵산이 상기 CRISPR/Cas12f1 복합체에 의해 편집될 수 있음.
  12. 제11항에 있어서, 상기 제2 프로모터 서열은 U6 프로모터 서열인 벡터.
  13. 제11항에 있어서, 상기 벡터는 바이러스 벡터인 것을 특징으로 하는 벡터.
  14. 제11항에 있어서, 상기 벡터는 플라스미드 벡터인 것을 특징으로 하는 벡터.
  15. 제13항에 있어서,
    상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 것을 특징으로 하는 벡터
  16. 제11항에 있어서,
    상기 벡터는 선형의 PCR 앰플리콘인 것을 특징으로 하는 벡터
  17. 다음 서열을 가지는, 세포 내에서 제1 표적 서열 및 제2 표적 서열을 가지는 핵산을 편집할 수 있는 엔지니어링 된 CRISPR/Cas12f1 시스템을 발현하는 벡터:
    Cas12f1 단백질을 암호화하는 서열을 포함하는 제1 서열;
    상기 제1 서열과 작동 가능하게 연결된 제1 프로모터 서열;
    제1 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 제2 서열,
    이때, 상기 제1 엔지니어링 된 가이드 RNA는 상기 Cas12f1 단백질과 상호작용할 수 있는 제1 스캐폴드 서열, 상기 제1 표적 서열과 상보적인 제1 스페이서 서열, 및 제1 U-rich tail 서열을 가지며,
    이때, 상기 제1 U-rich tail 서열은 (UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임;
    상기 제2 서열과 작동 가능하게 연결된 제2 프로모터 서열;
    제2 엔지니어링 된 가이드 RNA를 암호화하는 서열을 포함하는 제3 서열,
    이때, 상기 제2 엔지니어링 된 가이드 RNA는 상기 Cas12f1 단백질과 상호작용할 수 있는 제2 스캐폴드 서열, 상기 제2 표적 서열과 상보적인 제2 스페이서 서열, 및 제2 U-rich tail 서열을 가지며,
    이때, 상기 제2 U-rich tail 서열은 (UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임; 및
    상기 제3 서열과 작동 가능하게 연결된 제3 프로모터 서열.
  18. 제17항에 있어서,
    상기 제2 프로모터 서열 및 상기 제3 프로모터 서열은 동일한 프로모터 서열인 것을 특징으로 하는 벡터.
  19. 제17항에 있어서,
    상기 제2 프로모터 서열은 H1 프로모터이고, 상기 제3 프로모터 서열은 U6 프로모터인 것을 특징으로 하는 벡터.
  20. 다음을 포함하는, 세포 내에서 표적 서열을 포함하는 핵산을 편집하는 방법:
    Cas12f1 단백질 또는 이를 암호화하는 핵산, 및 엔지니어링 된 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것,
    이로 인해 상기 세포 내에서 CRISPR/Cas12f1 복합체가 형성될 수 있으며,
    이로 인해 상기 표적 서열을 포함하는 핵산이 CRISPR/Cas12f1 복합체에 의해 편집될 수 있고,
    이때, 상기 엔지니어링 된 가이드 RNA는 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 상기 스페이서 서열의 3'말단에 연결된 U-rich tail 서열을 가지며,
    이때, 상기 U-rich tail 서열은(UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
  21. 제20항에 있어서, 상기 전달은 상기 Cas12f1 단백질 및 상기 엔지니어링 된 가이드 RNA를 CRISPR/Cas12f1 복합체로써 세포 내에 주입하는 것인 방법.
  22. 제20항에 있어서, 상기 전달은 상기 Cas12f1 단백질을 암호화하는 핵산 및 상기 엔지니어링 된 가이드 RNA를 암호화하는 핵산을 포함하는 벡터를 세포 내에 주입하는 것인 방법.
  23. 제22항에 있어서, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상인 방법.
  24. 다음을 포함하는, 세포 내에서 표적 서열을 포함하는 핵산을 편집하는 방법:
    CRISPR/Cas12f1 복합체 상기 표적 서열을 포함하는 핵산에 접촉시키는 것,
    이때, 상기 CRISPR/Cas12f1 복합체는 Cas12f1 단백질, 및 엔지니어링 된 가이드 RNA를 포함하고,
    이때, 상기 엔지니어링 된 가이드 RNA는 상기 Cas12f1 단백질과 상호작용할 수 있는 스캐폴드 서열, 상기 표적 서열과 상보적인 스페이서 서열, 및 U-rich tail 서열을 포함하고,
    이때, 상기 U-rich tail 서열은(UaN)nUb로 표현되고,
    상기 N은 아데노신(A), 유라실(U), 사이티딘(C), 구아노신(G) 중 하나이고,
    상기 a는 1 이상 4 이하의 한 정수이고, 상기 n은 0, 1, 2 중의 한 정수이며, 상기 b는 1 이상 10 이하의 한 정수임.
KR1020200142308A 2019-10-29 2020-10-29 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 KR102455623B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220129329A KR20220141777A (ko) 2019-10-29 2022-10-11 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20190135935 2019-10-29
KR1020190135935 2019-10-29

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020220129329A Division KR20220141777A (ko) 2019-10-29 2022-10-11 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도

Publications (2)

Publication Number Publication Date
KR20210053228A true KR20210053228A (ko) 2021-05-11
KR102455623B1 KR102455623B1 (ko) 2022-10-18

Family

ID=75715490

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020200142308A KR102455623B1 (ko) 2019-10-29 2020-10-29 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
KR1020220129329A KR20220141777A (ko) 2019-10-29 2022-10-11 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220129329A KR20220141777A (ko) 2019-10-29 2022-10-11 CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도

Country Status (6)

Country Link
US (1) US20220307018A1 (ko)
EP (1) EP4053285A2 (ko)
JP (1) JP2023500188A (ko)
KR (2) KR102455623B1 (ko)
CN (1) CN114846146B (ko)
WO (1) WO2021086083A2 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022240262A1 (ko) * 2021-05-14 2022-11-17 주식회사 진코어 Rna-guided nuclease를 이용한 lca10 치료용 조성물 및 치료방법
WO2023282597A1 (ko) * 2021-07-05 2023-01-12 주식회사 진코어 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
WO2023059115A1 (ko) * 2021-10-06 2023-04-13 주식회사 진코어 유전자 편집을 위한 target 시스템 및 이의 용도
WO2023172116A1 (ko) * 2022-03-10 2023-09-14 주식회사 진코어 듀센 근이영양증 치료를 위한 유전자 편집 시스템 및 이를 이용한 질병 치료 방법
WO2023191570A1 (ko) * 2022-03-30 2023-10-05 주식회사 진코어 어셔 증후군 치료를 위한 유전자 편집 시스템
WO2023229222A1 (ko) * 2022-05-27 2023-11-30 주식회사 진코어 확장된 표적 범위를 갖는 엔지니어링된 cas12f 단백질 및 이의 용도
WO2023153845A3 (ko) * 2022-02-09 2024-04-11 주식회사 진코어 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114846146B (zh) * 2019-10-29 2024-04-12 基恩科雷有限责任公司 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途
CA3223009A1 (en) * 2021-06-17 2022-12-22 Kaiyi JIANG Systems, methods, and compositions comprising miniature crispr nucleases for gene editing and programmable gene activation and inhibition
US20230265421A1 (en) * 2022-02-21 2023-08-24 Zhuhai Shu Tong Medical Technology Co., Ltd. Type ii crispr/cas9 genome editing system and the application thereof
WO2023168242A1 (en) * 2022-03-01 2023-09-07 Epicrispr Biotechnologies, Inc. Engineered nucleases, compositions, and methods of use thereof
CN116622810A (zh) * 2023-01-10 2023-08-22 南华大学 一种新型的工程化CRISPR-Cas14a1检测系统、方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190038479A (ko) * 2016-05-06 2019-04-08 주노 쎄러퓨티크스 인코퍼레이티드 유전자 조작된 세포 및 그의 제조방법
KR20190058358A (ko) * 2017-11-21 2019-05-29 한국생명공학연구원 CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도
KR20190100967A (ko) * 2017-01-05 2019-08-29 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템 트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106460003A (zh) * 2014-04-08 2017-02-22 北卡罗来纳州立大学 用于使用crispr相关基因rna引导阻遏转录的方法和组合物
WO2019046540A1 (en) * 2017-08-31 2019-03-07 New York Genome Center, Inc. METHODS AND COMPOSITIONS COMPRISING CRISPR-CPF1 AND APPROVED GUIDING CRISPR RNAES FOR PROGRAMMABLE GENOMIC DELETIONS
MX2020004578A (es) 2017-11-01 2020-12-03 Univ California Composiciones de casz y metodos de uso.
US20220073890A1 (en) 2018-12-14 2022-03-10 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
CN114846146B (zh) * 2019-10-29 2024-04-12 基恩科雷有限责任公司 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190038479A (ko) * 2016-05-06 2019-04-08 주노 쎄러퓨티크스 인코퍼레이티드 유전자 조작된 세포 및 그의 제조방법
KR20190100967A (ko) * 2017-01-05 2019-08-29 더 보드 오브 리젠츠 오브 더 유니버시티 오브 텍사스 시스템 트리플 가이드 서열을 지닌 crispr/cas9를 사용한 엑손 스키핑 변형을 위한 최적화된 전략
KR20190058358A (ko) * 2017-11-21 2019-05-29 한국생명공학연구원 CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Genome Biology.,DOI.ORG/10.1186/S13059_019_1620_8(2019.2.) *
Nat Commun.,9(1):3651(2018.9.7.) *
Science.,362(6416):839-842(2018.11.16.)* *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022240262A1 (ko) * 2021-05-14 2022-11-17 주식회사 진코어 Rna-guided nuclease를 이용한 lca10 치료용 조성물 및 치료방법
WO2023282597A1 (ko) * 2021-07-05 2023-01-12 주식회사 진코어 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
WO2023059115A1 (ko) * 2021-10-06 2023-04-13 주식회사 진코어 유전자 편집을 위한 target 시스템 및 이의 용도
WO2023153845A3 (ko) * 2022-02-09 2024-04-11 주식회사 진코어 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법
WO2023172116A1 (ko) * 2022-03-10 2023-09-14 주식회사 진코어 듀센 근이영양증 치료를 위한 유전자 편집 시스템 및 이를 이용한 질병 치료 방법
WO2023172115A1 (ko) * 2022-03-10 2023-09-14 주식회사 진코어 Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법
WO2023191570A1 (ko) * 2022-03-30 2023-10-05 주식회사 진코어 어셔 증후군 치료를 위한 유전자 편집 시스템
WO2023229222A1 (ko) * 2022-05-27 2023-11-30 주식회사 진코어 확장된 표적 범위를 갖는 엔지니어링된 cas12f 단백질 및 이의 용도

Also Published As

Publication number Publication date
US20220307018A1 (en) 2022-09-29
CN114846146B (zh) 2024-04-12
WO2021086083A2 (ko) 2021-05-06
JP2023500188A (ja) 2023-01-05
CN114846146A (zh) 2022-08-02
KR20220141777A (ko) 2022-10-20
WO2021086083A3 (ko) 2021-06-24
EP4053285A2 (en) 2022-09-07
KR102455623B1 (ko) 2022-10-18

Similar Documents

Publication Publication Date Title
KR102455623B1 (ko) CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
JP7379160B2 (ja) CRISPR-Cpf1を使用する誘導性で調整可能な多重ヒト遺伝子制御
CN109790527A (zh) 普氏菌属和弗朗西斯氏菌属的CRISPR1(Cpf1)的变体
US20230060517A1 (en) New method for targeted editing of rna
KR20220144343A (ko) CRISPR/Cas12f1 시스템 효율화를 위한 U-rich tail을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도
CN117337326A (zh) 工程化的Cas12i核酸酶、效应蛋白及其用途
KR20240023081A (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
JP2023544817A (ja) CRISPR/Cas12f1システム効率化のためのエンジニアリングされたガイドRNAおよびその用途
KR20200135225A (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
KR20230051095A (ko) 유전자 편집을 위한 TaRGET 시스템 및 이의 용도
KR102638799B1 (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
KR20230007218A (ko) 초소형 염기교정 시스템 및 이의 용도
KR20230121569A (ko) 상동지정복구를 위한 TaRGET 시스템 및 이를 이용한 유전자 편집 방법
US20230374500A1 (en) Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof
JP5246904B2 (ja) 外来遺伝子導入用ベクター及び外来遺伝子が導入されたベクターの製造方法
US20220145332A1 (en) Cell penetrating transposase
CN115052986A (zh) 包含核酸酶的组合物及其用途
WO2017051000A1 (en) Death receptor based selection marker
WO2020160481A1 (en) Targetable 3&#39;-overhang nuclease fusion proteins
KR20220145438A (ko) CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
CN116568806A (zh) 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途
CN116162609A (zh) Cas13蛋白、CRISPR-Cas系统及其应用
WO2024089629A1 (en) Cas12 protein, crispr-cas system and uses thereof
CA3163369A1 (en) Variant cas9

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant