KR20230074819A - 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도 - Google Patents

절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도 Download PDF

Info

Publication number
KR20230074819A
KR20230074819A KR1020237015257A KR20237015257A KR20230074819A KR 20230074819 A KR20230074819 A KR 20230074819A KR 1020237015257 A KR1020237015257 A KR 1020237015257A KR 20237015257 A KR20237015257 A KR 20237015257A KR 20230074819 A KR20230074819 A KR 20230074819A
Authority
KR
South Korea
Prior art keywords
cas12f1
protein
seq
dcas12f1
engineered
Prior art date
Application number
KR1020237015257A
Other languages
English (en)
Other versions
KR102700253B1 (ko
Inventor
김용삼
김도연
Original Assignee
주식회사 진코어
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020210181875A external-priority patent/KR20230007218A/ko
Application filed by 주식회사 진코어 filed Critical 주식회사 진코어
Priority to KR1020247028537A priority Critical patent/KR20240133781A/ko
Publication of KR20230074819A publication Critical patent/KR20230074819A/ko
Application granted granted Critical
Publication of KR102700253B1 publication Critical patent/KR102700253B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 명서서에서는 핵산 절단 활성이 제거된 dead Cas12f1 및 상기 dead Cas12f1에 기능성 도메인을 융합시킨 융합 단백질을 개시한다. 상기 dead Cas12f1 및 dCas12f1-기반 융합 단백질은 가이드 RNA와 함께 CRISPR 유전자 조절 시스템을 구성할 수 있으며, 표적 유전자에 대한 염기교정, 발현조절 등 다양한 기능을 발휘할 수 있다.

Description

절단비활성 CAS12F1, 절단비활성 CAS12F1 기반 융합 단백질, 이를 포함하는 CRISPR 유전자 조절 시스템, 그 제조방법 및 용도
본 발명은 엔지니어링 된 CRISPR/Cas12f1 시스템에 대한 발명이다. 특히, 절단비활성 Cas12f1 (dead Cas12f1) 단백질 및 상기 dead Cas12f1 단백질에 추가적인 도메인이 융합된 융합 단백질에 대한 기술이다. 구체적으로, 상기 융합 단백질은 표적 유전자에 대한 염기교정 기능을 가지는 CRISPR 염기교정 복합체, 및 표적 유전자에 대한 발현조절 기능을 가지는 CRISPR 발현조절 복합체에 대한 내용을 포함한다.
CRISPR/Cas 시스템은 Cas 단백질의 핵산 절단 활성에 기한 용도 외에도, 그 높은 표적-특이적 결합 능력을 이용하여 염기교정, 유전자 발현조절 등, 전반적인 유전자 조절 분야에 활용하려는 연구가 활발하다. 이때, 염기교정, 유전자 발현 조절 등의 기술 분야에 Cas 단백질을 활용하려면, 그 핵산 절단 활성을 제거한 dead form을 사용해야 한다. 또한, 상기 dead form의 Cas 단백질에 적절한 기능성 도메인을 추가하여, 목적하는 효과를 달성할 수 있는 융합 단백질을 제조해야 한다.
한편, CRISPR 조절 시스템에 주로 이용되는 dead Cas9 단백질은 그 크기가 커서 CRISPR 조절 시스템을 위한 융합 단백질을 만들고 이를 세포에 전달하기 위해 AAV 등의 벡터에 패키징 하는데 어려움이 있다. 이러한 문제를 해결하기 위해, Cas9 단백질을 split 하여 여러 벡터로 세포 내 전달하는 방법 및 상대적으로 크기가 작은 Cas 단백질의 개발 및 이의 적용 등의 노력으로 해결책을 모색하고 있는 상황이다.
본 명세서에서는 dead Cas12f1 단백질을 제공하고자 한다.
본 명세서에서는 dead Cas12f1 단백질 및 염기교정 도메인이 융합된 dCas12f1-염기교정 융합 단백질을 제공하고자 한다.
본 명세서에서는 dead Cas12f1 단백질 및 유전자 발현조절 도메인이 융합된 dCas12f1-발현조절 융합 단백질을 제공하고자 한다.
본 명세서에서는 엔지니어링 된 Cas12f1 단백질 (상기 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및/또는 dCas12f1-발현조절 융합 단백질 포함)과 함께 CRISPR 유전자 조절 시스템을 구성할 수 있는 가이드 RNA를 제공하고자 한다.
본 명세서에서는 상기 엔지니어링 된 Cas12f1 단백질 및 가이드 RNA를 포함하는 CRISPR 유전자 조절 복합체(시스템)를 제공하고자 한다.
본 명세서에서는 상기 CRISPR 유전자 조절 시스템의 각 구성요소를 발현할 수 있는 벡터를 제공하고자 한다.
본 명세서에서는 엔지니어링 된 CRISPR/Cas12f1 조성물을 제공하고자 한다.
본 명세서에서는 상기 CRISPR 유전자 조절 시스템을 활용한 유전자 조절 방법을 제공하고자 한다.
본 명세서에서는 상기 CRISPR 유전자 조절 시스템의 용도를 제공하고자 한다.
본 명세서에서는 다음 아미노산 서열로 표현되는 야생형 Cas12f1 기반의 dead Cas12f1 단백질을 개시한다: MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGX1ANASX2VEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIX3VGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMX4NLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYX5KKNKFPHFKCEKCNFKENAX6YNAALNISNPKLKSTKEEP(서열번호 9) 여기서, X1은 이소류신(isoleucine) 또는 트립토판(tryptophan)이고, X2는 세린(serine) 또는 티로신(tyrosine)이고, X3은 아스파르트산(aspartic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고, X4는 글루탐산(glutamic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine), X5는 아르기닌(arginine), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이며, X6은 아스파르트산(aspartic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고,
여기서 상기 X3, X4, X5, 및 X6 중 적어도 하나는 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)임.
본 명세서에서는 다음을 포함하는 dead Cas12f1 단백질을 개시한다: 20개 내지 30개의 아미노산을 포함하는 더미 부분, 여기서, 상기 더미 부분은 MGEKSSRRRRNGKSGAWTAAITSCVGGK(서열번호 10), MAGGPGAGSAAPVSSTSSLPLAALNMRV(서열번호 11), MAGGPGAGSAAPVSSTSSLPLAALNM(서열번호 12), 및 MEKRINKIRKKLSADNATKPVSRSGP(서열번호 13) 중 선택된 아미노산 서열로 표현됨; 및 상기 dead Cas12f1, 여기서, 상기 더미 부분 및 상기 야생형 Cas12f1 기반의 dead Cas12f1은 상기 dead Cas12f1 단백질의 N말단에서 C말단 방향으로 순차적으로 연결되어 있음.
일 실시예로, 상기 dead Cas12f1 단백질은 서열번호 2 내지 서열번호 8, 서열번호 15 내지 서열번호 24, 서열번호 26 내지 서열번호 29, 서열번호 31 내지 서열번호 34, 서열번호 36 내지 서열번호 39 중 선택된 아미노산 서열로 표현될 수 있다.
본 명세서에서는 다음을 포함하는 dCas12f1-염기교정 융합 단백질을 개시한다: 상기 dead Cas12f1 단백질; 및 탈아미노화효소(deaminase), 여기서, 상기 탈아미노화효소는 서열번호 245, 서열번호 247 내지 서열번호 249, 서열번호 274 내지 서열번호 283 중 선택된 아미노산 서열을 가짐.
일 실시예로, 상기 탈아미노화효소는 서열번호 274 내지 서열번호 279 중 선택된 아미노산 서열을 가질 수 있다.
일 실시예로, 상기 탈아미노화효소는 상기 dead Cas12f1의 N말단 및/또는 C말단에 융합될 수 있다.
일 실시예로, 상기 dCas12f1-염기교정 융합 단백질은 서열번호 284 내지 서열번호 324, 서열번호 418 내지 서열번호 442 중 선택된 아미노산 서열을 가질 수 있다.
일 실시예로, 상기 dCas12f1-염기교정 융합 단백질은 적어도 하나의 uracil glycosylase inhibitor(UGI)를 더 포함하고, 상기 탈아미노화효소는 서열번호 280 내지 서열번호 283 중 선택된 아미노산 서열을 가지고, 상기 적어도 하나의 UGI는 상기 dead Cas12f1에 융합된 것일 수 있다.
일 실시예로, 상기 탈아미노화효소는 상기 dead Cas12f1 단백질의 N말단(C말단)에 융합되어 있고, 상기 적어도 하나의 UGI는 상기 dead Cas12f1 단백질의 C말단(N말단)에 융합된 것일 수 있다.
일 실시예로, 상기 dCas12f1-염기교정 융합 단백질은 서열번호 325 내지 서열번호 328 중 선택된 아미노산 서열로 표현될 수 있다.
일 실시예로, 상기 dead Cas12f1 및 탈아미노화효소는 링커를 통해 연결되어 있고, 상기 링커는 서열번호 260 내지 서열번호 273 중 선택된 아미노산 서열로 표현되는것일 수 있다.
일 실시예로, 상기 dCas12f1-염기교정 융합 단백질은 적어도 하나의 nuclear localization signal(NLS)를 추가적으로 포함하고, 상기 NLS이 N말단, C말단, 또는 양 말단에 위치할 수 있다.
본 명세서에서는 다음을 포함하는 dCas12f1-발현조절 융합 단백질을 개시한다: 상기 dead Cas12f1 단백질; 및 적어도 하나의 발현조절 도메인으로, 각각 VP64, KRAB, MeCP2, DNMT, HDAC, Tet1, 및 p300 중 선택된 것.
일 실시예로, 상기 발현조절 도메인은 각각 독립적으로 서열번호 329 내지 서열번호 333 중 선택된 아미노산 서열로 표현될 수 있다.
일 실시예로, 상기 발현조절 도메인은 상기 dead Cas12f1 단백질의 N말단 및/또는 C말단에 위치할 수 있다.
일 실시예로, 상기 dCas12f1-발현조절 융합 단백질은 서열번호 511 내지 서열번호 521중 선택된 아미노산 서열로 표현되는 것일 수 있다.
본 명세서에서는 다음을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물을 제공한다: 상기 dead Cas12f1 단백질, 상기 dCas12f1-염기교정 융합 단백질, 및 상기 dCas12f1-발현조절 융합 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질, 또는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산; 및 적어도 하나의 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산, 여기서, 각각의 가이드 RNA는 스캐폴드, 스페이서, 및 U-rich tail을 포함하고, 상기 스캐폴드, 상기 스페이서, 및 상기 U-rich tail은 5'말단에서 3'말단 방향으로 순차적으로 연결되어 있고, 상기 스캐폴드는 서열번호 197 내지 서열번호 199 중 선택된 핵산 서열로 표현되고, 상기 U-rich tail은 (UaN)bUc의 핵산 서열로 표현되고, 여기서 N은 A, U, C, 및 G 중 각각 독립적으로 선택되고, a는 1 이상 5 이하의 정수, b는 0 이상의 정수이고, 상기 스페이서는 10 이상 50 이하의 뉴클레오사이드를 포함하고, 미리 결정된 표적 서열과 상보적인 핵산 서열을 가짐.
일 실시예로, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 엔지니어링 된 Cas12f1 단백질 및 상기 가이드 RNA를 리보뉴클레오프로틴(ribonucleoprotein; RNP) 형태로 포함할 수 있다.
일 실시예로, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 벡터 형태로 포함 할수 있다.
일 실시예로, 상기 벡터는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산, 제1 가이드 RNA를 암호화하는 핵산, 및 제2 가이드 RNA를 암호화하는 핵산을 포함하고, 상기 제1 가이드 RNA의 스페이서의 핵산 서열 및 상기 제2 가이드 RNA의 스페이서의 핵산 서열은 서로 다를 수 있다.
본 명세서에서는 다음을 포함하는, 세포 내 표적 유전자의 염기교정 방법을 개시한다: 상기 dCas12f1-염기교정 단백질을 포함하는 상기 CRISPR/Cas12f1 조성물을 살아있는 세포 내로 도입하는 것, 여기서, 상기 세포의 상기 표적 유전자는 표적가닥 및 비-표적가닥을 포함하는 이중가닥 DNA이고, 상기 표적가닥은 표적 서열을 가지고, 상기 비-표적가닥은 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 및 프로토스페이서를 가지고, 상기 프로토스페이서는 상기 표적 서열과 상보적인 서열을 가지는, 10nt 내지 50nt의 핵산서열이고, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 가이드 RNA의 스페이서는 상기 표적가닥의 표적 서열과 혼성화(hybridized)될 수 있는 것이고, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 상기 세포 내로 도입함으로써, CRISPR-염기교정 복합체가 세포 내에서 형성되고, 상기 CRISPR-염기교정 복합체에 의해 상기 프로토스페이서의 적어도 하나의 아데닌이 구아닌으로 치환됨.
일 실시예로, 상기 표적 유전자의 상기 프로토스페이서는 5'말단에서 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 15번째, 16번째, 17번째, 18번째, 19번째, 및 20번째 위치에 적어도 하나의 아데닌을 포함하고, 상기 염기교정 방법의 수행 결과, 상기 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 15번째, 16번째, 17번째, 18번째, 19번째, 및 20번째 위치의 아데닌 중 적어도 하나가 구아닌으로 치환될 수 있다.
본 명세서에서는 다음을 포함하는, 세포 내 표적 유전자의 염기교정 방법을 제공한다: 상기 dCas12f1-염기교정 단백질을 포함하는, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 상기 세포 내로 도입하는 것, 여기서, 상기 세포의 상기 표적 유전자는 표적가닥 및 비-표적가닥을 포함하는 이중가닥 DNA이고, 상기 표적가닥은 표적 서열을 가지고, 상기 비-표적가닥은 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 및 프로토스페이서를 가지고, 상기 프로토스페이서는 상기 표적 서열과 상보적인 서열을 가지는, 10nt 내지 50nt의 핵산서열이고, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 가이드 RNA의 스페이서는 상기 표적가닥의 표적 서열과 혼성화(hybridized)될 수 있는 것이고, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 상기 세포 내로 도입함으로써, CRISPR-염기교정 복합체가 세포 내에서 형성되고, 상기 CRISPR-염기교정 복합체에 의해 상기 프로토스페이서의 적어도 하나의 시토신이 티민으로 치환됨.
일 실시예로, 상기 표적 유전자의 상기 프로토스페이서는 5'말단에서 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 및 9번째 위치에 적어도 하나의 시토신을 포함하고, 상기 염기교정 방법의 수행 결과, 상기 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 및 9번째 위치의 시토신 중 적어도 하나가 티민으로 치환되는, 염기교정 방법.
일 실시예로, 상기 세포는 진핵세포일 수 있다.
본 명세서에서는 다음을 포함하는, 세포 내 표적 유전자 발현조절 방법을 제공한다: 상기 dCas12f1-발현조절 융합 단백질을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물을 세포 내에 도입하는 것, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 도입에 의해, 세포 내 CRISPR 유전자조절 복합체가 형성되고, 상기 CRISPR 유전자조절 복합체에 의해 상기 표적 유전자의 발현이 조절됨.
일 실시예로, 상기 세포는 진핵세포일 수 있다.
본 명세서에서 개시하는 CRISPR 유전자 조절 복합체 및 그 구성요소에 의해, 세포 내 표적 유전자에 대한 염기교정, 표적 유전자의 발현조절(촉진 또는 저해) 등 다양한 유전자 기능 조절 효과를 보일 수 있다. 또한, 상기 CRISPR 유전자 조절 시스템은 한 단위의 아데노-연관 바이러스 (AAV) 벡터에 탑재할 수 있어 높은 효율 및 활용성을 기대할 수 있다.
도 1은 본 발명에 따른 염기교정을 위한 초소형 염기교정(Base editing) 구조물의 다양한 예시에 대한 모식도이다.
도 2는 본 발명에서 제공하는 염기교정을 위한 초소형 염기교정 구조물에 포함되는 아데노신 탈아미노화효소의 이종이량체 구조 및 이의 아미노산 서열을 나타낸 것이다. (a)는 아데노신 탈아미노화효소 TadA-eTadA1의 구조를 나타낸다. Linker-TadA-Linker-eTadA1-NLS 순으로 연결되어 있고, 상기 TadA, eTadA1, 링커 및 NLS의 아미노산 서열을 나타내었다. (b)는 아데노신 탈아미노화효소 eTadA1-Tad의 구조를 나타낸다. Linker-eTadA1-Linker-TadA-NLS 순으로 연결되어 있고, 상기 TadA, eTadA1, 링커 및 NLS의 아미노산 서열을 나타내었다. 도면에 도시된 각 서열은 예시적인 서열로서, 이에 제한되지 않는다.
도 3은 본 발명에서 제공하는 염기교정을 위한 초소형 염기교정 구조물에 포함되는 시티딘 탈아미노화효소 모듈 및 이의 아미노산 서열을 나타낸 것이다. 상단의 구조는 시티딘 탈아미노화효소 APOBEC1 모듈 구조를 나타낸다. NLS-APOBEC1-Linker 순으로 연결되어 있고, 상기 APOBEC1, 링커 및 NLS의 아미노산 서열을 나타내었다. APOBEC1의 첫 번째 메티오닌(M)은 생략되었다. 중간의 구는 시티딘 탈아미노화효소 APOBEC3A 모듈 구조를 나타낸다. APOBEC3A-Linker-NLS 순으로 연결되어 있고, 상기 APOBEC3A, 링커 및 NLS의 아미노산 서열을 나타내었다. 하단의 구조는 시티딘 탈아미노화효소 APOBEC3B 모듈 구조를 나타낸다. APOBEC3B-Linker-NLS 순으로 연결되어 있고, 상기 APOBEC3B, 링커 및 NLS의 아미노산 서열을 나타내었다. 도면에 도시된 각 서열은 예시적인 서열로서, 이에 제한되지 않는다.
도 4는 본 발명에 제공하는 예시적인 아데노-연관 바이러스(AAV)벡터의 구조를 도시하였다.
도 5는 본 발명에서 제공하는 Cas12f1 variant 1(TnpB)의 dead-form의 핵산 절단 활성을 확인한 결과이다. 여기서, TnpB (D354A)는 서열번호 15의 dead Cas12f1, TnpB (D354A)는 서열번호 16의 dead Cas12f1, TnpB (D354A)는 서열번호 17의 dead Cas12f1, TnpB (D354A)는 서열번호 19의 dead Cas12f1, TnpB (D354A)는 서열번호 22의 dead Cas12f1, TnpB (D354A)는 서열번호 23의 dead Cas12f1, 및 TnpB (D354A)는 서열번호 24의 dead Cas12f1의 dead Cas12f1을 나타낸다. wt TnpB는 대조군으로, 서열번호 14의 Cas12f1 변이체 단백질을 나타낸다.
도 6은 dCas12f1-염기교정 단백질에 포함된 dead Cas12f1의 종류에 따른 CRISPR 염기교정 복합체의 염기교정 효율을 나타낸 것이다. 여기서, 표적 프로토스페이서 서열은 Target-3이고, 가이드 RNA는 v4.1을 사용하였다. 여기서, D326A는 서열번호 287, E422A는 서열번호 292, R490A는 서열번호 293, D510A는 서열번호 294의 dCas12f1-염기교정 융합 단백질을 각각 나타낸다.
도 7은 dCas12f1-염기교정 단백질에 포함된 dead Cas12f1의 종류에 따른 CRISPR 염기교정 복합체의 염기교정 효율을 나타낸 것이다. 여기서, 표적 프로토스페이서 서열은 Target-3이고, 가이드 RNA는 v4.1을 사용하였다. 여기서, D354A는 , E450A는 서열번호 295, R518A는 서열번호 296, D538A는 서열번호 297의 dCas12f1-염기교정 융합 단백질을 각각 나타낸다.
도 8은 실험예 3.4에 따라, 발현벡터에 포함된 프로모터 종류에 따른 염기교정 효율을 나타낸 실험 결과이다. (a) 및 (b)는 각각 Target-1 및 Target-3에 대한 프로모터 종류에 따른 염기 교정율의 결과를 나타내었다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 11에 나타낸 바와 같다.
도 9는 실험예 3.5에 따라, 링커의 길이에 따른 염기교정 효율을 나타낸 실험 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 12에 나타낸 바와 같다.
도 10은 실험예 3.5에 따라, 링커의 길이에 따른 염기교정 효율을 나타낸 실험 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 13에 나타낸 바와 같다.
도 11은 실험예 3.5에 따라, 링커의 길이에 따른 염기교정 효율을 나타낸 실험 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 14에 나타낸 바와 같다.
도 12는 실험예 3.6에 따라, 다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 15에 나타낸 바와 같다.
도 13은 실험예 3.6에 따라, 다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 15에 나타낸 바와 같다.
도 14은 실험예 3.6에 따라, 다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, I159W는 표 15의 "D538A, I159W"에 대응되고, S164Y는 표 15의 "D538A, S164Y"에 대응되고, I159W/S164y는 표 15의 "D538A, I159W, S164Y"에 대응된다. WT는 대조군으로, 서열번호 14의 Cas12f1 variant 1을 포함하는 CRISPR/Cas12f1 시스템을 나타낸다.
도 15, 도 16, 도 17, 및 도 18은 실험예 3.7에 따라, 다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 각 레이블에 따른 CRISPR 염기교정 복합체의 구성은 표 16 및 표 17에 나타낸 바와 같다.
도 19, 도 20, 도 21, 도 22, 도 23, 및 도 24는 실험예 3.8에 따라, 다양한 유전자를 타겟하여dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, CRISPR 염기교정 시스템에 사용된 dCas12f1-염기교정 융합 단백질은 서열번호 299이고, 표적 별 각각의 가이드 RNA는 각 도면의 gRNA 열에 나타낸 바와 같다.
도 25, 도 26 및 도 27은 실험예 3.9에 따라, 다양한 염기교정 도메인을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 각 레이블은 표 18에 나타낸 바와 같고, 도 25는 v3.0, 도 26은 v4.0, 도 27은 v4.1의 가이드 RNA를 사용한 결과를 각각 나타낸다.
도 28, 도 29 및 도 30은 실험예 3.9에 따라, 다양한 염기교정 도메인을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 각 레이블은 표 19에 나타낸 바와 같고, 도 28은 v3.0, 도 29는 v4.0, 도 30은 v4.1의 가이드 RNA를 사용한 결과를 각각 나타낸다.
도 31은 실험예 3.11에 따라, 다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질의 염기교정 효율 및 기존의 Cas9 기반의 염기교정 시스템의 염기교정 효율을 비교한 결과이다. 여기서, 각 레이블에 따른 CRISPR 염기교정 복합체의 구성은 표 22에 나타냈다.
도 32는 실험예 3.12에 따라, 기존의 miniABEmax 및 본 명세서의 CRISPR 염기교정 시스템의 염기교정 효율을 비교한 것이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 실험예 3.12에 나타낸 것과 같다.
도 33은 실험예 3.13에 따라, 시티딘 탈아미노화효소를 염기교정 도메인으로 포함하는 CRISPR 염기교정 복합체가 시토신 염기교정 활성을 보이는 지 확인한 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 23에 나타냈다.
도 34는 실험예 3.14에 따라, 본 명세서의 CRISPR 염기교정 복합체가 원치 않는 인델을 발생시키는 지 여부롤 확인한 결과이다. 여기서, 각 레이블 별 CRISPR 염기교정 복합체의 구성은 표 24에 나타냈다.
도 35는 실험예 3.15에 따라, CRISPR 염기교정 시스템의 각 구성요소를 탑재한 AAV 벡터의 세포 내 염기교정율을 확인한 결과이다. 좌측의 모식도는 형질전환된 세포주를 모식적으로 나타낸 것이다. 우측의 모식도는 서열번호 287의 dCas12f1-염기교정 융합 단백질을 포함하는 CRISPR 염기교정 시스템을 탑재한 AAV 벡터 및 이것으로 형질감염되어 교정된 세포를 모식적으로 나타낸 것이다. 하단의 표는 상기 AAV 벡터에 의해 세포 내 표적 유전자의 표적 프로토스페이서 부위의 아데닌 염기교정율을 나타냈다.
도 36은 실험예 3.15에 따라, CRISPR 염기교정 시스템의 각 구성요소를 탑재한 AAV 벡터의 세포 내 염기교정율을 확인한 결과이다. 좌측의 모식도는 형질전환된 세포주를 모식적으로 나타낸 것이다. 우측의 모식도는 서열번호 291의 dCas12f1-염기교정 융합 단백질을 포함하는 CRISPR 염기교정 시스템을 탑재한 AAV 벡터 및 이것으로 형질감염되어 교정된 세포를 모식적으로 나타낸 것이다. 하단의 표는 상기 AAV 벡터에 의해 세포 내 표적 유전자의 표적 프로토스페이서 부위의 아데닌 염기교정율을 나타냈다.
도 37은 실험예 3.15에 따라, 본 명세서의 CRISPR 염기교정 시스템을 탑재한 AAV 벡터 및 SpCas9-ABE split AAV의 염기교정 효과를 비교한 결과이다. 상단의 그래프는 시간에 따른 염기교정율을 나타낸 것이다. 하단의 그래프는 교정되어 나타나는 mRuby 유전자의발현율을 나타낸 것이다.
도 38은 본 명세서의 CRISPR 염기교정 시스템을 탑재한 AAV 벡터의 전달을 통한 다중 유전자 교정을 확인한 결과이다. (a)는 한 종류의 gRNA가 포함된 AAV 벡터 AAV-S1 및 AAV-S2와 서로다른 gRNA 두 종류가 포함된 AAV 벡터 AAV-S1/2의 모식도를 나타내었다. (b)는 세포 내 표적 프로토스페이서 부위에서 상기 AAV 벡터들에 의한 염기 교정율(%)을 나타낸 결과이다.
도 39, 도 40, 도 41, 도 42, 도 43, 도 44, 도 45, 도 46, 도 47, 도 48, 및 도 49는 실험예 4.1에 따라, 본 명세서의 CRISPR 발현조절 시스템 중, 발현저해 기능을 가지는 CRISPR interference 시스템의 BRCA1 유전자에 대한 발현 저해 효과를 확인한 결과이다. 여기서, 상기 CRISPR interference 시스템에 포함된 각 dCas12f1-발현조절 융합 단백질은 각 도면 상단에 모식적으로 나타내었다. 여기서, KRAB, MeCP2, hHDAC3, 및 DNMT3A는 본 명세서에서 설명된 바와 같고, TnpB는 서열번호 17의 dead Cas12f1 단백질과 같다. 실험 결과, BRCA1 유전자의 mRNA의 상대적인 발현량 차이를 하단의 그래프에 나타내었다.
도 50은 실험예 4.2에 따라, 본 명세서의 CRISPR 발현조절 시스템 중, 발현촉진 기능을 가지는 CRISPR activation 시스템의 OCT4 유전자에 대한 발현 촉진 효과를 확인한 결과이다. 여기서, 1, 2, 3, 및 4는 각각 표 28의 activation-1, activation-2, activation-3, 및 activation-4를 표적한 바와 같다.
도 51, 도 52, 도 53 및 도 54는 실험예 3.2에 따라, 본 명세서의 다양한 구조의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 상기 표적 프로토스페이서 서열은 표1 및 표 2에 나타난 바와 같다. 상기 dCas12f1-염기교정 융합 단백질은 표 9에 나타난 바와 같으며, 구체적으로, ABE_N1은 dCas12f1-ABE-N1, ABE_N2는 dCas12f1-ABE-N2, ABE_C1은 dCas12f1-ABE-C1, 및 ABE_C1는 dCas12f1-ABE-C2를 각각 나타낸다.
도 55, 도 56, 및 도 57은 실험예 3.2에 따라, 본 명세서의 다양한 구조의 dCas12f1-염기교정 단백질을 포함하는 CRISPR 염기교정 시스템의 염기교정 효율을 확인한 결과이다. 여기서, 상기 표적 프로토스페이서 서열은 표1 및 표 2에 나타난 바와 같다. 상기 dCas12f1-염기교정 융합 단백질은 표 9에 나타난 바와 같으며, 구체적으로, ABE_N1은 dTnpB-ABE-N1, ABE_N2는 dTnpB-ABE-N2, ABE_C1은 dTnpB-ABE-C1, 및 ABE_C1는 dTnpB-ABE-C2를 각각 나타낸다.
도 58은 변이 위치 내 다양한 아미노산으로 치환하여 제조한 dead Cas12f1 단백질의 핵산 절단 활성 제거 유무를 실험한 그래프이다.
여기서, 각 레이블은 서열번호 1의 Cas12f1 아미노산 서열 기준, 변이 위치 및 변이 대상을 나타낸다, 예를 들어, dCas12f(R490A)-KRAB은 서열번호 1의 Cas12f1 아미노산 서열의 490번째 아르기닌을 알라닌으로 치환한 변이체를 의미한다. 다른 레이블도 동일한 규칙으로 작성되었다.
발명의 실시를 위한 최선의 형태
이하, 첨부된 도면을 참조하여, 발명의 내용을 특정한 구현예와 예시들을 통해 더욱 상세하게 설명한다. 상기 첨부된 도면은 발명의 일부 구현예를 포함하지만, 모든 구현예를 포함하고 있지는 않다는 점에 유의해야 한다. 본 명세서에 의해 개시되는 발명의 내용은 다양하게 구현될 수 있으며, 여기에 설명되는 특정 구현예로 제한되지 않는다. 이러한 구현예들은 본 명세서에 적용되는 법적 요건을 만족시키기 위해 제공되는 것으로 보아야 한다. 본 명세서에 개시된 발명이 속한 기술분야에 있어 통상의 기술자라면, 본 명세서에 개시된 발명의 내용에 대한 많은 변형 및 다른 구현예들을 떠올릴 수 있을 것이다. 따라서, 본 명세서에서 개시된 발명의 내용은 여기에 기재된 특정 구현예로 제한되지 않으며, 이에 대한 변형 및 다른 구현예들도 청구범위 내에 포함되는 것으로 이해되어야 한다.
용어의 정의
본 명세서에서 사용되는 "약"이라는 용어는 참조 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이에 대해 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1% 정도로 변하는 양, 수준, 값, 수, 빈도, 퍼센트, 치수, 크기, 양, 중량 또는 길이를 의미한다.
아미노산 서열 표기
달리 서술하지 않는 한, 본 명세서에서 아미노산 서열을 기재할 때는 아미노산 일문자 표기법, 또는 세문자 표기법을 사용하여, N-터미널에서 C-터미널 방향으로 기재한다. 예를 들어, MAKN로 표기하는 경우, N-터미널에서 C-터미널 방향으로 메티오닌(Methionine), 알라닌(Alanine), 리신(Lysine), 및 아스파라긴(Asparagine)이 차례로 연결된 펩타이드를 의미한다. 또 다른 예를 들어, Thr-Leu-Lys로 표기하는 경우, N-터미널에서 C-터미널 방향으로 트레오닌(Threonine), 류신(Leucine), 및 리신(Lysine)이 차례로 연결된 펩타이드를 의미한다. 상기 일문자 표기법으로 나타낼 수 없는 아미노산의 경우, 다른 문자를 사용하여 표기하며, 추가적으로 보충하여 설명한다.
각각의 아미노산 표기 방법은 다음과 같다: 알라닌(Alanine; Ala, A); 아르기닌(Arginine; Arg, R); 아스파라긴(Asparagine; Asn, N); 아스파르트산(Aspartic acid; Asp, D); 시스테인(Cysteine; Cys, C); 글루탐산(Glutamic acid; Glu, E); 글루타민(Glutamine; Gln, Q); 글리신(Glycine; Gly, G); 히스티딘(Histidine; His, H); 이소류신(Isoleucine; Ile, I); 류신(Leucine; Leu, L); 리신(Lysine; Lys K); 메티오닌(Methionine; Met, M); 페닐알라닌(Phenylalanine; Phe, F); 프롤린(Proline; Pro, P); 세린(Serine; Ser, S); 트레오닌(Threonine; Thr, T); 트립토판(Tryptophan; Trp, W); 티로신(Tyrosine; Tyr, Y); 및 발린(Valine; Val, V).
A,T,C,G, 및 U
본 명세서에서 사용되는 A, T, C, G 및 U 기호는 당업계 통상의 기술자가 이해하는 의미로 해석된다. 문맥 및 기술에 따라 DNA 또는 RNA 상에서 염기, 뉴클레오사이드 또는 뉴클레오타이드로 적절히 해석될 수 있다. 예를 들어, 염기를 의미하는 경우는 각각 아데닌(A), 티민(T), 시토신(C), 구아닌(G) 또는 우라실(U) 자체로 해석될 수 있고, 뉴클레오사이드를 의미하는 경우는 각각 아데노신(A), 티미딘(T), 시티딘(C), 구아노신(G) 또는 유리딘(U)으로 해석될 수 있으며, 서열에서 뉴클레오타이드를 의미하는 경우는 상기 각각의 뉴클레오사이드를 포함하는 뉴클레오타이드를 의미하는 것으로 해석되어야 한다.
작동 가능하게 연결된(operably linked)
본 명세서에서 사용되는 "작동 가능하게 연결된"이라는 용어는 유전자 발현 기술에 있어서, 특정 구성이 다른 구성과 연결되어, 상기 특정 구성이 의도된 방식대로 기능할 수 있도록 연결되어 있는 것을 의미한다. 예를 들어, 프로모터 서열이 암호화 서열과 작동적으로 연결되었다고 할 때, 상기 프로모터가 상기 암호화 서열의 세포 내에서의 전사 및/또는 발현에 영향을 미칠 수 있도록 연결된 것을 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 유전자 또는 표적 핵산
본 명세서에서 사용되는 "표적 유전자" 또는 "표적 핵산"은 기본적으로, 유전자 발현 조절의 대상이 되는 세포 내 유전자, 또는 핵산을 의미한다. 상기 표적 유전자 또는 표적 핵산은 혼용될 수 있으며, 서로 동일한 대상을 지칭할 수 있다. 상기 표적 유전자 또는 표적 핵산은 달리 기재되지 않은 한, 대상 세포가 가진 고유한 유전자 또는 핵산, 혹은 외부 유래의 유전자 또는 핵산 모두를 의미할 수 있으며, 유전자 발현 조절의 대상이 될 수 있다면 특별히 제한되지 않는다. 상기 표적 유전자 또는 표적 핵산은 단일가닥 DNA, 이중가닥 DNA, 및/또는 RNA일 수 있다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
표적 서열
본 명세서에서 사용되는 "표적 서열"은 CRISPR activation 복합체 또는 CRISPR interference 복합체가 표적 유전자 또는 표적 핵산의 발현을 조절하기 위해 인식하는 특정 서열을 의미한다. 상기 표적 서열은 그 목적에 따라 적절히 선택될 수 있다.
일 예로, "표적 서열"은 표적 유전자 또는 표적 핵산 서열 내에 포함된 서열이며, 본 명세서에서 제공하는 가이드 RNA에 포함된 스페이서(가이드 도메인)의 서열과 상보성을 가지는 서열 또는 상기 스페이서와 상보적으로 결합하는 서열을 의미한다. 상기 표적 서열은 상기 가이드 RNA에 의해 인식되는 표적 가닥(target strand) 내에 위치한다. 이때, PAM 서열은 Cas 단백질이 인식하는 서열로, 상기 표적 가닥과 상보적인 가닥인 비표적 가닥(non-target strand) 내에 위치한다. 상기 비표적 가닥은 프로토스페이서 서열을 포함하고, 이때, 상기 프로토스페이서 서열은 상기 PAM 서열의 3' 말단에 위치한다. 상기 프로토스페이서 서열은 상기 표적 서열과 상보적인 결합을 형성하는 서열이다.
또 다른 예로, 상기 표적 서열은 CRISPR/Cas 시스템의 가이드 RNA와 상보적으로 결합하는 특정 가닥만을 지칭할 수 있으며, 상기 특정 가닥 부분을 포함하는 표적 이중 가닥 전체를 지칭할 수도 있으며, 이는 문맥에 따라 적절히 해석된다.
또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
벡터
본 명세서에서 사용되는 "벡터"는 달리 특정되지 않는 한, 유전 물질을 세포 내로 운반할 수 있는 모든 물질을 통틀어 일컫는다. 예를 들어, 벡터는 대상이 되는 유전 물질, 예를 들어 dead Cas12f1 단백질을 포함하는 융합 단백질을 암호화하는 핵산, 및/또는 가이드 RNA를 암호화하는 핵산을 포함하는 DNA 분자일 수 있으나, 이에 제한되는 것은 아니다. 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
자연계에서 발견되는
본 명세서에서 "자연계에서 발견되는" 이라는 용어는, 자연계에서 발견되는, 변형되지 않은 대상을 의미하며, 인위적인 변형이 가해진 "엔지니어링 된 대상"과 구분하기 위해 사용된다. 상기 "자연계에서 발견되는" 유전자, 핵산, DNA, RNA 등은 야생형 및 mature form (active form)의 유전자, 핵산, DNA, RNA를 모두 포괄하는 개념으로 사용된다. 상기 용어는 그 외 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석되어야 한다.
엔지니어링 된
본 명세서에서 사용되는 "엔지니어링 된"이란 용어는 자연계에 이미 존재하는 구성을 가진 물질, 분자 등과 구분하기 위해 사용하는 용어로, 상기 물질, 분자 등에 인위적인 변형이 가해진 것을 의미한다. 예를 들어, "엔지니어링 된 Cas12f1 단백질"의 경우, 자연계에 존재하는 Cas12f1 단백질의 구성에 인위적인 변경이 가해진 것을 통틀어 의미한다. 또한, 상기 용어는 당업계 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절히 해석될 수 있다.
NLS(Nuclear Localization Sequence, or Signal)
본 명세서에서 "NLS"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 외부의 물질을 핵 내부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 구체적으로, 상기 NLS는 아미노산 서열 PKKKRKV(서열번호 200)을 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호 201)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(서열번호 202) 또는 RQRRNELKRSP(서열번호 203)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 204)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부 터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 205); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(서열번호 206) 및 PPKKARED(서열번호 207); 인간 p53의 서열 PQPKKKPL(서열번호 208); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호 209); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호 210) 및 PKQKKRK(서열번호 211); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호 212); 마우스 Mx1 단백질의 서열 REKKKFLKRR(서열번호 213); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호 214); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호 215)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다. 본 명세서에서 사용되는 "NLS"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
NES(Nuclear Export Sequence, or Signal)
본 명세서에서 "NES"라 함은, 핵 수송(nuclear transport) 작용으로 세포 핵 내부의 물질을 핵 외부로 수송할 때, 수송 대상인 단백질에 붙어 일종의 "태그"역할을 하는 일정 길이의 펩타이드, 또는 그 서열을 의미한다. 본 명세서에서 사용되는 "NES"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
태그
본 명세서에서 "태그"라 함은, 펩타이드, 또는 단백질의 추적 및/또는 분리정제를 쉽게 하기 위하여 부가되는 기능적 도메인을 통틀어 일컫는다. 구체적으로, 상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루 티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등의 태그 단백질, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 청록색 형관 단백질(CFP), 청색 형광 단백질(BFP), HcRED, DsRed 등의 자가형광 단백질, 및 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타 -글루쿠로니다제, 루시퍼라제 등의 리포터 유전자를 포함하나, 이에 제한되는 것은 아니다. 본 명세서에서 사용되는 "태그"라는 용어는 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에서 언급된 모든 간행물, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한되는 것으로 의도되지 않는다.
아데노신 탈아미노화효소(adenosine deaminase)
본 명세서에서 사용되는 용어 "아데노신 탈아미노화효소"는 RNA/DNA 및 DNA 이중가닥에서 아데닌(A)을 표적하여, 아데닌 또는 아데닌-함유 분자(예, 아데노신, DNA, RNA)의 아데닌 모이어티 를 하이포잔틴(hypoxanthine) 또는 하이포잔틴-함유 분자(예, 이노신(I))의 하이포잔틴 모이어티로 가수분해하는 탈아미노화 반응에 관여하는 단백질, 또는 그러한 기능을 하는 도메인을 지칭한다. 상기 아데노신 탈아미노화효소(adenosine deaminase)는 고등 동물에는 거의 발견되지 않으나 암소의 근육 내, 우유, 쥐의 혈액에 조금 존재하며 가재의 내장 및 곤충 등에서 많이 존재한다고 알려져 있다.
시티딘 탈아미노화효소(cytidine deaminase)
본 명세서에서 사용되는 용어 "시티딘 탈아미노화효소"는 시토신(C)을 표적화하여, 시토신을 탈아미노화시켜 유라실(Uracil, U)로의 전환을 야기하는 효소 단백질이다. 시토신의 아민기를 제거하여 유라실로 만들면 일련의 세포 내 수선 기작에 의하여 유라실은 티민(T)으로 변환되어, 최종적으로 시토신(C) 염기를 티민(T) 염기로의 염기 교정이 유도될 수 있다. 시티딘 탈아미노화효소(cytidine deaminase)는 일반적으로 RNA에서 작동하지만 일부는 single strand DNA(ssDNA)에서도 작동할 수 있는 것으로 알 려져 있고(Harris et al., 2002), 그 예로 인간 activation-induced cytidine deaminase(AID), 인간 APOBEC3G, 쥐 APOBEC1, APOBEC3A, APOBEC3B, CDA, AID, 그리고 칠성장어 PmCDA1 등이 있으나 이에 제한되는 것은 아니다.
링커
본 명세서에서 사용되는 용어 "링커"는 두 분자, 또는 두 구성요소를 연결하는 연결자를 의미한다. 상기 링커는 핵산, 아미노산, 또는 기타 화합물일 수 있으며, 연결 대상인 두 분자가 무엇인가에 따라서 그 종류가 결정될 수 있다. 달리 기재되지 않은 한, 동종의 구성요소 또는 분자가 링커로 연결되어 있는 경우, 상기 링커도 연결 대상과 동종의 분자로 이해할 수 있다. 예를 들어, 상기 링커가 연결하는 대상이 단백질, 펩타이드, 또는 아미노산인 경우, 상기 링커 역시 단백질, 펩타이드, 또는 아미노산일 수 있다. 또 다른 예를 들어, 상기 링커가 연결하는 대상이 핵산인 경우, 상기 링커 역시 핵산일 수 있다. 구체적으로, 연결 대상이 모두 DNA인 경우 링커도 DNA일 수 있으며, 연결 대상이 모두 RNA인 경우 링커도 RNA일 수 있다.
본 명세서에서 서로 상이한 구성이 연결, 융합, 및/또는 결합되어있다고 기재하는 경우, 상기 두 구성이 서로 직접 연결되어 있는 경우 및 상기 두 구성이 동종의 링커를 통해 연결되어 있는 경우를 모두 포괄하는 것으로 이해되어야 한다.
상기 링커가 RNA, 또는 DNA인 경우, 5'-GAAA-3'의 핵산 서열을 가지는 핵산일 수 있으나, 이에 제한되는 것은 아니다. 상기 링커가 아미노산, 펩타이드, 또는 단백질인 경우 (GGGGS)n, (G)n, (EAAAK)n, (GGS)n, (XP)n, SGGSSGGSSG(서열번호 260), SGGSSGGSSGSETP(서열번호 261), SGGSSGGSSGSETPGT(서열번호 262), SGGSSGGSSGSETPGTSESA(서열번호 263), SGGSSGGSSGSETPGTSESATPES(서열번호 264), SGGSSGGSSGSETPGTSESATPESSGGS(서열번호 265), SGGSSGGSSGSETPGTSESATPESSGGSSGGS(서열번호 266), SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGSE(서열번호 267), SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGSETPGT(서열번호 268), GGGGS(서열번호 269), EAAAK(서열번호 270), SGSETPGTSESATPES(서열번호 271), SGGS(서열번호 272), 및 SGGSKRTADGSEFE(서열번호 273) 중 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다. 여기서, 상기 n은 1 이상의 정수, X는 표준 아미노산 중 선택된 하나이다.
본 명세서에서 사용되는 "링커"라는 용어는 그 외 통상의 기술자가 인식할 수 있는 의미를 모두 포함하며, 문맥에 따라 적절하게 해석될 수 있다.
이하 본 발명을 설명한다.
CRISPR/Cas12f1 시스템
CRISPR/Cas12f 시스템은 type V CRISPR/Cas 시스템 중 V-F 서브타입에 속하고, 이는 다시 V-F1 내지 V-F3의 베리언트로 나뉜다. CRISPR/Cas12f 시스템은 선행연구(Harrington et al., Programmed DNA destruction by miniature CRISPR-Cas14 enzymes, Science 362, 839-842 (2018))에서 Cas14로 명명된 이펙터 단백질 중, Cas14a, Cas14b, 및 Cas14c 변이체를 포함하는 CRISPR/Cas14 시스템을 포함한다. 이 중, Cas14a 이펙터 단백질을 포함하는 CRISPR/Cas14a 시스템은 CRISPR/Cas12f1 시스템으로 분류된다(Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)). 최근 선행 연구(Takeda et al., Structure of the miniature type V-F CRISPR-Cas effector enzyme, Molecular Cell 81, 1-13 (2021), Xiao et al., Structural basis for the dimerization-dependent CRISPR-Cas12f nuclease, bioRxiv (2020)) 등을 통해 상기 CRISPR/Cas12f1 복합체의 구조가 밝혀졌다.
선행 연구(Harrington et al., Science 362, 839-842 (2018), Tautvydas Karvelis et al., Nucleic Acids Research 48, 5016-5023 (2020))에서 밝혀진 바로는, 상기 CRISPR/Cas12f1 시스템은 세포 내에서 이중 가닥 DNA에 대한 절단 활성을 보이지 않거나, 절단 활성을 보이더라도 그 효율이 매우 낮아 이를 적극적으로 유전자 편집에 활용하기 힘들다는 한계를 가지고 있었다. 하지만 이러한 한계를 극복하기 위해, 최근 본 발명자들은 CRISPR/Cas12f1 시스템의 세포 내 유전자 편집 활성을 높이기 위한, 엔지니어링 된 Cas12f1 가이드 RNA를 개발하였다.
종래 기술의 한계점
Cas 뉴클레아제, 또는 Cas 뉴클레아제에 기반한 다양한 융합 단백질을 효과적으로 활용하기 위해서는 상기 Cas 뉴클레아제 및 가이드 RNA를 암호화하여 벡터에 탑재하고, 이를 세포에 전달하는 기술이 필수적이다. 하지만, 기존에 연구된 대부분의 Cas 뉴클레아제는 그 크기 때문에 이를 벡터에 탑재하는 데 어려움을 겪고 있다. 가장 널리 쓰이고, 중요하게 취급되는 벡터인 아데노-연관 바이러스 (AAV)에 탑재할 수 있는 핵산 서열 길이는 한정되어 있는데( ~ 4.7kb), 대부분의 Cas 뉴클레아제를 암호화하는 핵산의 길이가 AAV에 탑재할 수 있는 용량을 넘어서기 때문이다.
한편, Cas 뉴클레아제의 높은 표적 서열 인식 능력을 이용하여, Cas 뉴클레아제에 기능성 도메인을 융합하여 염기교정, 유전자 발현 조절 등의 기능을 가진 융합 단백질을 개발하고자 하는 연구가 활발하다. 하지만, 이 또한 크기가 큰 Cas 뉴클레아제에 추가적인 도메인을 융합시키는 것이기 때문에, 그 개발 및 전달 벡터 개발에 더욱 더 어려움을 겪고 있다.
Dead Cas12f1 단백질 및 dCas12f1 기반 융합 단백질
Dead Cas12f1 단백질 및 dCas12f1 기반 융합 단백질 개괄
본 명세서의 발명자들은 크기가 매우 작아 1) 추가적인 도메인을 융합한 신규 융합 단백질의 개발이 용이하고, 2) 완성된 융합 단백질을 AAV에 탑재하기 용이한 Cas12f1 기반 융합 단백질을 개발하고자 하였다.
발명자들은 우선 다양한 융합 단백질에 응용할 수 있도록, 야생형의 Cas12f1 단백질 및 Cas12f1 변이체의 핵산 절단 활성을 상실시킨 dead Cas12f1 단백질을 발명하였다.
또한, 본 발명자들은 상기 개발된 dead Cas12f1 단백질에 염기교정 도메인을 융합하여 세포 내 표적 유전자의 염기교정 기능을 가지는 dCas12f1-염기교정 융합 단백질을 발명하였다. 구체적으로, 상기 dCas12f1-염기교정 융합 단백질은 그 구체적인 구성에 따라 1) 상기 표적 유전자 내 특정 위치의 아데닌(A)을 구아닌(G)으로 교정할 수 있는 기능, 및/또는 2) 상기 상기 표적 유전자 내 특정 위치의 시토신(C)을 티민(T)으로 교정할 수 있는 기능을 가진다.
또한, 본 발명자들은 상기 개발된 dead Cas12f1 단백질에 유전자 발현조절 도메인을 융합하여 세포 내 표적 유전자에 대한 발현조절 기능을 가지는 dCas12f1-발현조절 융합 단백질을 발명하였다. 구체적으로, 상기 dCas12f1-발현조절 융합 단백질은 그 구체적인 구성에 따라 1) 표적 유전자의 전사를 촉진하는 기능, 및/또는 2) 표적 유전자의 전사를 저해하는 기능을 가진다.
이하, 서술 상 편의를 위해, 상기 다양한 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및 dCas12f1-발현조절 융합 단백질을 통틀어 엔지니어링 된 Cas12f1 단백질로 지칭할 수 있다.
발명자들은, 이전 연구를 통해 Cas12f1 단백질의 표적 서열 인식 및 핵산 절단 활성을 획기적으로 높이고, 이중가닥 핵산 절단을 가능하게 한 엔지니어링 된 가이드 RNA를 발명한 바 있으며, 이러한 가이드 RNA를 상기 dead Cas12f1 및 dCas12f1 기반 융합 단백질과 조합하고, 위 엔지니어링 된 CRISPR/Cas12f1 시스템이 의도된 기능을 수행함을 실험을 통해 확인함으로써 본 발명을 완성하였다.
Dead Cas12f1 단백질
본 명세서에서 개시하는 dead Cas12f1 단백질은 Cas12f1 단백질을 변형시켜 핵산 절단 활성을 상실시킨 것일 수 있다. 여기서, 상기 Cas12f1 단백질은 야생형의 Cas12f1 단백질일 수 있고, Cas12f1 변이체 단백질일 수 있다. 본 명세서의 발명자들은 야생형의 Cas12f1의 핵산 절단 활성에 관여하는 것으로 알려진 위치, 및 연구를 통해 선정한 위치의 아미노산을 변형함으로써, 핵산 절단 활성을 상실시킨 dead Cas12f1 단백질을 발명했다. 한편, 발명자들은 야생형의 Cas12f1 단백질의 아미노산 서열의 N말단 및/또는 C말단에 아미노산이 추가된 돌연변이체 중, 상기 Cas12f1 단백질과 동일하거나 향상된 기능을 가지는 Cas12f1 변이체가 있음을 밝혔으며, 상기한 야생형 Cas12f1 단백질을 dead form으로 변형하는 기술을 응용하여, 상기 Cas12f1 변이체를 기반으로 한 dead Cas12f1 단백질을 발명했다.
일 구현예로, 상기 야생형의 Cas12f1를 기반으로 한 dead Cas12f1 단백질은 서열번호 2 내지 서열번호 8 중 선택된 서열을 가질 수 있다. 일 구현예로, 상기 Cas12f1 변이체를 기반으로 한 dead Cas12f1 단백질은 서열번호 15 내지 서열번호 24, 서열번호 26 내지 서열번호 29, 서열번호 31 내지 서열번호 34, 서열번호 36 내지 서열번호 39 중 선택된 서열을 가질 수 있다.
dCas12f1-염기교정 융합 단백질
본 명세서에서는 상기 dead Cas12f1 단백질에 염기교정 도메인을 융합시킨 dCas12f1-염기교정 융합 단백질을 개시한다. 상기 염기교정 도메인은 유전자 내 특정 염기를 다른 염기로 교정하는 기능을 가지는 도메인으로, 상기 dead Cas12f1의 높은 표적 서열 인식 능력과 결합하면, 특정 부위의 염기를 원하는 염기로 교정할 수 있다.
일 구현예로, 상기 염기교정 도메인은 아데노신 탈아미노화효소, 및/또는 시티딘 탈아미노화효소일 수 있으며, 상기 도메인이 융합한 dCas12f1-염기교정 융합 단백질은 아데닌 및/또는 시토신 베이스 에디터로 기능한다.
dCas12f1-발현조절 융합 단백질
본 명세서에서는 상기 dead Cas12f1 단백질에 염기교정 도메인을 융합시킨 dCas12f1-발현조절 융합 단백질을 개시한다. 상기 발현조절 도메인은 표적 유전자의 발현을 조절하는 기능을 가지는 도메인으로, 상기 dead Cas12f1의 높은 표적 서열 인식 능력과 결합하면, 특정 유전자의 발현을 촉진시키거나, 저해할 수 있다.
일 구현예로, 상기 발현조절 도메인은 VP64일 수 있으며, 상기 VP64가 융합한 dCas12f1-발현조절 융합 단백질은 특정 유전자의 발현을 촉진하는 기능을 한다. 또 다른 구현예로, 상기 발현조절 도메인은 KRAB, MeCP2, DNMT3A, 및 hHDAC3 중 선택된 것 수 있으며, 상기 도메인이 융합한 dCas12f1-발현조절 융합 단백질은 특정 유전자의 발현을 저해하는 기능을 한다.
Dead Cas12f1 단백질의 특징 - 융합 단백질 개발이 용이함
본 명세서에서 개시하는 Dead Cas12f1 단백질은 그 크기가 매우 작으며, 본 명세서에서 개시하는 가이드 RNA와 함께 작용하여 표적 특이적으로 결합하는 활성이 매우 높기 때문에, 추가적인 기능적 도메인을 융합시켜 기능성 단백질을 개발하기 매우 용이하다.
Dead Cas12f1 단백질 및 dCas12f1 기반 융합 단백질의 특징 - 벡터 탑재가 용이함
본 명세서에서 개시하는 Dead Cas12f1 단백질 및 dCas12f1 기반 융합 단백질은 사이즈가 매우 작아 AAV에 탑재 가능한 사이즈이며, 경우에 따라서는 2개 이상의 표적 서열을 표적화하는 가이드 RNA도 탑재가 가능하다. 따라서, 크기가 매우 커서 AAV 한 단위에 탑재가 불가능한 다른 Cas 시스템 대비 벡터 제조가 매우 용이하며, 한 단위의 AAV로부터 단백질 및 가이드 RNA 등의 구성요소 모두를 발현시킬 수 있으므로, 실제 유전자 치료제 개발 시 매우 높은 효능을 기대할 수 있다.
Cas12f1 단백질
Cas12f1 단백질 - 개괄
본 명세서에서 개시하는 Dead Cas12f1 단백질, 또는 dCas12f1 기반 융합 단백질은 1) 야생형 Cas12f1 단백질, 또는 Cas12f1 변이체 단백질에 기반하여, 2) 핵산 절단 활성을 보이지 않도록 변형된 것(Dead Cas12f1)이며, 3) dCas12f1 기반 융합 단백질의 경우, 상기 dead Cas12f1에 추가적인 기능적 도메인을 융합시킨 것이다.
상기 야생형 Csa12f1 단백질은 전술한 바 Cas14a 이펙터 단백질을 포함하는 CRISPR/Cas14a 시스템을 포함한다(Makarova et al., Nature Reviews, Microbiology volume 18, 67 (2020)).
본 명세서의 발명자들은 상기 야생형 Cas12f1 단백질과 동일한 기능을 하는 Cas12f1 변이체 단백질을 개발하였으며, 상기 Cas12f1 변이체 단백질은 상기 야생형의 Cas12f1 단백질의 기능적 유사체에 해당한다.
이하 본 명세서에서 "Cas12f1 단백질"이라는 단어는, 달리 기재되지 않은 한, 상기 야생형의 Cas12f1 단백질 및 동일한 기능을 가지는 Cas12f1 변이체 단백질(야생형 Cas12f1의 기능적 유사체)를 통틀어 지칭하며, 문맥에 따라 적절히 해석되어야 한다.
야생형의 Cas12f1 단백질
상기 Cas12f1 단백질은 야생형 Cas12f1 단백질일 수 있다. 이때, 상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자의 이중 가닥 또는 단일 가닥을 절단할 수 있다.
일 구현예로서, 상기 Cas12f1 단백질은 Cas14 패밀리(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)에서 유래한 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 단백질은 Uncultured archaeon 유래의 Cas14a1 단백질(Harrington et al., Science 362, 839-842 (2018); US 2020/0172886 A1)일 수 있다. 예를 들어, 상기 Cas14a1 단백질은 서열번호 1의 아미노산 서열을 가질 수 있다.
Cas12f1 변이체 단백질 1 - 일반
상기 Cas12f1 단백질은 Cas12f1 변이체 단백질일 수 있다. 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다. 이때, 상기 변형은 삭제(deletion) 및/또는 치환(substitution)일 수 있다. 또는 상기 Cas12f1 변이체는 야생형 Cas12f1 단백질의 아미노산 서열의 양 말단 및 또는 서열 내에 적어도 하나 이상의 아미노산 서열이 추가된 것일 수 있다. 이때, 상기 변형은 삽입(insertion)일 수 있다. 이때, 상기 Cas12f1 변이체는 "Cas12f1 돌연변이(Cas12f1 mutant)" 또는 "Cas14a1 돌연변이(Cas14a1 mutant)"로 지칭한다.
일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 제거된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 제거된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 서열번호 1의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다.
다른 일 구현예로서, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질의 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 이때, 상기 치환은 하나의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 하나의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 하나의 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 치환은 다수개의 아미노산이 다수개의 다른 아미노산으로 치환된 것일 수 있으며, 이때, 치환되는 아미노산의 수와 치환하는 아미노산의 수는 서로 동일하거나 다를 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 RuvC 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질에 포함된 PAM을 인식하는 도메인 내 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또는, 상기 Cas12f1 돌연변이는 서열번호 1 아미노산 서열 중 적어도 하나 이상의 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 중 선택된 아미노산 서열로 표현될 수 있다.
상기 Cas12f1 돌연변이는 야생형 Cas12f1 단백질과 동일한 기능을 가지는 변이체 또는 기능 일부 또는 전부가 변형된 변이체일 수 있다. 예를 들어, 상기 Cas12f1 돌연변이는 표적 핵산의 이중 가닥 중 하나의 가닥만 절단하도록 변경된 것일 수 있다. 또는 상기 Cas12f1 돌연변이는 5'-TTTA-3' 또는 5'-TTTG-3'이 아닌 다른 PAM 서열을 인식하도록 변형된 것일 수 있다.
Cas12f1 변이체 단백질 2 - 더미 서열을 포함하는 Cas12f1 변이체 단백질
본 발명자들은 본 출원 발명자들은 연구를 통해 상기 야생형의 Cas12f1 단백질의 아미노산 서열의 N말단 및/또는 C말단에 아미노산이 추가된 돌연변이체 중, 상기 Cas12f1 단백질과 동일하거나 향상된 기능을 가지는 Cas12f1 변이체가 있음을 밝혔다. 더 나아가, 상기 야생형의 Cas12f1 단백질의 N말단에 일정 길이의 아미노산 서열을 추가하여, 상기 야생 Cas12f1 단백질과 동일한 기능을 하는 Cas12f1 변이체를 발명하였다. 상기 Cas12f1 변이체에 대해서는 한국 특허출원 제10-2021-0181875호에 자세히 개시되어 있다. 달리 기재되지 않은 한, 본 명세서에서도 상기 출원의 상기 Cas12f1 변이체, 또는 기능적 유사체에 대한 내용이 참조될 수 있다.
일 구현예로, 상기 Cas12f1 변이체는 야생형의 Cas12f1 단백질의 N말단 및/또는 C말단에 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 또는 30개의 아미노산이 추가된 것일 수 있다. 일 구현예로, 상기 Cas12f1 변이체는 야생형의 Cas12f1 단백질의 N말단 및/또는 C말단에 전술한 두 개의 수치범위 내의 아미노산이 추가된 것일 수 있다. 예를 들어, 상기 Cas12f1 변이체는 야생형의 Cas12f1 단백질의 N말단에 26개 내지 28개의 아미노산이 추가된 것일 수 있다.
상기 일정 길이의 아미노산 서열은 더미 서열로 지칭될 수 있으며, 상기 더미 서열은 1) 상기 Cas12f1 변이체 단백질이 가이드 RNA와 상호작용하여 복합체를 형성하는데 방해되지 않고, 2) 상기 Cas12f1 변이체 단백질이 핵산 절단 활성을 나타내는 데 영향을 미치지 않으며, 3) 상기 Cas12f1 변이체 단백질이 표적 유전자 내의 PAM 서열을 인식하는 데 영향을 미치지 않는 것이라면 달리 제한되지 않는다.
일 구현예로, 상기 더미 서열은 1개 내지 40개 이내의 아미노산을 포함할 수 있다. 예를 들어, 상기 더미 서열은 서열번호 10 내지 서열번호 13중 선택된 아미노산 서열일 수 있다.
일 구현예로, 상기 Cas12f1 변이체는 서열번호 14, 서열번호 25, 서열번호 30, 서열번호 35중 선택된 아미노산 서열로 표현되는 단백질일 수 있다. 이 중 서열번호 14로 표현되는 단백질은, Candidatus Woesearchaeota archaeon 유래의 Transposon-associated transposase B (TnpB)로도 알려져있으며, 본 명세서에서는 Cas12f1 단백질, Cas12f1 변이체, Cas12f1 기능적 유사체, TnpB, TnpB 기능적 유사체 등의 용어를 혼용하여 사용할 수 있다.
본 명세서에서 서열번호 14의 Cas12f1 변이체 단백질은 Cas12f1 variant 1, 서열번호 25의 Cas12f1 변이체 단백질은 Cas12f1 variant 2, 서열번호 30의 Cas12f1 변이체 단백질은 Cas12f1 variant 3, 서열번호 35의 Cas12f1 변이체 단백질은 Cas12f1 variant 4로 지칭될 수 있다. 상기 명칭은 편의상 사용하는 명칭일 뿐이며, 위 용어에 의해 상기 Cas12f1 단백질 변이체가 제한되지 않는다.
Cas12f1 단백질의 PAM 서열
상기 Cas12f1 단백질은 표적 핵산 또는 표적 유전자 내에 존재하는 Protospacer Adjacent Motif(PAM) 서열을 인식할 수 있다. 이때, PAM 서열은 상기 Cas14a1 단백질에 따라 정해지는 고유한 서열이다.
상기 Cas12f1 단백질을 위한 PAM 서열은 T-rich 서열일 수 있다. 상기 Cas12f1 단백질을 위한 PAM 서열은 5'-TTTN-3'서열일 수 있다. 이때, 상기 N은 A, T, C, 또는 G일 수 있다. 예를 들어, 상기 PAM 서열은 5'-TTTA-3', 5'-TTTT-3', 5'-TTTC-3' 또는 5'-TTTG-3' 서열일 수 있다.
Dead Cas12f1 단백질
Dead Cas12f1 단백질 개괄
본 명세서에서는 Cas12f1 단백질에서 핵산 절단 활성이 제거된 것인 절단 비활성 Cas12f1 (dead Cas12f1) 단백질을 개시한다. 상기 dead Cas12f1 단백질은 상기 야생형의 Cas12f1 단백질 및/또는 Cas12f1 단백질 변형체에서 핵산 절단 활성이 제거된 기능적 변이체를 의미한다.
본 명세서의 발명자들은 연구를 통해 야생형의 Cas12f1 단백질의 특정 아미노산이 핵산 절단 활성에 중요하게 관여한다는 것을 발견했으며, 해당 부위의 변형을 통해 핵산 절단 활성이 제거된, dead Cas12f1 단백질을 발명하였다.
더 나아가, 발명자들은 상기 야생형 Cas12f1 단백질을 dead form으로 만들기 위해 수행한 변형을 응용하면 상기 Cas12f1 변이체 단백질 기반의 dead Cas12f1 단백질을 만들 수 있다는 것을 밝혔다. 이에 따라, 발명자들은 상기 Cas12f1 변이체 단백질에 대한 dead form의 단백질을 발명하였다.
상기 Cas12f1 변형체 기반의 dead Cas12f1 단백질을 포함하는 염기교정/발현조절 융합 단백질은 상기 야생형 Cas12f1 기반의 dead Cas12f1 단백질을 포함하는 융합 단백질들과 비교하여 적어도 동등한, 표적 서열에 따라서는 더 나은 기능을 보인다.
Dead Cas12f1을 만들기 위한 변이 위치
본 명세서에서 개시하는 dead Cas12f1 단백질은 야생형의 Cas12f1 단백질 기준, 핵산 절단 활성에 관여하는 아미노산이 다른 아미노산으로 치환되어 핵산 절단 활성을 상실한 것이 특징이다. 상기 변이 대상 위치는 핵산 절단 활성에 관여하는 아미노산 위치라면 특별히 제한되지 않으며, 하나 이상의 위치에서 변이가 일어난 것일 수 있다.
일 구현예로, 상기 변이 위치는 서열번호 1 기준, 326번째 아스파르트산, 422번째 글루탐산, 490번째 아르기닌, 및/또는 510번째 아스파르트산일 수 있다.
Dead Cas12f1을 만들기 위한 변이 대상
상기 Cas12f1 단백질의 변이 대상 위치를 적절하게 변이시키면 핵산 절단 활성을 상실할 것으로 기대할 수 있다. 이때, 변이 대상 위치의 원 아미노산의 종류 및 구조를 고려하여, 활성을 상실하도록 적절한 다른 아미노산으로 치환해야 한다.
일 구현예로, 상기 dead Cas12f1 단백질은 상기 핵산 절단 활성에 관여하는 하나 이상의 변이 대상 위치의 아미노산을 다른 표준 아미노산으로 치환한 것일 수 있다. 구체적으로, 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 및/또는 발린(valine)으로 치환한 것일 수 있다.
Cas12f1 변이체 단백질의 dead form
상기 dead Cas12f1을 만들기 위한 변이 위치 및 변이 대상은 Cas12f1 변이체 단백질에도 그대로 적용하여, Cas12f1 변이체 단백질의 dead form을 만들 수 있다. 구체적으로, 상기 Cas12f1 변이체 단백질이 더미 서열을 포함하는 변이체인 경우, 상기 Cas12f1 변이체에, 야생형의 Cas12f1 단백질의 아미노산 서열에 대응하는 상기 변이 위치의 아미노산을 상기 변이 대상 아미노산으로 치환함으로써, Cas12f1 변이체 단백질 기반의 dead Cas12f1 단백질을 만들 수 있다.
일 구현예로, 상기 Dead Cas12f1 단백질은 서열번호 14로 표현되는 야생형 Cas12f1에서 다음 중 선택된 하나 이상의 변이 위치 각각을 하나 이상의 변이 대상으로 치환한 것일 수 있다:
변이 위치: 354번째 아스파르트산, 450번째 글루탐산, 518번째 아르기닌, 및/또는 538번째 아스파르트산; 및
변이 대상: 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 및/또는 발린(valine).
더 구체적인 예시는 《발명의 가능한 실시예》 단락 중 "dead Cas12f1 단백질" 단락에 기재되어 있다.
Dead Cas12f1 단백질 아미노산 서열 예시
일 구현예로, 상기 dead Cas12f1 단백질은 서열번호 2 내지 서열번호 5, 서열번호 15 내지 서열번호 24, 서열번호 26 내지 서열번호 29, 서열번호 31 내지 서열번호 34, 서열번호 36 내지 서열번호 39의 아미노산 서열을 가질 수 있다.
dCas12f1-염기교정 융합 단백질
dCas12f1-염기교정 융합 단백질 개괄
본 명세서에서는 Dead Cas12f1 단백질 및 염기교정 도메인이 융합된 dCas12f1-염기교정 융합 단백질을 개시한다. 상기 dCas12f1-염기교정 융합 단백질은 상기 dead Cas12f1 단백질, 하나 이상의 염기교정 도메인, 및 기타 추가 구성이 융합된 단백질이며, 세포 내에 전달되는 경우, 가이드 RNA와 함께 작용하여 상기 세포 내 표적 유전자 내의 미리 결정된 표적 서열, 또는 상기 표적 서열과 인접한 범위의 핵산 서열의 염기를 교정하는 기능을 할 수 있다. 상기 dCas12f1-염기교정 융합 단백질은 상기 dead Cas12f1 단백질, 및 하나 이상의 염기교정 도메인을 필수적으로 포함하며, 추가적인 구성을 포함할 수 있다.
그 결과, 상기 dCas12f1-염기교정 융합 단백질은 표적 유전자의 표적 서열과 인접한 부위의 염기를 교정하는 기능을 하는 CRISPR 염기교정 시스템으로 작용할 수 있다.
이하 상기 dCas12f1-염기교정 융합 단백질의 구성에 대해 구체적으로 설명한다.
dCas12f1-염기교정 융합 단백질 구성 1 - Dead Cas12f1 단백질
상기 dCas12f1-염기교정 융합 단백질은 핵산 절단 활성이 상실된 Dead Cas12f1 단백질을 포함한다. 전술한 바 상기 Dead Cas12f1 단백질은 표적 유전자 내 미리 결정된 표적 서열을 인식하고, 해당 부위에 결합하는 기능을 함으로써, dCas12f1-염기교정 융합 단백질의 또 다른 구성인 염기교정 도메인이 표적 서열, 또는 표적 서열과 인접한 부위의 염기를 교정할 수 있도록 하는 역할을 한다. 달리 표현하면, 상기 Dead Cas12f1 단백질은 염기를 교정하고자 하는 표적 서열 부위에 상기 염기교정 도메인을 위치-특이적으로 전달하는 역할을 하도록 설계된 부분이다. 상기 Dead Cas12f1 단백질은 핵산 절단 활성이 상실된 것을 특징으로 하므로, 원치 않은 핵산 절단 및 인델 발생 효과를 일으키지 않는다. 상기 Dead Cas12f1 단백질의 구체적인 구성은 《Dead Cas12f1 단백질》 단락에서 설명한 바와 같다.
dCas12f1-염기교정 융합 단백질 구성 2 - 염기교정 도메인
상기 dCas12f1-염기교정 융합 단백질은 염기교정 도메인을 포함한다. 상기 염기교정 도메인은 표적 유전자의 특정 염기를 교정하는 기능을 가지는 도메인이라면 특별히 제한되지 않는다. 좀 더 구체적으로, 상기 염기교정 도메인으로 표적 유전자 내 특정 위치의 아데닌을 구아닌으로 교정할 수 있는 아데노신 탈아미노화효소, 및 시토신을 티민으로 교정할 수 있는 시티딘 탈아미노화효소가 알려져 있다. 본 명세서의 발명자들은 이러한 탈아미노화효소를 상기 dead Cas12f1에 결합하여, 아데닌 염기교정 유전자가위(adenine base-editor; ABE) 및 시토신 염기교정 유전자가위(cytosine base-editor; CBE)를 발명하였다.
염기교정 도메인 1 - 아데노신 탈아미노화효소
상기 염기교정 도메인은 아데노신 탈아미노화효소의 전부, 또는 일부 도메인일 수 있다. 상기 dCas12f1-염기교정 융합 단백질이 아데노신 탈아미노화효소를 포함하는 경우, 상기 dCas12f1-염기교정 융합 단백질은 아데닌 염기교정 유전자가위(이하, ABE)로 기능한다. 상기 아데노신 탈아미노화효소의 전부, 또는 일부 도메인을 포함하는 dCas12f1-염기교정 융합 단백질은 표적 서열, 또는 표적 서열과 인접한 서열에 포함된 하나 이상의 아데닌을 구아닌으로 치환하는 기능을 한다. 상기 아데노신 탈아미노화효소는 dCas12f1-염기교정 융합 단백질이 상기 기능을 할 수 있도록 하는 것이면 달리 제한되지 않는다. 예를 들어, 상기 아데노신 탈아미노화효소는 대장균 (E. coli) 유래의 tRNA adenosine deaminase(TadA) 및/또는 상기 TadA의 변이체일 수 있다. 또한, 상기 dCas12f1-염기교정 융합 단백질은 TadA 및/또는 상기 TadA의 변이체를 한 단위 이상 포함할 수 있다.
염기교정 도메인 2 - 시티딘 탈아미노화효소
상기 염기교정 도메인은 시티딘 탈아미노화효소의 전부, 또는 일부 도메인일 수 있다. 상기 dCas12f1-염기교정 융합 단백질이 아데노신 탈아미노화효소를 포함하는 경우, 상기 dCas12f1-염기교정 융합 단백질은 시토신 염기교정 유전자가위(이하, CBE)로 기능한다. 상기 시티딘 탈아미노화효소의 전부, 또는 일부 도메인을 포함하는 dCas12f1-염기교정 융합 단백질은 표적 서열, 또는 표적 서열과 인접한 서열에 포함된 하나 이상의 시토신을 티민으로 치환하는 기능을 한다. 상기 시티딘 탈아미노화효소는 dCas12f1-염기교정 융합 단백질이 상기 기능을 할 수 있도록 하는 것이면 달리 제한되지 않는다. 예를 들어, 인간 activation-induced cytidine deaminase(AID), 인간 APOBEC3G, 쥐 APOBEC1, APOBEC3A, APOBEC3B, CDA, AID, 및/또는 칠성장어 PmCDA1일 수 있다.
기타 구성 1 - 기타 염기교정 관여 도메인
상기 dCas12f1-염기교정 융합 단백질은 상기 염기교정 도메인 외, 염기교정에 관여하는 추가적인 도메인을 포함할 수 있다. 상기 추가적인 도메인은 상기 탈아미노화효소의 염기교정 기능을 보조하거나, 그 효율을 높이는 역할을 할 수 있다. 상기 dCas12f1-염기교정 융합 단백질은 상기 추가적인 도메인을 1개, 2개, 또는 3개 이상 포함할 수 있다.
일 구현예로, 상기 추가적인 도메인은 uracil glycosylase inhibitor일 수 있다. 또 다른 구현예로, 상기 추가적인 도메인은 gam protein일 수 있다.
기타 구성 2 - NLS, 링커 등
본 명세서에서 개시되는 dCas12f1-염기교정 융합 단백질은 하나 이상의 추가 도메인을 더 포함할 수 있다. 상기 추가 도메인은 상기 dCas12f1-염기교정 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 상기 추가 도메인은 상기 dCas12f1-염기교정 융합 단백질에 포함된 dead Cas12f1 단백질과 염기교정 도메인의 사이에 위치할 수 있다.
상기 dCas12f1-염기교정 융합 단백질은 하나 이상의 NLS(Nuclear Localization Sequence), 및/또는 NES(Nuclear Export Sequence)를 추가로 포함할 수 있다. 상기 NLS는 《용어의 정의》 단락의 "NLS(Nuclear Localization Sequence, or Signal)" 단락에 설명된 것일 수 있다.
상기 dCas12f1-염기교정 융합 단백질은 하나 이상의 링커를 포함할 수 있다. 상기 링커는 상기 융합 단백질 내 각 구성을 연결하는 것으로, 각 구성의 기능에 영향을 미치지 않는 것이라면 달리 제한되지 않는다. 상기 dCas12f1-염기교정 융합 단백질의 각 구성은 직접 연결되어 있을 수 있으나, 링커를 통해 연결되어 있을 수 있다. 상기 링커는 《용어의 정의》 단락 중 "링커" 단락에 설명된 것일 수 있다.
dCas12f1-염기교정 융합 단백질의 구조
본 명세서에서 개시하는 dCas12f1-염기교정 융합 단백질은 상기 dead Cas12f1 단백질 및 상기 염기교정 도메인이 순차적으로 연결된 구조의 융합 단백질이며, 이때, 염기교정 도메인 및 추가 구성의 종류, 개수, 조합 및 융합 위치를 다양하게 조합하여 설계 가능한 것을 특징으로 한다. 이러한 dCas12f1-염기교정 융합 단백질의 다양한 모듈화는 Cas12f1 단백질이 작은 크기를 가진다는 장점을 활용하여 더 효과적인 dCas12f1-염기교정 융합 단백질의 개발을 가능하게 한다. 각각의 모듈 구성이 따라 상기 dCas12f1-염기교정 융합 단백질의 염기교정 효율에 차이가 생길 수 있으며, 각 표적 유전자에 따라 다양한 모듈화를 통해 최적의 CRISPR 염기교정 시스템을 설계할 수 있다.
일 구현예로, 상기 dCas12f1-염기교정 융합 단백질은 하나 이상의 염기교정 도메인을 포함할 수 있다. 일 구현예로, 상기 dCas12f1-염기교정 융합 단백질은 하나 이상의 기타 염기교정 관여 도메인을 포함할 수 있다. 일 구현예로, 상기 dCas12f1-염기교정 융합 단백질은 하나 이상의 기타 구성을 포함할 수 있다.
일 구현예로, 상기 dead Cas12f1 단백질 및 상기 염기교정 도메인은 직접 연결되어 있을 수 있고, 링커를 통해 연결되어 있을 수 있다. 일 구현예로, 상기 dead Cas12f1 단백질 및 염기교정 도메인이 연결된 구조를 기초로, 상기 dCas12f1-염기교정 융합 단백질은 다양한 추가 구성을 포함할 수 있다.
일 구현예로, 상기 dCas12f1-염기교정 융합 단백질은 다음 중 선택된 구조로 표현될 수 있다:
NH2-[dCas12f1]-[Linker]-[BE]-COOH; 및
NH2-[BE]-[Linker]-[dCas12f1]-COOH.
일 구현예로, 상기 dCas12f1-염기교정 융합 단백질은 도 1에 개시된 구조로 표현될 수 있다.
dCas12f1-염기교정 융합 단백질의 예시서열
일 구현예로, 상기 dCas12f1-염기교정 융합 단백질은 서열번호 284 내지 서열번호 328, 서열번호 418 내지 서열번호 442 중 선택된 아미노산 서열로 표현될 수 있다.
dCas12f1-발현조절 융합 단백질
dCas12f1-발현조절 융합 단백질 개괄
본 명세서에서는 Dead Cas12f1 단백질 및 유전자 발현조절 도메인이 융합된 dCas12f1-발현조절 융합 단백질을 개시한다. 상기 dCas12f1-발현조절 융합 단백질은 상기 dead Cas12f1 단백질, 하나 이상의 상기 유전자 발현조절 도메인, 및 기타 구성이 융합된 단백질이며, 세포 내에 전달되는 경우, 가이드 RNA와 함께 작용하여 상기 세포 내 미리 결정된 표적 유전자의 발현을 조절하는 기능을 할 수 있다. 상기 dCas12f1-발현조절 융합 단백질은 상기 dead Cas12f1 단백질, 및 하나 이상의 유전자 발현조절 도메인을 필수적으로 포함하며, 추가적인 구성을 포함할 수 있다. 그 결과, 상기 dCas12f1-발현조절 융합 단백질은 유전자의 발현을 촉진시키는 CRISPR activation 시스템 및/또는 유전자의 발현을 저해시키는 CRISPR interference 시스템으로 기능할 수 있다.
dCas12f1-발현조절 융합 단백질 구성 1 - Dead Cas12f1 단백질
상기 dCas12f1-발현조절 융합 단백질은 핵산 절단 활성이 상실된 Dead Cas12f1 단백질을 포함한다. 전술한 바 상기 Dead Cas12f1 단백질은 표적 유전자 내 미리 결정된 표적 서열을 인식하고, 해당 부위에 결합하는 기능을 함으로써, dCas12f1-발현조절 융합 단백질의 또 다른 구성인 유전자 발현조절 도메인이 표적 유전자의 발현을 조절할 수 있도록 하는 역할을 한다. 달리 표현하면, 상기 Dead Cas12f1 단백질은 발현을 조절하고자 하는 표적 유전자 부위에 상기 염기교정 도메인을 위치-특이적으로 전달하는 역할을 하도록 설계된 부분이다. 상기 Dead Cas12f1 단백질은 핵산 절단 활성이 상실된 것을 특징으로 하므로, 원치 않은 핵산 절단 및 인델 발생 효과를 일으키지 않는다. 상기 Dead Cas12f1 단백질의 구체적인 구성은 《Dead Cas12f1 단백질》 단락에서 설명한 바와 같다.
dCas12f1-발현조절 융합 단백질 구성 2 - 유전자 발현조절 도메인
상기 dCas12f1-발현조절 융합 단백질은 유전자 발현조절 도메인을 포함한다. 상기 유전자 발현조절 도메인은 표적 유전자의 발현을 조절할 수 있는 것이라면 특별히 제한되지 않는다. 좀 더 구체적으로, 상기 유전자 발현조절 도메인은 특정 유전자의 전사를 활성, 또는 촉진시키는 역할을 하는 전사 활성 단백질, 및/또는 특정 유전자의 전사를 저해, 또는 억제시키는 역할을 하는 전사 저해 단백질일 수 있다. 본 명세서의 발명자들은 이러한 유전자 발현조절 도메인을 상기 dead Cas12f1에 융합시켜, CRISPR activation 시스템, 및 CRISPR interference 시스템을 구성할 수 있는 dCas12f1-발현조절 융합 단백질을 발명하였다.
유전자 발현조절 도메인 1 - 전사 촉진 인자
상기 유전자 발현조절 도메인은 전사 활성 단백질일 수 있다. 상기 전사활성 단백질은 표적 유전자의 전사를 활성 또는 촉진시키는 역할을 하는 단백질일 수 있다. 상기 전사 활성 단백질은 표적 유전자의 인핸서 또는 프로모터 근위 요소(promoter-proximal element)에 결합할 수 있는 DNA 결합 단백질일 수 있다. 상기 전사 활성 단백질은 프로모터 근처에 위치한 조절 DNA 부위에 결합하여 일반적인 transcription machinery (RNA 중합효소 및 일반적인 transcription factors 등)와 단백질-단백질 상호작용을 통해 프로모터에 transcription machinery의 결합을 촉진하여 유전자의 전사를 촉진할 수 있다. 또는 상기 전사 활성 단백질은 RNA 중합효소가 프로모터로부터 방출되어 DNA를 따라 합성을 진행하도록 촉발하여 유전자의 전사를 촉진할 수 있다.
일 구현예로, 상기 전사 활성 단백질은 VP64, Sun Tag, VPR(VP64, p65, Rta) 또는 TV(TAL, VP64) 일 수 있다.
유전자 발현조절 도메인 2 - 전사 저해 인자
상기 발현 조절 도메인은 전사 저해 단백질일 수 있다. 상기 전사저해 단백질은 표적 유전자의 전사를 저해 또는 억제시키는 역할을 하는 단백질일 수 있다. 상기 전사저해 단백질은 표적 유전자의 operator 또는 silencer에 결합하여 표적 유전자의 발현을 저해 또는 억제하는 DNA 결합 단백질 또는 펩타이드일 수 있다. 이때, 상기 전사 저해 단백질은 RNA 중합효소가 프로모터에 부착되는 것을 차단하여 유전자의 전사를 저해 또는 억제할 수 있다. 또는 상기 전사 저해 단백질은 크로마틴의 구조변화를 유도하여 유전자의 전사를 저해 또는 억제하는 단백질 또는 펩타이드일 수 있다. 이때, 상기 크로마틴의 구조변화는 메틸화(methylation), 탈메틸화(demethylation), 아세틸화(acetylation), 탈아세틸화(deacetylation) 등에 의한 것일 수 있다.
일 구현예로, 상기 전사 저해 단백질은 KRAB, DNMT, MeCP2, HDAC, LSD, SRDX SALL1 및/또는 SDS3일 수 있다. 이때, 상기 DNMT는 DNMT1, TRDMT1 또는 DNMT3일 수 있다. 이때, 상기 HDAC는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10 또는 HDAC11일 수 있다.
기타 구성 - NLS, 링커 등
본 명세서에서 개시되는 dCas12f1-발현조절 융합 단백질은 하나 이상의 추가 도메인을 더 포함할 수 있다. 상기 추가 도메인은 상기 dCas12f1-발현조절 융합 단백질의 N 말단 및/또는 C 말단에 위치할 수 있다. 또는 상기 추가 도메인은 상기 dCas12f1-발현조절 융합 단백질에 포함된 dead Cas12f1 단백질과 유전자 발현조절 도메인의 사이에 위치할 수 있다.
본 명세서에서 제공하는 Cas12f1 융합 단백질은 변형된 Cas12f1 단백질과 발현 조절 도메인을 연결하는 링커를 포함하는 것을 특징으로 한다. 이때, 상기 링커는 변형된 Cas12f1 단백질과 발현 조절 도메인의 기능 및 구조에 영향을 주지 않는 아미노산 서열인 것을 특징으로 한다. 구체적으로, 상기 링커는 《용어의 정의》 단락의 "링커" 단락에 설명된 것일 수 있다.
상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 NLS(Nuclear Localization Sequence), 및/또는 NES(Nuclear Export Sequence)를 추가로 포함할 수 있다. 구체적으로 상기 NLS는 《용어의 정의》 단락의 "NLS(Nuclear Localization Sequence, or Signal)" 단락에 설명된 것일 수 있다.
상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 태그를 포함할 수 있다. 구체적으로, 상기 태그는 《용어의 정의》 단락의 "태그" 단락에 설명된 것일 수 있다.
dCas12f1-발현조절 융합 단백질의 구조
본 명세서에서 개시하는 dCas12f1-발현조절 융합 단백질은 상기 dead Cas12f1 단백질 및 상기 유전자 발현조절 도메인이 순차적으로 연결된 구조의 융합 단백질이며, 이때, 상기 발현조절 도메인 및 추가 구성의 종류, 개수, 조합 및 융합 위치를 다양하게 조합하여 설계 가능한 것을 특징으로 한다. 이러한 dCas12f1-발현조절 융합 단백질의 다양한 모듈화는 Cas12f1 단백질이 작은 크기를 가진다는 장점을 활용하여 더 효과적인 dCas12f1-발현조절 융합 단백질의 개발을 가능하게 한다. 각각의 모듈 구성이 따라 상기 dCas12f1-발현조절 융합 단백질의 발현조절 효율에 차이가 생길 수 있으며, 각 표적 유전자에 따라 다양한 모듈화를 통해 최적의 CRISPR 발현조절 시스템을 설계할 수 있다.
일 구현예로, 상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 유전자 발현조절 도메인을 포함할 수 있다. 일 구현예로, 상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 기타 발현조절 관여 도메인을 포함할 수 있다. 일 구현예로, 상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 기타 구성을 포함할 수 있다.
일 구현예로, 상기 dead Cas12f1 단백질 및 상기 발현조절 도메인은 직접 연결되어 있을 수 있고, 링커 및/또는 NLS를 통해 연결되어 있을 수 있다. 일 구현예로, 상기 dead Cas12f1 단백질 및 발현조절 도메인이 연결된 구조를 기초로, 상기 dCas12f1-발현조절 융합 단백질은 다양한 추가 구성을 포함할 수 있다.
구체적인 예시 구성은 《발명의 가능한 실시예》 단락의 "dCas12f1-발현조절 도메인 융합 단백질" 단락에 기재되어 있다.
가이드 RNA
가이드 RNA 개괄
본 명세서에서는 dead Cas12f1 및 dCas12f1 기반 융합 단백질(이하, 엔지니어링 된 Cas12f1 단백질로 통칭한다)과 복합체를 이루고, 상기 엔지니어링 된 Cas12f1 단백질이 표적-특이적으로 기능할 수 있도록 하는 가이드 RNA를 개시한다. 상기 가이드 RNA는 야생형의 Cas12f1과 함께 CRISPR/Cas12f1 시스템을 이루어 이중가닥 핵산 절단 활성을 나타낼 수 있는 것으로, 본 명세서의 발명자들이 야생형의 가이드 RNA를 기반으로 다양한 변형을 연구하여 발명한 것이다. 상기 가이드 RNA는 5'말단에서 3'말단 방향으로 스캐폴드, 스페이서, 및 U-rich tail이 연결된 것이다.
상기 스캐폴드는 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 이룰 수 있는 부분으로, 야생형의 가이드 RNA의 tracrRNA, 및 crRNA direct repeat 부분에 대응되는 부위이며, 야생형의 가이드 RNA에서 다양하게 변형된 부분이다. 상기 스페이서는 엔지니어링 된 Cas12f1 단백질이 표적으로 하는 표적 서열에 상보적으로 결합할 수 있는 부분으로, 상기 표적 서열에 따라 그 서열이 결정된다. 상기 U-rich tail은 스페이서의 3'말단 부분에 위치하며, 유리딘(U)을 풍부하게 포함하는 부분이다. 상기 U-rich tail은 상기 스캐폴드와 시너지를 일으켜, 상기 엔지니어링 된 Cas12f1가 표적-특이적으로 기능을 발휘하는 효율을 높이는 역할을 한다.
스캐폴드
상기 스캐폴드는 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 이룰 수 있는 부분으로, 본 명세서에 개시되는 (엔지니어링 된) Cas12f1에 특이적인 구성이다. 상기 스캐폴드는 야생형의 Cas12f1 가이드 RNA의 tracrRNA 부분, 및 crRNA direct repeat 부분에 다양한 조작을 가한 것으로, 야생형 가이드 RNA의 tracrRNA 및 야생형 가이드 RNA의 crRNA direct repeat 부분과 대응하는 엔지니어링 된 tracrRNA 부분 및 엔지니어링 된 crRNA direct repeat 부분을 포함한다. 상기 스캐폴드는 효율적인 발현 및 사용을 위해 일반적으로 엔지니어링 된 tracrRNA 및 엔지니어링 된 crRNA direct repeat 부분을 링커로 연결시킨 형태를 취하나, 상기 링커가 필수적인 것은 아니다. 달리 표현해, 상기 스캐폴드는 한 분자의 핵산으로 구성되거나, 두 분자의 핵산으로 구성되면서 각 핵산 분자의 일부가 서로 상보적인 결합을 하고 있는 형태일 수 있다.
일 구현예로, 상기 스캐폴드는 5' - [엔지니어링 된 tracrRNA] - 링커 - [엔지니어링 된 crRNA direct repeat] - 3' 구조일 수 있다. 상기 스캐폴드의 각 구성에 대한 다양한 구현예들은 《발명의 가능한 실시예》 단락에 기재되어 있다.
스페이서
상기 스페이서는 상기 엔지니어링 된 Cas12f1 단백질 및 상기 가이드 RNA가 복합체를 이룬 후, 표적 유전자의 표적 서열에 특이적으로 결합하여 표적-특이적으로 기능을 발휘할 수 있도록 설계되는 부분이다. 상기 스페이서는 표적 유전자를 인식(recognizing), 결합(binding) 또는 타겟(targeting)하는 RNA 서열이다. 보다 구체적으로, 스페이서는 표적 서열과 상보적으로 결합하는 RNA 서열, 표적 서열과 상보적인 결합을 형성할 수 있는 RNA 서열 또는 표적 서열에 상보성을 가지는 RNA 서열이다. 스페이서는 프로토스페이서 서열과 동일하거나, 유사하거나 또는 그에 대응되는 RNA 서열이다. 이때, 프로토스페이서 서열은 표적 서열과 유기적인 관계를 가지며, 이와 관련된 설명은 상기 《용어의 정의》 단락 중 "표적 서열, 표적 가닥 및 비표적 가닥"에서 설명한 바와 같다. 스페이서는 표적 서열에 따라 변경되는 서열로, 스페이서는 표적 서열에 따라 달라진다. 또한, 스페이서는 RNA 서열로, 표적 유전자의 표적 서열 내에 존재하는 아데노신(A)에 대해, 상기 스페이서는 상보적인 결합을 형성할 수 있는 유리딘(U)을 포함한다. 또는 표적 유전자의 프로토스페이서 서열 내에 존재하는 티미딘(T)에 대해, 상기 스페이서는 티미딘(T) 대신에 유리딘(U)을 포함한다. 또한, 상기 스페이서는 가이드 도메인(guide domain)으로도 지칭되며, 이하에서 스페이서와 가이드 도메인은 병용될 수 있다.
U-rich tail
상기 U-rich tail은 스페이서의 3'말단 부분에 위치하며, 유리딘(U)을 풍부하게 포함하는 부분이다. 본 명세서의 발명자들은 구체적으로, 상기 U-rich tail은 상기 스캐폴드와 시너지를 일으켜, 상기 엔지니어링 된 Cas12f1가 표적-특이적으로 기능을 발휘하는 효율을 높이는 역할을 한다. 예를 들어, 상기 U-rich tail은 UUUUAUUUUUU(서열번호 231) 일 수 있다. 상기 U-rich tail의 다양한 구현예들은 《발명의 가능한 실시예》 단락에 기재되어 있다.
엔지니어링 된 Cas12f1 단백질 - 가이드 RNA 복합체
엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체의 구성
본 명세서에서는 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체를 개시한다. 상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 1) dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질 및 dCas12f1-발현조절 융합 단백질 중 선택된 것인 엔지니어링 된 Cas12f1 단백질, 및 2) 가이드 RNA를 포함한다. 여기서, dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및 dCas12f1-발현조절 융합 단백질은 각각 위에서 설명한 바와 같다.
상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 CRISPR 유전자 조절 복합체(시스템)로 지칭될 수 있다. 예를 들어, 상기 엔지니어링 된 Cas12f1 단백질이 dCas12f1-염기교정 융합 단백질인 경우, 상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 CRISPR 염기교정 복합체(시스템)로 지칭될 수 있다. 또 다른 예를 들어, 상기 엔지니어링 된 Cas12f1 단백질이 dCas12f1-발현조절 융합 단백질인 경우, 상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 CRISPR 발현조절 복합체(시스템)로 지칭될 수 있다.
엔지니어링 된 Cas12f1 단백질
상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 엔지니어링 된 Cas12f1 단백질을 포함한다. 상기 엔지니어링 된 Cas12f1 단백질은 전술한 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및 dCas12f1-발현조절 융합 단백질을 통틀어 일컬으며, 상기 CRISPR 유전자 조절 복합체의 사용 목적에 따라 적절히 선택되고, 최적화될 수 있다. 상기 각각의 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및 dCas12f1-발현조절 융합 단백질은 해당 단락에서 설명된 바와 같다.
가이드 RNA
상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 가이드 RNA를 포함한다. 상기 가이드 RNA는 CRISPR/Cas12f1 시스템에서 기능할 수 있는 것으로, 해당 단락에서 설명된 것과 같다. 상기 가이드 RNA의 스캐폴드는 상기 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 이룰 수 있는 것이다.
엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체 1 - CRISPR 염기교정 복합체
일 구현예로, 상기 엔지니어링 된 Cas12f1이 dCas12f1-염기교정 융합 단백질인 경우, 상기 CRISPR 유전자 조절 복합체는 표적 유전자 내 하나 이상의 염기를 교정하는 기능을 가지며, CRISPR 염기교정 복합체(시스템)으로 지칭될 수 있다.
구체적으로, 상기 dCas12f1-염기교정 융합 단백질이 염기교정 도메인으로 아데노신 탈아미노화효소를 포함하는 경우, 상기 CRISPR 염기교정 복합체는 CRISPR 아데닌 염기교정(ABE) 복합체(시스템)으로 지칭될 수 있으며, 표적 유전자의 표적 서열에 결합하여 프로토스페이서 서열, 또는 이에 인접한 아데닌 염기를 구아닌 염기로 교정할 수 있다.
구체적으로, 상기 dCas12f1-염기교정 융합 단백질이 염기교정 도메인으로 시티딘 탈아미노화효소를 포함하는 경우, 상기 CRISPR 염기교정 복합체는 CRISPR 시토신 염기교정(CBE) 복합체(시스템)으로 지칭될 수 있으며, 표적 유전자의 표적 서열에 결합하여 프로토스페이서 서열, 또는 이에 인접한 시토신 염기를 티민 염기로 교정할 수 있다.
엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체 2 - CRISPR activation/interference 복합체
일 구현예로, 상기 엔지니어링 된 Cas12f1이 dCas12f1-발현조절 융합 단백질인 경우, 상기 CRISPR 유전자 조절 복합체는 표적 유전자의 발현을 조절(촉진 또는 저해)하는 기능을 가지며, CRISPR 발현조절 복합체(시스템)으로 지칭될 수 있다.
구체적으로, 상기 dCas12f1-발현조절 융합 단백질이 발현조절 도메인으로 전사 활성 단백질을 포함하는 경우, 상기 CRISPR 발현조절 복합체는 CRISPR activation 복합체(시스템)으로 지칭될 수 있으며, 표적 유전자의 인핸서 또는 프로모터 근처에 위치한 조절 DNA 부위에 결합하여 RNA 중합효소가 프로모터로부터 방출되어 DNA를 따라 합성을 진행하도록 촉발하여 유전자의 전사를 촉진할 수 있다.
한편, 상기 dCas12f1-발현조절 융합 단백질이 발현조절 도메인으로 전사 저해 단백질을 포함하는 경우, 상기 CRISPR 발현조절 복합체는 CRISPR interference 복합체(시스템)으로 지칭될 수 있으며, 표적 유전자의 operator 또는 silencer에 결합하여 RNA 중합효소가 프로모터에 부착되는 것을 차단하여 유전자의 전사를 저해 또는 억제할 수 있다.
엔지니어링 된 Cas12f1 단백질 및 가이드 RNA를 암호화하는 벡터
엔지니어링 된 Cas12f1 단백질 및 가이드 RNA를 암호화하는 벡터 - 개괄
본 명세서에서는 CRISPR 유전자 조절 시스템의 각 구성요소를 발현시키기 위한 벡터를 제공한다. 구체적으로, 상기 벡터는 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 가이드 RNA를 암호화하는 핵산을 포함하며, 상기 엔지니어링 된 Cas12f1 단백질 및 상기 가이드 RNA를 발현시킬 수 있도록 구성된다. 상기 벡터의 서열은 하나 이상의 프로모터 서열을 포함한다. 상기 프로모터는 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열 및/또는 가이드 RNA를 암호화하는 핵산 서열과 작동적으로 연결되어, 세포 내에서 상기 핵산 서열의 전사가 촉진될 수 있도록 한다. 여기서, 상기 엔지니어링 된 Cas12f1 단백질은 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질 및 dCas12f1-발현조절 융합 단백질 중 선택된 것이고, 각 단백질은 《Dead Cas12f1 단백질》, 《dCas12f1-염기교정 융합 단백질》, 및 《dCas12f1-발현조절 융합 단백질》 단락에서 설명한 바와 같다. 또한, 상기 가이드 RNA는 《가이드 RNA》 단락에서 설명한 바와 같다.
벡터 구성 - 엔지니어링 된 Cas12f1 단백질 발현 서열
상기 벡터는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산을 포함한다. 여기서, 상기 엔지니어링 된 Cas12f1 단백질은 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질 및 dCas12f1-발현조절 융합 단백질 중 선택된 것이고, 각 단백질은 《Dead Cas12f1 단백질》, 《dCas12f1-염기교정 융합 단백질》, 및 《dCas12f1-발현조절 융합 단백질》 단락에서 설명한 바와 같다. 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산은 상기 엔지니어링 된 Cas12f1 단백질을 발현할 수 있는 서열이며, 발현 환경에 맞추어 적절히 코돈-최적화된 것일 수 있다.
벡터 구성 - 가이드 RNA 발현 서열
상기 벡터는 상기 가이드 RNA를 암호화하는 핵산을 포함한다. 여기서, 상기 가이드 RNA는 《가이드 RNA》 단락에서 설명한 바와 같다.
벡터 구성 - 프로모터 서열
상기 벡터 서열은 각 구성요소를 암호화하는 서열에 작동 가능하게 연결된 프로모터 서열을 포함한다. 상기 벡터의 발현 대상을 세포 내에서 발현시키려면, 각 구성 요소를 암호화하는 서열에 프로모터 서열을 작동적으로 연결시켜 세포 내에서 RNA 전사 인자가 활성화될 수 있도록 해야 한다. 상기 프로모터 서열은 대응하는 RNA 전사 인자, 또는 발현 환경에 따라 달리 설계할 수 있으며, 상기 CRISPR 유전자 조절 시스템의 각 구성 요소를 세포 내에서 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 상기 프로모터 서열은 RNA 중합효소(예를 들어, RNA Pol I, Pol II, 또는 Pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1), 및 7SK 중 하나 일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 벡터 서열은 엔지니어링 된 Cas12f1 단백질을 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 서열과 작동 가능하게 연결될 수 있다. 일 구현예로, 상기 벡터 서열은 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 가이드 RNA를 암호화하는 서열과 작동 가능하게 연결될 수 있다. 일 구현예로, 상기 벡터 서열은 엔지니어링 된 Cas12f1 단백질을 암호화하는 서열, 가이드 RNA를 암호화하는 서열, 및 프로모터 서열을 포함할 수 있다. 이때, 상기 프로모터 서열은 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 서열, 및 상기 가이드 RNA를 암호화하는 서열과 작동적으로 연결되며, 상기 프로모터 서열로 인해 활성화된 전사 인자가 상기 엔지니어링 된 Cas12f1 단백질 및 상기 가이드 RNA를 발현시킨다.
벡터 구성 - 둘 이상의 프로모터 서열 포함 가능
일 구현예로, 상기 벡터 서열은 제1 프로모터 서열, 엔지니어링 된 Cas12f1 단백질을 암호화하는 제1 서열, 제2 프로모터 서열 및 가이드 RNA를 암호화하는 제2 서열을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상지 제2 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도된다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 동일한 종류의 프로모터일 수 있다. 이때, 상기 제1 프로모터 및 상기 제2 프로모터는 상이한 종류의 프로모터일 수 있다.
일 구현예로, 상기 벡터 서열은 제1 프로모터 서열, 엔지니어링 된 Cas12f1 단백질을 암호화하는 제1 서열, 제2 프로모터 서열, 제1 가이드 RNA를 암호화하는 제2 서열, 제3 프로모터 서열 및 제2 가이드 RNA를 암호화하는 제3 서열을 포함할 수 있다. 이때, 상기 제1 프로모터 서열은 상기 제1 서열과 작동적으로 연결되고, 상기 제2 프로모터 서열은 상기 제2 서열과 작동적으로 연결되고, 상기 제3 프로모터 서열은 상기 제3 서열과 작동적으로 연결되며, 상기 제1 프로모터 서열에 의해 상기 제1 서열의 전사가 유도되고, 상기 제2 프로모터 서열에 의해 상기 제2 서열의 전사가 유도되며, 상기 제3 프로모터 서열에 의해 상기 제3 서열의 전사가 유도된다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 동일한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터 서열 및 상기 제3 프로모터 서열은 U6 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 제2 프로모터 및 상기 제3 프로모터는 상이한 종류의 프로모터일 수 있다. 구체적으로, 상기 제2 프로모터는 U6 프로모터 서열, 상기 제3 프로모터는 H1 프로모터 서열일 수 있으나, 이에 제한되는 것은 아니다.
벡터 구성 - 종결 신호
상기 벡터는 상기 프로모터 서열과 작동 가능하게 연결된 종결 신호를 포함할 수 있다. 상기 벡터 서열이 상기 프로모터 서열을 포함하는 경우, RNA 전사 인자에 의해 상기 프로모터와 작동 가능하게 연결된 서열의 전사가 유도되는데, 이러한 RNA 전사 인자의 전사 종결을 유도하는 서열을 종결 신호라고 일컫는다. 상기 종결 신호는, 프로모터 서열의 종류에 따라 달라질 수 있다. 예를 들어, 상기 프로모터가 U6, 또는 H1 프로모터일 경우, 상기 프로모터는 티미딘 연속 서열(예를 들어, TTTTTT (T6) 서열)을 종결 신호로 인식한다.
일 구현예로, 상기 벡터 서열이 U6 프로모터 서열을 포함하는 경우, 상기 U6 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다. 일 구현예로, 상기 벡터 서열이 H1 프로모터 서열을 포함하는 경우, 상기 H1 프로모터 서열과 작동 가능하게 연결된, 티미딘 연속 서열이 종결 신호로 작용할 수 있다. 일 구현예로, 상기 티미딘 연속 서열은 5개 이상의 티미딘이 연속으로 연결된 서열일 수 있다.
벡터 구성 - 기타 구성
상기 벡터 서열은 상기 구성 외, 목적에 따라 필요한 구성요소를 포함할 수 있다.
일 구현예로, 상기 벡터 서열은 조절/제어 구성요소 서열, 및/또는 부가 구성 요소 서열을 포함할 수 있다. 일 구현예로, 상기 부가 구성 요소는 형질주입된 세포를 비형질주입 세포로부터 구별하기 위한 목적으로 부가된 것일 수 있다. 이때, 상기 조절/제어 구성요소 서열 및 부가 구성 요소는 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)을 포함할 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있으나, 이에 제한되는 것은 아니다.
부가 구성요소
상기 벡터는 전술한 발현 대상 외, NLS, 태그 단백질 등의 부가 구성 요소를 발현하도록 구성된 것일 수 있다. 일 구현예로, 상기 부가 구성 요소는 상기 엔지니어링 된 Cas12f1 단백질 및/또는 가이드 RNA와는 독립적으로 발현될 수 있다. 또 다른 구현예로, 상기 부가 구성 요소는 상기 엔지니어링 된 Cas12f1 단백질 및/또는 가이드 RNA와 연결되어 발현될 수 있다. 이때, 상기 부가 구성 요소는 CRISPR 유전자 조절 시스템을 발현시키고자 할 때 일반적으로 발현시키는 구성 요소일 수 있으며, 공지기술을 참조할 수 있다. 예를 들어, 상기 부가 발현 요소는, "용어의 정의" 중 "태그" 단락에서 설명된 태그 중 하나일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저 항성 유전자, 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신 (Bleomycin), 하이그로마이신(hygromycin), 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있으나, 이에 제한되는 것은 아니다.
벡터 종류 - 바이러스 벡터
상기 벡터는 바이러스 벡터일 수 있다.
일 구현예로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 하나 이상일 수 있다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
벡터 종류 - 비바이러스 벡터
상기 벡터는 비바이러스 벡터일 수 있다.
일 구현예로, 상기 비바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, 및 mRNA로 구성된 군에서 선택되는 1 이상일 수 있다. 일 구현예로, 상기 플라스미드는 pcDNA 시리즈, pS456, pG1806, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다. 일 구현예로, 상기 벡터는 PCR 앰플리콘(amplicon)일 수 있다.
벡터 형태 - 원형 또는 선형 벡터
상기 벡터는 원형 또는 선형 형태일 수 있다. 상기 벡터가 선형 벡터인 경우, 상기 선형 벡터 서열이 종결 신호를 따로 포함하지 않더라도, 그 3'말단에서 RNA 전사가 종결된다. 이와 비교하여, 상기 벡터가 원형 벡터인 경우, 상기 원형 벡터 서열이 종결 신호를 따로 포함하지 않는다면, RNA 전사가 종결되지 않게 된다. 따라서, 상기 벡터로 원형 벡터를 사용하는 경우, 의도한 대상을 발현하기 위해서는 각 프로모터 서열과 관련된 전사 인자에 대응하는 종결 신호가 포함되어야 한다.
엔지니어링 된 CRISPR/Cas12f1 조성물
본 명세서에서는 상기 CRISPR 유전자 조절 복합체의 각 구성요소, 또는 이를 암호화하는 핵산을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물을 개시한다. 구체적으로, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 엔지니어링 된 Cas12f1 단백질 또는 상기 Cas12f1 단백질을 암호화하는 핵산, 및 가이드 RNA 및 상기 가이드 RNA를 암호화하는 핵산을 포함한다. 여기서, 상기 엔지니어링 된 Cas12f1 단백질은 dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및 dCas12f1-발현조절 융합 단백질 중 선택된 것이며, 위의 각 단락에서 설명된 바와 같다. 상기 가이드 RNA는 《가이드 RNA》 단락에서 설명된 바와 같다. 상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 구성요소 외 적절한 추가 구성요소를 더 포함할 수있다.
엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 유전자 조절 방법 - 공통
CRISPR 복합체를 이용한 유전자 조절 방법 - 개괄
본 명세서에서는 상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 이용하여 세포 내 표적 유전자를 조절하는 방법을 개시한다. 여기서, 상기 "유전자 조절"은 유전자의 절단, 돌연변이 발생 촉진, 염기교정, 유전자 발현 촉진, 유전자 발현 저해 등, 인위적으로 일어나는 유전자 조작 및 기능조절 등을 통틀어 지칭하며, 특정 방법으로 제한되지 않는다. 따라서, 이하 "유전자 조절 방법"이라 함은, 표적 유전자에 대한 염기교정 방법, 표적 유전자의 발현을 조절하는 방법, 기타 유전자 조절 방법을 포괄하여 지칭하는 것으로 이해해야 한다.
본 명세서에서는 1) 상기 dCas12f1-염기교정 융합 단백질을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 표적 유전자 염기교정 방법, 및 2) 상기 dCas12f1-발현조절 융합 단백질을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 표적 유전자 발현조절 방법을 구체적으로 개시한다.
상기 발명은 모두 상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 대상 세포에 도입, 전달, 투여 및/또는 주입하는 것을 포함하는 바, 이하 공통적인 방법 부분을 설명한 후, 염기교정 방법, 발현조절 방법을 나누어 설명한다.
대상세포
일 구현예로, 상기 대상 세포는 원핵 세포일 수 있다. 일 구현예로, 상기 대상 세포는 진핵 세포일 수 있다. 구체적으로, 상기 진핵 세포는 식물 세포, 동물 세포, 및/또는 인간 세포일 수 있으나, 이에 제한되지 않는다.
표적 서열 결정
CRISPR 염기교정 복합체로 교정하고자 하는 표적 유전자, 및/또는 CRISPR 발현조절 복합체로 발현을 조절하고자 하는 표적 유전자는 그 목적, 대상 세포 환경, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 엔지니어링 된 Cas12f1 단백질이 인식하는 PAM 서열, 및/또는 기타 변수를 고려하여 결정할 수 있다. 이때, 표적 유전자 내에 존재하는 적절한 길이의 표적 서열을 결정할 수 있다면, 그 방법은 특별히 제한되지 않으며, 공지된 기술을 활용할 수 있다.
표적 서열에 따른 스페이서 서열 결정
상기 표적 서열이 결정되고 나면, 이에 대응하는 스페이서 서열을 설계한다. 상기 스페이서 서열은 상기 표적 서열과 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 유전자와 상보적으로 결합할 수 있는 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산과 상보적으로 결합할 수 있도록 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 표적 가닥 서열에 포함된 표적 서열과 상보적인 서열로 설계된다. 일 구현예로, 상기 스페이서 서열은 상기 표적 핵산의 비표적 가닥 서열에 포함된 프로토스페이서의 DNA 서열에 상응하는 RNA 서열로 설계된다. 구체적으로, 상기 스페이서 서열은, 상기 프로토스페이서 서열과 동일한 염기 서열을 가지되, 상기 염기 서열에 포함된 티미딘 각각이 모두 유리딘으로 치환된 서열로 설계된다.
표적 서열과 스페이서 서열의 상보성
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 바로 이전 문장에서 선택된 수치 범위 내 상보적인 서열일 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 60% 내지 90% 상보적인 서열일 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 90% 내지 100% 상보적인 서열일 수 있다.
표적 서열과 스페이서 서열 간 미스매치 개수
일 구현예로, 상기 스페이서 서열은 상기 표적 서열과 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 또는 10개의 미스매치를 가지는 상보적인 서열일 수 있다. 일 구현예로, 상기 스페이서 서열은 바로 이전 문장에서 선택된 수치 범위 내의 미스매치를 가질 수 있다. 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 1개 내지 5개의 미스매치를 가질 수 있다. 또 다른 예를 들어, 상기 스페이서 서열은 상기 표적 서열과 6개 내지 10개의 미스매치를 기질 수 있다.
엔지니어링 된 Cas12f1-가이드 RNA 복합체 각 구성 요소의 세포 내 전달
본 명세서에서 제공하는 유전자 조절 방법은 대상 세포 내에서 CRISPR 유전자 조절 복합체가 표적 유전자와 접촉하는 것을 전제로 한다. 따라서, 상기 CRISPR 유전자 조절 복합체가 상기 표적 유전자와 접촉하는 것을 유도하기 위해, 상기 유전자 조절 방법은 상기 CRISPR 유전자 조절 복합체의 각 구성요소를 대상 세포 내에 전달하는 것을 포함한다.
일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 및 엔지니어링 된 Cas12f1 단백질을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA를 암호화하는 핵산 및 엔지니어링 된 Cas12f1 단백질을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA를 암호화하는 핵산 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산을 대상 세포 내에 전달하는 것을 포함할 수 있다. 가이드 RNA 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산은 다양한 전달 형태로, 다양한 전달 방법을 이용하여 대상 세포 내에 전달될 수 있다.
전달 형태 1 - RNP
상기 전달 형태로, 가이드 RNA 및 엔지니어링 된 Cas12f1 단백질이 결합한 리보뉴클레오프로틴(Ribonucleoprotein, RNP)를 이용할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 및 엔지니어링 된 Cas12f1 단백질이 결합한 CRISPR 유전자 조절 복합체를 대상 세포 내에 주입하는 것을 포함할 수 있다.
전달 형태 2 - 비바이러스 벡터
또 다른 전달 형태로, 가이드 RNA를 암호화하는 핵산 서열 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA를 암호화하는 핵산 서열 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 비바이러스 벡터는 플라스미드, 네이키드 DNA, DNA 복합체, 또는 mRNA일 수 있으나, 이에 제한되는 것은 아니다. 또 다른 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 비바이러스 벡터, 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제2 비바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 비바이러스 벡터 및 상기 제2 비바이러스 벡터는 각각 플라스미드, 네이키드 DNA, DNA 복합체, 및 mRNA로 이뤄진 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 3 - 바이러스 벡터
또 다른 전달 형태로, 가이드 RNA를 암호화하는 핵산 서열 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 이용할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA를 암호화하는 핵산 서열 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예로, 상기 바이러스 벡터는 아데노-연관 바이러스일 수 있다.
또 다른 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA를 암호화하는 핵산 서열을 포함하는 제1 바이러스 벡터, 및 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 서열을 포함하는 제2 바이러스 벡터를 대상 세포 내에 주입하는 것을 포함할 수 있다. 구체적으로, 상기 제1 바이러스 벡터 및 제2 바이러스 벡터는 각각 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택된 하나일 수 있으나, 이에 제한되는 것은 아니다.
전달 방법 1 - 일반적인 전달 수단
상기 전달 방법은, 세포 내로 가이드 RNA 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 적절한 전달 형태로 세포 내로 전달할 수 있는 것이라면 특별히 제한되지 않는다. 일 구현예로, 상기 전달 방법은 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 및/또는 일시적인 세포 압축 또는 스퀴징일 수 있다.
전달 방법 2 - 나노파티클
상기 전달 방법은, 상기 CRISPR 유전자 조절 시스템에 포함된 적어도 하나의 구성요소를 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 당업계 통상의 기술자가 적절히 선택할 수 있는 공지된 방법일 수 있다. 예를 들어, 상기 나노파티클 전달 방법은 (WO 2019/089820 A1)에 개시된 방법일 수 있으나, 이에 제한되는 것은 아니다.
일 구현예로, 상기 전달 방법은 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산 및/또는 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 일 구현예로, 상기 전달 방법은 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산, 제1 가이드 RNA 또는 이를 암호화하는 핵산, 및/또는 제2 가이드 RNA 또는 이를 암호화하는 핵산을 나노파티클을 이용하여 전달하는 것일 수 있다. 이때, 상기 전달 방법은 양이온성 리포좀법, 초산 리튬-DMSO, 지질-매개 형질감염(transfection), 인산칼슘 침전법(precipitation), lipofection, PEI(Polyethyleneimine)-매개 형질감염, DEAE-dextran 매개 형질감염, 및/또는 나노파티클-매개 핵산 전달(Panyam et., al Adv Drug Deliv Rev. 2012 Sep 13. pii: S0169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023 참조)일 수 있으나, 이에 제한되는 것은 아니다. 이때, 상기 CRISPR 유전자 조절 시스템의 구성 요소는 RNP, 비바이러스 벡터, 및/또는 바이러스 벡터 형태일 수 있다. 예를 들어, 상기 CRISPR 유전자 조절 시스템의 구성 요소는 각 구성요소를 암호화하는 mRNA 형태일 수 있으나, 이에 제한되는 것은 아니다.
전달 형태 및 방법 조합
상기 유전자 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성의 전달 형태 및/또는 전달 방법은 서로 동일하거나 상이할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 형태로 전달하고, 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산은 제2 전달 형태로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 형태 및 상기 제2 전달 형태는 각각 전술한 전달 형태 중 어느 하나일 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산은 제1 전달 방법으로 전달하고, 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산은 제2 전달 방법으로 전달하는 것을 포함할 수 있다. 이때, 상기 제1 전달 방법 및 상기 제2 전달 방법은 각각 전술한 전달 방법 중 어느 하나일 수 있다.
전달 순서
상기 유전자 발현 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내 전달하는 것을 포함하는데, 이때 상기 구성이 세포 내에 동시에 전달될 수 있지만, 시간차를 두고 순차적으로 전달될 수 있다.
일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 동시에 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 가이드 RNA 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산을 세포 내로 전달한 후, 시간 차를 두고 가이드 RNA를 세포 내로 전달하는 것을 포함할 수 있다.
CRISPR 유전자 조절 복합체가 표적 핵산과 접촉
본 명세서에서 개시하는 유전자 조절 방법에서, 표적 유전자의 발현 조절은 대상 세포 내에서 CRISPR 유전자 조절 복합체가 표적 유전자와 접촉하면서 이뤄진다. 따라서, 상기 유전자 발현 조절 방법은 CRISPR 유전자 조절 복합체가 대상 세포 내에서 접촉하도록 하거나, 접촉을 유도하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 CRISPR 유전자 조절 복합체가 대상 세포 내에서 표적 유전자와 접촉하는 것을 포함할 수 있다. 일 구현예로, 상기 유전자 발현 조절 방법은 CRISPR 유전자 조절 복합체가 대상 세포 내에서 표적 유전자와 접촉하도록 유도하는 것을 포함할 수 있다. 이때, 상기 유도는 상기 CRISPR 유전자 조절 복합체가 세포 내에서 표적 유전자와 접촉하도록 하는 방법이라면 특별히 제한되지 않는다. 일 구현예로, 상기 유도는 가이드 RNA 또는 이를 암호화하는 핵산, 및 엔지니어링 된 Cas12f1 단백질 또는 이를 암호화하는 핵산을 세포 내에 전달하는 것일 수 있다.
엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 염기교정 방법
염기교정 방법 개괄
상기 《엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 유전자 조절 방법》 단락에 기재된 유전자 방법에 있어서, 1) 표적 유전자에 포함된 특정 염기를 목적 염기로 교정하거나, 치환하거나, 바꾸는 것을 목적으로 하며, 2) 상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 엔지니어링 된 Cas12f1 단백질이 《dCas12f1-염기교정 융합 단백질》 단락에서 설명된 것이며, 3) 상기 표적 서열은 교정하고자 하는 특정 염기에 인접한 서열로 설계할 때, 상기 유전자 조절 방법은 엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 염기교정 방법으로 지칭될 수 있다.
상기 염기교정 방법의 수행 결과, 표적 유전자 내 특정 염기(예를 들어, 아데닌 또는 시토신)가 목적 염기(예를 들어, 구아닌으로 또는 티민)로 교정되게 된다.
염기교정 메커니즘 1 - 염기교정의 의미
본 명세서에서 개시하는 상기 염기교정 방법에 의해, 세포 내 표적 유전자의 특정 염기가 목적 염기로 교정되게 된다. 이하, 상기 교정되는 염기의 위치, 및 그 교정 범위에 대해 구체적으로 설명한다.
상기 표적 유전자가 이중가닥 DNA라 할 때, 표적 서열을 가지는 가닥을 표적가닥, PAM 서열 및 프로토스페이서 서열을 가지는 가닥을 비표적 가닥이라 한다. 상기 염기교정 방법에 의해, 세포 내에서 CRISPR 염기교정 복합체가 형성되고, 상기 CRISPR 염기교정 복합체가 표적 서열에 결합한다. 이때, 상기 표적 서열에 상보적인 서열인 상기 프로토스페이서 서열 (또는 이와 인접한 서열) 내 하나 이상의 특정 염기가 상기 CRISPR 염기교정 복합체에 의해 변형되게 된다. 그 후, 세포 고유의 염기 수선 기작에 의해, 상기 변형을 기초로 표적 유전자의 서열 내 염기서열의 변형이 일어나게 되는데, 이를 염기교정이라 일컫는다.
일 구현예로, 상기 염기교정은 상기 프로토스페이서 서열 내 하나 이상의 아데닌이 구아닌으로 변형된 것일 수 있다. 또 다른 구현예로, 상기 염기교정은 상기 프로토스페이서 서열 내 하나 이상의 시토신이 티민으로 변형된 것일 수 있다.
염기교정 메커니즘 2 - 염기교정 범위
상기 염기교정이 일어나는 위치 범위는 상기 CRISPR 염기교정 복합체에 포함된 dCas12f1-염기교정 융합 단백질의 구성 및 종류에 따라 다를 수 있다. 여기서, 상기 염기교정이 일어날 수 있는 위치 범위를 교정 윈도우(editing window)라 지칭할 수 있다.
본 명세서에서 개시하는 염기교정 방법에서 상기 교정 윈도우는 달리 서술되지 않는 한, 프로토스페이서 서열의 5'말단의 염기를 1번 위치 (첫번째 위치)로 하여, 3'말단 방향(다운스트림 방향)으로 2번 위치 (두 번째 위치), 3번 위치 (세 번째 위치), n번 위치 (n번째 위치, n은 자연수)로 지칭할 수 있다. 필요한 경우, 프로토스페이서 서열의 5'말단의 염기를 1번 위치 (첫번째 위치)로 하여, 5'말단 방향(업스트림 방향)으로 0번 위치 (PAM 서열의 3'말단 염기), -1번 위치, -2번 위치, n번 위치(n은 0이 아닌 음수)로 지칭할 수 있다.
일 구현예로, 상기 염기교정 방법의 수행 결과 프로토스페이서 서열의 5'말단의 염기를 1번 위치로 하여, 3'말단 방향으로 1번, 2번, 3번, 4번, 5번, 6번, 7번, 8번, 9번, 10번, 11번, 12번, 13번, 14번, 15번, 16번, 17번, 18번, 19번, 20번, 21번, 22번, 23번, 24번, 25번, 26번, 27번, 28번, 29번, 30번, 31번, 32번, 33번, 34번, 35번, 36번, 37번, 38번, 39번, 40번, 41번, 42번, 43번, 44번, 45번, 46번, 47번, 48번, 49번, 또는 50번 위치의 염기가 교정될 수 있다. 여기서, 염기교정 윈도우는 바로 이전 문장에서 선택된 두 개의 수치범위로 구성된 위치 범위일 수 있다. 예를 들어, 상기 염기교정 윈도우는 2번 내지 8번 위치 범위일 수 있다. 일 구현예로, 상기 염기교정은 상기 염기교정 윈도우 내 하나 이상의 아데닌이 구아닌으로 변형되는 것일 수 있다. 또 다른 구현예로, 상기 염기교정은 상기 염기교정 윈도우 내 하나 이상의 시토신이 티민으로 변형되는 것일 수 있다.
염기교정 메커니즘 3 - 교정 되는 염기의 개수
상기 염기교정은 1개의 염기가 변형되는 것에 국한되지 않으며, 2개, 3개, 4개, 또는 5개 이상의 염기가 동시에 변형될 수 있다.
일 구현예로, 상기 염기교정은 프로토스페이서 서열의 5'말단 염기를 기준으로, 3'말단 방향의 2번 내지 8번 위치의 염기교정 윈도우 내 하나 이상의 아데닌이 구아닌으로 변형되는 것일 수 있다. 또 다른 구현예로, 상기 염기교정은 프로토스페이서 서열의 5'말단 염기를 기준으로, 3'말단 방향의 3번 내지 5번 위치의 염기교정 윈도우 내 하나 이상의 시토신이 티민으로 변형되는 것일 수 있다.
염기교정 방법 수행 결과
본 명세서에서 제공하는 염기교정 방법의 수행 결과, 표적 유전자에 포함된 프로토스페이서, 또는 상기 프로토스페이서와 인접한 핵산, 및/또는 표적 서열과 인접한 핵산 내예 특정 염기가 목적 염기로 교정되거나, 치환되거나, 바뀌게 된다.
일 구현예로, 상기 특정 염기가 목적 염기로 교정되는 것은, 아데닌이 구아닌으로 교정되는 것일 수 있다. 일 구현예로, 상기 특정 염기가 목적 염기로 교정되는 것은, 시토신이 티민으로 교정되는 것일 수 있다.
엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 유전자 발현조절 방법
유전자 발현조절 방법 개괄
상기 《엔지니어링 된 CRISPR/Cas12f1 조성물을 이용한 유전자 조절 방법》 단락에 기재된 유전자 방법에 있어서, 1) 표적 유전자의 발현을 촉진/활성화하거나, 저해/비활성화하는 것을 목적으로 하며, 2) 상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 엔지니어링 된 Cas12f1 단백질이 《dCas12f1-발현조절 융합 단백질》 단락에서 설명된 것이며, 3) 상기 표적 서열은 발현을 조절하고자 하는 표적 유전자, 또는 이와 인접한 핵산으로 설계할 때, 상기 유전자 조절 방법은 CRISPR/Cas12f1 조성물을 이용한 유전자 발현조절 방법으로 지칭될 수 있다.
상기 염기교정 방법의 수행 결과, 표적 유전자의 발현이 촉진(또는 증가) 또는 억제(또는 저해)될 수 있다.
유전자 발현조절 방법 수행 결과
본 명세서에서 제공하는 유전자 발현 조절 방법의 수행 결과로, 표적 유전자의 발현이 촉진(또는 증가) 또는 억제(또는 저해)될 수 있다. 이때, 상기 발현은 표적 유전자의 mRNA로의 전사를 의미할 수 있다. 일반적으로, 표적 유전자의 발현이 촉진(또는 증가)되면, 해당 유전자의 mRNA의 발현양이 증가하고 해당 유전자에 의해 암호화된 단백질의 생산이 증가된다. 또한, 표적 유전자의 발현이 억제(또는 저해)되면, 해당 유전자의 mRNA의 발현양이 감소하고 해당 유전자에 의해 암호화된 단백질의 생산이 감소된다. 일 구현예로, 상기 유전자 발현 조절 방법의 수행 결과, 표적 유전자에 의해 암호화된 단백질의 생산이 증가 또는 감소될 수 있다.
발명의 가능한 실시예
이하 본 명세서에서 제공하는 발명의 가능한 실시예들을 나열한다. 본 단락에서 제공하는 이하의 실시예들은 단지 발명의 일 예시에 해당될 뿐이다. 따라서, 본 명세서에서 제공하는 발명을 하기 실시예로 제한하여 해석할 수 없다. 실시예 번호와 함께 기재된 간략한 설명 또한, 각 실시예 간 구분의 편의를 위한 것일 뿐 본 명세서에서 개시하는 발명에 대한 제한으로 해석될 수 없다.
Dead Cas12f1 단백질
실시예 1, Dead Cas12f1, WT 기반
Dead Cas12f1 단백질,
여기서, 상기 Dead Cas12f1 단백질은 MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 1)로 표현되는 야생형 Cas12f1에서 다음 중 선택된 하나 이상의 아미노산이 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)으로 치환된 것임:
326번째 아스파르트산; 422번째 글루탐산; 490번째 아르기닌; 및 510번째 아스파르트산.
실시예 2, WT 기반, 서열한정
실시예 1에 있어서, 상기 Dead Cas12f1 단백질은 MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 2), MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 3), MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 4), MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 5), MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGWANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 6), MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASYVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 7), 및 MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGWANASYVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 8)중 선택된 아미노산 서열을 가짐.
실시예 3, Dead CAs12f1, 변이체 1 기반
Dead Cas12f1 단백질,
여기서, 상기 Dead Cas12f1 단백질은 MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 14)로 표현되는 Cas12f1 변이체 단백질에서 다음 중 선택된 하나 이상의 아미노산이 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)으로 치환된 것임:
354번째 아스파르트산; 450번째 글루탐산; 518번째 아르기닌; 및 538번째 아스파르트산.
실시예 4, 변이체 1 기반, 서열한정
실시예 3에 있어서, 상기 Dead Cas12f1 단백질은 MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 15), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 16), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 17), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 18), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGWANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 19), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASYVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 20), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGWANASYVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 21), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 22), MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 23), 및 MGEKSSRRRRNGKSGAWTAAITSCVGGKMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 24)중 선택된 아미노산 서열을 가짐.
실시예 5, Dead Cas12f1, 변이체 2 기반
Dead Cas12f1 단백질,
여기서, 상기 Dead Cas12f1 단백질은 MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 25)로 표현되는 Cas12f1 변이체 단백질에서 다음 중 선택된 하나 이상의 아미노산이 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)으로 치환된 것임:
354번째 아스파르트산; 450번째 글루탐산; 518번째 아르기닌; 및 538번째 아스파르트산.
실시예 6, 변이체 2 기반, 서열한정
실시예 5에 있어서, 상기 Dead Cas12f1 단백질은 MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 26), MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 27), MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 28), 및 MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 29)중 선택된 아미노산 서열을 가짐.
실시예 7, Dead Cas12f1, 변이체 3 기반
Dead Cas12f1 단백질,
여기서, 상기 Dead Cas12f1 단백질은 MAGGPGAGSAAPVSSTSSLPLAALNMMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 30)로 표현되는 Cas12f1 변이체 단백질에서 다음 중 선택된 하나 이상의 아미노산이 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)으로 치환된 것임:
352번째 아스파르트산; 448번째 글루탐산; 516번째 아르기닌; 및 536번째 아스파르트산.
실시예 8, 변이체 3 기반, 서열한정
실시예 7에 있어서, 상기 Dead Cas12f1 단백질은 MAGGPGAGSAAPVSSTSSLPLAALNMRVMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 31), MAGGPGAGSAAPVSSTSSLPLAALNMMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 32), MAGGPGAGSAAPVSSTSSLPLAALNMMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 33), 및 MAGGPGAGSAAPVSSTSSLPLAALNMMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 34)중 선택된 아미노산 서열을 가짐.
실시예 9, Dead Cas12f1, 변이체 4 기반
Dead Cas12f1 단백질,
여기서, 상기 Dead Cas12f1 단백질은 MEKRINKIRKKLSADNATKPVSRSGPMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 35)로 표현되는 야생형 Cas12f1에서 다음 중 선택된 하나 이상의 아미노산이 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)으로 치환된 것임:
352번째 아스파르트산; 448번째 글루탐산; 516번째 아르기닌; 및 536번째 아스파르트산.
실시예 10, 변이체 4 기반, 서열한정
실시예 9에 있어서, 상기 Dead Cas12f1 단백질은 MEKRINKIRKKLSADNATKPVSRSGPMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIAVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 36), MEKRINKIRKKLSADNATKPVSRSGPMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMANLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 37), MEKRINKIRKKLSADNATKPVSRSGPMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYAKKNKFPHFKCEKCNFKENADYNAALNISNPKLKSTKEEP(서열번호 38), 및 MEKRINKIRKKLSADNATKPVSRSGPMAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGIANASSVEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIDVGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMENLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYRKKNKFPHFKCEKCNFKENAAYNAALNISNPKLKSTKEEP(서열번호 39)중 선택된 아미노산 서열을 가짐.
실시예 11, Dead Cas12f1, 구조식 표현
다음 서열로 표현되는 Dead Cas12f1:
N-[더미서열]-[Dead Cas12f1]-C
여기서, 상기 더미서열은 1mer, 2mer, 3mer, 4mer, 5mer, 6mer, 7mer, 8mer, 9mer, 10mer, 11mer, 12mer, 13mer, 14mer, 15mer, 16mer, 17mer, 18mer, 19mer, 20mer, 21mer, 22mer, 23mer, 24mer, 25mer, 26mer, 27mer, 28mer, 29mer, 30mer, 31mer, 32mer, 33mer, 34mer, 35mer, 36mer, 37mer, 38mer, 39mer, 40mer, 41mer, 42mer, 43mer, 44mer, 45mer, 46mer, 47mer, 48mer, 49mer, 또는 50mer 길이의 아미노산 서열이고,
상기 Dead Cas12f1은 MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGX1ANASX2VEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIX3VGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMX4NLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYX5KKNKFPHFKCEKCNFKENAX6YNAALNISNPKLKSTKEEP(서열번호 9)의 아미노산 서열을 가지고,
여기서, 상기 X1은 이소류신 또는 트립토판, 상기 X2는 세린 또는 티로신이고,
상기 X3은 아스파르트산 또는 알라닌이고, 상기 X4는 글루탐산 또는 알라닌이고, 상기 X5는 아르기닌, 알라닌, 글루타민, 류신, 또는 트립토판이고, 상기 X6은 아스파르트산, 알라닌, 류신, 또는 발린이고,
여기서 상기 X3, X4, X5, 및 X6 중 적어도 하나는 알라닌, 글루타민, 류신, 트립토판, 또는 발린임.
실시예 12, 더미서열 한정
실시예 11에 있어서, 상기 더미 서열은 MGEKSSRRRRNGKSGAWTAAITSCVGGK(서열번호 10), MAGGPGAGSAAPVSSTSSLPLAALNMRV(서열번호 11), MAGGPGAGSAAPVSSTSSLPLAALNM(서열번호 12), 및 MEKRINKIRKKLSADNATKPVSRSGP(서열번호 13)중 선택된 것인 Dead Cas12f1.
염기교정 도메인
실시예 13, 탈아미노화효소
도메인 단백질을 1개, 2개, 3개, 4개, 또는 5개 이상 포함하는 염기교정 도메인,
여기서, 상기 도메인 단백질은 각각 독립적으로, 다음에서 선택된 단백질(폴리펩타이드)의 전부 또는 일부임:
대장균 (E. coli) 유래의 tRNA adenosine deaminase(TadA); 대장균 (E. coli) 유래의 tRNA adenosine deaminase(TadA)의 변이체; 인간 activation-induced cytidine deaminase(AID); 인간 APOBEC3G; 쥐 APOBEC1; APOBEC3A; APOBEC3B; CDA; AID; 및 칠성장어 PmCDA1.
실시예 14, 아데노신 탈아미노화효소
실시예 13에 있어서, 상기 도메인 단백질은 각각 독립적으로, 다음에서 선택된 단백질(폴리펩타이드)의 전부 또는 일부임:
대장균 (E. coli) 유래의 tRNA adenosine deaminase(TadA); 및 대장균 (E. coli) 유래의 tRNA adenosine deaminase(TadA)의 변이체,
여기서, 상기 도메인 단백질은 아데노신 탈아미노화효소로 지칭할 수 있음.
실시예 15, 아데노신 탈아미노화효소, 서열 한정
실시예 14에 있어서, 상기 TadA 및/또는 TadA의 변이체는 다음 중 선택된 아미노산 서열로 표현됨:
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD(서열번호 241); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호 242); MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAAIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD(서열번호 243); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAAIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호 244); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGWRNSKRGAAGSLMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSIN(서열번호 245); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGWRQSKRGAAGSLMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSIN(서열번호 246); MVEFSDEYWMRHALTLAKRARDEGEVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGQVLQNYRLIDATLYVTFEPCVMCAGAMIHSRIKRVVFGWRNSKRGAAGSLMNVLNHPGMNHRVEITEGVLADECAALLSDFFRMRRQQKKAQKK(서열번호 247); MVEFSDEYWMRHALTLAKRARDEGEVPVGAVLVLNNQVIGEGWNRSISLHDPTAHAEIMALRQGGQVLQNYRLIDCTLYVTFEPCVMCAGAMIHSRIKRVVFGWRNPKRGAAGSLMNVLNHPGMNHRIEITEGVLADECAAMLSDFFRMRRQQKKAQKK(서열번호 248); MVEFSDEYWMRHALTLAKRARDEGEVPVGAVLVLNNQVIGEGWNRSITHHDPTAHAEIMALRQGGQVLQNYRLIDCTLYVTFEPCVMCAGAMIHARIKRVVFGWRNPKRGAAGSVMNVLNHPGMNHRIEITEGVLADECAAMLSDFFRMRRQQKKAQKK(서열번호 249); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNSKRGAAGSLMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSIN(서열번호 250); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGWRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호 251); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGWRQAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호 252); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTD(서열번호 253); MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRQAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호 254); MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD(서열번호 255); 및 MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD(서열번호 256).
실시예 16, 아데노신 탈아미노화효소 구조, 마쿠시 형태
다음 구조로 표현되는 염기교정 도메인(아데노신 탈아미노화효소):
NH2-[Tad1]-[Linker]-[Tad2]-COOH
상기 Tad1은 서열번호 241 내지 서열번호 256 중 선택된 아미노산 서열을 가지는 제1도메인 단백질이고,
상기 Linker는 링커, 또는 부존재이고,
상기 Tad2는 서열번호 241 내지 서열번호 256 중 선택된 아미노산 서열을 가지는 제2도메인 단백질이거나, 부존재이고,
상기 Tad2가 부존재인 경우, 상기 Linker도 부존재임.
실시예 17, 마쿠시 형태, 링커 한정
실시예 16에 있어서, 상기 링커는 서열번호 260 내지 서열번호 273 중 선택된 아미노산 서열로 표현됨.
실시예 18, 시티딘 탈아미노화효소
실시예 13에 있어서, 상기 도메인 단백질은 각각 독립적으로, 다음에서 선택된 단백질(폴리펩타이드)의 전부 또는 일부임:
인간 activation-induced cytidine deaminase(AID); 인간 APOBEC3G; 쥐 APOBEC1; APOBEC3A; APOBEC3B; CDA; AID; 및 칠성장어 PmCDA1,
여기서, 상기 도메인 단백질은 시티딘 탈아미노화효소로 지칭할 수 있음.
실시예 19, 시티딘 탈아미노화효소, 서열 한정
실시예 18에 있어서, 상기 도메인 단백질은 다음 중 선택된 아미노산 서열을 가짐:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(서열번호 257); MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN(서열번호 258); 및 MNPQIRNPMERMYRDTFYDNFENEPILYGRSYTWLCYEVKIKRGRSNLLWDTGVFRGQVYFKPQYHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLSEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDYEEFAYCWENFVYNEGQQFMPWYKFDENYAFLHRTLKEILRYLMDPDTFTFNFNNDPLVLRRRQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPSQPWDGLEEHSQALSGRLRAILQNQGN(서열번호 259).
실시예 20, 아데노신/시티딘 탈아미노화효소 모두 포함
실시예 13에 있어서, 상기 염기교정 도메인은 2개 이상의 도메인 단백질을 포함하고,
여기서, 상기 염기교정 도메인은 실시예 14 내지 실시예 17 중 어느 하나의 아데노신 탈아미노화효소를 하나 이상 포함하고, 실시예 18 내지 실시예 19 중 어느 하나의 시티딘 탈아미노화효소를 하나 이상 포함함.
실시예 21, CBE, 실험예 구조 한정
실시예 20에 있어서, 상기 염기교정 도메인은 다음 중 선택된 구조임:
NH2-[ABE]-[Linker]-[CBE]-COOH; 및
NH2-[CBE]-[Linker]-[ABE]-COOH,
여기서, 상기 ABE는 실시예 14 내지 실시예 17 중 어느 하나의 아데노신 탈아미노화효소, 상기 CBE는 실시예 18 내지 실시예 19 중 어느 하나의 시티딘 탈아미노화효소, 상기 Linker는 링커 또는 부존재임.
실시예 22, 링커 추가
실시예13 내지 실시예21중 어느 하나에 있어서, 상기 염기교정 도메인은 하나 이상의 링커를 추가적으로 포함하고, 상기 링커는 상기 염기교정 도메인에 포함된 각각의 도메인 단백질 사이에 연결됨.
유전자 발현조절 도메인
실시예 23, 유전자 발현조절 도메인
도메인 단백질을 1개, 2개, 3개, 4개, 또는 5개 이상 포함하는 유전자 발현조절 도메인,
여기서, 상기 도메인 단백질은 각각 독립적으로, 다음에서 선택된 단백질(폴리펩타이드)의 전부 또는 일부임:
VP64; Sun Tag; VPR(VP64, p65, Rta); TV(TAL, VP64); KRAB; DNMT; MeCP2; HDAC; LSD; SRDX SALL1; 및 SDS3.
실시예 24, 세부 도메인 한정
실시예 23에 있어서, 상기 DNMT가 DNMT1, TRDMT1 및 DNMT3 중 선택된 것 이거나; 및/또는 상기 HDAC가 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10 및 HDAC11 중 선택된 것임.
실시예 25, 서열 한정
실시예 23에 있어서, 상기 유전자 발현조절 도메인은 상기 도메인 단백질을 하나 이상 포함하며, 상기 각각의 단백질 도메인은 독립적으로, 다음 중 선택된 아미노산 서열을 가짐:
MDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDML(서열번호 329); RTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLV(서열번호 330); VQVKRVLEKSPGKLLVKMPFQASPGGKGEGGGATTSAQVMVIKRPGRKRKAEADPQAIPKKRGRKPGSVVAAAAAEAKKKAVKESSIRSVQETVLPIKKRKTRETVSIEVKEVVKPLLVSTLGEKSGKGLKTCKSPGRKSKESSPKGRSSSASSPPKKEHHHHHHHAESPKAPMPLLPPPPPPEPQSSEDPISPPEPQDLSSSICKEEKMPRAGSLESDGCPKEPAKTQPMVAAAATTTTTTTTTVAEKYKHRGEGERKDIVSSSMPRPNREEPVDSRTPVTERVS(서열번호 331); PSRLQMFFANNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV(서열번호 332); 및 MAKTVAYFYDPDVGNFHYGAGHPMKPHRLALTHSLVLHYGLYKKMIVFKPYQASQHDMCRFHSEDYIDFLQRVSPTNMQGFTKSLNAFNVGDDCPVFPGLFEFCSRYTGASLQGATQLNNKICDIAINWAGGLHHAKKFEASGFCYVNDIVIGILELLKYHPRVLYIDIDIHHGDGVQEAFYLTDRVMTVSFHKYGNYFFPGTGDMYEVGAESGRYYCLNVPLRDGIDDQSYKHLFQPVINQVVDFYQPTCIVLQCGADSLGCDRLGCFNLSIRGHGECVEYVKSFNIPLLVLGGGGYTVRNVARCWTYETSLLVEEAISEELPYSEYFEYFAPDFTLHPDVSTRIENQNSRQYLDQIRQTIFENLKMLNHAPSVQIHDVPADLLTYDRTDEADAEERGPEENYSRPEAPNEFYDGDHDNDKESDVEI(서열번호 333).
실시예 26, 링커/NLS 포함
실시예23 내지 실시예25중 어느 하나에 있어서, 상기 유전자 발현조절 도메인은 하나 이상의 링커 및/또는 하나 이상의 nuclear localization signal (NLS)를 추가로 포함함.
실시예 27, 전사촉진 단백질 한정
실시예23 내지 실시예26중 어느 하나에 있어서, 상기 도메인 단백질은 VP64, Sun Tag, VPR(VP64, p65, Rta), 및 TV(TAL, VP64) 중 선택된 것임.
실시예 28, 전사저해 단백질 한정
실시예23 내지 실시예27중 어느 하나에 있어서, 상기 도메인 단백질은 KRAB, DNMT, MeCP2, HDAC, LSD, SRDX SALL1, 및 SDS3 중 선택된 것임.
기타 구성요소
실시예 29, NLS
다음 중 선택된 아미노산 서열로 표현되는 nuclear localization signal:
PKKKRKV(서열번호 200); KRPAATKKAGQAKKKK(서열번호 201); PAAKRVKLD(서열번호 202); RQRRNELKRSP(서열번호 203); NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호 204); RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호 205); VSRKRPRP(서열번호 206); PPKKARED(서열번호 207); PQPKKKPL(서열번호 208); SALIKKKKKMAP(서열번호 209); DRLRR(서열번호 210); PKQKKRK(서열번호 211); RKLKKKIKKL(서열번호 212); REKKKFLKRR(서열번호 213); KRKGDEVDGVDEVAKKKSKK(서열번호 214); 및 RKCLQAGMNLEARKTKK(서열번호 215).
실시예 30, 아미노산 링커
아미노산 링커로, 연결대상의 기능에 영향을 미치지 않는 것.
실시예 31, 아미노산 링커
실시예 30, 다음 중 선택된 아미노산 서열로 표현되는 링커:
SGGSSGGSSG(서열번호 260); SGGSSGGSSGSETP(서열번호 261); SGGSSGGSSGSETPGT(서열번호 262); SGGSSGGSSGSETPGTSESA(서열번호 263); SGGSSGGSSGSETPGTSESATPES(서열번호 264); SGGSSGGSSGSETPGTSESATPESSGGS(서열번호 265); SGGSSGGSSGSETPGTSESATPESSGGSSGGS(서열번호 266); SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGSE(서열번호 267); SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGSETPGT(서열번호 268); GGGGS(서열번호 269); EAAAK(서열번호 270); SGSETPGTSESATPES(서열번호 271); SGGS(서열번호 272); 및 SGGSKRTADGSEFE(서열번호 273).
실시예 32, Uracil Glycosylase Inhibitor
1개 이상의 uracil glycosylase inhibitor 도메인을 가지는 uracil glycosylase inhibitor,
여기서, 각각의 uracil glycosylase inhibitor 도메인은 각각 독립적으로, 다음 아미노산 서열 중 선택됨: TNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(서열번호 461).
실시예 33, 2개 이상의 UGI, 링커 포함
실시예 32에 있어서, 상기 uracil glycosylase inhibitor는 2개 이상의 uracil glycosylase inhibitor 도메인을 포함하고, 상기 uracil glycosylase inhibitor 도메인은 링커를 통해 연결됨.
가이드 RNA
실시예 34, 엔지니어링 된 tracrRNA, 자연계에서 발견되는 서열
다음 중 선택된 핵산 서열로 표현되는 엔지니어링 된 tracrRNA:
CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUUUUCCUCUCCAAUUCUGCACAA(서열번호 41); 및 CUUCACUGAUAAAGUGGAGAACCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGGGCUGCUUGCAUCAGCCUAAUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAACAAAUUCAUUU(서열번호 42).
실시예 35, 엔지니어링 된 tracrRNA, WT 기준
다음 서열로 표현되는 엔지니어링 된 tracrRNA:
5'-[제1서열]-[제2서열]-[제2서열]-[제2서열]-[제2서열]-3'
여기서, 상기 제1서열은 CAAAUUCANNNCNCCUCUCCAAUUCUGCACAA(서열번호 45), CAAAUUCANNNCNCCUCUCCAAUUCUGCACA(서열번호 46), CAAAUUCANNNCNCCUCUCCAAUUCUGCAC(서열번호 47), CAAAUUCANNNCNCCUCUCCAAUUCUGCA(서열번호 48), CAAAUUCANNNCNCCUCUCCAAUUCUGC(서열번호 49), CAAAUUCANNNCNCCUCUCCAAUUCUG(서열번호 50), CAAAUUCANNNCNCCUCUCCAAUUCU(서열번호 51), CAAAUUCANNNCNCCUCUCCAAUUC(서열번호 52), CAAAUUCANNNCNCCUCUCCAAUU(서열번호 53), CAAAUUCANNNCNCCUCUCCAAU(서열번호 54), CAAAUUCANNNCNCCUCUCCAA(서열번호 55), CAAAUUCANNNCNCCUCUCCA(서열번호 56), CAAAUUCANNNCNCCUCUCC(서열번호 57), CAAAUUCANNNCNCCUCUC(서열번호 58), CAAAUUCANNNCNCCUCU(서열번호 59), CAAAUUCANNNCNCCUC(서열번호 60), CAAAUUCANNNCNCCU(서열번호 61), CAAAUUCANNNCNCC(서열번호 62), CAAAUUCANNNCNC(서열번호 63), 및 CAAAUUCANNNCN(서열번호 64) 중 선택된 핵산 서열을 가지고,
상기 제2서열은 및 AUGUCGAGAAGUGCUUUCUUCGGAAAGUAACCCUCGAAA(서열번호 65) 중 선택된 핵산 서열을 가지고,
상기 제3서열은 및 GGCUGCUUGCAUCAGCCUA(서열번호 66) 중 선택된 핵산 서열을 가지고,
상기 제4서열은 CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUG(서열번호 67), CCGCUUCACCAAAAGCUGUCCUUAGGGAUUAGAACUUGAGUGAAGGUG(서열번호 68), CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUG(서열번호 69), CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUG(서열번호 70), CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUG(서열번호 71), CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUG(서열번호 72), CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUG(서열번호 73), CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUG(서열번호 74), CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUG(서열번호 75), CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUG(서열번호 76), CCGCUUCACCAAAUUAGCUUGAGUGAAGGUG(서열번호 77), CCGCUUCACCAAUUAGUUGAGUGAAGGUG(서열번호 78), CCGCUUCACCAUUAGUGAGUGAAGGUG(서열번호 79), CCGCUUCACCUUAGGAGUGAAGGUG(서열번호 80), CCGCUUCACUUAGAGUGAAGGUG(서열번호 81), CCGCUUCACUUAGGUGAAGGUG(서열번호 82), CCGCUUCAUUAGUGAAGGUG(서열번호 83), CCGCUUCUUAGGAAGGUG(서열번호 84), CCGCUUUUAGAAGGUG(서열번호 85), CCGCUUUAGAGGUG(서열번호 86), CCGCUUAGGGUG(서열번호 87), 및 CCGUUAGGUG(서열번호 88) 중 선택된 핵산 서열을 가지고,
상기 제5서열은 CUUCACUGAUAAAGUGGAGAA(서열번호 89), AAGUGGAGAA(서열번호 90), AAAGUGGAGAA(서열번호 91), UAAAGUGGAGAA(서열번호 92), AUAAAGUGGAGAA(서열번호 93), GAUAAAGUGGAGAA(서열번호 94), UGAUAAAGUGGAGAA(서열번호 95), CUGAUAAAGUGGAGAA(서열번호 96), ACUGAUAAAGUGGAGAA(서열번호 97), CACUGAUAAAGUGGAGAA(서열번호 98), UCACUGAUAAAGUGGAGAA(서열번호 99), 및 UUCACUGAUAAAGUGGAGAA(서열번호 100) 중 선택된 핵산 서열을 가지며,
상기 엔지니어링 된 tracrRNA는 서열번호 41 내지 서열번호 42의 핵산 서열과는 상이한 것을 특징으로 함.
실시예 36, 링커 서열 치환
실시예 35에 있어서, 상기 제4서열 내 포함된 5'-UUAG-3' 서열이 5'-GAAA-3' 서열로 치환된 서열인 tracrRNA 스캐폴드 서열.
실시예 37, 엔지니어링 된 tracrRNA, MF 기준
다음 서열로 표현되는, 엔지니어링 된 tracrRNA 스캐폴드:
5'-[제1영역]-[제2영역]-[제3영역]-[제4영역]-3',
여기서, 상기 제1영역은 AAGUGGAGAA(서열번호 101), AAAGUGGAGAA(서열번호 102), UAAAGUGGAGAA(서열번호 103), AUAAAGUGGAGAA(서열번호 104), GAUAAAGUGGAGAA(서열번호 105), UGAUAAAGUGGAGAA(서열번호 106), CUGAUAAAGUGGAGAA(서열번호 107), ACUGAUAAAGUGGAGAA(서열번호 108), CACUGAUAAAGUGGAGAA(서열번호 109), UCACUGAUAAAGUGGAGAA(서열번호 110), UUCACUGAUAAAGUGGAGAA(서열번호 111), 및 CUUCACUGAUAAAGUGGAGAA(서열번호 112) 중 선택된 핵산 서열을 가지고,
상기 제2영역은 CCUUAGGUGG(서열번호 113), CCGUUAGGUGG(서열번호 114), CCGCUUAGGGUGG(서열번호 115), CCGCUUUAGAGGUGG(서열번호 116), CCGCUUUUAGAAGGUGG(서열번호 117), CCGCUUCUUAGGAAGGUGG(서열번호 118), CCGCUUCAUUAGUGAAGGUGG(서열번호 119), CCGCUUCACUUAGGUGAAGGUGG(서열번호 120), CCGCUUCACUUAGAGUGAAGGUGG(서열번호 121), CCGCUUCACCUUAGGAGUGAAGGUGG(서열번호 122), CCGCUUCACCAUUAGUGAGUGAAGGUGG(서열번호 123), CCGCUUCACCAAUUAGUUGAGUGAAGGUGG(서열번호 124), CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG(서열번호 125), CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG(서열번호 126), CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG(서열번호 127), CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG(서열번호 128), CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG(서열번호 129), CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG(서열번호 130), CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG(서열번호 131), CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG(서열번호 132), CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG(서열번호 133), 및 CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG(서열번호 134) 중 선택된 핵산 서열을 가지고,
상기 제3영역은 CCUUAGGUGG(서열번호 113), CCGUUAGGUGG(서열번호 114), CCGCUUAGGGUGG(서열번호 115), CCGCUUUAGAGGUGG(서열번호 116), CCGCUUUUAGAAGGUGG(서열번호 117), CCGCUUCUUAGGAAGGUGG(서열번호 118), CCGCUUCAUUAGUGAAGGUGG(서열번호 119), CCGCUUCACUUAGGUGAAGGUGG(서열번호 120), CCGCUUCACUUAGAGUGAAGGUGG(서열번호 121), CCGCUUCACCUUAGGAGUGAAGGUGG(서열번호 122), CCGCUUCACCAUUAGUGAGUGAAGGUGG(서열번호 123), CCGCUUCACCAAUUAGUUGAGUGAAGGUGG(서열번호 124), CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG(서열번호 125), CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG(서열번호 126), CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG(서열번호 127), CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG(서열번호 128), CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG(서열번호 129), CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG(서열번호 130), CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG(서열번호 131), CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG(서열번호 132), CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG(서열번호 133), 및 CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG(서열번호 134) 중 선택된 핵산 서열을 가지고,
상기 제4영역은 CCUUAGGUGG(서열번호 113), CCGUUAGGUGG(서열번호 114), CCGCUUAGGGUGG(서열번호 115), CCGCUUUAGAGGUGG(서열번호 116), CCGCUUUUAGAAGGUGG(서열번호 117), CCGCUUCUUAGGAAGGUGG(서열번호 118), CCGCUUCAUUAGUGAAGGUGG(서열번호 119), CCGCUUCACUUAGGUGAAGGUGG(서열번호 120), CCGCUUCACUUAGAGUGAAGGUGG(서열번호 121), CCGCUUCACCUUAGGAGUGAAGGUGG(서열번호 122), CCGCUUCACCAUUAGUGAGUGAAGGUGG(서열번호 123), CCGCUUCACCAAUUAGUUGAGUGAAGGUGG(서열번호 124), CCGCUUCACCAAAUUAGCUUGAGUGAAGGUGG(서열번호 125), CCGCUUCACCAAAAUUAGACUUGAGUGAAGGUGG(서열번호 126), CCGCUUCACCAAAAGUUAGAACUUGAGUGAAGGUGG(서열번호 127), CCGCUUCACCAAAAGCUUAGGAACUUGAGUGAAGGUGG(서열번호 128), CCGCUUCACCAAAAGCUUUAGAGAACUUGAGUGAAGGUGG(서열번호 129), CCGCUUCACCAAAAGCUGUUAGUAGAACUUGAGUGAAGGUGG(서열번호 130), CCGCUUCACCAAAAGCUGUUAGUUAGAACUUGAGUGAAGGUGG(서열번호 131), CCGCUUCACCAAAAGCUGUUUAGAUUAGAACUUGAGUGAAGGUGG(서열번호 132), CCGCUUCACCAAAAGCUGUCUUAGGAUUAGAACUUGAGUGAAGGUGG(서열번호 133), 및 CCGCUUCACCAAAAGCUGUCCCUUAGGGGAUUAGAACUUGAGUGAAGGUGG(서열번호 134) 중 선택된 핵산 서열을 가지며,
상기 엔지니어링 된 tracrRNA는 서열번호 41 내지 서열번호 42의 핵산 서열과는 상이한 것을 특징으로 함.
실시예 38, 엔지니어링 된 tracrRNA, 유사한 서열 포함
실시예34 내지 실시예37중 어느 하나의 tracrRNA 서열과 약 70% 이상, 약 71% 이상, 약 72% 이상, 약 73% 이상, 약 74% 이상, 약 75% 이상, 약 76% 이상, 약 77% 이상, 약 78% 이상, 약 79% 이상, 약 80% 이상, 약 81% 이상, 약 82% 이상, 약 83% 이상, 약 84% 이상, 약 85% 이상, 약 86% 이상, 약 87% 이상, 약 88% 이상, 약 89% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상 일치하거나(identical), 동일하거나(same), 매칭되거나(matched), 및/또는 동등한(equivalent) 서열을 가지는 Cas12a 단백질,
여기서, 용어 "약"의 의미는 《용어의 정의》의 "약" 단락에서 정의된 것과 같다.
실시예 39, 엔지니어링 된 crRNA direct repeat
다음 중 선택된 핵산 서열로 표현되는 엔지니어링 된 crRNA direct repeat:
GUUGCAGAACCCGAAUAGACGAAUGAAGGAAUGCAAC(서열번호 43); 및 GAAUGAAGGAAUGCAAC(서열번호 44).
실시예 40, 엔지니어링 된 crRNA direct repeat, WT 기준
다음 서열로 표현되는 엔지니어링 된 crRNA direct repeat:
5'-[제6서열]-[제7서열]-3'
여기서, 상기 제6서열은 GUUGCAGAACCCGAAUAGNBNNNUGAAGGA(서열번호 158), GUUGCAGAACCCGAAUAGNGNNNUGAAGGA(서열번호 159), UUGCAGAACCCGAAUAGNGNNNUGAAGGA(서열번호 160), UGCAGAACCCGAAUAGNGNNNUGAAGGA(서열번호 161), GCAGAACCCGAAUAGNGNNNUGAAGGA(서열번호 162), CAGAACCCGAAUAGNGNNNUGAAGGA(서열번호 163), AGAACCCGAAUAGNGNNNUGAAGGA(서열번호 164), GAACCCGAAUAGNGNNNUGAAGGA(서열번호 165), AACCCGAAUAGNGNNNUGAAGGA(서열번호 166), ACCCGAAUAGNGNNNUGAAGGA(서열번호 167), CCCGAAUAGNGNNNUGAAGGA(서열번호 168), CCGAAUAGNGNNNUGAAGGA(서열번호 169), CGAAUAGNGNNNUGAAGGA(서열번호 170), GAAUAGNGNNNUGAAGGA(서열번호 171), AAUAGNGNNNUGAAGGA(서열번호 172), AUAGNGNNNUGAAGGA(서열번호 173), UAGNGNNNUGAAGGA(서열번호 174), AGNGNNNUGAAGGA(서열번호 175), 및 NGNNNUGAAGGA(서열번호 176) 중 선택된 핵산 서열을 가지고,
상기 제7서열은 5'-AUGCAAC-3'이며,
여기서, 상기 각각의 N은 독립적으로 A, C, G, 또는 U임.
실시예 41, 엔지니어링 된 crRNA direct repeat, MF 기준
다음 서열로 표현되는 엔지니어링 된 crRNA direct repeat:
5'-[제5영역]-[제6영역]-3'
여기서, 상기 제5영역은 GAAUGAAGGA(서열번호 177), CGAAUGAAGGA(서열번호 178), ACGAAUGAAGGA(서열번호 179), GACGAAUGAAGGA(서열번호 180), AGACGAAUGAAGGA(서열번호 181), UAGACGAAUGAAGGA(서열번호 182), AUAGACGAAUGAAGGA(서열번호 183), AAUAGACGAAUGAAGGA(서열번호 184), GAAUAGACGAAUGAAGGA(서열번호 185), CGAAUAGACGAAUGAAGGA(서열번호 186), CCGAAUAGACGAAUGAAGGA(서열번호 187), CCCGAAUAGACGAAUGAAGGA(서열번호 188), ACCCGAAUAGACGAAUGAAGGA(서열번호 189), AACCCGAAUAGACGAAUGAAGGA(서열번호 190), GAACCCGAAUAGACGAAUGAAGGA(서열번호 191), AGAACCCGAAUAGACGAAUGAAGGA(서열번호 192), CAGAACCCGAAUAGACGAAUGAAGGA(서열번호 193), GCAGAACCCGAAUAGACGAAUGAAGGA(서열번호 194), UGCAGAACCCGAAUAGACGAAUGAAGGA(서열번호 195), 및 UUGCAGAACCCGAAUAGACGAAUGAAGGA(서열번호 196) 중 선택된 핵산 서열을 가지고,
상기 제6영역은 5'-AUGCAAC-3'이고,
상기 서열은 서열번호 43 내지 서열번호 44의 핵산 서열과는 상이한 것을 특징으로 함.
실시예 42, 유사한 서열 포함
실시예39 내지 실시예41중 어느 하나의 crRNA direct repeat 서열과 약 70% 이상, 약 71% 이상, 약 72% 이상, 약 73% 이상, 약 74% 이상, 약 75% 이상, 약 76% 이상, 약 77% 이상, 약 78% 이상, 약 79% 이상, 약 80% 이상, 약 81% 이상, 약 82% 이상, 약 83% 이상, 약 84% 이상, 약 85% 이상, 약 86% 이상, 약 87% 이상, 약 88% 이상, 약 89% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상 일치하거나(identical), 동일하거나(same), 매칭되거나(matched), 및/또는 동등한(equivalent) 서열을 가지는 Cas12a 단백질,
여기서, 용어 "약"의 의미는 《용어의 정의》의 "약" 단락에서 정의된 것과 같다.
실시예 43, U-rich tail
다음 중 선택된 서열로 표현되는 U-rich tail:
5'-(UaN)dUe-3';
5'-UaVUaVUe-3'; 및
5'-UaVUaVUaVUe-3',
여기서, 상기 N은 A, C, G 또는 U이고, 상기 각각의 V는 각각 독립적으로 A, C 또는 G이며,
상기 a는 0 내지 4의 정수이고, 상기 d는 0 내지 3의 정수이며, 상기 e는 1 내지 10의 정수임.
실시예 44, U-rich tail 서열 예시
실시예 43에 있어서, 상기 U-rich tail은 다음 중 선택된 핵산 서열을 가짐:
UUURUUU(서열번호 216); UUURUUURUUU(서열번호 217); UUUURU(서열번호 218); UUUURUU(서열번호 219); UUUURUUU(서열번호 220); UUUURUUUU(서열번호 221); UUUURUUUUU(서열번호 222); UUUURUUUUUU(서열번호 223); UUUAUUU(서열번호 224); UUUAUUUAUUU(서열번호 225); UUUUAU(서열번호 226); UUUUAUU(서열번호 227); UUUUAUUU(서열번호 228); UUUUAUUUU(서열번호 229); UUUUAUUUUU(서열번호 230); UUUUAUUUUUU(서열번호 231); UUUGUUU(서열번호 232); UUUGUUUGUUU(서열번호 233); UUUUGU(서열번호 234); UUUUGUU(서열번호 235); UUUUGUUU(서열번호 236); UUUUGUUUU(서열번호 237); UUUUGUUUUU(서열번호 238); UUUUGUUUUUU(서열번호 239); 및 UUUUUU(서열번호 240).
실시예 45, 가이드 RNA
다음을 포함하는 가이드 RNA:
엔지니어링 된 tracrRNA, 및 엔지니어링 된 crRNA direct repeat를 포함하는 스캐폴드;
스페이서(가이드 도메인); 및
선택적으로, U-rich tail,
여기서, 스캐폴드는 실시예중 어느 하나의 dead Cas12f1 단백질, 실시예중 어느 하나의 dCas12f1-염기교정 융합 단백질, 및/또는 실시예중 어느 하나의 dCas12f1-발현조절 융합 단백질과 상호작용하여 복합체를 이룰 수 있는 것이고,
상기 스페이서는 미리 결정된 표적 서열과 상보적으로 결합할 수 있도록 설계된 것이고,
상기 U-rich tail은 서열 내 유리딘(U)을 풍부하게 함유하는 것이며,
5'말단에서 3'말단 방향으로 상기 스캐폴드, 상기 스페이서, 및 상기 U-rich tail이 순차적으로 연결됨.
실시예 46, 스캐폴드, 두 분자의 핵산
실시예 45에 있어서,
상기 스캐폴드의 엔지니어링 된 tracrRNA 및 상기 스캐폴드의 엔지니어링 된 crRNA direct repeat는 별개의 핵산 분자이며,
상기 엔지니어링 된 tracrRNA의 일부 및 상기 엔지니어링 된 crRNA direct repeat이 상보적으로 결합되어 있고,
상기 엔지니어링 된 crRNA direct repeat의 3'말단 부분이 상기 스페이서의 3'말단 부분과 연결된 가이드 RNA.
실시예 47, 스캐폴드, 한 분자의 핵산
실시예 45에 있어서,
상기 스캐폴드의 엔지니어링 된 tracrRNA의 3'말단 및 상기 스캐폴드의 엔지니어링 된 crRNA direct repeat의 3'말단이 링커를 통해 연결되어 있으며,
상기 엔지니어링 된 crRNA direct repeat의 3'말단 부분이 상기 스페이서의 3'말단 부분과 결합된 가이드 RNA.
실시예 48, 링커 한정
실시예 47에 있어서, 상기 링커는 5'-GAAA-3'인 가이드 RNA.
실시예 49, 엔지니어링 된 tracrRNA 한정
실시예45 내지 실시예48중 어느 하나에 있어서,
상기 엔지니어링 된 tracrRNA는 실시예34 내지 실시예38중 어느 하나의 tracrRNA인 가이드 RNA.
실시예 50, 엔지니어링 된 crRNA direct repeat 한정
실시예45 내지 실시예49중 어느 하나에 있어서,
상기 엔지니어링 된 crRNA direct repeat는 실시예39 내지 실시예42중 어느 하나의 crRNA direct repeat인 가이드 RNA.
실시예 51, U-rich tail 한정
실시예45 내지 실시예50중 어느 하나에 있어서,
상기 U-rich tail은 실시예43 내지 실시예44중 어느 하나의 U-rich tail인 가이드 RNA.
실시예 52, 유사한 서열 포함
실시예45 내지 실시예51중 어느 하나의 가이드 RNA 서열과 약 70% 이상, 약 71% 이상, 약 72% 이상, 약 73% 이상, 약 74% 이상, 약 75% 이상, 약 76% 이상, 약 77% 이상, 약 78% 이상, 약 79% 이상, 약 80% 이상, 약 81% 이상, 약 82% 이상, 약 83% 이상, 약 84% 이상, 약 85% 이상, 약 86% 이상, 약 87% 이상, 약 88% 이상, 약 89% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상 일치하거나(identical), 동일하거나(same), 매칭되거나(matched), 및/또는 동등한(equivalent) 서열을 가지는 Cas12a 단백질,
여기서, 용어 "약"의 의미는 《용어의 정의》의 "약" 단락에서 정의된 것과 같다.
실시예 53, 가이드 RNA를 암호화하는 DNA
실시예45 내지 실시예52중 어느 하나 중 어느 하나의 가이드 RNA를 암호화하는 DNA.
dCas12f1-염기교정 융합 단백질
실시예 54, dCas12f1-염기교정 융합 단백질
다음을 포함하는 dCas12f1-염기교정 융합 단백질:
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질; 및
하나 이상의, 실시예13 내지 실시예22중 어느 하나의 염기교정 도메인.
실시예 55, 아데닌 염기교정 유전자가위(ABE)
실시예 에 있어서, 상기 염기교정 도메인은 실시예 14 내지 실시예 17 중 어느 하나의 아데노신 탈아미노화효소임.
실시예 56, ABE, 구조 한정
실시예 55에 있어서, 상기 dCas12f1-염기교정 융합 단백질은 다음 중 선택된 구조임:
NH2-[dCas12f1]-[Linker]-[BE]-COOH; 및
NH2-[BE]-[Linker]-[dCas12f1]-COOH,
여기서, 상기 dCas12f1은 상기 dead Cas12f1 단백질이고, 상기 BE는 상기 아데노신 탈아미노화효소이며, 상기 Linker는 링커 또는 부존재임.
실시예 57, ABE, 서열 한정
실시예 56에 있어서, 상기 dCas12f1-염기교정 융합 단백질은 서열번호 284 내지 서열번호 324, 서열번호 418 내지 서열번호 442 중 선택된 아미노산 서열을 가짐.
실시예 58, 시티딘 염기교정 유전자가위(CBE)
실시예 54에 있어서, 상기 염기교정 도메인은 실시예 18 내지 실시예 22중 어느 하나의 시티딘 탈아미노화효소임.
실시예 59, CBE, 구조한정
실시예 58에 있어서, 상기 dCas12f1 염기교정 융합 단백질은 실시예32 내지 실시예33중 어느 하나의 uracil glycosylase inhibitor를 포함하고,
다음 중 선택된 구조임:
NH2-[UGI]-[Linker2]-[dCas12f1]-[Linker1]-[BE]-COOH; 및
NH2-[BE]-[Linker1]-[dCas12f1]-[Linker2]-[UGI]-COOH,
여기서, 상기 dCas12f1은 상기 dead Cas12f1 단백질이고, 상기 BE는 상기 아데노신 탈아미노화효소이며, 상기 Linker1은 제1링커 또는 부존재이고, 상기 Linker2는 제2링커 또는 부존재임.
실시예 60, CBE, 서열 한정
실시예 59에 있어서, 상기 dCas12f1-염기교정 융합 단백질은 서열번호 325 내지 서열번호 328중 선택된 아미노산 서열을 가짐.
실시예 61, NLS 추가 포함
실시예54 내지 실시예60중 어느 하나에 있어서,
상기 dCas12f1-염기교정 융합 단백질은 실시예 29의 NLS를 1개 이상 추가적으로 포함하고,
상기 NLS는 상기 dCas12f1-염기교정 융합 단백질의 N말단 및/또는 C말단에 위치하며,
상기 dCas12f1-염기교정 융합 단백질 및 NLS는 링커를 통해 연결되거나, 또는 직접 연결된 dCas12f1-염기교정 융합 단백질.
dCas12f1-발현조절 융합 단백질
실시예 62, dCas12f1-발현조절 도메인 융합 단백질
다음을 포함하는 dCas12f1-발현조절 융합 단백질:
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질; 및
하나 이상의, 실시예23 내지 실시예28중 어느 하나의 유전자 발현조절 도메인.
실시예 63, N terminal 모듈
실시예62중 어느 하나에 있어서, 상기 하나 이상의 유전자 발현조절 도메인이 상기 dead Cas12f1 단백질의 N말단에 연결된, dCas12f1-발현조절 융합 단백질.
실시예 64, N terminal, 추가 구성
실시예 63에 있어서,
상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 추가 도메인을 포함하고,
상기 추가 구성은 각각 독립적으로 링커, NLS, 및 태그 중 선택된 것이고,
상기 추가 구성은 다음 중 선택된 하나 이상의 위치에 연결된 dCas12f1-발현조절 융합 단백질:
dCas12f1-발현조절 융합 단백질의 N말단;
dCas12f1-발현조절 융합 단백질의 C말단;
상기 dead Cas12f1 단백질 및 상기 유전자 발현조절 도메인 사이; 및
상기 유전자 발현조절 도메인 및 다른 유전자 발현조절 도메인 사이.
실시예 65, 실험예 모듈 구조
실시예 63에 있어서, 상기 dCas12f1-발현조절 융합 단백질 다음 중 선택된 구조로 표현됨:
NH2-[NLS1]-[Linker1]-[Regulator1]-[Linker2]-[NLS2]-[dCas12f1]-[NLS3]-COOH;
NH2-[NLS1]-[Linker1]-[FLAG]-[Linker2]-[Regulator1]-[Linker3]-[NLS2]-[Linker4]-[dCas12f1]-[NLS3]-COOH; 및
NH2-[NLS1]-[Linker1]-[Regulator1]-[Linker2]-[NLS2]-[Regulator2]-[NLS3]-[Linker3]-[dCas12f1]-[NLS4]-COOH,
여기서, 상기 Linker1, Linker2, Linker3, 및 Linker4는 각각 독립적으로, 실시예30 내지 실시예31중 어느 하나의 링커, 또는 부존재이고,
상기 FLAG는 DYKDDDDK(서열번호 510) 또는 부존재이고,
상기 Regulator1 및 Regulator2는 각각 독립적으로, 실시예23 내지 실시예28중 어느 하나의 유전자 발현조절 도메인이고,
상기 dCas12f1은 실시예1 내지 실시예12중 어느 하나의 dead Cas12f1이고,
상기 NLS1, NLS2, NLS3 및 NLS4는 각각 독립적으로, 실시예29중 어느 하나의 NLS 또는 부존재임.
실시예 66, 실험예 한정
실시예 65에 있어서, 상기 dCas12f1-발현조절 융합 단백질은 다음 중 선택된 것임:
NH2-[NLS1]-[Linker1]-[Regulator1]-[Linker2]-[NLS2]-[dCas12f1]-[NLS3]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 KRAB이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨;
NH2-[NLS1]-[Linker1]-[FLAG]-[Linker2]-[Regulator1]-[Linker3]-[NLS2]-[Linker4]-[dCas12f1]-[NLS3]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 DNMT3A이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨; 및
NH2-[NLS1]-[Linker1]-[Regulator1]-[Linker2]-[NLS2]-[Regulator2]-[NLS3]-[Linker3]-[dCas12f1]-[NLS4]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 KRAB이고, 상기 Regulator2는 MeCP2이며, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨.
실시예 67, C terminal 모듈
실시예62 내지 실시예66중 어느 하나에 있어서, 상기 하나 이상의 유전자 발현조절 도메인이 상기 dead Cas12f1 단백질의 C말단에 연결된, dCas12f1-발현조절 융합 단백질.
실시예 68, C terminal, 추가 구성
실시예 67에 있어서,
상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 추가 도메인을 포함하고,
상기 추가 구성은 각각 독립적으로 링커, NLS, 및 태그 중 선택된 것이고,
상기 추가 구성은 다음 중 선택된 하나 이상의 위치에 연결된 dCas12f1-발현조절 융합 단백질:
dCas12f1-발현조절 융합 단백질의 N말단;
dCas12f1-발현조절 융합 단백질의 C말단;
상기 dead Cas12f1 단백질 및 상기 유전자 발현조절 도메인 사이; 및
상기 유전자 발현조절 도메인 및 다른 유전자 발현조절 도메인 사이.
실시예 69, 실험예 모듈 구조
실시예 67에 있어서, 상기 dCas12f1-발현조절 융합 단백질 다음 중 선택된 구조로 표현됨:
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-COOH;
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-[Linker3]-[NLS3]-[Regulator2]-COOH;
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-[Linker3]-[Regulator2]-COOH; 및
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-[Linker3]-[Regulator2]-[Linker4]-[NLS3]-[Regulator3]-COOH,
여기서, 상기 Linker1, Linker2, Linker3, 및 Linker4는 각각 독립적으로, 실시예30 내지 실시예31중 어느 하나의 링커, 또는 부존재이고,
상기 Regulator1, Regulator2, 및 Regulator3는 각각 독립적으로, 실시예23 내지 실시예28중 어느 하나의 유전자 발현조절 도메인이고,
상기 dCas12f1은 실시예1 내지 실시예12중 어느 하나의 dead Cas12f1이고,
상기 NLS1, NLS2, 및 NLS3는 각각 독립적으로, 실시예29중 어느 하나의 NLS 또는 부존재임.
실시예 70, 실험예 한정
실시예 69에 있어서, 상기 dCas12f1-발현조절 융합 단백질은 다음 중 선택된 것임:
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 KRAB이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨;
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 hHDAC3이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨;
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-[Linker3]-[NLS3]-[Regulator2]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 KRAB이고, 상기 Regulator2는 MeCP2이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨;
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-[Linker3]-[Regulator2]-COOH 구조로 표현되고,
여기서, 상기 Regulator1 및 Regulator2는 KRAB이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨; 및
NH2-[NLS1]-[Linker1]-[dCas12f1]-[NLS2]-[Linker2]-[Regulator1]-[Linker3]-[Regulator2]-[Linker4]-[NLS3]-[Regulator3]-COOH 구조로 표현되고,
여기서, 상기 Regulator1 및 Regulator2는 KRAB이고, 상기 Regulator3는 MeCP2이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨.
실시예 71, N/C terminal 모듈
실시예62 내지 실시예70중 어느 하나에 있어서,
상기 dCas12f1-발현조절 융합 단백질은 제1 유전자 발현조절 도메인 및 제2 유전자 발현조절 도메인을 포함하고,
상기 제1 유전자 발현조절 도메인은 상기 dead Cas12f1 단백질의 N말단에 연결되고,
상기 제2 유전자 발현조절 도메인은 상기 dead Cas12f1 단백질의 C말단에 연결된, dCas12f1-발현조절 융합 단백질.
실시예 72, N/C terminal, 추가 구성
실시예 71에 있어서,
상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 추가 도메인을 포함하고,
상기 추가 구성은 각각 독립적으로 링커, NLS, 및 태그 중 선택된 것이고,
상기 추가 구성은 다음 중 선택된 하나 이상의 위치에 연결된 dCas12f1-발현조절 융합 단백질:
dCas12f1-발현조절 융합 단백질의 N말단;
dCas12f1-발현조절 융합 단백질의 C말단;
상기 dead Cas12f1 단백질 및 상기 유전자 발현조절 도메인 사이; 및
상기 유전자 발현조절 도메인 및 다른 유전자 발현조절 도메인 사이.
실시예 73, 실험예 모듈 구조
실시예 71에 있어서, 상기 dCas12f1-발현조절 융합 단백질 다음 중 선택된 구조로 표현됨:
NH2-[NLS1]-[Linker1]-[FLAG]-[Linker2]-[Regulator1]-[Linker3]-[NLS2]-[Linker4]-[dCas12f1]-[NLS3]-[Regulator3]-COOH;
NH2-[NLS1]-[Linker1]-[Regulator1]-[Linker2]-[NLS2]-[Regulator2]-[NLS3]-[Linker3]-[dCas12f1]-[NLS4]-[Linker4]-[Regulator3]-COOH; 및
NH2-[NLS1]-[Regulator1]-[NLS2]-[Linker1]-[dCas12f1]-[NLS3]-[Linker2]-[Regulator3]-COOH,
여기서, 상기 Linker1, Linker2, Linker3, 및 Linker4는 각각 독립적으로, 실시예30 내지 실시예31중 어느 하나의 링커, 또는 부존재이고,
상기 FLAG는 "FLAG" 또는 부존재이고,
상기 Regulator1, Regulator2, 및 Regulator3는 각각 독립적으로, 실시예23 내지 실시예28중 어느 하나의 유전자 발현조절 도메인이고,
상기 dCas12f1은 실시예1 내지 실시예12중 어느 하나의 dead Cas12f1이고,
상기 NLS1, NLS2, NLS3, 및 NLS4는 각각 독립적으로, 실시예29중 어느 하나의 NLS 또는 부존재임.
실시예 74, 실험예 한정
실시예 73에 있어서, 상기 dCas12f1-발현조절 융합 단백질은 다음 중 선택된 것임:
NH2-[NLS1]-[Linker1]-[FLAG]-[Linker2]-[Regulator1]-[Linker3]-[NLS2]-[Linker4]-[dCas12f1]-[NLS3]-[Regulator3]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 KRAB이고, 상기 Regulator2는 MeCP2이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨;
NH2-[NLS1]-[Linker1]-[Regulator1]-[Linker2]-[NLS2]-[Regulator2]-[NLS3]-[Linker3]-[dCas12f1]-[NLS4]-[Linker4]-[Regulator3]-COOH 구조로 표현되고,
여기서, 상기 Regulator1 및 상기 Regulator3은 KRAB이고, 상기 Regulator2는 MeCP2이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨; 및
NH2-[NLS1]-[Regulator1]-[NLS2]-[Linker1]-[dCas12f1]-[NLS3]-[Linker2]-[Regulator3]-COOH 구조로 표현되고,
여기서, 상기 Regulator1은 MeCP2이고, 상기 Regulator2는 KRAB이고, 상기 dCas12f1은 서열번호 17 내지 서열번호 18 중 선택된 아미노산 서열로 표현됨.
실시예 75, 전사촉진 단백질
실시예62 내지 실시예74중 어느 하나에 있어서, 상기 발현조절 도메인은 실시예 27의 유전자 발현조절 도메인인, dCas12f1-발현조절 융합 단백질.
실시예 76, 전사저해 단백질
실시예62 내지 실시예75중 어느 하나에 있어서, 상기 발현조절 도메인은 실시예 28의 유전자 발현조절 도메인인, dCas12f1-발현조절 융합 단백질.
실시예 77, 도면 구조
도 39 내지 도 49에 나타난 구조의 dCas12f1-발현조절 융합 단백질,
여기서, 도면의 dTnpB는 실시예1 내지 실시예12중 어느 하나의 dead Cas12f1임.
엔지니어링 된 Cas12f1-가이드 RNA 복합체
실시예 78, 엔지니어링 된 Cas12f1-가이드 RNA 복합체
다음을 포함하는 엔지니어링 된 Cas12f1-가이드 RNA 복합체:
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질, 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질, 및 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질; 및
실시예45 내지 실시예52중 어느 하나의 가이드 RNA,
여기서, 상기 가이드 RNA의 스캐폴드는 상기 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 가이드 RNA의 스페이서는 미리 결정된 표적 서열을 표적할 수 있도록 설계된 것임.
실시예 79, dead Cas12f1 복합체
실시예 78에 있어서,,
상기 엔지니어링 된 Cas12f1 단백질은 실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질임.
실시예 80, 염기교정 복합체
실시예 78에 있어서,,
상기 엔지니어링 된 Cas12f1 단백질은 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질이고,
상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 염기교정 복합체로 지칭될 수 있음.
실시예 81, 발현조절 복합체
실시예 78에 있어서,,
상기 엔지니어링 된 Cas12f1 단백질은 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질이고,
상기 엔지니어링 된 Cas12f1 단백질-가이드 RNA 복합체는 발현조절 복합체로 지칭될 수 있음.
엔지니어링 된 Cas12f1 및 가이드 RNA를 암호화하는 벡터
실시예 82, 엔지니어링 된 Cas12f1 및 가이드 RNA를 암호화하는 벡터, 가이드 1종류
다음을 포함하는 엔지니어링 된 Cas12f1 및 가이드 RNA를 암호화하는 벡터:
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질, 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질, 및 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산; 및
실시예45 내지 실시예52중 어느 하나의 가이드 RNA를 암호화하는 핵산,
여기서, 상기 가이드 RNA의 스캐폴드는 상기 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 가이드 RNA의 스페이서는 미리 결정된 표적 서열을 표적할 수 있도록 설계된 것임.
실시예 83, 엔지니어링 된 Cas12f1 및 가이드 RNA를 암호화하는 벡터, 가이드 2종류
다음을 포함하는 엔지니어링 된 Cas12f1 및 가이드 RNA를 암호화하는 벡터:
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질, 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질, 및 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산;
실시예45 내지 실시예52중 어느 하나에서 선택된 제1 가이드 RNA를 암호화하는 핵산; 및
실시예45 내지 실시예52중 어느 하나에서 선택된 제2 가이드 RNA를 암호화하는 핵산,
여기서, 상기 각각의 제1 가이드 RNA 및 제2 가이드 RNA의 스캐폴드는 상기 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 각각의 제1 가이드 RNA 및 제2 가이드 RNA의 스페이서는 미리 결정된 표적 서열을 표적할 수 있도록 설계된 것임.
실시예 84, 벡터 개수
실시예82 내지 실시예83중 어느 하나에 있어서, 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 가이드 RNA를 암호화하는 핵산 모두가 1개 (1단위)의 벡터에 탑재된 것을 특징으로 하는 벡터.
실시예 85, 벡터 종류
실시예 에 있어서, 상기 벡터는 바이러스 벡터 또는 비-바이러스 벡터임.
실시예 86, 바이러스 벡터 종류
실시예 85에 있어서, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스, 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스 중 선택된 바이러스 벡터임.
실시예 87, 비-바이러스 벡터 종류
실시예 85에 있어서, 상기 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, PCR 앰플리콘(amplicon) 및 mRNA로 중 선택된 비-바이러스 벡터이고,
여기서, 선택적으로, 상기 플라스미드는 pcDNA 시리즈, pS456, pG1806, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19 중 선택된 것이고,
상기 선택적으로, 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13 중 선택된 것이다.
엔지니어링 된 CRISPR/Cas12f1 조성물
실시예 88, 엔지니어링 된 CRISPR/Cas12f1 조성물
다음을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물:
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질, 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질, 및 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질, 또는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산; 및
1개(1단위, 1종류, 1타입) 이상의, 실시예45 내지 실시예52중 어느 하나의 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,
여기서, 상기 각각의 가이드 RNA의 스캐폴드는 상기 엔지니어링 된 Cas12f1 단백질과 상호작용하여 복합체를 형성할 수 있고,
상기 각각의 가이드 RNA의 스페이서는 미리 결정된 표적 서열을 표적할 수 있도록 설계된 것임.
실시예 89, Ribonucleoprotein 포함
실시예 88에 있어서,
상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 엔지니어링 된 Cas12f1 단백질 및 1개의 가이드 RNA를 리보뉴클레오프로틴(Ribonucleoprotein; RNP) 형태로 포함함.
실시예 90, 암호화 핵산 포함
실시예 88에 있어서,
상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 1개 이상의 가이드 RNA를 암호화하는 핵산을 포함함.
실시예 91, Vector 포함
실시예 90에 있어서,, 실시예 91에 있어서, 상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 1개 이상의 가이드 RNA를 암호화하는 핵산을 실시예82 내지 실시예87중 어느 하나의 벡터 형태로 포함함.
실시예 92, 염기교정 조성물
실시예88 내지 실시예91중 어느 하나에 있어서,
상기 엔지니어링 된 Cas12f1 단백질은 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 융합 단백질이며,
상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 염기교정 조성물로 지칭될 수 있음.
실시예 93, ABE 조성물
실시예 92에 있어서,
상기 엔지니어링 된 Cas12f1 단백질은 실시예 55 내지 실시예 57 중 어느 하나의 아데노신 탈아미노화효소이고,
상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 아데닌 염기교정(adenine base editor;ABE) 조성물로 지칭될 수 있음.
실시예 94, ABE 조성물
실시예 92에 있어서,
상기 엔지니어링 된 Cas12f1 단백질은 실시예 58 내지 실시예 61 중 어느 하나의 아데노신 탈아미노화효소이고,
상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 시토신 염기교정(cytosine base editor;CBE) 조성물로 지칭될 수 있음.
실시예 95, 발현조절 조성물
실시예88 내지 실시예94중 어느 하나에 있어서,
상기 엔지니어링 된 Cas12f1 단백질은 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 융합 단백질이며,
상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 발현조절 조성물로 지칭될 수 있음.
엔지니어링 된 CRISPR/Cas12f1 시스템을 포함하는 약학적 조성물
실시예 96, 약학적 조성물 일반
다음을 포함하는, 암, 유전질환, 또는 감염질환을 치료하기 위한 약학적 조성물:
실시예88 내지 실시예95중 어느 하나의 CRISPR/Cas12f1 조성물; 및
약학적으로 허용되는 담체.
실시예 97, 담체 한정
실시예 96에 있어서, 상기 약학적으로 허용되는 담체는 다음 중 선택된 하나 이상임:
락토오스, 사카로오스, 솔비톨, 만니톨, 전분, 아밀로펙틴, 셀룰로오스 또는 젤라틴 등과 같은 결합제; 디칼슘 포스페이트 등과 같은 부형제; 옥수수 전분 또는 고구마 전분 등과 같은 붕해제; 스테아르산 마그네슘, 스테아르산 칼슘, 스테아릴 푸마르산 나트륨 또는 폴리에틸렌 글리콜 왁스 등과 같은 윤활유; 감미제; 방향제; 시럽제; 지방유와 같은 액체 담체; 멸균된 수용액; 프로필렌글리콜; 폴리에틸렌글리콜; 에틸올레이트와 같은 주사 가능한 에스테르; 현탁제; 유제; 동결 건조 제제; 외용제; 안정제; 완충제; 동물성 유; 식물성 유; 왁스; 파라핀; 전분; 트라칸트; 셀룰로오스 유도체; 폴리에틸렌 글리콜; 실리콘; 벤토나이트; 실리카; 탈크; 산화 아연.
표적 유전자 염기교정 방법
실시예 98, 염기교정 방법 1
다음을 포함하는, 세포의 표적 유전자에 포함된 염기를 교정하거나, 편집하거나, 치환하는 방법:
실시예 92 내지 실시예 94 중 어느 하나의 염기교정 조성물을 상기 세포에 전달하거나(deliver), 주입하거나(inject), 투여하는(administrate) 것,
여기서, 상기 염기교정 조성물의 가이드 RNA의 스페이서는 상기 세포의 상기 표적 유전자에 포함된 표적 서열을 표적화(target)하거나, 인식(recognize)하거나, 또는 상기 표적 서열과 결합(hybridize)할 수 있는 것임.
실시예 99, 염기교정 방법 2
다음을 포함하는, 세포의 표적 유전자에 포함된 염기를 교정하는 방법:
상기 세포 내에서 실시예 80의 염기교정 복합체 및 상기 표적 유전자의 접촉을 유도하는 것,
여기서, 상기 염기교정 조성물의 가이드 RNA의 스페이서는 상기 세포의 상기 표적 유전자에 포함된 표적 서열을 표적화(target)하거나, 인식(recognize)하거나, 또는 상기 표적 서열과 결합(hybridize)할 수 있는 것임.
실시예 100, 메커니즘 구체화
실시예98 내지 실시예99중 어느 하나에 있어서, , 상기 세포의 상기 표적 유전자는 이중가닥 DNA로, 표적 가닥 및 비-표적 가닥을 포함하고,
상기 표적 가닥은 상기 표적 서열을 가지며,
상기 비-표적 가닥은 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 및 프로토스페이서를 가지고,
상기 프로토스페이서는 상기 표적 서열에 상보적인 서열을 가지고,
상기 가이드 RNA의 스페이서는 상기 세포의 상기 표적 유전자에 포함된 표적 서열을 표적화(target)하거나, 인식(recognize)하거나, 또는 상기 표적 서열과 결합(hybridize)할 수 있는 것이며,
상기 염기교정 방법의 결과로, 상기 프로토스페이서에 포함되거나, 상기 프로토스페이서에 인접한 적어도 하나의 아데닌이 구아닌으로, 및/또는 적어도 하나의 시토신이 티민으로 교정되거나, 편집되거나, 치환됨.
실시예 101, ABE method
실시예98 내지 실시예100중 어느 하나에 있어서, 상기 염기교정 조성물은 실시예 93의 ABE 조성물이고,
상기 염기교정 방법의 결과로, 상기 프로토스페이서에 포함된 적어도 하나의 아데닌이 구아닌으로 교정되거나, 편집되거나, 치환됨.
실시예 102, ABE method, 염기교정 윈도우 한정
실시예 101에 있어서,
상기 표적 유전자의 상기 프로토스페이서는 5'말단으로부터 1번째, 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 10번째, 11번째, 12번째, 13번째, 14번째, 15번째, 16번째, 17번째, 18번째, 19번째, 20번째, 21번째, 22번째, 23번째, 24번째, 25번째, 26번째, 27번째, 28번째, 29번째, 또는 30번째 위치 중 적어도 하나 이상의 아데노신을 포함하고,
상기 염기교정 방법의 결과로, 상기 프로토스페이서에 포함된 적어도 하나의 상기 아데닌이 구아닌으로 교정되거나, 편집되거나, 치환됨.
실시예 103, CBE method
실시예 98 내지 실시예 100 중 어느 하나에 있어서, 상기 염기교정 조성물은 실시예 94의 CBE 조성물이고,
상기 염기교정 방법의 결과로, 상기 프로토스페이서에 포함된 적어도 하나의 시토신이 티민으로 교정되거나, 편집되거나, 치환됨.
실시예 104, ABE method, 염기교정 윈도우 한정
실시예 101에 있어서,
상기 표적 유전자의 상기 프로토스페이서는 5'말단으로부터 1번째, 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 10번째, 11번째, 12번째, 13번째, 14번째, 15번째, 16번째, 17번째, 18번째, 19번째, 20번째, 21번째, 22번째, 23번째, 24번째, 25번째, 26번째, 27번째, 28번째, 29번째, 또는 30번째 위치 중 적어도 하나 이상의 시토신을 포함하고,
상기 염기교정 방법의 결과로, 상기 프로토스페이서에 포함된 적어도 하나의 상기 시토신이 티민으로 교정되거나, 편집되거나, 치환됨.
표적 유전자 발현조절 방법
실시예 105, 발현조절 방법
다음을 포함하는, 세포의 표적 유전자의 발현을 조절하는 방법:
실시예중 어느 하나의 발현조절 조성물을 상기 세포에 전달하거나(deliver), 주입하거나(inject), 투여하는(administrate) 것,
여기서, 상기 염기교정 조성물의 가이드 RNA의 스페이서는 상기 세포의 상기 표적 유전자에 포함된 표적 서열을 표적화(target)하거나, 인식(recognize)하거나, 또는 상기 표적 서열과 결합(hybridize)할 수 있는 것임.
실시예 106, 방법 수행 결과
실시예 105에 있어서, 상기 발현조절 조성물의 도입 결과 세포 내 CRISPR 발현조절 복합체가 형성되고,
상기 CRISPR 발현조절 복합체에 의해 상기 표적 유전자의 발현이 조절됨.
실시예 107, 유전자 발현 촉진 방법
실시예 106에 있어서,
상기 발현조절 조성물은 실시예 75의 dCas12f1-발현조절 융합 단백질을 포함하고,
상기 CRISPR 발현조절 복합체는 CRISPR activation 복합체이며,
상기 CRISPR activation 복합체에 의해 상기 표적 유전자의 발현이 촉진됨.
실시예 108, 유전자 발현 저해 방법
실시예 106에 있어서,
상기 발현조절 조성물은 실시예 76의 dCas12f1-발현조절 융합 단백질을 포함하고,
상기 CRISPR 발현조절 복합체는 CRISPR interference 복합체이며,
상기 CRISPR interference 복합체에 의해 상기 표적 유전자의 발현이 저해됨.
엔지니어링 된 Cas12f1 단백질의 용도
실시예 109, 엔지니어링 된 Cas12f1 단백질의 용도
실시예1 내지 실시예12중 어느 하나의 dead Cas12f1 단백질, 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질, 및 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질의 유전자 조절 방법에 사용하는 용도.
실시예 110, 염기교정 용도 한정
실시예 109에 있어서, 상기 엔지니어링 된 Cas12f1 단백질은 실시예54 내지 실시예61중 어느 하나의 dCas12f1-염기교정 단백질 중 선택된 것이고,
상기 유전자 조절 방법은 실시예98 내지 실시예104중 어느 하나의 표적 유전자 염기교정 방법인, 엔지니어링 된 Cas12f1 단백질의 용도.
실시예 111, 발현조절 용도 한정
실시예 109에 있어서, 상기 엔지니어링 된 Cas12f1 단백질은 실시예62 내지 실시예77중 어느 하나의 dCas12f1-발현조절 단백질 중 선택된 것이고,
상기 유전자 조절 방법은 실시예105 내지 실시예108중 어느 하나의 표적 유전자 발현조절 방법인, 엔지니어링 된 Cas12f1 단백질의 용도.
발명의 실시를 위한 형태
이하, 실험예 및 실시예를 통해 본 명세서가 제공하는 발명에 대해 더욱 상세히 설명한다. 이들 실시예는 오로지 본 명세서에 의해 개시되는 내용을 예시하기 위한 것으로, 본 명세서에 의해 개시되는 내용의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실험예 1. 실험방법 및 재료
실험예 1.1. Cas12f1 단백질 제조
인간 세포에서 발현하기 위해, Cas12f1 유전자를 코돈-최적화 시켰으며(서열번호 460), 상기 최적화된 서열이 벡터 제조를 위해 합성되었다. 최종적으로 Cas12f1 단백질을 암호화하는 서열에는 chicken β-actin 프로모터, 5'- 및 3'-말단의 핵 위치 신호 서열(nuclear localization signal sequence), 자가 절단 T2A 펩타이드로 연결된 eGFP를 인코딩하는 서열이 부가되었다.
(엔지니어링 된) Cas12f1 가이드 RNA를 암호화하는 주형 DNA가 합성되었고, pTwist Amp plasmid vector (Twist Bioscience)에 클로닝되었다. 필요한 경우, 상기 벡터는 U6-상보적 forward primer 및 protospacer-상보적 reverse primer를 사용하여, 상기 가이드 RNA 암호화 서열의 증폭을 위한 주형으로 사용되었다. Gibson assembly를 사용하여, 상기 코돈-최적화된 Cas12f1 유전자를 포함하는 벡터에 엔지니어링 된 Cas12f1 가이드 RNA를 암호화하는 올리고뉴클레오타이드를 클로닝함으로써, 엔지니어링 된 CRISPR/Cas12f1 시스템에 대한 벡터를 제조하였다.
실험예 1.2. Dead Cas12f1 변이체 단백질 제조
실험예 1.1에 의해 제조된 Cas12f1을 발현하는 벡터를 mutagenesis 방법으로 Cas12f1을 dead 형태로 변형시켰고, 각 실험에 사용할 수 있는 다양한 Dead-Cas12f1 단백질을 제조했다. 각 Dead 형태에 따라 적절한 프라이머를 사용하였다 (각 실험예 참조).
실험예 1.3. 염기교정 도메인 융합 단백질 제조
각 실험에 사용할 염기교정 도메인 융합 단백질을 암호화하는 핵산 서열을 특정한 후, 다음과 같은 방법으로 염기교정 도메인 융합 단백질을 제조했다:
상기 암호화 핵산 서열을 pMAL-c2 플라스미드 벡터에 클로닝하여 복제시켰다. 상기 플라스미드 벡터를 이용하여 BL21(DE3) E. coli를 형질전환하였다. 상기 형질전환된 E. coli 콜로니를 광학 밀도가 0.7에 도달할 때까지 37℃의 LB broth에서 성장시켰다. 상기 형질전환된 E. coli는 0.1 mM isopropylthio-β-D-galactoside 존재 하, 18℃에서 하룻밤(overnight) 동안 배양되었다.
그 후, 상기 형질전환된 E. coli는 3,500g에서 30분간 원심분리되고 수집되었다. 수집된 형질전환된 E. coli는 20 mM Tris-HCl(pH 7.6), 500 mM NaCl, 5 mM β-mercaptoethanol, 5 % glycerol에서 재현탁되었다. 상기 재현탁된 E. coli는 용해되었고, sonication을 통하여 파쇄되었다. 파쇄된 E. coli가 포함된 샘플은 15,000g로 30분 간 원심분리 된 후, 상측액은 0.45 ㎛ 주사기 필터(Millipore)를 통해 여과되었다. 여과된 상층액 내에 존재하는 아데노신 탈아미노화효소 또는 시티딘 탈아미노화효소와 결합된 dCas12f1 단백질은 FPLC 정제 시스템(KTA Purifier, GE Healthcare)을 사용하여, Ni2+-친화성 컬럼에 로드되었다. 상기 로드된 dCas12f1 단백질은 80-400 mM imidazole, 20 mM Tris-HCl(pH 7.5) 구배에서 용출되었다.
상기 용출된 단백질은 TEV 프로테아제로 16시간 동안 처리되었다. 상기 분리된 단백질은 0.15-1.6 M NaCl 선형 농도구배의 Heparin 컬럼에서 정제되었다. Heparin 컬럼에서 정제된 재조합 Cas12f1 단백질은 20 mM Tris pH 7.6, 150 mM NaCl, 5 mM β-mercaptoethanol, 5 % glycerol에 대해 투석되었다. 상기 투석된 단백질은 MBP 컬럼을 통과시켜 정제후 0.5-1.2 M NaCl의 선형 구배로 monoS 컬럼(GE Healthcare) 또는 EnrichS에서 재정재되었다. 상기 재정재된 단백질들을 모아, 20 mM Tris pH 7.6, 150 mM NaCl, 5 mM β-mercaptoethanol, 5 % glycerol에 대해 투석하여 초소형 염기교정(Base editing) 구조물을 정제하였다. 상기 생산된 단백질의 농도는 소 혈청 알부민(BSA)을 표준으로 사용하여 Bradford 정량법을 이용하여 정량하여 coomassie blue-stained SDS-PAGE 겔에서 전기구형적 (electropheromerically)으로 측정되었다.
실험예 1.4. 유전자 발현조절 도메인 융합 단백질 제조
실험예 1.2에 의해 제조된 dead Cas12f1의 N말단 및/또는 C말단에 KRAB, MeCP2, DNMT3A 각각 또는 그 조합을 클로닝 하였다 (도 39 내지 도 49). template를 사용하여 KOD-one (TOYOBO)로 Vector와 Insert fragment를 증폭 후 Gibson Assembly® Master Mix (NEB)를 사용하여 protocol 대로 Ligation을 진행하였다. 각 vector, insert fragment 제작을 위해 사용한 template DNA와 프라이머는 다음 [표 1] 및 [표 2]에 나타내었다.
[표 1]
Figure pct00001
[표 2]
Figure pct00002
실험예 1.4. 가이드 RNA 제조
각 실험에 사용할 가이드 RNA의 핵산 서열을 특정한 후, 다음과 같은 방법으로 가이드 RNA를 제조했다:
상기 설계된 Cas12f1 sgRNA는 이를 제조하기 위해 미리 설계한 가이드 RNA를 화학적으로 합성하여 가이드 RNA를 제조한 후, 미리 설계한 가이드 RNA 서열 및 T7 프로모터 서열을 포함하는 PCR 앰플리콘을 제조했다.
엔지니어링된 Cas12f1 싱글 가이드 RNA의 3'-말단에 대한 U-rich tail 연결은 서열-변형된 프라이머(primer) 및 Cas12f1 가이드 RNA 플라스미드 벡터의 존재 하에서 Pfu PCR Master Mix5 (Biofact)를 사용하여 수행되었다. 상기 PCR 앰플리콘은 HiGeneTM Gel & PCR Purification System (Biofact)을 사용하여 정제되었다.
또한, 상기 엔지니어링된 Cas12f1 싱글 가이드 RNA의 엔지니어링된 스캐폴드 영역 중 제2 영역, 제4 영역 및 제5 영역의 변형은 ApoI 및 BamHI 제한 효소를 사용하여 선형화된 가이드 RNA를 암호화하는 벡터에 변형된 서열을 포함하는 합성 올리고뉴클레오타이드를 클로닝하여 수행되었다.
상기 엔지니어링된 Cas12f1 싱글 가이드 RNA의 엔지니어링된 스캐폴드 영역 중 제1 영역의 변형은 tracrRNA의 5'-말단 부분을 표적으로 하는 정방향 프라이머(forward primer) 및 U6 프로모터 영역을 표적으로 하는 역방향 프라이머(reverse primer)를 사용하여 캐노니컬(canonical) 또는 엔지니어링된 주형 플라스미드 벡터의 PCR 증폭에 의해 수행되었다.
상기 PCR 증폭은 Q5 Hot Start high-fidelity DNA polymerase(NEB)에 의해 수행되었으며, PCR 산물은 KLD Enzyme Mix(NEB)를 사용하여 결찰되었다(ligated). 상기 결찰된(ligated) PCR 산물은 DH5α E.coli 세포로 형질도입(transformed)되었다. Sanger 시퀀싱 분석에 의해 변이(Mutagenesis)가 확인되었다.
변형된 플라스미드 벡터는 NucleoBond ®Xtra Midi EF kit (MN)를 사용하여 정제되었다. 정제된 플라스미드 1 마이크로그램이 T7 RNA polymerase(NEB) 및 NTPs(Jena Bioscience)를 사용한 mRNA 합성의 주형으로 사용되었다. 상기 제조된 엔지니어링된 Cas12f1 가이드 RNA를 Monarch®RNA cleanup kit (NEB)를 사용하여 정제하고, 극저온 바이알(cryogenic vials)에 분취하여 액체 질소에 보관하였다.
가이드 RNA 및 엔지니어링된 가이드 RNA 앰플리콘을 제조하기 위해, KAPA HiFi HotStart DNA polymerase(Roche) 또는 Pfu DNA polymerase(Biofact)를 이용하여, canonical가이드 RNA의 주형 DNA 플라스미드 및 엔지니어링된 가이드 RNA 주형 DNA 플라스미드를 U6-상보적인 정방향 프라이머(complementary forward primer) 및 프로토스페이서 서열 상보적인 역방향 프라이머(protospacer sequence-complementary reverse primer)를 사용하여 PCR 증폭을 수행하였다. 상기 PCR 증폭 결과물을 HigeneTM Gel & PCR purification system (Biofact)를 사용하여 정제하여 가이드 RNA 및 엔지니어링된 가이드 RNA 앰플리콘을 수득하였다.
상기 PCR 앰플리콘을 주형으로, NEB T7 polymerase를 사용하여 시험관 내 전사(in vitro transcription)을 수행했다. 상기 in vitro transcription 수행 결과물에 NEB DNase I을 처리한 후 Monarch RNA Cleanup Kit(NEB)를 이용하여 정제한 후, 가이드 RNA를 수득했다. 이 후, 미리 설계한 가이드 RNA 서열 및 T7 프로모터 서열을 포함하는 플라스미드 벡터를 Tblunt 플라스미드 클로닝 방법에 따라 제조했다.
상기 벡터를 T7 프로모터 서열을 포함하는 가이드 RNA 서열 양 끝을 절단(double cut)하여 정제한 후, 그 결과물에 NEB T7 polymerase를 사용하여 시험관 내 전사(in vitro transcription)을 수행했다. 상기 시험관 내 전사(in vitro transcription) 수행 결과물에 NEB DNase I를 처리한 후, Monarch RNA Cleanup Kit (NEB)를 이용하여 정제한 후, 가이드 RNA를 수득했다.
이하 실험예에 사용한 가이드 RNA 서열은 다음 [표 3]에 나타낸 바와 같다.
[표 3]
Figure pct00003
여기서, 상기 가이드 RNA는 5'-스캐폴드-스페이서-U-rich tail-3' 구조이고, 상기 스페이서는 각 실험예의 프로토스페이서와 동등한 RNA 서열(DNA 서열의 T를 U로 치환한 것)로 설계된다.
실험예 1.5. 리보뉴클레오프로틴(ribonucleoprotein; RNP) 입자 제조
각 실험에 사용할 엔지니어링 된 Cas12f1 단백질(Dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및/또는 dCas12f1-발현조절 융합 단백질) 및 가이드 RNA의 조합을 특정한 후, 다음과 같은 방법으로 RNP 입자를 제조했다:
실험예 1.1 내지 실험예 1.3에 의해 제조된 엔지니어링 된 Cas12f1 단백질 300 nM 및 실험예 1.4에 의해 제조된 가이드 RNA를 900 nM을 10분 동안 실온에서 인큐베이션하여 리보뉴클레오프로틴 입자(RNP)를 제조하였다.
실험예 1.6. 플라스미드, rAAV 벡터(AAV inverted terminal repeat vector) 설계 및 제조
각 실험에 사용할 엔지니어링 된 Cas12f1 단백질(Dead Cas12f1 단백질, dCas12f1-염기교정 융합 단백질, 및/또는 dCas12f1-발현조절 융합 단백질), 가이드 RNA, 및 기타 벡터 구성을 특정한 후, 다음과 같은 방법으로 플라스미드 벡터를 설계하고 제조했다.
상기 엔지니어링 된 Cas12f1 단백질을 인간 세포에서 발현하기 위해 인간 코돈-최적화시켰으며, 코돈-최적화된 염기서열을 포함하는 폴리뉴클레오타이드를 합성하였다.
상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 코돈-최적화된 폴리뉴클레오타이드는 chicken β-actin(CBA) 프로모터, 5'-말단 및 3'-말단의 핵 위치 신호(nuclear localization signal, NLS) 서열 및 자가 절단 T2A 펩타이드(2A)로 연결된 eGFP를 인코딩하는 서열을 포함하는 플라스미드 또는 CMV enhancer, CMV 프로모터, 5'-말단 또는 3'-말단의 핵 위치 신호(nuclear localization signal, NLS) 서열을 포함하는 플라스미드에에 작동가능하게 연결되어 클로닝(cloning)되었다.
또한, 상기 특정된 가이드 RNA를 위한 주형 DNA를 합성하였고(Twist Bioscience), 이를 pTwist Amp 플라스미드 벡터에 클로닝하여 복제하였다. 엔지니어링된 가이드 RNA에 대한 주형 DNA는 엔자임클로닝 기법을 이용하여 제작되었으며, 이는 pTwist Amp 플라스미드에 클로닝되어 복제되었다. 또한 상기 플라스미드를 주형으로 하여 U6-상보적인 정방향 프라이머(complementary forward primer) 및 프로토스페이서 서열 상보적인 역방향 프라이머(protospacer sequence-complementary reverse primer)를 사용하여 가이드 RNA 또는 엔지니어링된 가이드 RNA의 앰플리콘을 제조하였다. 필요에 따라, 제조한 앰플리콘을 T-blunt 플라스미드(Biofact)에 클로닝하여 복제하였다.
또한, 엔지니어링된 듀얼 가이드 RNA(Engineered dual guide RNA)를 제조하기 위해서, 엔지니어링된 tracrRNA 및 엔지니어링된 crRNA를 암호화하는 올리고뉴클레오타이드를 제한 효소 BamHI 및 HindIII 제한 효소(New EnglandBiolabs)로 절단하여 pSilencer 2.0(ThermoFisher Scientific) 내로 클로닝하여 복제하였다.
상기 특정된 가이드 RNA를 암호화하는 주형 DNA가 합성되었고, 이는 pTwist Amp plasmid vector(Twist Bioscience)에 클로닝되었다. 필요에 따라, 상기 벡터는 U6-상보적 정방향 프라이머 및 프로토스페이서-상보적 역방향 프라이머를 사용하여, 상기 가이드 RNA 암호화 서열의 증폭을 위한 주형으로 사용되었다.
Gibson assembly를 사용하여 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 코돈-최적화된 폴리뉴클레오타이드를 포함하는 벡터에, 상기 가이드 RNA를 암호화하는 폴리뉴클레오타이드를 클로닝함으로써, 엔지니어링 된 Cas12f1 시스템의 각 구성요소를 발현하는 벡터를 제조하였다.
구체적으로, 1) chicken β-actin(CBA) 프로모터, 5'- 및 3'-말단의 핵 위치 신호(nuclear localization signal, NLS) 서열 및 자가 절단 T2A 펩타이드(2A)로 연결된 eGFP를 인코딩하는 서열 또는 1)-1 CMV enhancer, CMV 프로모터, 5'- 또는 3'-말단의 핵 위치 신호(nuclear localization signal, NLS) 서열, 2) 상기 엔지니어링 된 Cas12f1 단백닐을 암호화하는 코돈-최적화된 폴리뉴클레오타이드 및 3) 상기 가이드 RNA가 작동가능하게 연결된, 아데노-연관 바이러스 역 말단 반복 플라스미드 벡터(AAV inverted terminal repeat vector) 및 벡터가 제조되었다.
여기서, 상기 엔지니어링 된 Cas12f1 단백질 및 가이드 RNA 전사는 각각 chicken β-actin(CBA) 프로모터 및 U6 프로모터; 또는 CMV 프로모터 및 U6 프로모터;에 의해 촉진되었다. 또한 상기 벡터 및 AAV 벡터는 eGFP, 가이드 RNA의 수 및/또는 효과기 단백질의 추가 등 유전자 편집의 목적에 따라 적절히 변경될 수 있다.
상기 AAV를 대량생산하기 위해, 상기 AAV 벡터 및 helper plasmid, RC plasmid를 HEK 293T 세포에 형질도입하였고, 상기 형질도입된 HEK 293T 세포를 2% FBS를 포함하는 DMEM 배지에서 배양하였다. PEIpro(Polyplus-transfection) 및 동일 몰 비율에서 플라스미드에 대한 삼중-형질주입(triple-transfection)를 사용한 PEI 공침(coprecipitation)을 사용하여 재조합 pseudotyped AAV vector 스톡이 생성되었다. 72시간의 배양 후, 상기 세포들을 용해시켰고, 용해물은 iodixanol (Sigma-Aldrich) stepgradientultracentrifugation에 의해 상기 AAV가 정제되었다.
실험예 1.7. 세포 배양 및 형질도입
HEK 293T (ATCC CRL-11268), HeLa (ATCC CLL-2), U-2OS (ATCC HTB-96) 및 K-562 (ATCC CCL-243) 세포를 10 % 열-비활성화 FBS, 1 % 페니실린/스트렙토마이신 및 0.1 mM 비필수 아미노산들이 보충된 DMEM 배지에서, 37 ℃ 5% CO2 조건 하에서 배양하였다.
실험예 1.6에 의해 제조된 벡터의 세포 형질 감염을 위해, 1.0 x 105 HEK 293T 세포를 형질감염 1일 전에 분주하였다. 세포 형질감염은 전기천공법(electroporation) 또는 lipofection으로 수행되었다.
전기천공법의 경우, 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 플라스미드 벡터 및 가이드 RNA를 암호화하는 DNA 각 2-5 ㎍을 Neon transfection system (Invitrogen)을 사용해 4 X 105 HEK 293 T세포에 형질주입(transfection) 하였다. 상기 전기천공법은 1300V, 10 mA, 3 pulse 조건 하 수행하였다.
lipofection의 경우에는, 6-15㎕ FuGene 시약을 (Promega) 2-5㎍의 엔지니어링 된 CAs12f1 단백질을 암호화하는 플라스미드 벡터 및 1.5-5㎍의 PCR 앰플리콘과 15 분 동안 혼합하였다. 상기 혼합물(300 ㎕)이 형질주입 1일 전에 1 X 106 개의 세포가 플레이팅 된 1.5ml DMEM 배지에 첨가되었다. 상기 세포들을 상기 혼합물의 존재하에서 1 내지 10일 간 배양시켰다. 배양 후, 상기 세포들이 수집되었고, 상기 세포의 게놈 DNA가 PureHelixTM genomic DNA preparation kit (NanoHelix)를 사용하거나, Maxwell RSC Cultured cells DNA Kit (Promega)를 사용하여 수작업으로 분리되었다.
실험예 1.6에 의해 제조된 AAV 벡터의 세포 형질 감염을 위해, 정량적 PCR에 의해 결정한 1, 5, 10, 50, 100, 100, 1000, 10000, 50000 및 100000의 상이한 감염 다중도(MOI, multiplicity of Infection)에서 인간 HEK 293T 세포를 상기 AAV 벡터로 감염시켰다. 상기 형질감염된 HEK 293T 세포는 2% FBS를 포함하는 DMEM 배지에서 배양되었다. 서로 다른 시점에서, 예를 들어 1일, 3일, 5일, 7일, 9일에 게놈 DNA의 분리를 위해 세포를 수집하였다.
또한, 실험예 1.5에 의해 제조된 리보뉴클레오프로틴 입자(RNP)를 전기천공법을 이용하여 형질주입하거나, lipofection 방법을 통하여 형질주입 후, 1일 후 실험예 1.4에 따라 제조된 가이드 RNA를 전기천공법을 사용하여 형질주입하였다.
실험예 1.8. 유전자 편집 효율 분석
HEK 293T 세포로부터 분리된 게놈 DNA 중, 프로토스페이서를 포함하는 영역을 표적-특이적 프라이머를 사용하여 KAPA HiFi HotStart DNA polymerase(Roche)의 존재 하에서 PCR을 수행하였다. 상기 증폭 방법은 제조사의 지시를 따랐다.
Illumina TruSeq HT dual indexes를 포함하는 상기 증폭의 결과물인 PCR 앰플리콘을 Illumina iSeq 100를 사용하여 150bp 페어 엔드 시퀀싱을 수행하였다. 인델 빈도는 MAUND를 사용하여 계산되었다. 상기 MAUND는 https://github.com/ibscge/maund 에서 제공된다.
BioFACTTM Lamp Pfu DNA polymerase를 사용하여 PCR 산물을 얻었다. 상기 PCR 산물(100-300 ㎍)을 25 ㎍반응 혼합물에서 10 유닛(units)의 T7E1 효소(NewEngland Biolabs)와 함께 37 ℃에서 30분 동안 반응시켰다. 20 ㎕ 반응 혼합물을 10 % 아크릴아마이드(acrylamide) 겔에 직접 로딩시키고, 절단된 PCR 산물을 TBE 버퍼시스템에서 작동시켰다. 겔 이미지를 브롬화에티듐(ethidium bromide) 용액으로 염색시킨 후, Printgraph 2 M gel imaging system(Atto)을 이용하여 디지털화하였다. 상기 디지털화한 결과물을 분석하여 유전자 편집 효율을 평가하였다. 또한, 원하지 않는 인델(Indel) 확인을 위해서는 NGS를 통해서 분석하였다.
실험예 1.9. 세포 내 염기 교정 활성 분석
세포 내 표적 핵산 또는 표적 유전자의 표적 부위에 위치한 아데닌(A) 염기 또는 시토신(C) 염기의 탈아미노화 분석은 하기와 같이 수행되었다.
실험예 1.7에 따라 엔지니어링 된 Cas12f1 시스템을 발현할 수 있는 벡터를 세포에 형질도입 시켰다. 3일, 5일 및 7일 후, 상기 형질감염된 HEK 293T 세포에서 게놈 DNA(genome DNA)를 수득하고, 이를 Genomic DNA prep kit (QIAGEN, 카탈로그 #: 69504)를 사용하여 정제하였다. 상기 정제물에서 표적 핵산 또는 표적 유전자의 표적 부위를 PCR로 증폭시킨 후, 최종 PCR 생성물을 타겟 딥 시퀀싱(targeted deep sequencing)을 사용하여 분석하였다.
KAPA HiFi HotStart PCR 키트 (KAPA Biosystems 사 #: KK2501)를 사용하여 라이브러리 생성을 위해 타겟 부위를 증폭시켰다. 이 라이브러리는 TruSeq HT Dual Index 시스템 (Illumina 사)이 있는 MiniSeq을 사용하여 시퀀싱하였다.
실험예 1.10. 세포 내 유전자 발현 억제 효과 분석
세포 내 유전자 발현 억제를 위해, dCas12f1-유전자 발현 저해 융합 단백질 및 이와 함께 사용할 가이드 RNA를 특정한 후, 다음 방법을 사용하여 세포 내 유전자 발현 억제 효과를 분석했다:
실험예 1.6에 의해 제조된 엔지니어링 된 Cas12f1 발현 벡터 1.5 μg 및 가이드 RNA cassete 0.5 μg를 각각 HEK293T-lentiX cell에 실험예 1.7에 의해 형질도입(transfection) 시켰다. 상기 형질도입 96시간 후 세포를 수확했다. Maxwell® RSC miRNA Tissue Kit (Promega)를 사용하여 RNA를 추출하였다. 1 μg의 RNA를 SuperScript IV Reverse Transcriptase (Invitrogen)를 사용하여 cDNA 합성을 protocol대로 진행하였다.
실험예 1.11. 세포 내 유전자 발현 촉진 효과 분석
세포 내 유전자 발현 억제를 위해, dCas12f1-유전자 발현 촉진 단백질 및 이와 함께 사용할 가이드 RNA를 특정한 후, 다음 방법을 사용하여 세포 내 유전자 발현 억제 효과를 분석했다:
실험예 1.6에 의해 제조된 dCas12f1-유전자 발현 촉진 융합 단백질 발현 벡터, 및 가이드 RNA 발현 벡터를 HEK293T 세포에 FugeneHD(Promega) reagent를 사용하여 형질도입(transfection) 하였다. transfection방법은 reagent의 protocol을 따른다.
상기 형질도입 72시간 후 Cell을 수확하여 RNA를 추출하였다. 추출한 RNA를 사용하여 SuperScript iV(Invitrogen)kit를 사용하여 cDNA를 합성하였다. cDNA를 주형으로 사용하여 qPCR로 expression 변화를 분석하였다.
실험예 1.12. 통계 분석
two-tailed Student's t-test에 의한 통계적 유의성 검증을 Sigma Plot software (ver. 14.0)를 이용하여 수행하였다. 0.05 미만의 p-value가 나타나는 경우 통계적으로 유의한 것으로 간주하였고, p-value는 각 도면에 도시하였다. 모든 데이터의 에러바들은 Sigma plot을 사용하여 도시되었으며, 각 데이터의 표준편차 값을 의미한다. 통계적 방법을 기반으로 샘플 크기를 미리 결정하지는 않았다. 각 실험예 별 실험은 3번씩 수행하였으며, 각 값의 평균값을 분석에 사용하였다.
실험예 1.2에 의해 제조된 Dead Cas12f1 변이체를 실험예 1.7 및 실험예 1.9에 의해 세포 내 유전자 절단 활성을 확인하였다. 실험에 사용한 실시예는 다음 표와 같고, 표적의 프로토스페이서 서열은 Target-3을 사용하였다.
[표 4] Dead Cas12f1 변이체
Figure pct00004
상기 제조된 변이체들은 indel을 발생시키지 않는 Dead form임을 확인하였다 (도 5).
실험예 3. 염기교정 도메인 융합 단백질의 염기교정 효과
실험예 3.1. 표적 서열 선정
본 명세서에서 개시하는 dCas12f1-염기교정 융합 단백질이 세포 내에서 표적 핵산 또는 유전자에 대해 염기교정 활성을 가지는지 여부를 조사하기 위해, Cas12f1의 PAM 서열을 포함하며 교정 윈도우 범위 내에 아데닌(A)이 다수 포함되어 있는 인간 내인성 DNA 표적 부위를 동정하였다.
실험에 사용한 프로토스페이서 서열은 다음 표와 같다.
[표 5] 염기교정 표적 서열 1
Figure pct00005
[표 6] 염기교정 표적 서열 2
Figure pct00006
[표 7] 염기교정 표적 서열 3
Figure pct00007
[표 8] 염기교정 표적 서열 4
Figure pct00008
실험예 3.2. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 1
다음 [표 9]에 따른, 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질의 효과를 다음과 같은 방법으로 확인했다:
[표 9] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00009
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-1, target-2, target-5 내지 target-10이다.
상기 표에 따른 엔지니어링 된 Cas12f1 단백질을 발현할 수 있는 벡터 및 가이드 RNA를 발현할 수 있는 벡터를 실험예 1.6에 따라 제조했다. 상기 제조된 벡터를 실험예 1.7에 따라 HEK 293T 세포에 형질 감염시키고, 3일 후 게놈 DNA를 분리했다.
그 후 상기 게놈 DNA 내 상기 표 9에 따른 표적 서열 부위에 대한 염기교정 효율을 실험예 1.9에 따라 분석하였다. 구체적으로, 상기 표 te3-01에 기재된 10개의 표적 부위에 대해서 교정 윈도우(editing windows) 예상 범위인 5'-말단 표적 부위의 가이드 RNA 결합영역 내 N1 내지 N20(PAM 서열 다음의 1번째 뉴클레오티드에서 20번째 뉴클레오티드)에 걸친 범위의 각 뉴클레오티드에서 모든 염기의 다른 염기로의 치환 여부를 분석하였다.
그 결과 도 51 내지 도 57에서 나타낸 바와 같이, 상기 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질을 포함하는 엔지니어링 된 Cas12f1 시스템이 교정 윈도우 범위 내 아데닌(A)을 구아닌(G)으로 효과적으로 교정함을 확인하였다. 특히 A3 및 A4 위치의 아데닌 염기를 구아닌 염기로 치환하는 효율이 가장 우수했다.
dCas12f1(D326A)이 포함된 dCas12f1-ABE-N1의 경우에, 상기 Target-1의 A2 염기를 구아닌으로 교정하는 빈도는 약 15 %이고(도 53), 상기 Target-3의 A3 및 A4 염기를 구아닌으로 교정하는 빈도는 각각 약 41 % 및 약 35 % 로 확인되었다(도 53). 또한 Target-5, Target-7 및 Target-8의 A3 및 A4 염기도 30 ~ 40 %의 빈도로 구아닌으로 동시에 교정하는 것을 확인하였다(도 54).
dCas12f1 variant type 1(D354A)가 포함된 dCas12f1.v1-ABE-C2의 경우에, 상기 Target-1의 A4 염기를 구아닌으로 교정하는 빈도는 약 14 %였다(도 55 내지 도 56). 또한 상기 Target-3의 A3 및 A4 염기를 구아닌으로 교정하는 빈도는 각각 약 47 % 및 약 40 % 로 확인되었고, 상기 Target-4의 A4 염기를 구아닌으로 교정하는 빈도는 약 37 %로 아주 높았다(도 57).
실험예 3.3. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 2
상기 실험예 3.2에 개시된 방법에 의해, 다음 [표 10]에 따른 dCas12f1-염기교정 융합 단백질의 효과를 확인했다:
[표 10] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00010
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-3이다.
실험 결과 도 6 및 7에서 나타낸 바와 같이, dCas12f1(D326A), dCas12f1(E422A), dCas12f1(R490A), dCas12f1(D510A)은 Target-3의 3A에 대해서 각각 약 9%, 약 13%, 약 3% 및 약 5%의 염기 교정율을 보였고, 4A에 대해서는 각각 약 4%, 약 5%, 약 2% 및 약 7%의 염기 교정율을 나타냈다.
dTnpB(D354A), dTnpB(E450A), dTnpB(R518A) 및 dTnpB(D538A)의 경우에는 Target-3의 2A에 대해서 각각 약 10%, 약 14%, 약 11% 및 약 17%의 염기 교정율을 보였고, 3A에 대해서 각각 약 22%, 약 25%, 약 17% 및 약 33%의 염기 교정율을 보였으며, 4A에 대해서는 각각 약 20%, 약 22%, 약 15% 및 약 26%의 염기 교정율을 나타냈다.
이로써, dTnpB가 dCas12f1 보다 더 우수한 염기교정 효율을 가짐을 확인하였다.
실험예 3.4. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 3
dCas12f1-염기교정 시스템의 염기교정 효율이 발현 벡터에 포함되는 프로모터의 종류와 연관이 있는 지를 확인하기 위해, 다음 표 11에 따른 염기교정 시스템에 대해, 실험예 3.2을 참조하여 염기교정 효율을 확인하였다.
[표 11] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00011
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-1 및 Target-3이다.
이때, 동일한 dCas12f1-염기교정 단백질에 대해, 발현 벡터에 사용되는 프로모터를 달리 하여 실험하였다.
그 결과, 사용된 CBA 프로모터와 CMV 프로모터 모두 우수한 염기교정 효율을 나타냈고, 특히 CBV 프로모터는 gRNA Ver4.1과의 조합의 경우에 가장 우수한 활성을 나타냈다(도 8).
실험예 3.5. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 4
dCas12f1-염기교정 시스템의 염기교정 효율이 염기교정 도메인 및 dead Cas12f1 단백질을 연결하는 링커의 길이와 연관이 있는 지를 확인하기 위해, 다음 표 te3-05에 따른 염기교정 시스템에 대해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
[표 12] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00012
[표 13] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00013
[표 14] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00014
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-3이다.
실험 결과, 상기 링커가 10개 내지 40개의 아미노산 길이로 변화하는 경우 모두 유사한 활성을 나타냈다 (도 9 내지 도 11). 따라서, dead Cas12f1 단백질 및 염기교정 도메인을 연결하는 링커의 길이는 염기교정 효율에 큰 영향을 미치지 않는 것으로 나타났다.
실험예 3.6. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 5
다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질의 염기교정 효율을 살펴보기 위해, 다음 표 15에 따른 염기교정 시스템에 디해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-3이다.
[표 15] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00015
실험 결과, 테스트된 상기 변이체들은 Target-3의 3A 및 4A에 대해서 유사한 염기 교정율을 나타내었다. 염기교정 윈도우에 영향을 줄 것으로 예상했던 I159W 및/또는 S164Y 변이체인 경우에는 Target-3의 6A에 대해서 염기 교정율이 야생형에 비해서 현저히 증가하는 결과를 보였다(도 12 내지 도 13).
실험예 3.7. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 6
다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질의 염기교정 효율을 살펴보기 위해, 다음 [표 16] 및 [표 17]에 따른 염기교정 시스템에 대해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
[표 16] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00016
[표 17] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00017
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-1이다.
실험 결과, 다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질을 사용하는 경우, 염기교정 윈도우가 표적 서열 1에서 N2 내지 N18까지 확장되는 결과를 나타냈다(도 15 내지 도 18).
실험예 3.8. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 7
다양한 표적 서열에 대한 dCas12f1-염기교정 단백질의 염기교정 효율을 살펴보기 위해, 서열번호 299의 dCas12f1-염기교정 융합 단백질, 및, v4.0 또는 v4.1의 가이드 RNA를 포함하는 염기교정 시스템에 대해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 [표 7] 내지 [표 8]에 나타난 것과 같다.
또한, 일구현 예로 TadAeTadA3를 이용한 염기교정 시스템을 다양한 표적서열에서 검증한 결과 25가지의 다양한 표적 서열에서 염기교정 윈도우가 A2 내지 A8 및/또는 A15 내지 A20까지 가능한 것을 확인하였다(도 19 내지 도 24).
실험예 3.9. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 8
dCas12f1-염기교정 단백질에 포함된 염기교정 도메인의 종류에 따른 염기교정 효율을 살펴보기 위해, 다음 [표 18] 및 [표 19]에 따른 염기교정 시스템에 대해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
[표 18] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00018
[표 19] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00019
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-3이다.
실험 결과, 도 25 내지 도 30에 나타낸 바와 같이, TadA-eTadA2, eTadA2 및 TadA-eTadA1가 dCas12f1 또는 dTnpB와 함께 우수한 염기교정 효율을 나타냈다. 이는 Tad가 염기교정 효율에 영향을 미치는 중요한 요소임을 의미한다.
실험예 3.10. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 9
dCas12f1-염기교정 단백질에 포함된 dead Cas12f1 단백질의 기초가 되는 Cas12f1 변이체 단백질의 종류에 따른 염기교정 효율을 살펴보기 위해, 다음 [표 20]에 따른 염기교정 시스템에 대해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
[표 20] 아데노신 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00020
상기 제작된 초소형 염기교정 시스템 각각의 염기교정 효과는 [표 21]에 나타냈다.
[표 21] 염기교정 시스템의 종류에 따른 염기교정 효과
Figure pct00021
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-1 및 Target-3이다.
실험 결과, Cas12f1 변이체 단백질에 기반한 dead Cas12f1 단백질을 포함하는 dCas12f1-염기교정 단백질의 염기교정 효율이 야생형의 Cas12f1 단백질에 기반한 dead Cas12f1을 포함하는 dCas12f1-염기교정 단백질의 염기교정 효율에 비해 전반적으로 매우 높게 나타났으며, 특히, 서열번호 15의 dead Cas12f1 variant 1의 경우 높은 염기교정 효율을 보이는 것을 확인할 수 있다.
실험예 3.11. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 10
다양한 dead Cas12f1 변이체 기반의 dCas12f1-염기교정 단백질의 염기교정 효율 및 기존의 Cas9 기반의 염기교정 시스템의 염기교정 효율을 비교하기 위해, [표 22]에 따른 염기교정 시스템, 및 비교예인 Cas9 기반의 ABE7.10, 8e 및 9에 대해, 실험예 3.2를 참조하여 염기교정 효율을 확인하였다.
[표 22]
Figure pct00022
실험 결과, 도 31에서 나타낸 바와 같이, dead Cas12f1 variant 1 기반 ABE-C3(서열번호 299)은 dead Cas12f1 기반의 ABEMINI(서열번호 284) 또는 Cas9 기반의 ABE7.10, 8e 및 9와 비교하여 A3 및 A4 위치에서 탁월한 염기교정율을 나타냈다. 이는 dead Cas12f1 variant 1 기반 염기교정 시스템이 가장 우수한 ABE 활성을 나타냄을 의미한다.
실험예 3.12. 아데노신 탈아미노화효소 융합 단백질의 염기교정 효과 11
본 명세서에서 개시하는 CRISPR 염기교정 시스템의 염기교정 활성을 기존의 AAV 벡터로 전달 가능한 크기를 가지는 아데닌 염기교정 유전자가위 miniABEmax와 비교하였다.
이를 위해, 서열번호 287에 따른 dCas12f1-염기교정 단백질(ABE-C2)을 암호화하는 핵산을 포함하는 AAV 벡터, 상기 ABE-C2 및 가이드 RNA를 암호화하는 핵산을 포함하는 AAV 벡터(ABE-C2+sgRNA) 및 상기 ABE-C2+sgRNA에 보조 표적 서열(Auxillary) 폴리뉴클레오타이드가 포함되어 있는 AAV 벡터(ABE-C2+sgRNA+Auxillary)를 제작했다.
또한, 상기 본 발명에 따른 초소형 염기교정(Base editing) 시스템과 세포 내 염기교정 효율을 비교할 기존의 spCas9n 기반의 아데닌 염기교정 유전자가위 AAV 벡터인 miniABEmax를 준비하였다.
상기 준비된 벡터들은 HEK 293T 세포에 형질감염하였고, 3일 후 상기 감염된 HEK 293T 세포에서 게놈 DNA(genome DNA)를 수득하였다. 이의 PCR 생성물을 타겟 딥 시퀀싱(targeted deep sequencing)을 사용하여 아데닌(A) 염기가 구아닌(G) 염기로 치환되었는지를 분석하였다.
분석 결과 도 32에서 나타낸 바와 같이, 본 발명에 따른 초소형 염기교정(Base editing) 시스템인 ABE-C2+sgRNA 및 ABE-C2+sgRNA+Auxillary는 아데닌(A) 염기를 구아닌(G) 염기로 치환하는 염기 교정율이 각각 30 % 및 40 %로 나타났다.
반면에, 기존의 SpCas9n 기반의 아데닌 염기교정 유전자가위 miniABEmax는 5 % 이하로, 낮은 아데닌 염기교정 특이성을 보였다.
상기 결과는 본 발명에 따른 dCas12f1 또는 이의 기능적 유사체를 포함하는 초소형 염기교정(Base editing) 시스템은 앞서 설명한 작은 사이즈에서 기인한 다양한 유전자 편집 활용 범위의 장점에 더불어, 염기교정에 있어서 기존에 가장 많은 연구가 진행되고 현재 염기교정 유전자가위로 사용되고 있는 것보다 염기 교정 효율이 현저히 증가된 것을 확인한 것이다.
실험예 3.13. 시티딘 탈아미노화효소 융합 단백질의 염기교정 효과 1
본 명세서에서 제공하는, 시티딘 탈아미노화효소를 염기교정 도메인으로 포함하는 dCas12f1-염기교정 융합 단백질이 시토신 염기교정 활성을 가지는 지 여부를 실험하였다. 이를 확인하기 위해, 상기 시토신 염기교정 조성물의 교정 윈도우 범위 내 시토신이 다수 포한되어 있는 인간 내인성 DNA 표적 부위를 선별하였다. 구체적으로, 선별된 표적의 프로토스페이서 서열은 상기 [표 5] 내지 [표 6]에 개시되어 있는 Target-2, Target-11, 및 Target-12와 같다.
상기 시토신 교정을 확인하기 위해서, 다음 [표 22]에 따른 시티딘 염기교정 시스템에 대해 염기교정 효율을 확인하였다.
[표 23] 시티딘 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질
Figure pct00023
이때, 가이드 RNA의 스페이서 설계에 사용한 프로토스페이서 서열은 Target-2, target-11, 및 target-12이다.
상기 표에 따른 엔지니어링 된 Cas12f1 단백질을 발현할 수 있는 벡터 및 가이드 RNA를 발현할 수 있는 벡터를 실험예 1.6에 따라 제조했다. 상기 제조된 벡터를 실험예 1.7에 따라 HEK 293T 세포에 형질 감염시키고, 3일 후 게놈 DNA를 분리했다.
그 후 상기 게놈 DNA 내 상기 표 te3-01에 따른 표적 서열 부위에 대한 염기교정 효율을 실험예 1.9에 따라 분석하였다. 구체적으로, 상기 표 5에 기재된 10개의 표적 부위에 대해서 교정 윈도우(editing windows) 예상 범위인 5'-말단 표적 부위의 가이드 RNA 결합영역 내 N1 내지 N20(PAM 서열 다음의 1번째 뉴클레오티드에서 20번째 뉴클레오티드)에 걸친 범위의 각 뉴클레오티드에서 모든 염기의 다른 염기로의 치환 여부를 분석하였다.
실험 결과, 상기 염기교정 시스템이 교정 윈도우 범위 내 시토신을 티민으로 교정함을 확인하였다 (도 33)
Target-2의 경우에 CBE-C1 및 CBE-C2로 표시한 시티딘 염기교정 시스템은 C4 및 C5 위치의 시토신 염기를 티민 염기로 치환하는 빈도가 가장 높았다(도 33). 또한 CBE-C2로 표시한 시티딘 염기교정 시스템은, 상기 Target-12의 C3 및 C4 염기를 티민으로 교정하는 빈도가 각각 약 20 % 및 약 16 % 로 확인되었다(도 33).
상기 결과로부터, 본 발명의 시티딘 탈아미노화효소를 포함하는 dCas12f1-염기교정 융합 단백질은 PAM 서열 다음의 C3 내지 C5에서 연속하여 위치한 2개의 시토신, 즉 C3 및 C4; 또는 C4 및 C5;를 동시에 티민으로 교정할 수 있음을 확인하였다.
상기 결과로 본 발명에 따른 시토신 염기 교정을 위한 초소형 염기교정 시스템이 교정 윈도우가 C3 내지 C5 범위로 좁게 나타나고, 그 범위내의 연속하는 2개의 시토신 염기를 동시에 티민 염기로 교정할 수 있다는 것을 확인하였다.
이는 전술한 아데노신 염기교정 시스템과 마찬가지로, 상기 시티딘 염기교정을 시스템도 침묵 돌연변이(silent mutation)를 일으키는 염기 교정의 문제를 해결할 수 있고, 종결코돈 UAA의 경우에 3번째의 아데닌이 구아닌으로 염기 교정이 일어나도 여전히 종결코돈 UAG가 되어 염기 교정의 효과가 나타나지 않는 문제를 극복하는 장점을 가지는 새로운 염기교정 유전자가위(Base Editor)임을 의미하는 것이다.
실험예 3.14. CRISPR 염기교정 복합체가 원치 않는 인델을 발생시키는 지 여부 확인
한편, 아데노신 탈아미노화효소 또는 시티딘 탈아미노화효소가 dCas9 또는 nCas9 단백질에 결합되어 있는 기존의 아데닌 염기교정 유전자가위(ABEs) 또는 시토신 염기교정 유전자가위(CBEs)는 염기 교정 이외에, 표적 핵산의 이중가닥 DNA 절단에 의해 표적 핵산 내에 염기가 결실 또는 추가되는 '원치 않는 indel'을 야기하기 때문에 문제가 되었다.
이에, 상기 dCas12f1-염기교정 단백질을 포함하는 염기교정 시스템이 세포 내에서 염기를 교정하는 과정에서 원치 않는 indel을 일으키는지 여부를 확인하였다.
이를 확인하기 위해, 다음 [표 24]의 염기교정 시스템에 대해 실험예 1.8에 따라 원치 않는 인델 발생 여부를 확인하였다. 이때, 비교군으로 dCas9 또는 nCas9 기반의 아데닌 염기교정 유전자가위 (ABEs) ABE7.10 및 ABE8e, 시토신 염기교정 유전자가위(CBEs) BE4 및 BE4-GAM을 사용하였다.
[표 24] dCas12f1-염기교정 융합 단백질
Figure pct00024
그 결과 도 34에서 나타낸 바와 같이, 상기 ABE-C2로 표시된 아데닌 염기교정 시스템, 및 상기 CBE-C2로 표시된 시토신 염기교정 시스템 모두 원치 않는 indel을 거의 발생하지 않음을 확인하였다.
그러나 기존의 dCas9 또는 nCas9 단백질 기반의 아데닌 염기교정 유전자가위(ABEs) ABE7.10 및 ABE8e와 시토신 염기교정 유전자가위(CBEs) BE4 및 BE4-Gam에서는 본 발명에 따른 상기 ABE-C2 및 CBE-C2와 각각 비교하여 각각 10 배 이상의 원치 않는 indel을 발생시키는 것으로 확인되었다.
상기의 결과는 아데닌(A)을 구아닌(G)로 교정하거나, 시토신(C)을 티민(T)으로 교정하는 염기 교정 활성은 유사하게 나타난 것과는 뚜렷한 대조를 보이는 결과이다. 이는 indel은 발생시키지 않고 특정 염기의 교정만을 필요로 하는 상황에서, 본 명세서에서 개시하는 염기교정 시스템이 매우 유용한 염기교정 유전자가위임을 시사한다.
나아가, 상기 결과는 최소형의 염기교정(Base editing) 시스템으로써, 본 명세서에서 개시하는 CRISPR 염기교정 복합체가 indel, 염기교정 또는 프라임 편집(prime editing) 등 목적하는 유전자 편집의 방식을 제약없이 선택할 수 있고, 부작용 없이 효과적으로 수행할 수 있다는 것을 새롭게 확인한 것이다.
실험예 3.15. CRISPR 염기교정 복합체의 각 구성요소를 암호화하는 AAV 벡터의 염기교정 효과 확인 1
본 명세서에서 제공하는 상기 CRISPR 염기교정 복합체의 각 구성요소를 암호화하는 AAV 벡터가 세포 내에에서 표적 유전자에 대한 염기교정 효과를 확인하기 위해, 세포 내 rAAV 벡터를 형질감염(transfection) 시켜 그 염기교정 효율을 확인하였다.
구체적으로, 상기 염기교정 효율을 확인하기 위해서, 다음과 같은 방법으로 eGFP는 정상적으로 발현하지만, 앞부분에 존재하는 종결코돈 때문에 mRuby 유전자는 발현하지 못하도록 형질도입된 세포주를 제작하였다. 1) chicken β-actin(CBA) 프로모터, 5'- 및 3'-말단의 핵 위치 신호(nuclear localization signal, NLS) 서열 및 자가 절단 T2A 펩타이드(2A)로 연결된 eGFP를 인코딩하는 서열; 2) 본 발명에 따른 코돈-최적화 된 초소형 염기교정(Base editing) 구조물이 인식할 수 있으며, 종결 코돈(TAG)을 가지고 있는 표적 서열(Target) 및/또는 보조 표적 서열(Auxillary) 폴리뉴클레오타이드; 및 3) mRuby 유전자 서열이 작동가능하게 연결된 플라스미드 벡터를 제조하였다. 상기 벡터를 HEK 293T 세포에 형질도입시켰다. 상기 플라스미드 벡터가 염색체에 삽입된 HEK 293T 세포는 eGFP는 정상적으로 발현하지만, mRuby 유전자는 그 앞부분에 존재하는 종결코돈 때문에 발현하지 못한다.
상기 플라스미드 벡터 구조 및 상기 표적 서열은 도 35 내지 도 36에서 자세히 나타냈다.
다음으로, 상기 플라스미드 벡터가 삽입된 HEK 293T 세포에, 실험예 1.6에 따라 rAAV 벡터를 제조했다. 상기 벡터에 탑재된 CRISPR 염기교정 시스템은 다음 [표 25]과 같다.
[표 25] rAAV 벡터에 탑재된 CRISPR 염기교정 시스템
Figure pct00025
여기서, 상기 가이드 RNA의 스페이서는 Target-14, Target-15, Target-16, 및 Target-43의 프로토스페이서 서열로부터 각각 설계되었다. 상기 벡터의 구조는 각각 도 35 내지 도 36에서 자세히 나타냈다.
상기 제조한 세포에, 상기 제조한 rAAV 벡터를 실험예 1.7에 따라 형질도입하고, mRuby 유전자의 발현 여부를 확인함으로써 상기 CRISPR 염기교정 시스템이 의도된 대로 염기교정 기능을 발휘했는 지 여부를 확인했다. 여기서, 대조군으로는 spCas9-ABE split AAV를 상기 제조한 세포에 형질감염시켜 확인하였다.
상기 mRuby의 발현을 여부를 확인하기로 한 이유는, 상기 벡터가 상기 형질도입된 HEK 293T 세포 내로 전달되어 표적 서열을 인식하여 그 부위에 위치하고, 상기 표적 서열 내에 존재하는 종결코돈 TAG의 아데닌(A) 염기를 구아닌(G) 염기로 치환하였다면, mRuby 유전자의 앞부분에 존재하던 종결코돈이 TGG(Trp)로 변경되어 종결코돈이 사라지기 때문에 상기 mRuby 유전자는 정상적으로 발현하게 될 것이기 때문이다.
실험 결과, 도 37에서 나타낸 바와 같이, 상기 CRISPR 염기교정 시스템은 상기 형질도입된 HEK 293T 세포 내에서 mRuby 유전자를 정상적으로 발현시키는 것을 확인하였다. 그 염기 교정율은 25.2 %로 나타났다. 또한, 상기 CRISPR 염기교정 시스템은 형질도입된 후 6일째에 약 40%, 9일째에 60 % 이상의 염기 교정율을 나타내며, HEK 293T 세포 내에서 mRuby 유전자를 정상적으로 발현시키는 것을 확인하였다(도 37).
본 명세서에서 제공하는 상기 CRISPR 염기교정 시스템을 탑재한 rAAV 벡터는 spCas9-ABE split AAV에 비해 훨씬 우수한 염기교정 효율을 나타내며, 이러한 효과는 형질도입 후 시간이 지날수록 더욱 두드러지는 것으로 나타났다.
실험예 3.16. 염기교정 도메인 융합 단백질을 암호화하는 AAV 벡터의 염기교정 효과 확인 2
본 명세서에서 개시하는 CRISPR 유전자 조절 시스템의 가장 큰 장점은 AAV가 가지는 전달 사이즈의 한계에 제약성이 없다는 점이다. 더욱이 본 발명을 통해 개발한 염기교정 시스템은 한 개의 가이드 RNA를 넣었을 경우 AAV 전달 한계 내에서 추가적인 공간의 여유가 존재한다. 이 추가 공간 안에 가이드 RNA 또는 shRNA와 같은 추가적인 요소를 추가함으로써 복수개의 유전자를 동시에 교정할 수 있는 장점을 지닌다.
이를 증명하기 위해 도 38에 기재한 바와 같이, 실험예 1.6을 참조하여, 서로 다른 guide RNA 한 종류를 넣은 AAV2와 그 두 guide RNA를 동시에 탑재한 AAV2를 제작하였다. 그 후, 실험예 1.7을 참조하여, 서열번호 299의 dCas12f1-염기교정 융합 단백질을 암호화하는 핵산을 포함하는 AAV2를 같은 감염다중도(multiplicity of infection, MOI)로 HEK293T 세포에 감염시켰다.
상기 준비된 AAV2 벡터들은 HEK 293T 세포에 형질감염하였고, 10일 후 상기 감염된 HEK 293T 세포에서 게놈 DNA(genome DNA)를 수득하였다. 이후, 실험예 1.9를 참조하여 PCR 생성물을 타겟 딥 시퀀싱(targeted deep sequencing)을 사용하여 아데닌(A) 염기가 구아닌(G) 염기로 치환되었는지를 분석하였다.
분석 결과 도 38에서 나타낸 바와 같이, 두 종류의 guide RNA를 탑재한 AAV2에서 두 타겟 모두 아데닌 염기교정의 효율을 확인하였다. 각각의 효율은 단독 guide RNA를 탑재한 경우와 비슷한 효율을 나타내었다. 이를 통해, 두 종류 이상의 가이드 RNA를 포함하는 다중 표적 CRISPR 유전자 조절 시스템을 탑재한 AAV 벡터를 사용하여 다중 표적 염기교정이 가능함을 확인하였다.
실험예 4. CRISPR 발현조절 시스템 발현 조절 효과
실험예 4.1. CRISPR interference 시스템의 표적 유전자 발현 저해 효과
본 명세서에서 개시하는 CRISPR interference 시스템의 표적 유전자 발현 저해 효과를 확인하기 위해, BRCA1 유전자를 표적으로 하여, 이를 표적하는 프로토스페이서 표적을 선정하였고, 이에 따라 가이드 RNA의 스페이서 서열을 설계하였다. 상기 스페이서 서열은 다음 [표 26]와 같다:
[표 26]
Figure pct00026
여기서, 비교군으로는 18s를 표적으로 사용하였고, 상기 비교군의 qPCR을 위해 사용한 프라이머는 다음 [표 27]와 같다:
[표 27]
Figure pct00027
실험예 1.4에 따라 다음의 dCas12f1-발현조절 융합 단백질 및 상기 [표 26]을 표적하는 가이드 RNA를 포함하는 CRISPR interference 시스템을 발현할 수 있는 벡터를 제조하였고, 이를 실험예 1.10에 따라 HEK293T-lentiX cell에 형질감염시켜 세포 내 유전자 발현 억제 효과를 분석하였다.
실험 결과, 도 39 내지 도 49에 나타난 바와 같이, 유전자 발현조절 도메인이 dead Cas12f1에 융합되는 위치(N말단 및/또는 C말단)와 관계 없이, 대부분의 모듈에서 BRCA1 mRNA level이 감소하는 것을 확인하였다.
실험예 4.2. CRISPR activation 시스템의 표적 유전자 발현 촉진 효과
본 명세서에서 개시하는 CRISPR activation 시스템의 표적 유전자 발현 촉진 효과를 확인하기 위해, OCT4 유전자를 표적으로 하여, 이를 표적하는 프로토스페이서 표적을 선정하였다. 선정한 표적 프로토스페이서 서열은 다음 [표 28]와 같다:
[표 28]
Figure pct00028
서열번호 5의 dead Cas12f1 단백질 및 서열번호 329의 VP64 유전자 발현 촉진 도메인을 포함하는 dCas12f1-발현조절 융합 단백질을 실험예 1.4를 참조하여 제조하였다. 제작한 dCas12f1-발현조절 융합 단백질과 각각의 guide RNA를 코딩하는 벡터를 HEK293T 세포에 FugeneHD(Promega) reagent를 사용하여 transfection 하였다. transfection방법은 reagent의 protocol을 따랐다. Transfection 72시간 후 Cell을 수확하여 RNA를 추출하였다. 추출한 RNA를 사용하여 SuperScript iV(Invitrogen)kit를 사용하여 cDNA를 합성하였다. cDNA를 주형으로 사용하여 qPCR로 expression 변화를 분석하였다
도 50에 나타난 바와 같이, 상기 CRISPR activation 시스템이 OCT4 유전자의 전사를 촉진하는 결과를 확인할 수 있었다.
실험예 5. Dead Cas12f1 단백질 변이의 추가 확장
Cas12f1 단백질의 Dead form을 만들 수 있는 변이 위치에, 알라닌 외 다른 아미노산으로 치환하여도 dead form이 형성될 수 있는 지 다음과 같이 실험하였다:
실험예 1.1의 Cas12f1을 발현하는 벡터를 mutagenesis 방법으로 Cas12f1을 dead 형태로 변형시켰다. Dead 형태는 D326A, E422A, R490A 또는 D510A이며, R490Q, R490W, R490L, D510L, D510V 또는 그 외 cleavage 활성을 상실하는 변이가 된 형태이다. 각각의 mutagenesis에 사용한 프라이머는 다음 [표29]에 나타내었다.
[표29]
Figure pct00029
만들어진 dead Cas12f1의 cleavage 활성이 제거되었는지 확인하기 위하여 HEK293T 세포에 5'-CACACACACAGTGGGCTACCATT-3'(서열번호 522)를 타겟 하여 transfection 하였다. Transfection 96시간 후 gDNA를 추출하여 NGS분석을 통하여 indel 발생을 비교하였다(도 58).
실험 결과, 서열번호 1의 야생형 Cas12f1 단백질 기준, R490A, R490Q, R490L, R490W, D510A, D510L, D510V, E422A, E326A 모두 핵산 절단 활성이 상실된 것으로 나타났으며, 이는 적절한 변이 위치의 아미노산을 알라닌 외 글루타민, 류신, 트립토판, 또는 발린으로 치환하여도 dead form을 만들 수 있다는 것을 보인 것이다.
본 명세서에서 개시하는 CRISPR 유전자 조절 복합체 및 그 구성요소에 의해, 세포 내 표적 유전자에 대한 염기교정, 표적 유전자의 발현조절(촉진 또는 저해) 등 다양한 유전자 기능 조절 효과를 보일 수 있어, 유전자 염기교정, 및/또는 유전자 발현조절 기술 분야에 사용할 수 있다. 또한, 상기 CRISPR 유전자 조절 시스템은 한 단위의 아데노-연관 바이러스 (AAV) 벡터에 탑재할 수 있어 높은 효율 및 활용성을 기대할 수 있다.

Claims (43)

  1. 다음 아미노산 서열로 표현되는 야생형 Cas12f1 기반의 dead Cas12f1 단백질:
    MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGX1ANASX2VEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIX3VGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMX4NLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYX5KKNKFPHFKCEKCNFKENAX6YNAALNISNPKLKSTKEEP(서열번호 9)
    여기서, X1은 이소류신(isoleucine) 또는 트립토판(tryptophan)이고, X2는 세린(serine) 또는 티로신(tyrosine)이고,
    X3은 아스파르트산(aspartic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고, X4는 글루탐산(glutamic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine), X5는 아르기닌(arginine), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이며, X6은 아스파르트산(aspartic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고,
    여기서 상기 X3, X4, X5, 및 X6 중 적어도 하나는 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)임.
  2. 다음을 포함하는 dead Cas12f1 단백질:
    20개 내지 30개의 아미노산을 포함하는 더미 부분,
    여기서, 상기 더미 부분은 MGEKSSRRRRNGKSGAWTAAITSCVGGK(서열번호 10), MAGGPGAGSAAPVSSTSSLPLAALNMRV(서열번호 11), MAGGPGAGSAAPVSSTSSLPLAALNM(서열번호 12), 및 MEKRINKIRKKLSADNATKPVSRSGP(서열번호 13) 중 선택된 아미노산 서열로 표현됨; 및
    MAKNTITKTLKLRIVRPYNSAEVEKIVADEKNNREKIALEKNKDKVKEACSKHLKVAAYCTTQVERNACLFCKARKLDDKFYQKLRGQFPDAVFWQEISEIFRQLQKQAAEIYNQSLIELYYEIFIKGKGX1ANASX2VEHYLSDVCYTRAAELFKNAAIASGLRSKIKSNFRLKELKNMKSGLPTTKSDNFPIPLVKQKGGQYTGFEISNHNSDFIIKIPFGRWQVKKEIDKYRPWEKFDFEQVQKSPKPISLLLSTQRRKRNKGWSKDEGTEAEIKKVMNGDYQTSYIEVKRGSKIGEKSAWMLNLSIDVPKIDKGVDPSIIGGIX3VGVKSPLVCAINNAFSRYSISDNDLFHFNKKMFARRRILLKKNRHKRAGHGAKNKLKPITILTEKSERFRKKLIERWACEIADFFIKNKVGTVQMX4NLESMKRKEDSYFNIRLRGFWPYAEMQNKIEFKLKQYGIEIRKVAPNNTSKTCSKCGHLNNYFNFEYX5KKNKFPHFKCEKCNFKENAX6YNAALNISNPKLKSTKEEP(서열번호 9)로 표현되는 야생형 Cas12f1 기반의 dead Cas12f1 단백질
    여기서, X1은 이소류신(isoleucine) 또는 트립토판(tryptophan)이고, X2는 세린(serine) 또는 티로신(tyrosine)이고,
    X3은 아스파르트산(aspartic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고, X4는 글루탐산(glutamic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine), X5는 아르기닌(arginine), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이며, X6은 아스파르트산(aspartic acid), 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고,
    여기서 상기 X3, X4, X5, 및 X6 중 적어도 하나는 알라닌(alanine), 글루타민(glutamine), 류신(leucine), 트립토판(tryptophan), 또는 발린(valine)이고,
    상기 더미 부분 및 상기 야생형 Cas12f1 기반의 dead Cas12f1은 상기 dead Cas12f1 단백질의 N말단에서 C말단 방향으로 순차적으로 연결되어 있음.
  3. 제1항에 있어서, 상기 dead Cas12f1 단백질은 서열번호 2 내지 서열번호 8 중 선택된 아미노산 서열로 표현되는 dead Cas12f1 단백질.
  4. 제2항에 있어서, 상기 dead Cas12f1 단백질은 서열번호 15 내지 서열번호 24, 서열번호 26 내지 서열번호 29, 서열번호 31 내지 서열번호 34, 서열번호 36 내지 서열번호 39 중 선택된 아미노산 서열로 표현되는 dead Cas12f1 단백질.
  5. 다음을 포함하는 dCas12f1-염기교정 융합 단백질:
    제1항 내지 제4항중 어느 하나의 dead Cas12f1 단백질; 및
    탈아미노화효소(deaminase),
    여기서, 상기 탈아미노화효소는 서열번호 245, 서열번호 247 내지 서열번호 249, 서열번호 274 내지 서열번호 283 중 선택된 아미노산 서열을 가짐.
  6. 제5항에 있어서, 상기 탈아미노화효소는 서열번호 274 내지 서열번호 279 중 선택된 아미노산 서열을 가지는 dCas12f1-염기교정 융합 단백질.
  7. 제6항에 있어서, 상기 탈아미노화효소는 상기 dead Cas12f1의 N말단에 융합된 dCas12f1-염기교정 융합 단백질.
  8. 제6항에 있어서, 상기 탈아미노화효소는 상기 dead Cas12f1의 C말단에 융합된 dCas12f1-염기교정 융합 단백질.
  9. 제6항에 있어서, 상기 dCas12f1-염기교정 융합 단백질은 서열번호 284 내지 서열번호 324, 서열번호 418 내지 서열번호 442 중 선택된 아미노산 서열을 가지는 dCas12f1-염기교정 융합 단백질.
  10. 제5항에 있어서,
    상기 dCas12f1-염기교정 융합 단백질은 적어도 하나의 uracil glycosylase inhibitor(UGI)를 더 포함하고,
    상기 탈아미노화효소는 서열번호 280 내지 서열번호 283 중 선택된 아미노산 서열을 가지고,
    상기 적어도 하나의 UGI는 상기 dead Cas12f1에 융합된, dCas12f1-염기교정 융합 단백질.
  11. 제10항에 있어서,
    상기 탈아미노화효소는 상기 dead Cas12f1 단백질의 N말단에 융합되어 있고,
    상기 적어도 하나의 UGI는 상기 dead Cas12f1 단백질의 C말단에 융합된, dCas12f1-염기교정 융합 단백질.
  12. 제10항에 있어서,
    상기 탈아미노화효소는 상기 dead Cas12f1 단백질의 C말단에 융합되어 있고,
    상기 적어도 하나의 UGI는 상기 dead Cas12f1 단백질의 N말단에 융합된, dCas12f1-염기교정 융합 단백질.
  13. 제10항에 있어서,,
    서열번호 325 내지 서열번호 328 중 선택된 아미노산 서열로 표현되는 dCas12f1-염기교정 융합 단백질.
  14. 제5항 내지 제13항중 어느 하나에 있어서,
    상기 dead Cas12f1 및 탈아미노화효소는 링커를 통해 연결되어 있고,
    상기 링커는 서열번호 260 내지 서열번호 273 중 선택된 아미노산 서열로 표현되는 dCas12f1-염기교정 융합 단백질.
  15. 제5항 내지 제14항중 어느 하나에 있어서,
    상기 dCas12f1-염기교정 융합 단백질은 적어도 하나의 nuclear localization signal(NLS)를 추가적으로 포함하고,
    상기 NLS이 N말단, C말단, 또는 양 말단에 위치하는 dCas12f1-염기교정 융합 단백질.
  16. 다음을 포함하는 dCas12f1-발현조절 융합 단백질:
    제1항 내지 제4항중 어느 하나의 dead Cas12f1 단백질; 및
    적어도 하나의 발현조절 도메인으로, 각각 VP64, KRAB, MeCP2, DNMT, HDAC, Tet1, 및 p300 중 선택된 것.
  17. 제16항에 있어서, 상기 발현조절 도메인은 각각 독립적으로 서열번호 329 내지 서열번호 333 중 선택된 아미노산 서열로 표현됨.
  18. 제16항 내지 제17항중 어느 하나에 있어서,
    상기 발현조절 도메인은 모두 상기 dead Cas12f1 단백질의 N말단에 위치하는 dCas12f1-발현조절 융합 단백질.
  19. 제18항에 있어서,
    서열번호 511 내지 서열번호 513중 선택된 아미노산 서열로 표현되는 dCas12f1-발현조절 융합 단백질.
  20. 제16항 내지 제17항중 어느 하나에 있어서, ,
    상기 발현조절 도메인은 모두 상기 dead Cas12f1 단백질의 C말단에 위치하는 dCas12f1-발현조절 융합 단백질.
  21. 제20항에 있어서,
    서열번호 514 내지 서열번호 518중 선택된 아미노산 서열로 표현되는 dCas12f1-발현조절 융합 단백질.
  22. 제16항 내지 제17항중 어느 하나에 있어서, ,
    상기 dCas12f1-발현조절 융합 단백질은 제1 발현조절 도메인 및 제2 발현조절 도메인을 포함하고,
    상기 제1 발현조절 도메인은 상기 dead Cas12f1 단백질의 N말단에 위치하고,
    상기 제2 발현조절 도메인은 상기 dead Cas12f1 단백질의 C말단에 위치하는 dCas12f1-발현조절 융합 단백질.
  23. 제22항에 있어서,
    서열번호 519 내지 서열번호 521중 선택된 아미노산 서열로 표현되는 dCas12f1-발현조절 융합 단백질.
  24. 다음을 포함하는 엔지니어링 된 CRISPR/Cas12f1 조성물:
    제1항 내지 제4항중 어느 하나의 dead Cas12f1 단백질, 제5항 내지 제15항중 어느 하나의 dCas12f1-염기교정 융합 단백질, 및 제16항 내지 제23항중 어느 하나의 dCas12f1-발현조절 융합 단백질 중 선택된 엔지니어링 된 Cas12f1 단백질, 또는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산; 및
    적어도 하나의 가이드 RNA, 또는 상기 가이드 RNA를 암호화하는 핵산,
    여기서, 각각의 가이드 RNA는 스캐폴드, 스페이서, 및 U-rich tail을 포함하고,
    상기 스캐폴드, 상기 스페이서, 및 상기 U-rich tail은 5'말단에서 3'말단 방향으로 순차적으로 연결되어 있고,
    상기 스캐폴드는 서열번호 197 내지 서열번호 199 중 선택된 핵산 서열로 표현되고,
    상기 U-rich tail은 (UaN)bUc의 핵산 서열로 표현되고, 여기서 N은 A, U, C, 및 G 중 각각 독립적으로 선택되고, a는 1 이상 5 이하의 정수, b는 0 이상의 정수이고,
    상기 스페이서는 10 이상 50 이하의 뉴클레오사이드를 포함하고, 미리 결정된 표적 서열과 상보적인 핵산 서열을 가짐.
  25. 제24항에 있어서,
    상기 엔지니어링 된 Cas12f1 단백질은 제5항 내지 제15항중 어느 하나의 dCas12f1-염기교정 융합 단백질인, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  26. 제25항에 있어서,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 엔지니어링 된 Cas12f1 단백질 및 상기 가이드 RNA를 리보뉴클레오프로틴(ribonucleoprotein; RNP) 형태로 포함하는, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  27. 제25항에 있어서,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 벡터 형태로 포함하는, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  28. 제27항에 있어서,
    상기 벡터는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산, 제1 가이드 RNA를 암호화하는 핵산, 및 제2 가이드 RNA를 암호화하는 핵산을 포함하고,
    상기 제1 가이드 RNA의 스페이서의 핵산 서열 및 상기 제2 가이드 RNA의 스페이서의 핵산 서열은 서로 다른, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  29. 제25항 내지 제28항중 어느 하나에 있어서,
    상기 엔지니어링 된 Cas12f1 단백질은 제6항 내지 제9항중 어느 하나의 dCas12f1-염기교정 융합 단백질인, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  30. 제25항 내지 제28항중 어느 하나에 있어서,
    상기 엔지니어링 된 Cas12f1 단백질은 제10항 내지 제14항중 어느 하나의 dCas12f1-염기교정 융합 단백질인, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  31. 제24항에 있어서,
    상기 엔지니어링 된 Cas12f1 단백질은 제16항 내지 제23항중 어느 하나의 dCas12f1-발현조절 융합 단백질인, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  32. 제31항에 있어서,
    상기 dCas12f1-발현조절 융합 단백질은 하나 이상의 VP64를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  33. 제31항에 있어서,
    상기 dCas12f1-발현조절 융합 단백질은 VP64, KRAB, MeCP2, DNMT, HDAC, Tet1 및 p300 중 선택된 하나 이상의 발현조절 도메인을 포함하는, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  34. 제31항에 있어서,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 엔지니어링 된 Cas12f1 단백질 및 상기 가이드 RNA를 리보뉴클레오프로틴(ribonucleoprotein; RNP) 형태로 포함하는, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  35. 제31항에 있어서,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물은 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산 및 상기 가이드 RNA를 암호화하는 핵산을 포함하는 벡터를 포함하는, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  36. 제35항에 있어서,
    상기 벡터는 상기 엔지니어링 된 Cas12f1 단백질을 암호화하는 핵산, 제1 가이드 RNA를 암호화하는 핵산, 및 제2 가이드 RNA를 암호화하는 핵산을 포함하고,
    상기 제1 가이드 RNA의 스페이서의 핵산 서열 및 상기 제2 가이드 RNA의 스페이서의 핵산 서열은 서로 다른, 엔지니어링 된 CRISPR/Cas12f1 조성물.
  37. 다음을 포함하는, 세포 내 표적 유전자의 염기교정 방법:
    제29항의 엔지니어링 된 CRISPR/Cas12f1 조성물을 살아있는 세포 내로 도입하는 것,
    여기서, 상기 세포의 상기 표적 유전자는 표적가닥 및 비-표적가닥을 포함하는 이중가닥 DNA이고,
    상기 표적가닥은 표적 서열을 가지고,
    상기 비-표적가닥은 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 및 프로토스페이서를 가지고,
    상기 프로토스페이서는 상기 표적 서열과 상보적인 서열을 가지는, 10nt 내지 50nt의 핵산서열이고,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 가이드 RNA의 스페이서는 상기 표적가닥의 표적 서열과 혼성화(hybridized)될 수 있는 것이고,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 상기 세포 내로 도입함으로써, CRISPR-염기교정 복합체가 세포 내에서 형성되고,
    상기 CRISPR-염기교정 복합체에 의해 상기 프로토스페이서의 적어도 하나의 아데닌이 구아닌으로 치환됨.
  38. 제37항에 있어서,
    여기서, 상기 표적 유전자의 상기 프로토스페이서는 5'말단에서 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 15번째, 16번째, 17번째, 18번째, 19번째, 및 20번째 위치에 적어도 하나의 아데닌을 포함하고,
    상기 염기교정 방법의 수행 결과, 상기 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 15번째, 16번째, 17번째, 18번째, 19번째, 및 20번째 위치의 아데닌 중 적어도 하나가 구아닌으로 치환되는, 염기교정 방법.
  39. 다음을 포함하는, 세포 내 표적 유전자의 염기교정 방법:
    제30항의 엔지니어링 된 CRISPR/Cas12f1 조성물을 상기 세포 내로 도입하는 것,
    여기서, 상기 세포의 상기 표적 유전자는 표적가닥 및 비-표적가닥을 포함하는 이중가닥 DNA이고,
    상기 표적가닥은 표적 서열을 가지고,
    상기 비-표적가닥은 프로토스페이서 인접 모티프(protospacer adjacent motif; PAM) 및 프로토스페이서를 가지고,
    상기 프로토스페이서는 상기 표적 서열과 상보적인 서열을 가지는, 10nt 내지 50nt의 핵산이고,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 가이드 RNA의 스페이서는 상기 표적가닥의 표적 서열과 혼성화(hybridized)될 수 있는 것이고,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물을 상기 세포 내로 도입함으로써, CRISPR-염기교정 복합체가 세포 내에서 형성되고,
    상기 CRISPR-염기교정 복합체에 의해 상기 프로토스페이서의 적어도 하나의 시토신이 티민으로 치환됨.
  40. 제39항에 있어서,
    여기서, 상기 표적 유전자의 상기 프로토스페이서는 5'말단에서 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 및 9번째 위치에 적어도 하나의 시토신을 포함하고,
    상기 염기교정 방법의 수행 결과, 상기 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 및 9번째 위치의 시토신 중 적어도 하나가 티민으로 치환되는, 염기교정 방법.
  41. 제37항 내지 제40항중 어느 하나에 있어서,
    상기 세포는 진핵세포인, 염기교정 방법.
  42. 다음을 포함하는, 세포 내 표적 유전자의 발현조절 방법:
    제31항 내지 제36항중 어느 하나의 엔지니어링 된 CRISPR/Cas12f1 조성물을 세포 내에 도입하는 것,
    상기 엔지니어링 된 CRISPR/Cas12f1 조성물의 도입에 의해, 세포 내 CRISPR 유전자조절 복합체가 형성되고,
    상기 CRISPR 유전자조절 복합체에 의해 상기 표적 유전자의 발현이 조절됨.
  43. 제42항에 있어서, 상기 세포는 진핵세포인 발현조절 방법.
KR1020237015257A 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도 KR102700253B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020247028537A KR20240133781A (ko) 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20210087956 2021-07-05
KR1020210087956 2021-07-05
KR1020210132306 2021-10-06
KR20210132306 2021-10-06
KR1020210181875 2021-12-17
KR1020210181875A KR20230007218A (ko) 2021-07-05 2021-12-17 초소형 염기교정 시스템 및 이의 용도
PCT/KR2022/009701 WO2023282597A1 (ko) 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247028537A Division KR20240133781A (ko) 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도

Publications (2)

Publication Number Publication Date
KR20230074819A true KR20230074819A (ko) 2023-05-31
KR102700253B1 KR102700253B1 (ko) 2024-09-03

Family

ID=84801951

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020247028537A KR20240133781A (ko) 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
KR1020237015257A KR102700253B1 (ko) 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020247028537A KR20240133781A (ko) 2021-07-05 2022-07-05 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도

Country Status (6)

Country Link
US (1) US20240254464A1 (ko)
EP (1) EP4368713A1 (ko)
JP (1) JP2024525602A (ko)
KR (2) KR20240133781A (ko)
AU (1) AU2022307018A1 (ko)
WO (1) WO2023282597A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8450107B1 (en) * 2011-11-30 2013-05-28 The Broad Institute Inc. Nucleotide-specific recognition sequences for designer TAL effectors
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
SG11202003863VA (en) 2017-11-01 2020-05-28 Univ California Casz compositions and methods of use
CN112805379B (zh) * 2018-08-03 2024-08-20 比姆医疗股份有限公司 多效应核碱基编辑器和使用其修饰核酸靶序列的方法
CN114846146B (zh) * 2019-10-29 2024-04-12 基恩科雷有限责任公司 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途

Also Published As

Publication number Publication date
AU2022307018A1 (en) 2024-02-15
WO2023282597A1 (ko) 2023-01-12
KR20240133781A (ko) 2024-09-04
KR102700253B1 (ko) 2024-09-03
US20240254464A1 (en) 2024-08-01
JP2024525602A (ja) 2024-07-12
EP4368713A1 (en) 2024-05-15

Similar Documents

Publication Publication Date Title
JP7093728B2 (ja) 化学的に修飾されたガイドrnaを使用する高特異性ゲノム編集
US20220307018A1 (en) ENGINEERED GUIDE RNA FOR THE OPTIMIZED CRISPR/Cas12f1 SYSTEM AND USE THEREOF
Tadić et al. CRISPR/Cas9-based epigenome editing: An overview of dCas9-based tools with special emphasis on off-target activity
US20240254479A1 (en) Engineered guide rna for optimized crispr/cas12f1 system and use thereof
KR20220144317A (ko) Crispr 시스템을 이용한 유전자 발현 조절 시스템
US11814620B2 (en) Effector proteins and methods of use
KR20240023081A (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
Li et al. Site-directed RNA editing by harnessing ADARs: advances and challenges
US20230374500A1 (en) Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof
KR20200135225A (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
KR102700253B1 (ko) 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
KR20230007218A (ko) 초소형 염기교정 시스템 및 이의 용도
KR102638799B1 (ko) CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
KR20220145438A (ko) CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도
CN117916372A (zh) 无切割活性的cas12f1、基于无切割活性的cas12f1的融合蛋白、包括其的crispr基因编辑系统及其制备方法和用途
WO2023196220A2 (en) Method for genome-wide functional perturbation of human microsatellites using engineered zinc fingers
WO2023120658A1 (ja) 酵素、複合体、組換えベクター、遺伝性疾患治療薬及びポリヌクレオチド
WO2024137767A1 (en) Compositions and methods for modifying dux4
WO2024182444A2 (en) Compositions and methods for the modification and regulation of liver gene expression
WO2024173699A2 (en) Compositions for the treatment of spinal muscular atrophy
WO2024196741A2 (en) Crispr systems targeting the braf gene relating to the treatment of melanoma
CN116568806A (zh) 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途
KR20230142365A (ko) 어셔 증후군 치료를 위한 유전자 편집 시스템
WO2024091907A1 (en) Compositions and methods for modifying the hpv16 genome
KR20240141024A (ko) E1347A DddAtox 변이체-TnpB fusion 단백질을 이용한 유전자 가위 시스템

Legal Events

Date Code Title Description
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant