KR20220096861A - 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 - Google Patents

표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 Download PDF

Info

Publication number
KR20220096861A
KR20220096861A KR1020200189691A KR20200189691A KR20220096861A KR 20220096861 A KR20220096861 A KR 20220096861A KR 1020200189691 A KR1020200189691 A KR 1020200189691A KR 20200189691 A KR20200189691 A KR 20200189691A KR 20220096861 A KR20220096861 A KR 20220096861A
Authority
KR
South Korea
Prior art keywords
cas9
target
lys
leu
rec2
Prior art date
Application number
KR1020200189691A
Other languages
English (en)
Other versions
KR102567576B1 (ko
Inventor
배상수
정영리
김성근
성기원
Original Assignee
한양대학교 산학협력단
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단, 서울대학교산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020200189691A priority Critical patent/KR102567576B1/ko
Publication of KR20220096861A publication Critical patent/KR20220096861A/ko
Application granted granted Critical
Publication of KR102567576B1 publication Critical patent/KR102567576B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 신규한 Cas9 단백질 변이체 및 이의 용도에 관한 것으로, 보다 구체적으로는 종래 Cas9 단백질에 비해 표적 특이성이 향상된 Cas9 단백질 변이체, 이를 포함하는 CRISPR/Cas9 시스템, 및 이의 유전자 편집 용도에 관한 것이다. 본 발명에서는 Cas9 단백질의 REC2 도메인의 특정 위치에서 아미노산을 치환하는 조작을 통해 checkpoint 구조에서의 비표적 검문을 강화하여 Cas9의 표적 특이성을 향상시켰다. 나아가 REC2 도메인을 조작한 돌연변이와 종래 알려진 Cas9-HF1 또는 eCas9 내 돌연변이의 조합을 통하여 기존에 보고된 Cas9 변이체 종들에 비하여 현저히 우수한 표적 특이성과 표적 서열의 절단 활성을 모두 갖춘 Cas9 단백질 변이체를 개발하였다. 이에, 본 발명은 Cas9 엔지니어링의 유망한 표적으로서 REC2 도메인을 새롭게 제시하였으며, 본 발명을 통해 제조된 Cas9 유전자가위는 유전자 교정 또는 조작이 요구되는 여러 분야, 예컨대 유전 질환, 대사이상 질환, 자가면역 질환, 감염증 등의 치료를 위한 치료제, 농작물의 품종 개량 및 동물의 형질 개량 등의 관련 분야에서 유용하게 활용될 수 있을 것이다.

Description

표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도{Novel Cas9 protein variants with improved target specificity and use thereof}
본 발명은 신규한 Cas9 단백질 변이체 및 이의 용도에 관한 것으로, 보다 구체적으로는 종래 Cas9 단백질에 비해 표적 특이성이 향상된 Cas9 단백질 변이체, 이를 포함하는 CRISPR/Cas9 시스템, 및 이의 유전자 편집 용도에 관한 것이다.
CRISPR(clustered regularly interspaced short palindromic repeats)/Cas9(CRISPR-associated protein 9) 시스템은 원핵생물의 후천 면역계에서 유래된 기술로, 현재는 유전자 교정을 위한 차세대 유전자가위로 크게 각광받고 있다. 상기 시스템은 스트렙토코커스 피오게네스(Streptococcus pyogenes)에서 유래한 Cas9 핵산분해효소와 두 개의 가이드 RNA(CRISPR RNA(crRNA) 및 trans-activating crRNA(tracrRNA)), 또는 상기 두 가이드 RNA를 이어 붙인 단일 가이드 RNA(sgRNA)로 구성되며, 이들은 Cas9:gRNA 복합체를 형성하여 표적 DNA를 절단하는 기능을 수행한다. Cas9:gRNA 복합체는 기본적으로 DNA와 crRNA 간의 20개(bp) 염기쌍 서열의 상보성을 바탕으로 표적 DNA를 식별하며, 이와 더불어 PAM(protospacer-adjacent motif) 이라고 불리는 표적 DNA의 3’ 말단에 위치한 짧은 서열(S. pyogenes Cas9의 경우 5’-NGG-3’)을 함께 인식하여 표적 유무를 판별한다. 하지만 이러한 CRISPR/Cas9 유전자가위 시스템은 제한된 수준의 표적 특이성을 나타내어 비표적 DNA의 절단을 함께 유발하는바, 이로 인해 질병 치료 기술로의 광범위한 활용은 여전히 가로막혀 있는 실정이다.
이에, 우선 Cas9의 표적 식별 방식을 보다 체계적으로 이해하기 위해, 표적 인식과 그 이후 절단까지의 과정에 대한 분자 수준에서의 메커니즘 연구가 활발히 진행되어 왔다. X선 결정학 및 cryo-EM 연구는 Cas9의 분자적 입체구조를 규명하였다. 그 결과, Cas9은 두 개의 lobe로 구성되어 있는데, 각각은 crRNA와 DNA의 표적 가닥(TS)이 형성하는 이형이중나선구조(heteroduplex)를 안정화하는 REC lobe(REC1, REC2, REC3 도메인으로 구성됨), 및 DNA의 TS와 그에 상보적인 반대편 가닥(NTS) 각각을 절단하는 HNH와 RuvC 핵산분해 도메인이 포함된 NUC lobe임이 알려져 있다. 더 나아가, 본 발명자들의 선행연구를 포함한 단일 분자 수준에서의 여러 연구는 DNA 분해 효소 활성을 지닌 Cas9:gRNA:DNA 복합체 구조뿐만 아니라 DNA를 자르지 못하는 상태의 반응 중간체를 추가적으로 발견하였다. 이러한 중간체 구조에서는, crRNA-DNA 이형이중나선구조(또는 R-loop 구조)가 PAM과 인접한 “seed” 영역(10-12 bp)에서만 부분적으로 형성되고, NTS는 RuvC 핵산분해 도메인으로부터 멀리 떨어져 REC2 도메인과 상호작용하며, HNH 핵산분해 도메인은 비활성 상태의 구조를 이룬다. 이 중간체의 존재 비율은 PAM으로부터 반대쪽 말단의 염기쌍 불일치(mismatch)에 민감하게 의존하기에, DNA 절단 직전의 표적 검문소(checkpoint) 역할을 수행하는 것으로 생각되고 있다. 이러한 연구들은 Cas9의 표적 특이성이, 첫 번째로는 DNA에 Cas9:gRNA가 결합하여 checkpoint 중간체 구조를 형성할 때 seed 영역의 상보성을 확인하고, PAM으로부터 떨어진 반대쪽 영역의 경우 checkpoint에서 최종적으로 상보성을 확인하여 DNA 절단을 위한 구조변화를 유도하는 총 두 단계의 메커니즘을 통해 결정된다는 것을 보여주었다.
이러한 구조적인 측면과 메커니즘 관점에서의 이해를 바탕으로, 비표적 DNA의 절단 문제를 극복하기 위한 노력들 역시 꾸준히 이어져 왔다. crRNA에 대한 직접적인 조작법, 예컨대 5’ 말단 길이 조절, DNA 또는 화학적으로 합성한 가교 핵산(bridged nucleic acid)으로의 부분적인 치환 등이 몇 가지 보고된 바 있긴 하지만, 표적 특이성 개선을 위한 현재까지의 가장 주된 전략은 Cas9 단백질 공학법(protein engineering)이다. 특히, crRNA-TS 이형이중나선구조와 인접하게 위치하는 REC3 도메인을 조작하는 연구가 많이 보고되어 왔다. 예컨대, 공지된 Cas9-HF1과 HypaCas9은 주로 REC3에 위치한, 이형이중나선구조와 직접적으로 상호작용하고 있는 아미노산 잔기들을 합리적으로 치환함으로써 효소활성을 지닌 Cas9:gRNA:DNA 구조를 전반적으로 불안정화하여 비표적 DNA 절단을 방지하도록 개발되었고, 반면에 evoCas9은 REC3에 대한 방향적 진화기술(directed evolution)을 적용하여 선별되었다. 또한, HNH와 RuvC 핵산분해 도메인에 대한 engineering 역시 시도되어 왔다. eCas9은 이형이중나선구조로부터 떨어져 나온 NTS의 절단을 위해 이와 상호작용하는 핵산분해 도메인 상의 잔기들 중 일부를 합리적으로 제거한 버전이고(Science, 01 Jan 2016, Vol. 351, 6268, pp. 84-88), 최근에 보고된 LZ3 Cas9은 주로 HNH와 RuvC 잔기들에 대한 무작위적인 돌연변이를 통해 진화되었다. 이에 더하여, Cas9 잔기 전체에 대한 방향적 진화기술 적용을 통해서는, REC과 NUC lobe 모두에 전반적으로 돌연변이를 포함하는 Sniper Cas9과 xCas9, 및 REC3에 하나의 돌연변이가 도입된 HiFi Cas9이 제작되었다. 하지만 이들 Cas9 종에 대한 고처리량(high-throughput) 프로파일링은 표적에 대한 효소 활성도와 특이성 사이의 보편적인 상충 관계를 보여주었고, 따라서 표적 활성을 유지한 채로 높은 특이성을 함께 지니는 Cas9을 개발하기 위한 새로운 전략의 필요성이 대두되었다.
본 발명자들은 상기와 같은 종래 CRISPR-Cas9 유전자가위 시스템의 비표적 서열에 대한 절단 문제를 해결하기 위하여 연구노력한 결과, Cas9 단백질의 REC2 도메인에 대한 합리적인 조작(engineering)을 통해 표적 활성은 야생형 수준으로 유지되면서 비표적 서열에 대한 절단 효율은 현저히 감소되어 표적 특이성이 향상된 Cas9 단백질 변이체를 개발하였으며, 나아가 본 발명에 따른 REC2 도메인이 조작된 Cas9 단백질과 공지된 Cas9 단백질 변이체의 일부 돌연변이를 조합한 결과 표적 특이성이 더욱 향상된 Cas9 단백질을 개발하였는바, 이로써 본 발명을 완성하였다.
이에, 본 발명은 표적 특이성이 향상된 Cas9 단백질 변이체를 제공하는 것을 목적으로 한다.
또한, 본 발명은 상기 Cas9 단백질 변이체를 포함하는, CRISPR/Cas9 시스템을 제공하는 것을 다른 목적으로 한다.
또한, 본 발명은 상기 Cas9 단백질 변이체를 암호화하는 폴리뉴클레오티드 및 이를 포함하는 벡터를 제공하는 것을 또 다른 목적으로 한다.
그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명의 목적을 달성하기 위하여, 본 발명은 서열번호 1의 아미노산으로 이루어진 야생형 Cas9 단백질의 REC2 도메인 영역에서 적어도 한 개의 돌연변이를 포함하는, Cas9 단백질 변이체를 제공한다.
본 발명의 일구현예로, 상기 REC2 도메인 영역은 서열번호 1의 아미노산 서열에서 170번부터 307번 위치의 아미노산을 포함하는 것일 수 있다.
본 발명의 다른 구현예로, 상기 Cas9 단백질 변이체는 E223, E232, D257, E260, D261, S219, Q228, T249, N251, S254, Q265 및 S267로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산이 Lys(K), Arg(R) 또는 Tyr(Y)으로 치환된 것일 수 있다.
본 발명의 또 다른 구현예로, 상기 Cas9 단백질 변이체는 하기에서 선택되는 어느 하나의 돌연변이를 포함하는 것일 수 있다.
E223K 및 E232K;
E223K, E232K 및 D257K;
D257K, E260K 및 D261K;
E223K, E232K, D257K, E260K 및 D261K;
E223R, E232R, D257R, E260R 및 D261R;
E223Y, E232Y, D257Y, E260Y 및 D261Y; 및
S219K, Q228K, T249K, N251K, S254K, Q265K 및 S267K.
본 발명의 또 다른 구현예로, 상기 Cas9 단백질 변이체는 R661, Q695, K848, K855, Q926 및 R1060으로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산의 돌연변이를 더 포함하는 것일 수 있다.
본 발명의 또 다른 구현예로, 상기 R661, Q695, K848, K855, Q926 및 R1060으로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산이 Ala(A)으로 치환된 것일 수 있다.
본 발명의 또 다른 구현예로, 상기 단백질 변이체는 표적 서열에 대한 특이성이 향상된 것일 수 있다.
또한, 본 발명은 상기 Cas9 단백질 변이체; 및 가이드 RNA(guide RNA)를 포함하는, CRISPR/Cas9 시스템을 제공한다.
또한, 본 발명은 상기 Cas9 단백질 변이체를 암호화하는, 폴리뉴클레오티드를 제공한다.
또한, 본 발명은 상기 폴리뉴클레오티드를 포함하는, 벡터를 제공한다.
본 발명에서는 Cas9 단백질 내 REC2 도메인의 특정 위치에서 아미노산을 치환하는 조작을 통해 checkpoint 구조에서의 비표적 검문을 강화하여 Cas9의 표적 특이성을 향상시켰으며, 나아가 REC2 도메인을 조작한 돌연변이와 종래 알려진 Cas9-HF1 또는 eCas9 내 돌연변이의 일부 조합을 통하여 기존에 보고된 Cas9 종들에 비하여 현저히 우수한 표적 특이성과 표적 서열에 대한 절단 활성을 모두 갖춘 Cas9 단백질 변이체를 개발하였다. 이에, 본 발명은 Cas9 엔지니어링의 유망한 표적으로서 REC2 도메인을 새롭게 제시하였으며, 본 발명을 통해 제조된 Cas9 유전자가위는 유전자 교정 또는 조작이 요구되는 여러 분야, 예컨대 유전 질환, 대사이상 질환, 자가면역 질환, 감염증 등의 치료를 위한 치료제 개발, 농작물의 품종 개량 및 동물의 형질 개량 등의 관련 분야에서 유용하게 활용될 수 있을 것이다.
도 1은 Cas9:gRNA:DNA 복합체의 3차원 분자 구조를 도시한 것으로, Cas9의 REC2 도메인 표면 상에 위치하는 양전하 및 음전하를 띤 잔기들을 각각 구별하여 나타내었고, 본 발명에 따른 상기 REC2의 음전하를 띤 잔기를 양전하 잔기로 치환시켜 조작한 Cas9 단백질 (REC2-K1, -K2, -K3, -K4 및 -R4)들의 아미노산 치환 정보를 나타낸 것이다.
도 2는 REC2의 음전하를 띤 아미노산 잔기가 양전하를 띤 라이신(K) 또는 아르기닌(R) 잔기로 치환된 Cas9 단백질(REC2-K1, -K2, -K3, -K4 및 -R4)들의 표적 특이성을 조사하기 위한 단일 분자 기반 측정 플랫폼의 설계도, 및 상기 플랫폼을 활용하여 표적과 비표적 DNA에 대한 in vitro 수준에서의 절단 효율을 측정한 결과를 나타낸 것이다.
도 3은 추가적으로 제작한 REC2가 조작된 Cas9 단백질들의 표적 특이성을 in vitro에서 분석한 결과로서, 도 3a는 Cas9:gRNA:DNA 복합체의 3차원 분자 구조를 도시한 것으로, Cas9의 REC2 도메인 표면 상에 위치하는 양전하, 음전하 및 극성을 갖는 아미노산 잔기를 구별하여 나타낸 것이고, 도 3b는 REC2 도메인 표면상에 음전하를 띤 아미노산 잔기를 티로신(Y)으로 치환시킨 Cas9 (REC2-Y4) 및 REC2 도메인 표면상의 극성을 띤 7개의 잔기를 라이신(K)으로 치환시킨 Cas9 (REC2-K’)을 상기 도 2의 실험군에 추가하여 표적과 비표적 DNA에 대한 in vitro 수준에서의 절단 효율을 측정한 결과를 나타낸 것이다.
도 4는 세포 내에서 REC2-K4, REC2-R4 Cas9의 EMX1, FANCF(2)HBG(2) 유전자 표적 및 비표적 DNA에 대한 절단 효율을 야생형 Cas9(WT) 및 기존에 보고된 조작된 Cas9 단백질(Sniper Cas9, eCas9 및 Cas9-HF1)의 절단 효율과 비교한 결과이다.
도 5는 본 발명에 따른 REC2 도메인이 조작된 Cas9과 기존에 보고된 조작된 Cas9 단백질(Sniper Cas9, eCas9 및 Cas9-HF1)의 돌연변이 조합에 따른 표적 특이성 향상 효과를 분석한 결과로서, 도 5a는 각 변이체 단독, 공지된 변이체와 REC2-K4의 조합, REC2-K4와 eCas9 또는 Cas9-HF1의 돌연변이 중 일부를 조합한 경우들의 표적 및 비표적 DNA에 대한 절단 효율을 분석한 결과이고, 도 5b는 상기 각 Cas9 변이체 단독 또는 조합의 표적에 대한 활성을 표적 특이성과 대비한 결과로 나타낸 것이며, 도 5c는 REC2-R4와 eCas9 또는 Cas9-HF1의 돌연변이 중 일부를 조합한 경우들의 표적 및 비표적 DNA에 대한 절단 효율을 추가적으로 측정하여 상기 도 5a의 실험군에 대한 결과와 함께 나타낸 것이다.
도 6은 REC2-K4와 eCas9 또는 Cas9-HF1의 돌연변이 중 일부를 조합한 다양한 경우를 추가하여 GX19-gRNA를 이용해 3개의 유전자 서열(EMX1, VEGFA site 3, HEK site 4)을 표적화하여, 이들 표적서열과 이미 잘 알려진 비표적 서열들에 대한 indel 빈도를 측정한 결과이다.
본 발명은 표적 특이성이 향상된 Cas9 단백질 변이체 및 이의 용도에 관한 것으로, 본 발명자들은 Cas9 단백질의 REC2 도메인을 조작하여 checkpoint 구조에서의 비표적 검문을 강화하여 Cas9의 표적 특이성을 향상시켰고, 나아가 REC2 도메인을 조작한 돌연변이와 종래 알려진 Cas9-HF1 또는 eCas9 내 돌연변이의 조합을 통해 우수한 표적 특이성과 표적 서열의 절단 활성을 모두 갖춘 Cas9 단백질 변이체를 개발하였다.
이하, 본 발명을 상세히 설명한다.
본 발명은 서열번호 1의 아미노산으로 이루어진 야생형 Cas9 단백질의 REC2 도메인 영역에서 적어도 한 개의 돌연변이를 포함하는, Cas9 단백질 변이체를 제공한다.
본 발명에서, 상기 “Cas9”이란 “CRISPR-Cas9”을 지칭하며, CRISPR-Cas9는 3세대 유전자가위로써 이용하고자 하는 특정 염기서열을 인식하여 절단하고 편집하며, 게놈의 목적 장소에 특정 유전자를 삽입하거나 특정 유전자의 활동을 정지시키는 조작을 간단하고 신속하고 효율성 있게 실시하는데 유용하다.
상기 REC2 도메인 영역은 서열번호 1의 아미노산 서열에서 170번부터 307번 위치의 아미노산을 포함하는 것일 수 있으며, 본 발명자들은 선행 연구를 통해 REC2 도메인이 비표적 서열을 구별하는데 중요한 역할을 한다는 것을 규명하였다. 구체적으로, 단일 분자 기반 측정 플랫폼을 이용해 Cas9과 상호작용하는 DNA 비표적 서열의 구조적 변화를 조사하고, REC2가 이의 표면 상의 양전하 아미노산 잔기가 비표적 서열을 checkpoint 중간체 구조에 붙잡아둠으로써 비표적 DNA 절단을 방지한다는 메커니즘을 규명하였다.
본원발명에서 사용되는 용어, “변이체”란 참조 엔터티(entity)(예컨대, 야생형 서열)와 상당한 구조적 동일성을 나타내지만 하나 이상에서 참조 엔터티와 구조적으로 상이한 엔터티를 지칭한다.
본 발명에 있어서, 상기 Cas9 단백질 변이체는 E223, E232, D257, E260, D261, S219, Q228, T249, N251, S254, Q265 및 S267로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산이 Lys(K), Arg(R) 또는 Tyr(Y)으로 치환된 것일 수 있고, 보다 바람직하게는 E223K 및 E232K; E223K, E232K 및 D257K; D257K, E260K 및 D261K; E223K, E232K, D257K, E260K 및 D261K; E223R, E232R, D257R, E260R 및 D261R; E223Y, E232Y, D257Y, E260Y 및 D261Y; 및 S219K, Q228K, T249K, N251K, S254K, Q265K 및 S267K로 이루어진 군에서 선택되는 어느 하나의 돌연변이를 포함하는 것일 수 있다.
본 발명에 있어서, 상기 Cas9 단백질 변이체는 R661, Q695, K848, K855, Q926 및 R1060으로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산의 돌연변이를 더 포함하는 것일 수 있고, 보다 바람직하게 상기 R661, Q695, K848, K855, Q926 및 R1060으로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산이 Ala(A)으로 치환된 것일 수 있다.
본 발명에서, 특정 아미노산 서열을 다른 서열로 치환하는 방법은 해당 기술분야에서 당업자에게 알려진 통상의 방법을 통해 수행될 수 있는 것으로, 특별한 방법으로 제한되지 않는다.
Cas9 단백질 또는 유전자 정보는 NCBI(National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있으나, 이에 제한되는 것은 아니다.
본 발명에 있어서, Cas9 단백질 또는 이의 변이체는 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 아우레우스(Streptococcus aureus), 프란시셀라 노비시다(Francisella novicida), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 레지오넬라 뉴모필라(Legionella pneumophila), 리스테리아 이노큐아(Listeria innocua), 또는 스트렙토코커스 뮤탄스(Streptococcus mutans) 유래일 수 있으며, 바람직하게는 스트렙토코커스 피오게네스(Streptococcus pyogenes)에서 유래된 것일 수 있다.
본 발명의 일실시예에서는, 선행연구 결과를 바탕으로 REC2와 비표적 서열 간의 상호작용을 강화하여 표적 특이성이 향상된 Cas9을 개발하기 위해 REC2 표면 상에 E223/E232와 D257/E260/D261 두 줄로 나열되어 있는 음전하 잔기를 양전하를 띤 라이신(K)으로 치환하여 NTS와의 정전기적 상호작용을 극대화할 수 있도록 여러 형태의 Cas9 단백질을 설계하였다(실시예 2 참조).
본 발명의 다른 실시예에서는, 상기 실시예 2에서 제작한 Cas9 변이체들에 대하여 in vitro에서 EMX1 유전자의 서열에서 19-20번째 염기(M19-20) 그리고 18-19번째 염기(M18-19)에 2-bp 염기쌍 불일치를 포함하는 두 개의 비표적 DNA에 대한 절단 효율을 시험하였다. 그 결과 제작한 4개의 변이체 모두 비표적 서열에 대한 절단 효율 감소효과를 나타내었으며, 특히 5개의 음전하를 띤 잔기 전부를 라이신으로 치환한 REC2-K4의 경우 우수한 표적 특이성 향상 효과가 있음을 확인하였다.
나아가 REC2-K4와 동일한 위치의 5개의 음전하 잔기들을 또 다른 양전하 아미노산인 아르기닌(R)으로 치환한 Cas9(REC2-R4), 상기 5개의 음전하 잔기를 티로신(Y)으로 치환한 Cas9(REC2-Y4) 및 전하적으로는 중성이지만 극성을 띤 7개의 잔기를 K로 치환한 Cas9(REC2-K’)을 추가로 제작하고 상기와 동일하게 실험을 진행하였다. 그 결과, REC2-R4 Cas9 만이 REC2-K4와 비교했을 때 표적 활성은 유지한 채로 비표적 DNA를 식별해내는 효과가 조금 더 향상되었고, 나머지 REC2-Y4 및 REC2-K’의 경우 2-3개의 전하 반전 돌연변이만을 포함하는 REC2-K1, -K2, 또는 -K3와 비슷한 수준인 것을 확인하였다(실시예 3 참조).
본 발명의 또 다른 실시예에서는, 세포 내에서 REC2-K4 및 REC2-R4의 표적 및 비표적 DNA 절단 효율을 확인하고 이를 WT 및 기존에 보고된 조작된 Cas9(Sniper Cas9, eCas9, Cas9-HF1)과 비교한 결과, REC2-K4와 REC2-R4 Cas9은 세포 내에서 낮아진 표적 활성을 나타내는 gX20-과 GX19-gRNA 모두와 효과적으로 사용 가능하며, gX20-gRNA 존재 하에서도 표적활성을 유지하고 특이성이 향상되도록 진화시킨 Sniper Cas9과 비등한 정도임을 확인하였다(실시예 4 참조).
본 발명의 또 다른 실시예에서는, REC2-K4 및 REC2-R4와 합리적으로 설계된 다른 종(Cas9-HF1과 eCas9)과의 조합을 통해 표적 특이성을 극대화시킬 수 있을 것이라고 가정하여 실험을 진행한 결과 두 종의 돌연변이를 모두 합한 경우인 REC2-K4+eCas9과 REC2-K4+Cas9-HF1의 경우에는 예상 외로 표적 활성이 크게 낮아진 반면, REC2-K4와 eCas9 혹은 Cas9-HF1의 돌연변이 중 일부를 조합한 경우 더욱 우수한 표적 특이성을 나타내는 것을 확인하였다(실시예 5 참조).
이에, 본 발명에 따른 상기 Cas9 단백질 변이체는 표적 서열에 대한 특이성이 향상된 것일 수 있다.
본 발명에서 사용되는 용어, “표적 서열에 대한 특이성” 또는 “표적 특이성”은 절단하고자 하는 표적 서열 또는 가닥에 대한 절단 효율이 높아지거나, 비표적 서열 또는 가닥에 대한 절단 효율이 감소하거나, 또는 상기 두 가지 모두를 포함하는 것을 의미한다.
본 발명의 다른 양태로서, 상기 Cas9 단백질 변이체를 암호화하는 폴리뉴클레오티드를 제공한다.
또한, 본 발명은 상기 폴리뉴클레오티드를 포함하는 벡터를 제공한다.
본 발명에서 사용되는 용어, 벡터는 세포 내로 전달하는 DNA 단편(들), 핵산 분자를 지칭할 때 사용된다. 벡터는 DNA를 복제시키고, 숙주세포에서 독립적으로 재생산될 수 있다.
본 발명의 또 다른 양태로서, 본 발명은 상기 Cas9 단백질 변이체; 및 가이드 RNA(guide RNA)를 포함하는, CRISPR/Cas9 시스템을 제공한다.
본 발명에서 사용되는 용어, “가이드 RNA(guide RNA; gRNA)”란 표적하는 특정 DNA의 위치를 찾아내어 Cas 단백질을 표적 DNA로 인도하는 역할을 하는 단일 가닥의 RNA로서, 상기 가이드 RNA는 PAM(protospacer adjacent motif) 자리와 인접하며, 표적 DNA의 10~25bp의 염기서열과 상보적인 서열을 포함하는 것일 수 있다. 상기 가이드 RNA는 표적 DNA 서열의 상보적 사슬과 염기쌍을 형성할 수 있는 서열의 5' 부위 앞에 1 내지 3개의 추가적인 뉴클레오타이드, 보다 구체적으로 1개 또는 2개의 뉴클레오타이드를 가질 수 있다. 또한 가이드 RNA는 표적 DNA 내 서열과 상보적인 서열을 가지는 부분(이를 Spacer region, Target DNA recognition sequence, base pairing region 등으로도 명명함) 및 Cas 단백질 결합을 위한 hairpin 구조를 포함할 수 있다. 보다 구체적으로, 표적 DNA 내 서열과 상보적인 서열을 가지는 부분, Cas 단백질 결합을 위한 hairpin 구조 및 Terminator 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 또 다른 양태로서, 상기 CRISPR/Cas9 시스템을 포함하는 유전자 편집용 조성물을 제공한다.
본원발명에서, “유전자”란 최광의의 의미로 간주되어야 하며, 구조 단백질 또는 조절 단백질을 암호화하는 것일 수 있고, 병리학적 조건과 연관된 것일 수 있다. 상기 유전자는 내인성(endogeneous) 유전자 및 삽입유전자(transgene) 모두를 포함한다. 유전자의 종류는 구체적인 것으로 제한되지 않고 당업자가 목적에 따라 적절히 선택할 수 있다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
[실시예]
실시예 1. 실험재료 및 실험방법
1-1. 단백질 발현 및 정제
각 Cas9 개량종 및 돌연변이종 단백질들을 발현시키기 위해 아미노 말단에 NLS(Nuclear localization sequence), HA-tag, 및 6xHis-tag가 포함된 pET28-a(+) 단백질 발현용 DNA 운반체들을 깁슨 어셈블리를 통하여 클로닝 하였다. 이후 E. coli (NiCo21(DE3); LumiMac)에 0.2mM의 IPTG를 처리하여 각 단백질들의 과발현을 유도하였고, 하룻밤 동안 상기 E. coli 를 18℃에서 배양하였다. 배양된 세포로부터 각 단백질을 Ni-NTA agarose resins(Qiagen)을 통해 정제한 다음, Amicon Ultra centrifugal filter-100 kDa(Millipore)을 사용하여 16,000 g, 4℃에서 30분 동안 초원심분리하여 농축하였다. 이후 Bradford 분석과 SDA-PAGE를 통해 각 단백질을 정량하였고, Cas9용 저장 완충용액(10 mM Tris-HCl pH 7.4, 300 mM NaCl, 0.1 mM EDTA, 1 mM DTT, 및 40% (v/v) glycerol)에 담아 -20℃에서 보관하였다.
1-2. 핵산 준비
시험관 내(in vitro) 실험을 위한 모든 DNA와 RNA 올리고뉴클레오타이드들은 Integrated DNA Technologies(IDT)로부터 합성 및 구매하였으며, 표적 DNA의 비표적가닥(non-target strand; NTS)은 표면고정을 위해 5’ 말단을 비오티닐화(biotinylation) 하였다. 비표적가닥과 표적가닥(TS) 모두 아미노기가 추가된 티민을 포함하고 있고, N-하이드록시석신이미드(NHS) 에스터가 연결된 형광단(Cy3는 GE Healthcare에서, Alexa647은 Thermo Fisher Scientific에서 구매함)이 아민-NHS 에스터 간의 짝지음 반응에 의해 표지되었다.
1-3. 단일 분자 시험관 분석
시험관 내에서 Cas9의 DNA 절단 효율을 분석하기 위해 본 발명자들이 선행연구들을 통해 개발 및 확립한 단일 분자 기반 측정 플랫폼을 활용하였다. 먼저, Cy3와 Alexa647 두 개의 형광 분자를 표지한 DNA 분자를 부동화한(passivated) 표면에 고정시켰다. 다음으로Cas9:gRNA 복합체 형성을 위해, 20 nM의 gRNA와 40 nM의 Cas9 단백질을 반응용액(50 mM Tris-HCl pH 7.9, 100 mM NaCl, 10 mM MgCl2, 1 mM DTT, 0.1 mg ml-1 BSA, 5%(v/v) glycerol, 및 ~4 mM Trolox)에서 37℃에서 10분 동안 전배양 한 후, 상기 DNA 분자와 함께 실온에서 30분 동안 효소반응시켰다. 다음으로 7M의 urea 용액을 주입하여 Alexa647이 표지된 절단된 DNA 절편을 씻어내면 Cy3가 표지된 반대편 DNA 절편만이 표면에 남게 되도록 하였다. 절단 효율은, Cy3-Alexa647이 이중으로 표지되어 있는 DNA 분자 개수와 Cy3가 표지되어 있는 모든 분자 개수 간의 비교를 통해 단일분자 이미지로부터 계산되었다.
1-4. 인간세포 배양 및 형질주입
각 Cas9 개량종 및 돌연변이종 단백질들을 인간세포에서 발현이 가능하도록 한 DNA 운반체들을 제작하였다. 실험은 HEK293T 세포(ATCC CRL-11268)에서 진행하였고, 상기 세포는 10% fetal bovine serum(FBS) 및 a penicillin/streptomycin mix (100 unit ml-1/100 mg ml-1)가 포함된 DMEM 배지에서 배양하였다.
이후 1.5×105개의 HEK293T 세포에 각각의 Cas9을 발현하는 플라스미드(750 ng)와 sgRNA 발현용 plasmid(250ng)를 전기천공법을 이용하여 형질주입하였고, 전기천공법은 제조사의 프로토콜에 따라 Neon™ Transfection System(Invitrogen)을 이용해 진행하였다. 형질주입 3일 후에 세포들을 회수하여 NucleoSpin Tissue (MACHEREY-NAGEL & Co.)를 사용해 유전체DNA를 추출하였다.
1-5. 표적 심층 서열 분석
표적 및 비표적 DNA의 염기서열을 분석하기 위해 Cas9 뉴클레아제가 작동한 유전체 DNA상의 위치를 SUN-PCR blend(SUN GENETICS)를 사용하여 중합효소연쇄반응(PCR)을 통해 증폭시켰다. 이후 PCR을 통해 생선된 DNA 라이브러리에 대하여 MiniSeq(Illumina) 장비를 이용해 염기 서열 분석을 진행하였다. MiniSeq을 통해 나온 분석 결과 파일을 Cas-Analyzer(http://www.rgenome.net/cas-analyzer/) 웹기반 분석도구를 사용하여 각 Cas9에 의해 형성된 표적 및 비표적 DNA 위치의 Indel 비율을 계산 및 분석하였다.
실시예 2. REC2-engineered Cas9의 합리적 설계
본 발명자들은 선행연구를 통해 Cas9 단백질의 REC2 도메인 표면 상의 양전하 잔기들이 NTS(비표적 가닥)를 checkpoint중간체 구조에 붙잡아 둠으로써 비표적 DNA 절단을 방지한다는 메커니즘을 밝혀낸 바 있다. 이러한 내용을 바탕으로, 본 발명자들은 REC2-NTS 간의 상호작용을 강화하여 표적 특이성이 향상된 Cas9을 개발하고자 하였다.
이를 위해, Cas9:gRNA:DNA 복합체의 3차원 분자 구조를 관찰한 결과, 도 1에 도시된 바와 같이 양전하를 띤 잔기들이 crRNA-TS이형 이중나선 구조를 향해 무리를 이루어 REC2 표면 상에 위치하고 있는 것을 볼 수 있고(파란색), REC2도메인에 대한 세부 분자 구조는 음전하를 띤 잔기들이 REC2 표면 상에 E223/E232와 D257/E260/D261로 나뉘어 두 줄로 나열되어 있는 것을 관찰할 수 있다(빨간색). 따라서 본 발명자들은 이들 음전하 잔기를 양전하를 띤 라이신(lysine; K)으로 치환하여 NTS와의 정전기적 상호작용을 극대화할 수 있도록 고안한 4 개의 후보 종을 일차적으로 디자인하였다: REC2-K1(E223K/E232K), REC2-K2(E223K/E232K/D257K), REC2-K3(D257K/E260K/D261K), 그리고 REC2-K4(E223K/E232K/D257K/E260K/D261K). 또한, 상기 음전하 잔기들을 또 다른 양전하를 띤 잔기인 아르기닌(arginine; R)으로 치환한 후보 종을 디자인하여 양전하 잔기로의 치환에 따른 효과를 함께 검증하였다: REC2-R4(E223R/E232R/D257R/E260R/D261R).
실시예 3. In vitro 수준에서 REC2-engineered Cas9의 표적 특이성 증진 확인
상기 실시예2에서 제조한 REC2-K 종들의 표적 특이성을 조사하기 위해, 우선적으로 in vitro에서 표적과 비표적 DNA에 대한 절단 효율을 측정하였다. 측정 방법으로는 본 발명자들이 선행연구들을 통해 개발 및 확립한 단일 분자 기반 측정 플랫폼을 활용하였으며, 그 원리는 도 2의 상단에 그림으로 도시하였고, 구체적인 방법은 실시예 1-3에 따라 실시하였다. 표적 DNA로는 EMX1 유전자의 서열에서 형광 표지를 위해 염기 한 개만을 치환한 염기서열을 사용하였다.
실험 결과, 도 2의 그래프로 나타낸 바와 같이 REC2-K 4종 모두 야생형(wild type; WT) Cas9에 비해 조금 더 높은 표적 절단율(>80%)을 보여주었다. 이는 REC2-K에 도입된 돌연변이들이 Cas9의 표적에 대한 효소 활성을 저해하지 않는다는 것을 의미하는 것이다. 한편, 비표적 DNA에 대한 절단의 경우 예상대로 모든 종에서 감소하는 결과가 나타났다. WT Cas9은 PAM으로부터 떨어진 부분(즉, PAM으로부터 18-20번째 염기 영역)에서 특히나 표적 특이성이 감소하는 것으로 잘 알려져 있기에, 19-20번째 염기(M19-20) 그리고 18-19번째 염기(M18-19)에 2-bp 염기쌍 불일치를 포함하는 두 개의 비표적 DNA에 대한 절단 효율을 시험하였다. 그 결과, REC2-K1, -K2, -K3의 경우 M19-20에 대한 효과는 미미하였고 M18-19에 대해서만 WT에 비해 절단 비율이 어느 정도 감소하였다. 반면, 5개의 음전하를 띤 잔기 전부를 lysine으로 치환한 REC2-K4의 경우 M19-20과 M18-19 모두에 대하여 절단 효율이 상당히 감소한 것으로 나타났으며, 특히 M18-19에 대해서는 실험오차 수준으로 무시할만 한 값을 보이는 것으로 확인되었다. 또한, 또 다른 양전하를 띤 잔기인 아르기닌으로 치환한 버전인 REC2-R4 역시 REC2-K4와 비교했을 때 표적 활성은 유지한 채로 비표적 DNA를 식별해내는 효과가 조금 더 향상된 것을 확인하였다. 이러한 결과를 통해 REC2 표면의 음전하를 양전하로 치환시키는 것이 표적 특이성을 향상시키는 것을 알 수 있었다.
상기 결과를 바탕으로, 본 발명자들은 2종의 Cas9을 추가적으로 설계하여 그 성능을 평가하였다. 구체적으로, 도 3a에 도시된 3차원 구조를 기반으로, REC2-K4와 동일한 위치의 5개의 음전하 잔기들을 NTS와 염기중첩(base stacking) 상호작용을 할 수 있는 티로신(tyrosine; Y)으로 치환한 버전인 REC2-Y4(E223Y/E232Y/D257Y/E260Y/D261Y), 및 음전하 잔기들이 아닌 전하적으로는 중성이지만 극성을 띤 7개의 잔기를 양전하를 띠는 잔기인 K로 치환한 버전인 REC2-K’(S219K, Q228K, T249K, N251K, S254K, Q265K, S267K)를 제작하였다.
상기 제작된 7종의 REC2-engineered Cas9에 대하여 상기와 동일한 방법으로 in vitro에서 표적과 비표적 DNA에 대한 절단 효율을 측정한 결과, 도 3b에서 볼 수 있는 바와 같이 REC2-Y4 및 REC2-K’의 경우에는 2-3개의 전하 반전 돌연변이만을 포함하는 REC2-K1, -K2, 또는 -K3와 비슷한 수준인 것을 확인하였다. 종합적으로, 이러한 결과를 통해 REC2 표면의 음전하를 양전하로 반전시키는 것이 표적 특이성 향상에 가장 효과적임을 알 수 있었다.
실시예 4. 세포 내에서 REC2-engineered Cas9의 표적 특이성 증진 확인
REC2-K4, REC2-R4 Cas9에 대하여 보다 심층적으로 그 특성을 파악하기 위해, 세포 내에서의 표적 및 비표적 DNA 절단 효율을 확인하고 이를 WT 및 기존에 보고된 engineered Cas9(Sniper Cas9, eCas9, Cas9-HF1)과 비교하고자 하였다. 이를 위해, 5’ 말단에 추가적으로 G 염기를 포함하는 sgRNA(gX20-gRNA)를 활용하여 세포 내 절단 효율을 측정하였다. 이러한 gX20-gRNA는 효과적인 전사(transcription)를 위해 많이 사용되지만 대다수의 engineered Cas9의 경우 낮아진 표적 활성으로 인해 gX20-gRNA와의 사용이 비효율적인 것으로 알려져 있다. 그러나 REC2-engineered Cas9들의 경우 시험관 수준에서 높은 표적 활성이 관찰되었기에 이를 바탕으로 gX20-gRNA와의 사용 가능성을 조사하였다. 먼저, 도 4에 도시된 바와 같이 HEK293T 세포에서 3개의 대표적인 유전자 서열(EMX1, FANCF(2), HBG(2))을 표적화하여, 이들 표적서열과 이미 잘 알려진 비표적 서열들에 대한 새로운 염기의 삽입 혹은 기존 염기의 결실(insertion or deletion; indel) 빈도를 측정하였다.
그 결과, 도 4에 나타낸 바와 같이 도 2 및 3의 결과와 부합하게, REC2-K4와 -R4 Cas9은 비표적 위치에 대해서는 보다 적은 indel을 생성하면서 표적서열에 대해서는 WT과 유사한 수준의 indel 빈도 값을 보여주었다. Sniper Cas9 역시 표적 활성을 유지한 채 비표적 절단 효율은 감소하였고, 표적 및 비표적에 대한 indel 값은 모두 REC2-K4 및 -R4와 유사하였다. 한편, eCas9과 Cas9-HF1의 경우 기존의 보고들과 일치하게, 비표적에 대한 indel은 가장 낮은 수준을 보였지만 그와 동시에 표적에 대한 indel 효율까지도 상당히 감소한 것을 확인할 수 있었다.
또한 추가적으로, 길이의 연장 없이 5’ 말단의 G가 표적 서열의 20번째 염기와 짝을 이루는 GX19-gRNA를 사용하여 상기와 동일하게 실험을 진행하였다. 그 결과, gX20-gRNA에 비해 표적과 비표적에 대한 절단 효율 모두가 전반적으로 증가하여 eCas9과 Cas9-HF1의 표적 활성이 부분적으로 회복되었으나, REC2-K4 Cas9의 표적 및 비표적에 대한 indel은 여전히 Sniper Cas9과 흡사한 수준을 유지하였다. 이러한 결과는 REC2-K4와 -R4 Cas9은 세포 내에서 gX20-과 GX19-gRNA 모두와 효과적으로 사용 가능하다는 것을 보여주며, 그 표적 특이성 및 표적활성은 gX20-gRNA 존재 하에서도 표적활성을 유지하며 특이성이 향상되도록 진화시킨 Sniper Cas9과 비등한 정도임을 알 수 있었다.
실시예 5. REC2-K4/R4와 eCas9/Cas9-HF1의 조합을 통한 표적 특이성의 극대화
본 발명자들은 REC2 도메인 조작을 통한 표적 특이성 개선 전략이 본 발명에서 최초로 시도되었다는 점을 감안할 때, REC2-K4 및 REC2-R4와 합리적으로 설계된 다른 종(Cas9-HF1과 eCas9)과의 조합은 특이성 향상에 있어 시너지 효과를 일으킬 수 있을 것이라 생각하였다. 이를 확인하기 위하여 상기 실시예 4에서와 같이 gX20-gRNA를 이용해 HEK293T 세포에서 3개의 대표적인 유전자 서열(EMX1, FANCF(2), HBG(2))을 표적화하여, 이들 표적서열과 이미 잘 알려진 비표적 서열들에 대한 indel 빈도를 측정하였다.
그 결과, 도 5a에 나타낸 바와 같이 두 종의 돌연변이를 모두 합한 경우인 REC2-K4+eCas9과 REC2-K4+Cas9-HF1의 경우에는 예상 외로 eCas9과 Cas9-HF1 각각에 비해 비표적 절단은 그다지 개선되지 않은 채로 표적 활성이 크게 낮아진 결과를 나타내었다. 그러나 REC2-K4와 eCas9 혹은 Cas9-HF1의 돌연변이 중 일부를 조합한 경우 즉, REC2-K3+K848A, REC2-K3+K855A, REC2-K3+R661A/Q695A의 경우에는 위의 세 표적 위치에 대해 뛰어난 특이성을 보이는 것을 확인하였다. 상기 3개 조합의 각 경우는 대부분의 경우에서 심지어 eCas9과 Cas9-HF1 보다 낮은 비표적에 대한 indel 값이 측정되었으며, 표적 활성은 gX20-gRNA를 사용했음에도 WT Cas9 수준을 유지하였다. 상기 각 Cas9 돌연변이 단독 또는 조합의 표적에 대한 활성을 표적 특이성과 대비한 결과는 도 5b에 나타낸 바와 같다.
상기 3개 조합에 대한 아르기닌(R) 버전(REC2-R3+K848A, REC2-R3+K855A, REC2-R3+R661A/Q695A) 역시 제작하여 분석한 결과, 도 5c에 나타낸 바와 같이 상기 라이신(K) 버전과 비슷한 성능을 보여주었다. 추가적으로, REC2-K4의 돌연변이 중 다른 일부분 즉, REC2-K1과 REC2-K2를 포함하는 조합들 또한 테스트해 보았으나, 그 효과는 REC2-R3 또는 -K3의 조합에는 미치지 못하였다.
나아가 REC2-K4와 eCas9 또는 Cas9-HF1의 돌연변이 중 일부를 조합한 3가지 경우 즉, REC2-K3+R1060A, REC2-K3+R661A/Q926A, REC2-K3+Q695A/Q926A의 3가지 조합을 추가하고 GX19-gRNA를 이용해 HEK293T 세포에서 3개의 유전자 서열(EMX1, VEGFA site 3, HEK site 4)을 표적화하여, 이들 표적서열과 이미 잘 알려진 비표적 서열들에 대한 indel 빈도를 측정하였다. 그 결과, 도 6에 나타낸 바와 같이 VEGFA 유전자에 대해서는 REC2-K4와 eCas9 또는 Cas9-HF1의 돌연변이 중 일부를 조합한 6가지 경우에서 비표적 효과의 감소는 두드러지지 않았으나, EMX1 및 HEK site 4에서는 상기 6가지 조합의 경우 표적 위치에 대해 높은 indel 효율을 보여주었고 비표적 효과는 거의 사라지는 결과를 확인하였다.
이러한 결과는 REC2-K4/R4의 일부인 REC2-K3 또는 -R3와 eCas9 혹은 Cas9-HF1에 포함된 돌연변이 중 일부와의 조합이 표적 특이성을 극대화시켜 기존에 보고된 engineered Cas9보다도 우수한 특성을 갖는다는 것을 보여준다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
<110> IUCF-HYU (Industry-University Cooperation Foundation Hanyang University) Seoul National University R&DB Foundation <120> Novel Cas9 protein variants with improved target specificity and use thereof <130> PD20-354 <160> 1 <170> KoPatentIn 3.0 <210> 1 <211> 1368 <212> PRT <213> Cas9_Wild type <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365

Claims (10)

  1. 서열번호 1의 아미노산으로 이루어진 야생형 Cas9 단백질의 REC2 도메인 영역에서 적어도 한 개의 돌연변이를 포함하는, Cas9 단백질 변이체.
  2. 제1항에 있어서,
    상기 REC2 도메인 영역은 서열번호 1의 아미노산 서열에서 170번부터 307번 위치의 아미노산을 포함하는 것을 특징으로 하는, Cas9 단백질 변이체.
  3. 제1항에 있어서,
    상기 Cas9 단백질 변이체는 E223, E232, D257, E260, D261, S219, Q228, T249, N251, S254, Q265 및 S267로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산이 Lys(K), Arg(R) 또는 Tyr(Y)으로 치환된 것을 특징으로 하는, Cas9 단백질 변이체.
  4. 제1항에 있어서,
    상기 Cas9 단백질 변이체는 하기에서 선택되는 어느 하나의 돌연변이를 포함하는 것을 특징으로 하는, Cas9 단백질 변이체:
    E223K 및 E232K;
    E223K, E232K 및 D257K;
    D257K, E260K 및 D261K;
    E223K, E232K, D257K, E260K 및 D261K;
    E223R, E232R, D257R, E260R 및 D261R;
    E223Y, E232Y, D257Y, E260Y 및 D261Y; 및
    S219K, Q228K, T249K, N251K, S254K, Q265K 및 S267K.
  5. 제1항에 있어서,
    상기 Cas9 단백질 변이체는 R661, Q695, K848, K855, Q926 및 R1060으로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산의 돌연변이를 더 포함하는 것을 특징으로 하는, Cas9 단백질 변이체.
  6. 제5항에 있어서,
    상기 R661, Q695, K848, K855, Q926 및 R1060으로 이루어진 군으로부터 선택되는 적어도 하나의 아미노산이 Ala(A)으로 치환된 것을 특징으로 하는, Cas9 단백질 변이체.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 단백질 변이체는 표적 서열에 대한 특이성이 향상된 것을 특징으로 하는, Cas9 단백질 변이체.
  8. 제1항의 Cas9 단백질 변이체; 및
    가이드 RNA(guide RNA)를 포함하는, CRISPR/Cas9 시스템.
  9. 제1항의 Cas9 단백질 변이체를 암호화하는, 폴리뉴클레오티드.
  10. 제9항의 폴리뉴클레오티드를 포함하는, 벡터.

KR1020200189691A 2020-12-31 2020-12-31 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 KR102567576B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200189691A KR102567576B1 (ko) 2020-12-31 2020-12-31 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200189691A KR102567576B1 (ko) 2020-12-31 2020-12-31 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도

Publications (2)

Publication Number Publication Date
KR20220096861A true KR20220096861A (ko) 2022-07-07
KR102567576B1 KR102567576B1 (ko) 2023-08-14

Family

ID=82398124

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200189691A KR102567576B1 (ko) 2020-12-31 2020-12-31 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도

Country Status (1)

Country Link
KR (1) KR102567576B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117327661A (zh) * 2023-12-01 2024-01-02 中国计量科学研究院 一种抗癌药物敏感性增强的fact突变体细胞系及构建方法和应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190005801A (ko) * 2017-07-07 2019-01-16 주식회사 툴젠 표적 특이적 crispr 변이체

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190005801A (ko) * 2017-07-07 2019-01-16 주식회사 툴젠 표적 특이적 crispr 변이체

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117327661A (zh) * 2023-12-01 2024-01-02 中国计量科学研究院 一种抗癌药物敏感性增强的fact突变体细胞系及构建方法和应用
CN117327661B (zh) * 2023-12-01 2024-03-15 中国计量科学研究院 一种抗癌药物敏感性增强的fact突变体细胞系及构建方法和应用

Also Published As

Publication number Publication date
KR102567576B1 (ko) 2023-08-14

Similar Documents

Publication Publication Date Title
JP6905755B2 (ja) Rnaガイド型エンドヌクレアーゼを使用してゲノム工学における特異性を改善する組成物および方法
CN113631708B (zh) 编辑rna的方法和组合物
AU2015299850B2 (en) Genome editing using Campylobacter jejuni CRISPR/CAS system-derived RGEN
KR20180069898A (ko) 핵염기 편집제 및 그의 용도
JP2019162140A (ja) Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法
CA3009727A1 (en) Compositions and methods for the treatment of hemoglobinopathies
AU2016274452A1 (en) Thermostable Cas9 nucleases
US11434478B2 (en) Compositions and methods for genome engineering with Cas12a proteins
WO2019147073A1 (ko) 아데노신 디아미나아제를 이용한 염기 교정 확인 방법
WO2018172798A1 (en) Argonaute system
EP4349979A1 (en) Engineered cas12i nuclease, effector protein and use thereof
KR102567576B1 (ko) 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도
US20190024090A1 (en) Construct for epigenetic modification and its use in the silencing of genes
EP4230737A1 (en) Novel enhanced base editing or revising fusion protein and use thereof
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
WO2018097657A1 (ko) 크로마틴 dna를 이용한 유전체 서열분석 방법 및 유전체 교정 확인 방법
KR102699944B1 (ko) Rna-가이드된 엔도뉴클레아제를 이용하는 게놈 조작에서 특이성을 개선하는 조성물 및 방법
WO2023206872A1 (zh) 一种工程优化的核酸酶、向导rna、编辑系统和应用
EP4209589A1 (en) Miniaturized cytidine deaminase-containing complex for modifying double-stranded dna
KR20240132120A (ko) Rna-가이드된 엔도뉴클레아제를 이용하는 게놈 조작에서 특이성을 개선하는 조성물 및 방법
Doyon A marker-free co-selection strategy for high efficiency human genome engineering
KR20230051688A (ko) 뉴클레아제 매개 핵산 변형
JP2024518413A (ja) 修飾ヌクレアーゼ
EA046214B1 (ru) Композиции и способы улучшения специфичности в геномной инженерии с применением рнк-направляемых эндонуклеаз

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant