WO2021215827A1

WO2021215827A1 - Cas9 또는 cas9 변이체를 이용한 유전체 교정

Info

Publication number: WO2021215827A1
Application number: PCT/KR2021/005031
Authority: WO
Inventors: 김진수; 이현지; 강범창
Original assignee: 기초과학연구원
Priority date: 2020-04-21
Filing date: 2021-04-21
Publication date: 2021-10-28

Abstract

본 발명은 Cas9 변이체 또는 이를 코딩하는 핵산, Cas9 또는 Cas9 변이체 또는 이를 코딩하는 핵산을 이용하여 유전체를 교정하기 위한 조성물 및 이를 이용한 유전체 교정 방법에 관한 것으로, 구체적으로는 프라임 에디팅을 위한 뉴클레아제 또는 이의 변이체 예를 들어 Cas9 또는 Cas9 변이체 또는 이를 코딩하는 핵산을 이용하여, 원하지 않는 삽입/결실(indel)을 줄이고, 우수한 효율로 유전체를 교정하기 위한 조성물 및 이를 이용한 유전체 교정 방법에 관한 것이다.

Description

CAS9 또는 CAS9 변이체를 이용한 유전체 교정

유전체의 특정위치를 인지하는 가이드 DNA와 DNA의 이중나선을 자르는 Cas9 효소로 결합된 분자 복합체를 포함하는 CRISPR에 의한 유전자 에디팅 (editing)에서 보여지는 유연성과 정밀성의 한계를 극복하기 위해, 개선된 유전체 교정방법이 보고된 바 있다.

구체적으로, 니케이즈 Cas9 (H840A) 및 M-MLV 역전사 효소로 구성된 프라임 에디터 단백질 복합체를 통해 니케이즈 Cas9은 한 가닥의 DNA만 절단하도록 변형을 유도하고, 역전사효소는 하나의 RNA 주형을 복사함으로써 새로운 DNA를 생성하며, 프라임 에디팅 가이드 RNA (pegRNA)가 프라임 에디터 단백질 복합체를 표적부위로 보내어, 유전체를 교정하는 프라임 에디팅 방법이 보고된 바 있다 (Anzalone AV, Randolph PB, Davis JR et al., “Search-and-replace genome editing without double-strand breaks or donor DNA,” Nature. 2019 Oct 21).

이러한 기술적 배경하에서, 본 출원의 발명자들은 니케이즈가 아닌 뉴클레아제를 포함하는 프라임 에디터 단백질도 프라임 에디팅을 일으킬 수 있고, 니케이즈에 변이를 도입하여 비타겟 가닥(non-target strand)을 자르는 니케이즈를 제작하거나, 일부 아미노산 잔기를 결실시킴으로써, DSB를 복구 (repair)하면서 발생될 수 있는 원하지 않는 삽입/결실을 현저히 줄일 수 있고, 우수한 효율로 목적하는 유전자 교정을 할 수 있을 뿐 아니라, 크기의 제한이 있는 AAV (Adeno-associated virus) 벡터를 통해 전달할 수 있다는 이점이 있음을 확인하고, 본 발명을 완성하였다.

발명의 요약

본 발명의 목적은 Cas9 또는 Cas9 변이체를 이용한 유전체 교정용 조성물 및 이를 이용한 유전체 교정 방법을 제공하는데 있다.

본 발명의 목적은 뉴클레아제 변이체 예를 들어 Cas9 변이체를 제공하는데 있다.

상기 목적을 달성하기 위하여, 본 발명은 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체 또는 이를 코딩하는 핵산을 제공한다.

본 발명은 또한, 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산을 제공한다:

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.

본 발명은 또한, (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물을 제공한다.

본 발명은 유전체 교정을 위한 제제의 제조에 사용하기 위한 조성물의 용도로, 상기 조성물은 (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함한다.

본 발명은 또한, (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물을 대상에 처리하는 단계를 포함하는 유전체 교정 방법을 제공한다.

도 1은 Cas9, nCas9-D10A, nCas9-H840A를 이용하여 표적 서열에 대한 절단 결과에 대한 예상 및 실험 결과를 나타낸 것이다.

(a) 전체적인 Digenome-seq의 개요. 표적 서열의 정보와 Cas9, nCas9-D10A, nCas9-H840A를 in vitro 절단 처리하였을 때 예상되는 절단 위치와 (Red arrowhead: 절단 위치, Blue: PAM sequence) 이 후 WGS (Whole Genome Sequencing)의 데이터를 IGV로 확인할 때 예상되는 결과 모식도 (red: forward strand& blue: reverse strand). (b) gDNA in vitro 절단의 결과. HAP1 세포의 gDNA를 사용하여 Cas9 variants들을 37C에 16시간동안 처리하고 WGS결과를 확인하였다. Cas9, nCas9-D10A는 예상과 동일한 절단 형태를 보였지만, nCas9-H840A의 경우, 예상과는 달리 타겟 가닥에도 부분적 절단이 일어났다. (c) 플라스미드 in vitro 절단 실험. gDNA에서 진행한 절단 실험을 다시 확인하기 위하여 플라스미드를 사용한 in vitro 절단 실험을 진행하였다. Supercoiled 형태의 플라스미드는 양쪽 가닥이 절단되면 선형 (linear), 한쪽 가닥이 절단 되면 오픈 원형 (open circular)의 형태로 전기 영동에 의하여 크기가 분리된다. 6030bp크기의 플라스미드를 가지고 한쪽 가닥을 절단하는 Nt.BbvCI 효소와 양쪽 가닥을 절단하는 SpeI 효소를 사용하여 각각 오픈 원형 (open circular)과 선형 (linear) 형태의 비교군을 제작하였다. 이 후 Cas9, nCas9-D10A, nCas9-H840A를 처리하여 플라스미드의 형태를 관찰하였다. Cas9에서는 대부분의 플라스미드가 양쪽 가닥이 잘려 선형 (linear) 형태로 남는 것을 확인 하였으며, nCas9-D10A를 처리하였을 때 대부분 한쪽 가닥이 절단되어 오픈 원형 (open circular) 형태로 남아있는 것을 확인하였다. 그러나 nCas9-H840A를 사용하였을 때 선형 (linear) 형태의 플라스미드가 nCas9-D10A를 처리한 때보다 더 많이 나타나는 것을 확인하였다. 이를 ImageJ software를 이용하여 밴드들의 강도 (intensity)를 측정하고 상대적 선형 밴드 강도 (linear band intensity)값을 얻은 결과, nCas9-D10A는 16.0%, nCas9-H840A는 43.3%로 각각 관찰되었다.

도 2는 Cas9 변이체 제작 및 이를 이용하여 도입될 수 있는 원하지 않는 삽입/결실 (indel : insertion and deletion) 효율을 확인한 결과를 나타낸 것이다.

(a) SpCas9의 뉴클레아제 도메인 (nuclease domain)으로는 HNH 도메인과 RuvC 도메인이 존재하는데, 이들은 각각 타겟 DNA와 비타겟 DNA (non-target DNA)를 자른다. Cas9의 HNH 도메인 또는 RuvC 도메인에 변이를 도입하면 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈로 제작할 수 있다. Cas9 니케이즈는 주로 RuvC 도메인에 D10A 변이를 도입한 형태나 HNH 도메인에 H840A 또는 N863A 변이를 도입한 형태를 사용한다. 이 연구에서는 HNH 도메인 내에서 DNA 절단에 관여하는 D839, H840, N854, N863 위치에 변이를 도입하여 완전하게 비타겟 가닥 (non-target strand) 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈를 만들고자 하였다.

(b) 세포 내에서 니케이즈 Cas9 (nCas9)에 의해 도입될 수 있는 원치 않는 indel (insertion and deletion) 효율을 확인하기 위하여, HEK293T 세포에 nCas9과 다양한 유전자를 타겟으로하는 sgRNA를 발현하는 플라스미드를 함께 전달하였다. 그 후 세포의 DNA를 분리하여 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 확인한 결과, 기존에 주로 사용하던 형태인 HNHv1(Cas9-H840A)에 의해 0.035~15% (평균 2.5%)의 indel이 나타나는 것을 확인하였다. 이를 줄이기 위하여 Cas9 HNH 도메인 내에 D839A, H840A, N854A, N863A 조합의 변이를 갖는 Cas9 변이체를 제작하였고, 이를 사용한 결과 다양한 변이체(HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), HNHv14(H840A/N863A/D839A/N854A)) 에서 원치 않는 indel 효율이 평균 1% 이하로 감소하는 것을 확인할 수 있었다.

(c) 앞선 실험에서 원치 않는 indel 효율의 감소한 Cas9 변이체가 1) Cas9이 한쪽 가닥만을 정확하게 자르는 니케이즈 형태가 되어서 인지, 혹은 2) Cas9 자체의 활성을 잃고 양쪽 가닥을 모두 못 자르는 효소적으로 불활성인 Cas9 (catalytically dead Cas9) 형태가 되어서 인지를 확인하기 위하여 이중 니킹 (double nicking) 실험(서로 다른 strand를 자르는 두 개의 sgRNA를 사용한 실험)을 진행하였다. 만약 1)의 경우라면 sgRNA-A나 sgRNA-1을 각각 처리하였을 때에는 indel 이 관찰되지 않고, sgRNA-A와 sgRNA-1을 동시에 처리한 경우에는 양쪽가닥(DNA double strand break)이 잘리게 되어 indel이 관찰되게 될 것이다. 만약 2)의 경우라면, sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 indel이 관찰되지 않을 것이다. 이를 실험적으로 2개의 타겟 사이트 (target site)에 대해서 확인해본 결과, HNHv7, HNHv11, HNHv12, HNHv14는 sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 1% 이하의 indel이 관찰되어 Cas9의 활성을 거의 잃은 효소적으로 불활성인 Cas9 (catalytically dead Cas9)임을 확인할 수 있었다. 반면, HNHv5, HNHv9, HNHv13의 경우, 각각의 sgRNA-A나 sgRNA-1만 처리했을 때에는 1% 이하의 indel이 관찰되지만 sgRNA-A와 sgRNA-1을 동시에 처리한 경우 1% 이상의 indel이 관찰되어, 한쪽 가닥을 자르는 Cas9 니케이즈 형태임을 확인할 수 있었다.

도 3은 in vitro 시험에서 절단 패턴 (cleavage pattern)의 변화 결과를 확인한 것이다.

(a) nCas9-H840A와 nCas9-H840A/N863A를 각각 분리된 HAP1 세포의 gDNA에 처리하여 WGS을 통해 절단 패턴의 변화를 관찰하였다. 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)를 타겟하여 확인해 본 결과, nCas9-H840A는 모두 일부 이중 가닥 (partial double strand) 절단을 일으키는 반면, nCas9-H840A/N863A를 처리하였을 때 원하는 비타겟 가닥(non-target strand)에서만 절단이 일어나는 패턴의 변화를 확인 할 수 있었다. (b) 다이게놈 시퀀싱 (Digenome sequencing)을 통한 전체 게놈 (whole genome)에서의 패턴 변화. 다이게놈 시퀀싱 (Digenome sequencing)은 전체 유전자에서 이중 가닥 절단 (double strand break)을 찾아낼 수 있는 방법 중 하나이다. 이를 통해 전체 유전자에서 나타나는 이중 가닥 절단 의 패턴을 비교하여 circos plot을 통해 나타내었다. 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)에 nCas9-H840A를 처리하였을 때, 표적 사이트와 오프 타겟 (off-target) 사이트에 이중 가닥 절단들이 관찰 되었다. 반면 nCas9-H840A/N863A를 처리하였을 때, 표적 사이트에서 이중 가닥 절단을 확인 할 수 없었고, 표적사이트를 제외한 오프 타겟 사이트들에서도 이중 가닥 절단이 사라지거나 그 비율이 현저히 줄어드는 것을 확인 할 수 있었다. 이를 통해 in vitro 실험 결과에서도 도 1과 마찬가지로 Cas0-H840A/N863A은 DNA의 한쪽 가닥만 자를 수 있는 니케이즈 (nickase) Cas9 형태임을 확인하였다.

도 4는 본 발명에 따른 프라임 에디터 단백질을 통한 유전자 교정 및 indel 효율을 확인한 결과를 나타낸 것이다.

nCas9과 MMLV 역전사효소로 구성된 PE (Prime Editor)를 도입하고자 하는 돌연변이를 유도할 수 있는 pegRNA와 함께 세포에 전달하고, DNA를 targeted deep-sequencing 방법으로 분석하여 (a) 의도한 유전자 교정의 효율(correct editing)와 (b) 의도치 않은 indel 효율 (unwanted indel activity)을 측정하였다. 나타낸 값은 모두 기존 형태인 PEv1(PE-H840A)의 값을 1로 두어 normalization 하였고, 의도한 유전자 교정의 효율이 1보다 높으면 분홍색, 1보다 낮으면 초록색 / 의도치 않은 indel 효율이 1보다 높으면 빨간색, 1보다 낮으면 파란색으로 표시하였다. (c, d) 정규화 (normalization) 하지 않은 NGS 데이터값.

(a, c) 도 1에서 사용했던 Cas9 변이체 형태를 그대로 활용하여 PE 형태로 제작하여 실험하였을 때, 기존의 PE-HNHv1(PE2-H840A)와 비교하여 PE-HNHv2, PE-HNHv3, PE-HNHv5, PE-HNHv6, PE-HNHv8, PE-HNHv10의 경우, 정확한 편집 (correct editing) 효율이 유지되는 것을 볼 수 있다. (의도한 교정 효율은 감소하지 않는 것이 좋으므로 도 4a의 값이 초록색이 아니여야 한다.)

(b, d) PE-HNHv1에 의한 도입되는 의도치 않은 indel 효율이 PE-HNHv5, PE-HNHv7, PE-HNHv9, PE-HNHv11, PE-HNHv12, PE-HNHv13, PE-HNHv14를 사용하면 절반 이하로 줄어드는 것을 확인할 수 있다. (의도치 않은 indel의 효율은 감소하는 것이 좋으므로 도 4b의 값이 파란색일수록 좋다.)

이를 통해 HNH 도메인에 변이를 도입한 PE의 HNH 도메인 변이체들 중 PE-HNHv5 (PE2-H840A/N863A)를 사용하면 기존 형태인 PE-HNHv1(PE2-H840A) 보다 원치 않는 indel의 발생 빈도를 줄어들고, 원하는 유전체 교정 효율은 유지함을 확인하였다. 또한, Cas9 뉴클레아제 형태 (기존에 있던 H840A 변이를 없앤 형태)로 구성된 PE2-Cas9-WT를 이용했을 때에도 평균 13.0%의 원하는 유전체 교정 효율을 얻을 수 있었고, PE의 효율이 아주 낮은 타겟에서는 간혹 Cas9 뉴클레아제를 사용했을 때 정확한 교정 (correct editing) 효율이 향상되는 것을 확인할 수 있었다 (도 4a. 에서 PE-Cas9-WT 부분에서 관찰되는 분홍색).

도 5는 추가 아미노산 잔기 결실을 포함하는 Cas9 변이체를 통한 유전자 교정 및 indel 효율을 확인한 결과를 나타낸 것이다.

(a) 의도치 않은 indel 돌연변이를 더 줄이기 위하여 Cas9의 HNH 도메인의 일부를 삭제한 후 다양한 길이의 링커 (아미노산 서열: AS, GGGGS, GGGGSGGGGS) 로 연결시킨 HNH 결실 변이 (HNH deletion variant : HNHΔ1-12) 들을 제작하였다.

(b) Cas9에 HNH 결실을 도입한 다양한 HNH 결실 변이 (HNHΔ1~12)들에 도입되는 indel 효율을 세가지 서로 다른 타겟 사이트 (target site)에서 측정하였다. 기존의 Cas9-H840A, 그리고 앞선 실험에서 발견한 Cas9-HNHv5 (Cas9-H840A/N863A)보다 Cas9-HNHΔ1~12는 훨씬 더 낮은 효율로 indel을 도입함을 확인하였다.

(c) 다양한 HNH deletion variant (HNHΔ1~12)를 사용하여 PE 변형체를 제작해보았고, 이를 세포에 처리한 후 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 의도한 유전체 교정 효율을 측정하였다. 그 결과, 기존 PE 또는 PE-HNHv5와 비교하여 PE-HNHΔ4~9 형태에서 비슷하거나 절반 정도의 효율로 원하는 교정 효율이 잘 일어남을 확인하였다.

(d) PE-HNH 결실 변이 (HNHΔ1~12)들에 의해 도입될 수 있는 원치 않는 indel의 빈도를 측정하였다. PE-HNHΔ4~9 형태에서는 의도치 않은 indel이 확연히 줄어드는 것을 확인하였다. 그리고 이는 앞선 HNH 포인트 뮤테이션 변이체 (point mutation variant : HNHv1~14)를 사용했을 때 보다도 개선됨을 확인하였다. 이를 통해 Cas9의 792~897 아미노산 부분 또는 786~885 아미노산 부분이 없는 PE를 사용하면 원치 않는 indel의 도입은 줄이고 의도했던 유전자 교정을 잘 일으킬 수 있음을 확인하였다. 결과적으로Cas9 서열의 100 아미노산 정도가 삭제되어도 PE로의 유전자 교정 기능을 잘 수행할 수 있으며, Cas9 및 PE의 단백질의 크기 또한 더 작아지는 이점이 있다.

도 6은 야생형 Cas9과 Cas9 변이체의 서열 비교 결과를 나타낸 것이다.

발명을 실시하기 위한 구체적인 내용

다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.

PE를 구성하는 H840A Cas9 니케이즈가 완전한 니케이즈가 아니여서 의도치 않은 indel 변이가 도입되는 문제점을 개선하고자, Cas9의 HNH 도메인 부분을 다양하게 변형시킨 변형체를 제작하였다. HNH 도메인 내에 포인트 뮤테이션 (point mutation)을 도입한 ‘포인트 뮤테이션 변이체 (point mutation variant)’와 HNH 도메인 일부를 삭제한 ‘결실 뮤테이션 변이체 (deletion mutation variant)’로 만들어진 다양한 Cas9 변형체들과 PE 변형체들의 의도치 않은 indel 도입 효율과 의도한 정확한 교정 (correct-editing)의 효율을 측정한 결과, 특정 변형체 (HNHv5(H840A/N863A), HNHΔ4~6(Δ792-897), HNH7~9(Δ786-885))를 사용하면 원치 않는 indel의 도입없이 의도한 유전자 교정을 유도할 수 있음을 확인하였다. 이를 활용한다면 의도하지 않은 돌연변이의 도입 없이, 정확하게 유전자 교정을 유도할 수 있으며, 더욱이 결실 변이체 (deletion variant)는 단백질의 크기를 100 아미노산 가량 줄일 수 있는 장점이 있다.

본 발명에 따른 구체적 실시예에서, Cas9 뉴클레아제 (Cas9 WT) 형태로 구성된 프라임 에디터 단백질 (prime editor protein)을 이용하여서도 프라임 에디팅 (Prime Editing)을 일으킬 수 있다.

또한, Cas9의 HNH 도메인에 다양한 변이를 도입하여 불완전한 니케이즈 (비타겟 가닥 (non-target strand)과 일부 타겟 가닥 (target-strand)을 자름)를 비타겟 가닥만을 자르는 니케이즈 형태로 만들 수 있었다. 또한, Cas9 니케이즈를 구성요소로 갖는 프라임 에디터 단백질 (prime editor protein)을 사용하는 프라임 에디팅 (Prime Editing) 방법에서도 비타겟 가닥 (non-target strand)만을 자르는 Cas9 니케이즈 변이체들을 (HNHv5(H840A/N863A), HNHΔ4~6(Δ792-897), HNH7~9(Δ786-885))를 사용하면 의도치 않은 indel이 도입되는 문제점을 개선할 수 있고, 원하는 유전자 교정을 정확하게 유도할 수 있다. 특히 결실 변이체 (deletion variant: HNHΔ4~6(Δ792-897), HNH7~9(Δ786-885)) 의 경우, Cas9 단백질의 크기가 100 아미노산 가량 줄어들어도 잘 작동한다는 강점이 있다. 크기의 제한이 있는 AAV (Adeno-associated virus) 벡터를 활용하게 된다면, 작은 크기이면서 의도하지 않은 indel을 줄여주는 결실 (deletion) 변형체를 사용하는 것이 훨씬 유리하다.

이를 바탕으로, 본 발명은 일 관점에서 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체 또는 이를 코딩하는 핵산에 관한 것이다.

본 발명은 다른 관점에서, 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 아미노산 잔기가 결실된 뉴클레아제 변이체 또는 이를 코딩하는 핵산에 관한 것이다.

구체적으로, 본 발명은 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산을 포함할 수 있다:

본 발명은 더욱이, (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물에 관한 것이다.

상기 뉴클레아제는 표적 특이적으로, 예를 들어, ZNFN (zinc finger nuclease), TALEN(transcriptional activator-like effector nuclease) 또는 Cas 단백질일 수 있으나, 이에 제한되는 것은 아니다. 상기 Cas 단백질은 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, Cas12i, Cas12j, Cas13a, Cas13b, Cas13c, Cas13d, Cas14, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, CsMT2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3 또는 Csf4의 엔도뉴클레아제, 특히 Cas9일 수 있으나, 이에 제한되는 것은 아니다.

상기 Cas 단백질은 Cas 단백질은 CRISPR/Cas 시스템의 주요 단백질 구성 요소로, 활성화된 엔도뉴클레아제 또는 니케이즈를 형성할 수 있는 단백질이다. 상기 Cas 단백질은 예를 들어, 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 피리팩터(Filifactor), 유박테리움(Eubacterium), 스트렙토코커스(Streptococcus: Streptococcus pyogenes), 락토바실러스(Lactobacillus), 미코플라즈마(Mycoplasma), 박터로이드(Bacteroides), 플라비플라비이볼라(Flaviivola), 플라보박테리움(Flavobacterium), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 나이세리아(Neisseria), 로세부리아(Roseburia), 파비바큐럼(Parvibaculum), 스타필로코커스(Staphylococcus: Staphylococcus aureus), 니트라티프랙터(Nitratifractor), 코리네박터리움(Corynebacterium) 및 캠필로박터(Campylobacter)로 이루어지는 군으로부터 선택되는 Cas 단백질의 오소로그(ortholog)를 포함하는 미생물 속으로부터 유래하고, 이들로부터 단순 분리된 것 또는 재조합된 것일 수 있다.

상기 Cas9은 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 서열을 확인할 수 있다. 상기 Cas9은 예를 들어, 서열번호 1의 아미노산 서열을 포함할 수 있다.

상기 표적 특이적 뉴클레아제는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법 등과 같이 인위적 또는 비자연적 생산된 것(non-naturally occurring)일 수 있다. 일 실시예에서, 상기 표적 특이적 뉴클레아제 (예컨대, Cas9, Cpf1, 등)은 재조합 DNA에 의하여 만들어진 재조합 단백질일 수 있다. 재조합 DAN(Recombinant DNA; rDNA)는 다양한 유기체로부터 얻어진 이종 또는 동종 유전 물질을 포함하기 위하여 분자 클로닝과 같은 유전자 재조합 방법에 의하여 인공적으로 만들어진 DNA 분자를 의미한다. 예컨대, 재조합 DNA를 적절한 유기체에서 발현시켜 표적 특이적 뉴클레아제를 생산 (in vivo 또는 in vitro)하는 경우, 재조합 DNA는 제조하고자 하는 단백질을 암호화 하는 코돈들 중에서 상기 유기체에 발현하기에 최적화된 코돈을 선택하여 재구성된 핵산 서열을 갖는 것일 수 있다.

상기 뉴클레아제 변이체는 변이된 형태의 변이 표적 특이적 뉴클레아제일 수 있다. 상기 변이 표적 특이적 뉴클레아제는 DNA 이중 가닥을 절단하는 엔도뉴클레아제 활성을 상실하도록 변이된 것을 의미할 수 있으며, 예컨대, 엔도뉴클레아제 활성을 상실하고 니케이즈 활성을 가지도록 변이될 수 있다. 상기 니케이즈를 통해 두 가닥 중 어느 한 가닥에 닉 (nick)이 도입될 수 있다.

상기 뉴클레아제 변이체는 예를 들어, Cas9의 변이체일 수 있다. 상기 Cas9의 뉴클레아제 도메인은 HNH 도메인과 RuvC 도메인이 존재하는데, 이들은 각각 타겟 DNA와 비타겟 DNA를 자를 수 있다. Cas9의 HNH 도메인 또는 RuvC 도메인에 변이를 도입하면 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈로 제작할 수 있다.

하나의 실시예에서, 상기 뉴클레아제 변이체는 Cas9의 아미노산 서열인 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환될 수 있다.

이를 바탕으로, 본 발명은 또 다른 관점에서, 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체에 관한 것이다.

구체적으로, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 변이를 포함할 수 있다:

서열번호 1의 서열 중 D839이 알라닌으로 치환;

서열번호 1의 서열 중 H840이 알라닌으로 치환;

서열번호 1의 서열 중 N854가 알라닌으로 치환; 및

서열번호 1의 서열 중 N863이 알라닌으로 치환.

본 발명에 따른 구체적 실시예에서, Cas9의 HNH 도메인에 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산을 다른 아미노산으로 치환시킨 Cas9 변이체를 제작하였다. 상기 Cas9 변이체는 HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), 또는 HNHv14(H840A/N863A/D839A/N854A))로 표시되었다. HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), 또는 HNHv14(H840A/N863A/D839A/N854A))의 Cas9 변이체를 사용하는 경우, 원치 않는 indel 효율이 평균 1% 이하로 감소하는 것을 확인할 수 있었다.

본 발명에 따른 구체적 실시예에서, 서열번호 2 내지 15로 구성된 군에서 선택되는 서열을 포함하는 뉴클레아제 변이체를 포함할 수 있다.

특히, HNH 도메인 변이를 도입한 프라임 에디터 단백질의 HNH 도메인 변이체 중 PE-HNHv5 (PE2-H840A/N863A)를 사용하면, 종래 공지된 PE-HNHv1(PE2-H840A) 보다 원치 않는 indel의 발생 빈도를 줄어들고, 원하는 유전체 교정 효율은 유지함을 확인하였다.

또한, 상기 Cas9 뉴클레아제 형태, 예를 들어 종래 공지된 H840A 변이를 없앤 형태)로 구성된 PE2-Cas9-WT를 이용했을 때에도 원하는 유전체 교정 효율을 얻을 수 있었고, PE의 효율이 아주 낮은 타겟에서는 정확한 교정 (correct editing) 효율이 향상되는 것을 확인할 수 있었다.

다른 관점에서, 상기 뉴클레아제 변이체는 뉴클레아제 아미노산 잔기의 결실을 포함할 수 있다. 상기 뉴클레아제 변이체는 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실을 포함한다. 구체적으로, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함할 수 있다:

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.

구체적으로, 상기 뉴클레아제 변이체는 Cas9의 HNH 도메인에서의 결실 예를 들어, 824 내지 874 위치의 아미노산 결실 (HNHΔ1, HNHΔ2 및 HNHΔ3), 792 내지 897 위치의 아미노산 결실 (HNHΔ4, HNHΔ5 및 HNHΔ6), 786 내지 885 위치의 아미노산 결실 (HNHΔ7, HNHΔ8 및 HNHΔ9), 또는 765 내지 908 위치 (HNHΔ10, HNHΔ11 및 HNHΔ12)의 아미노산 결실을 포함할 수 있다.

위에 따른, 다양한 HNH 도메인 결실 변이체 (deletion variant : HNHΔ1~12)를 사용하여 프라임 에디터 단백질 변형체를 제작해 보았고, 이를 세포에 처리한 후 유전체 교정 효율을 측정한 결과, 종래 프라임 에디터 단백질 PE 또는 PE-HNHv5와 비교하여 PE-HNHΔ4~9 형태에서 비슷하거나 절반 정도의 효율로 원하는 교정 효율이 잘 일어남을 확인하였다. 다만, PE-HNHΔ4~9 형태에서는 의도치 않은 indel이 확연히 줄어드는 것을 확인하였다.

경우에 따라서, 상기 결실된 위치 예를 들어, 서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 어느 하나에서 824 내지 874 위치, 792 내지 897 위치, 786 내지 885 위치 또는 765 내지 908 위치의 아미노산 결실을 대신하여, 823 위치의 아미노산 C-말단, 791 위치의 아미노산 C-말단, 785 위치의 아미노산 C-말단, 또는 764 위치의 아미노산 C-말단에 펩타이드 링커를 추가로 포함할 수 있다.

상기 펩타이드 링커는 약 2-25aa 길이를 가질 수 있다. 예를 들어, 알라닌, 글리신 및/또는 세린과 같은 아미노산이 포함될 수 있으나, 이에 제한되는 것은 아니다.

상기 링커는 예를 들어, (AnS)m (n, m은 각각 1 내지 10), (GS)n, (GGS)n, (GSGGS)n 또는 (GnS)m (n, m은 각각 1 내지 10)을 포함할 수 있으나, 상기 링커는 예를 들어 (AnS)m 또는 (GnS)m (n, m은 각각 1 내지 10)일 수 있다. 구체적으로, 상기 링커는 (AnS)m에서 n=1, m=1, 또는 (GnS)m에서 n=4이고, m은 1 또는 2인 G4S 또는 (G4S)2일 수 있다.

상기 프라임 에디팅 가이드 RNA는 교정 서열을 포함하고, 역전사 효소 주형 (template)으로 기능한다. 상기 역전사 효소(RT)는 역전사 효소 주형을 이용하여 DNA 가닥(즉, 상보적 DNA, cDNA)을 합성할 수 있는 RNA-의존적 DNA 폴리머라아제이다. 상기 역전사 효소는 예를 들어, M-MLV(Moloney murine leukemia virus) 역전사 효소 또는 이의 변이체, 예를 들어 RNase H 활성이 결여된 M-MLV-RT, 또는 M-MLV 변이체 (D200N, T306K, W313F, T330P, L603W), BLV(bovine leukemia virus) RT 또는 이의 변이체, RSV(Rous sarcoma virus) RT 또는 이의 변이체, 또는 AMV(Avian Myeloblastosis Virus) RT 또는 이의 변이체를 포함할 수 있으나, 이에 제한되는 것은 아니다.

구체적으로, 상기 역전사 효소는 M-MLV (Moloney Murine Leukemia Virus) 유래의 M-MLV 역전사 효소 또는 이의 변이체일 수 있고, 예를 들어 서열번호 29의 서열을 포함하는 M-MLV 변이체 (D200N, T306K, W313F, T330P, L603W)일 수 있다.

상기 뉴클레아제 또는 이의 변이체와 역전사 효소는 개별적으로 각각의 뉴클레아제 또는 이의 변이체와 역전사 효소를 포함할 수 있고, 뉴클레아제 또는 이의 변이체와 역전사 효소의 융합단백질 형태로 포함될 수 있다.

상기 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA) 또는 이를 코딩하는 DNA는 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함한다.

상기 교정 서열을 포함하는 서열은 역전사 효소 주형 (template)으로 작용한다. 상기 역전사 효소 주형은 목적하는 교정 서열을 포함하고, 게놈 DNA 로커스에 상동성을 가진다. 상기 교정 서열은 이종성 (heterologous) 서열로, 게놈에서 교정하고자 하는 대상 서열을 포함한다.

상기 결합 영역은 역전사 효소 주형의 5’ 방향 또는 3’ 방향에 임의로 위치할 수 있고, 구체적으로 결합 영역은 역전사 효소 주형의 3’ 방향에 위치할 수 있다.

상기 결합 영역은 프라임 에디터 단백질에 포함된 뉴클레아제 또는 이의 변이체 예를 들어 니케이즈에 의해 닉이 생긴 게놈 DNA 가닥에 상보적인 서열을 포함할 수 있다. 상기 결합 영역이 타겟 사이트 (target site)에 혼성화하여, 역전사 효소의 활성 개시점으로 작용할 타겟 사이트 수 있다.

상기 결합 영역은 타겟 사이트의 서열과 80% 이상, 예를 들어 85% 이상, 90% 이상, 95% 이상, 97% 이상, 98% 이상, 99% 이상, 100%의 상동성을 가지는 5 이상, 6 이상, 7 이상, 8 이상, 9 이상, 10 이상, 11 이상, 12 이상, 13 이상, 14 이상, 15 이상, 20 이상, 25 이상의 뉴클레오티드를 포함할 수 있다.

본 발명에 따른 조성물은 (1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하며, (1) 및 (2)를 전달하기 위해 단일 또는 복수의 전달 수단을 동일 또는 상이한 구성으로 조합하여 사용할 수 있다.

상기 (1)은 제1전달 수단에 포함되고, (2)는 제2전달 수단에 포함될 수 있고, 각각의 전달 시스템은 동시에 바이러스 전달수단이거나, 하나는 바이러스 전달수단이고 다른 하나는 비-바이러스 전달수단이거나, 동시에 비-바이러스 전달수단일 수 있다.

상기 핵산은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다. 상기 프라임 에디팅 가이드 RNA는 가이드 RNA의 RNA 서열 또는 이를 코딩하는 DNA 서열을 포함할 수 있다.

상기 (1)의 프라임 에디터 단백질을 코딩하는 DNA 서열 및 (2)의 프라임 에디팅 가이드 RNA를 코딩하는 DNA 서열이 벡터와 같은 전달 수단을 통해 제공될 수 있다. 상기 (1)을 코딩하는 DNA 서열 및 (2)를 코딩하는 DNA 서열을 동일한 벡터 상에 위치하도록 하여 하나의 벡터를 통해 동시에 전달할 수 있다. 상기 (1)의 프라임 에디터 단백질을 코딩하는 DNA 서열 및 (2)의 프라임 에디팅 가이드 RNA를 코딩하는 DNA 서열을 별개의 다른 벡터상에 위치하도록 하여 전달할 수 있다.

본 발명에 따른 조성물은 바이러스 벡터 예를 들어, Adeno-Associated Viral Vector (AAV), Adenoviral Vector (AdV), Lentiviral Vector (LV) 또는 Retroviral Vector (RV), 이외 기타 바이러스 벡터, 예를 들어, Simian virus 40 (SV40) ori, bovine papilloma virus (BPV) ori 또는 Epstein-Barr nuclear antigen (EBV) ori를 포함하는 에피좀 벡터를 사용하여 전달할 수 있다.

상기 벡터는 각각 국소주입법 (예컨대， 병변 또는 표적 부위 직접 주입), 전기천공법 (electroporation), 리포펙션, 바이러스 벡터, 나노파티클 (nanoparticles) 뿐만 아니라, PTD (Protein translocation domain) 융합 단백질 방법 등을 통해 생체 내 또는 세포 내로 전달될 수 있다.

경우에 따라서, (2)의 프라임 에디팅 가이드를 코딩하는 DNA 서열은 벡터를 통해 전달될 수 있다. 상기 (1)의 프라임 에디터 단백질 또는 이를 코딩하는 RNA 서열을 mRNA 형태로 전달할 수 있다. 상기 프라임 에디터 단백질 또는 mRNA는 직접 전달되거나, 캐리어를 통해 전달될 수 있다.

또한, 상기 (1)의 프라임 에디터 단백질을 코딩하는 RNA 서열 및 (2)의 프라임 에디팅 가이드 RNA 서열을 포함할 수 있다. 상기 (1)을 코딩하는 mRNA 및 (2)의 mRNA 형태로 전달할 수 있다. 상기 mRNA는 직접 전달되거나, 캐리어를 통해 전달될 수 있다.

더욱이, 상기 (1)의 프라임 에디터 단백질 및 (2) 프라임 에디팅 가이드 RNA의 mRNA가 조립된 RNP (ribonucleoprotein) 복합체를 형성하도록 하여 전달할 수 있다. 상기 RNP는 직접 전달되거나, 캐리어를 통해 전달될 수 있다.

상기 RNP 복합체는 미세주입법 (microinjection), 전기천공법 (electroporation), DEAE-덱스트란 처리, 리포펙션 (lipofection), 나노파티클-매개 형질주입, 단백질 전달 도메인 매개 도입, 및 PEG-매개 형질주입 등과 같은 당업계의 다양한 방법에 의해 세포로 전달될 수 있지만, 이에 제한되는 것은 아니다.

상기 RNP 복합체는 공동-형질주입 또는 단계적-형질주입 형태로 수행될 수 있다. 공동-형질주입은 (1)의 프라임 에디터 단백질 및 (2) 프라임 에디팅 가이드 RNA를 동시에, 단계적-형질주입은 (1)의 프라임 에디터 단백질을 먼저 형질주입한 다음, (2) 프라임 에디팅 가이드 RNA를 두 번째 형질주입하여 수행되는 것일 수 있으나, 이에 제한되지 않는다.

RNP는 생체 내에서 통상적으로 72시간 내에 분해 되므로 계속적으로 남아 독성 및 비표적 교정을 일으킬 가능성이 낮으므로 유전자치료에 사용할 때 이점이 있다. PE를 RNP가 아닌 플라스미드 DNA 형태로 진핵세포에 도입할 수도 있으나, 이 경우 플라스미드 조각이 유전체에 삽입될 수 있다. 특히, 식물세포 유전자 교정의 경우 RNP 방식은 DNA 방식과는 달리 GMO 규제를 받지 않을 가능성이 있다.

상기 캐리어는 예를 들어, 세포 투과성 펩타이드(CPP), 나노입자, 또는 중합체를 포함할 수 있으나, 이에 제한되는 것은 아니다. CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩타이드이다. 카고는 (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA를 포함할 수 있다. 상기 (1)의 프라임 에디터 단백질 또는 이를 코딩하는 핵산은 공유 결합을 통한 화학적 결합 또는 비-공유 상호작용을 통해 조립될 수 있다. 상기 (2) 프라임 에디팅 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드는 CPP와 복합체화되어, 축합된 양으로 하전된 입자를 형성한다.

상기 나노입자와 관련하여, 본 발명에 따른 조성물은 고분자 나노입자, 금속 나노입자, 금속/무기 나노입자 또는 지질 나노입자를 통해 전달될 수 있다. 상기 고분자 나노입자는 예를 들어, 롤링 써클 증폭에 의해 합성된 DNA nanoclew, 실 유사 DNA 나노입자일 수 있다. DNA nanoclew, 실 유사 DNA 나노입자에 (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA를 로딩하고, 엔도좀 탈출능을 향상시키기 위해 PEI를 코팅하였다. 이러한 복합체가 세포막에 결합하여, 내재화된 다음 엔도좀 탈출을 통해 핵으로 이동하여, (1) 및 (2)가 동시에 전달되도록 할 수 있다.

상기 금속 나노입자와 관련하여, (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA에 금입자를 연결시키고 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)와 복합체를 형성하여 세포에 전달할 수 있다. 상기 양이온성 엔도좀 탈출 폴리머 (endosomal disruptive polymer)는 예를 들어, polyethylene imine, poly(arginine), poly(lysine), poly(histidine), poly-[2-{(2-aminoethyl)amino}-ethyl-aspartamide] (pAsp(DET)), poly(ethylene glycol) (PEG)와 poly(arginine)의 block co-polymer, PEG와 poly(lysine)의 block co-polymer, 또는 PEG와 poly{N-[N-(2-aminoethyl)-2-aminoethyl]aspartamide} (PEG-pAsp(DET))의 block co-polymer일 수 있다.

상기 금속/무기 나노입자와 관련하여, 예를 들어 ZIF-8 (zeolitic imidazolate framework-8)를 통해 (1) 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및 (2) 프라임 에디팅 가이드 RNA를 캡슐화할 수 있으며, 음으로 하전된 RNP를 양으로 하전된 nanoscale ZIF로 캡슐화할 수 있다. 효율적 엔도좀 탈출을 통해 목적하는 타겟 유전자의 발현을 변경시킬 수 있다.

음이온을 띠는(negatively charged) (1) 및 (2)를 코딩하는 DNA 또는 핵산은 양이온을 띠는(cationic) 물질들과 결합하여 나노입자 (nanoparticles)를 형성할 수 있고, 이는 세포로 수용체 매개 엔도사이토시스 (receptor-mediated endocytosis) 혹은 파고사이토시스 (phagocytosis) 등을 통해 침투할 수 있다. (1) 및 (2)의 RNP 복합체가 양이온성 중합체에 결합될 수 있다. 양이온성 중합체로 폴리알릴아민 (PAH); 폴리에틸렌이민 (PEI); 폴리(L-리신) (PLL); 폴리(L-아르기닌) (PLA); 폴리비닐아민 단일- 또는 공중합체; 폴리(비닐벤질-트리-C1-C4-알킬암모늄염); 지방족 또는 방향지방족 디할로겐화물 및 지방족 N,N,N',N'-테트라-C1-C4-알킬-알킬렌디아민의 중합체; 폴리(비닐피리딘) 또는 폴리(비닐피리디늄염); 폴리(N,N-디알릴-N,N-디-C1-C4-알킬-암모늄할로겐화물); 4차화된 디-C1-C4-알킬-아미노에틸 아크릴레이트 또는 메타크릴레이트의 단일- 또는 공중합체; 폴리쿠아드(POLYQUAD)™; 폴리아미노아미드 등이 포함될 수 있다.

양이온성 지질로 양이온성 리포솜 제제를 포함할 수 있다. 리포솜의 지질 이중층은 캡슐화된 핵산을 분해로부터 보호하며, 핵산에 결합할 수 있는 항체에 의한 특이적 중화를 방지할 수 있다. 엔도좀 성숙 동안 엔도좀 멤브레인과 리포좀이 융합되어, 양이온성 지질-핵산절단효소의 효율적인 엔도좀 탈출이 가능하다. 양이온성 지질로 폴리에틸렌이민, 폴리아미도아민 (PAMAM) 성화 수지상체, 리포펙틴 (DOTMA와 DOPE의 조합), 리포펙타제, 리포펙타민(LIPOFECTAMINE)® (예컨대 리포펙타민® 2000, 리포펙타민® 3000, 리포펙타민® RNAiMAX, 리포펙타민® LTX), 세인트-레드(SAINT-RED) (시노볼룩스 세라퓨틱스(Synvolux Therapeutics)사, 네덜란드 그로닝겐 소재), DOPE, 시토펙틴 (길레드 사이언시즈(Gilead Sciences) 사, 캘리포니아 포스터 시티 소재), 및 유펙틴 (JBL사, 캘리포니아 산 루이스 오비스포 소재)가 포함될 수 있다. 대표적인 양이온성 리포솜은 N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 클로라이드 (DOTMA), N-[1-(2,3-디올레올옥시)-프로필]-N,N,N-트리메틸암모늄 메틸술페이트 (DOTAP), 3β-[N-(N',N'-디메틸아미노에탄)카르바모일]콜레스테롤 (DC-Chol), 2,3-디올레일옥시-N-[2(스페르민카르복스아미도)에틸]-N,N-디메틸-1-프로판아미늄 트리플루오로아세테이트 (DOSPA), 1,2-디미리스틸옥시프로필-3-디메틸-히드록시에틸 암모늄 브로마이드; 또는 디메틸디옥타데실암모늄 브로마이드 (DDAB)으로부터 제조될 수 있다.

지질 나노입자와 관련하여, 캐리어로 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀 제형은 주로 천연 인지질 및 지질, 예컨대 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 포스파티딜콜린 또는 모노시알로강글리오사이드 등을 포함할 수 있다. 경우에 따라서, 혈장 내 불안정성을 해소하기 위하여, 지질막에 콜레스테롤 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)을 추가할 수 있다. 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다.

본 발명은 다른 관점에서, 상기 조성물을 세포에 처리하는 단계를 포함하는 유전체 교정 방법에 관한 것이다.

상기 세포는 진핵 세포 (예컨대, 효모 등의 균류， 진핵 동물 및 /또는 진핵 식물 유래 세포 (예컨대, 배아세포， 줄기세포, 체세포, 생식세포 등) 등)， 진핵 동물 (예컨대， 인간, 원숭이 둥의 영장류 개， 돼지， 소， 양， 염소, 마우스，래트 등)， 또는 진핵 식물 (예컨대, 녹조류 등의 조류，옥수수, 콩，밀， 벼 등)일 수 있으나, 이에 제한되는 것은 아니다.

실시예

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.

실시예 1. Cas9, nCas9-D10A, nCas9-H840A를 이용한 표적 서열에 대한 절단

표적 서열의 정보와 Cas9, nCas9-D10A, nCas9-H840A를 in vitro 절단 처리하였을 때 예상되는 절단 위치와 (Red arrowhead: 절단 위치, Blue: PAM sequence) 이후 WGS (Whole Genome Sequencing)의 데이터를 IGV로 확인할 때 결과를 예상하고, 도 1a에 나타내었다.

HAP1 세포의 gDNA를 사용하여 Cas9 variants들을 37C에 16시간 동안 처리하고 WGS결과를 확인하였다. 도 1b에 따르면, Cas9, nCas9-D10A는 예상과 동일한 절단 형태를 보였지만, nCas9-H840A의 경우, 예상과는 달리 타겟 가닥에도 부분적 절단이 일어났다.

gDNA에서 진행한 절단 실험을 다시 확인하기 위하여 플라스미드를 사용한 in vitro 절단 실험을 진행하였다. Supercoiled 형태의 플라스미드는 양쪽 가닥이 절단되면 선형 (linear), 한쪽 가닥이 절단 되면 오픈 원형 (open circular)의 형태로 전기 영동에 의하여 크기가 분리된다. 6030bp크기의 플라스미드를 가지고 한쪽 가닥을 절단하는 Nt.BbvCI 효소와 양쪽 가닥을 절단하는 SpeI 효소를 사용하여 각각 오픈 원형 (open circular)과 선형 (linear) 형태의 비교군을 제작하였다. 이 후 Cas9, nCas9-D10A, nCas9-H840A를 처리하여 플라스미드의 형태를 관찰하였다. 도 1c에 따르면, Cas9에서는 대부분의 플라스미드가 양쪽 가닥이 잘려 선형 (linear) 형태로 남는 것을 확인 하였으며, nCas9-D10A를 처리하였을 때 대부분 한쪽 가닥이 절단되어 오픈 원형 (open circular) 형태로 남아있는 것을 확인하였다. 그러나 nCas9-H840A를 사용하였을 때 선형 (linear) 형태의 플라스미드가 nCas9-D10A를 처리한 때보다 더 많이 나타나는 것을 확인하였다. 이를 ImageJ software를 이용하여 밴드들의 강도 (intensity)를 측정하고 상대적 선형 밴드 강도 (linear band intensity)값을 얻은 결과, nCas9-D10A는 16.0%, nCas9-H840A는 43.3%로 각각 관찰되었다.

실시예 2. 삽입/결실 (indel : insertion and deletion) 효율 확인

SpCas9의 뉴클레아제 도메인 (nuclease domain)으로는 HNH 도메인과 RuvC 도메인이 존재하는데, 이들은 각각 타겟 DNA와 비타겟 DNA (non-target DNA)를 자른다. Cas9의 HNH 도메인 또는 RuvC 도메인에 변이를 도입하면 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈로 제작할 수 있다. Cas9 니케이즈는 주로 RuvC 도메인에 D10A 변이를 도입한 형태나 HNH 도메인에 H840A 또는 N863A 변이를 도입한 형태를 사용한다. 도 2a에서와 같이, HNH 도메인 내에서 DNA 절단에 관여하는 D839, H840, N854, N863 위치에 변이를 도입하여 완전하게 비타겟 가닥 (non-target strand) 한쪽 가닥 만을 자를 수 있는 Cas9 니케이즈를 만들고자 하였다.

세포 내에서 니케이즈 Cas9 (nCas9)에 의해 도입될 수 있는 원치 않는 indel (insertion and deletion) 효율을 확인하기 위하여, HEK293T 세포에 nCas9과 다양한 유전자를 타겟으로하는 sgRNA를 발현하는 플라스미드를 함께 전달하였다. 그 후 세포의 DNA를 분리하여 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 확인하였다. 도 2b에 따르면 기존에 주로 사용하던 형태인 HNHv1(Cas9-H840A)에 의해 0.035~15% (평균 2.5%)의 indel이 나타나는 것을 확인하였다. 이를 줄이기 위하여 Cas9 HNH 도메인 내에 D839A, H840A, N854A, N863A 조합의 변이를 갖는 Cas9 변이체를 제작하였고, 이를 사용한 결과 다양한 변이체(HNHv5(H840A/N863A), HNHv7(H840A/N854A), HNHv9(N863A/N854A), HNHv11(H840A/N863A/N854A), HNHv12(H840A/D839A/N854A), HNHv13(N863A/D839A/N854A), HNHv14(H840A/N863A/D839A/N854A)) 에서 원치 않는 indel 효율이 평균 1% 이하로 감소하는 것을 확인할 수 있었다.

앞선 실험에서 원치 않는 indel 효율의 감소한 Cas9 변이체가 1) Cas9이 한쪽 가닥만을 정확하게 자르는 니케이즈 형태가 되어서 인지, 혹은 2) Cas9 자체의 활성을 잃고 양쪽 가닥을 모두 못 자르는 효소적으로 불활성인 Cas9 (catalytically dead Cas9) 형태가 되어서 인지를 확인하기 위하여 이중 니킹 (double nicking) 실험(서로 다른 strand를 자르는 두 개의 sgRNA를 사용한 실험)을 진행하였다. 만약 1)의 경우라면 sgRNA-A나 sgRNA-1을 각각 처리하였을 때에는 indel 이 관찰되지 않고, sgRNA-A와 sgRNA-1을 동시에 처리한 경우에는 양쪽가닥(DNA double strand break)이 잘리게 되어 indel이 관찰되게 될 것이다. 만약 2)의 경우라면, sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 indel이 관찰되지 않을 것이다. 도 2c에 따르면, 이를 실험적으로 2개의 타겟 사이트 (target site)에 대해서 확인해본 결과, HNHv7, HNHv11, HNHv12, HNHv14는 sgRNA-A / sgRNA-1 / sgRNA-A+sgRNA-1의 모든 경우에서 1% 이하의 indel이 관찰되어 Cas9의 활성을 거의 잃은 효소적으로 불활성인 Cas9 (catalytically dead Cas9)임을 확인할 수 있었다. 반면, HNHv5, HNHv9, HNHv13의 경우, 각각의 sgRNA-A나 sgRNA-1만 처리했을 때에는 1% 이하의 indel이 관찰되지만 sgRNA-A와 sgRNA-1을 동시에 처리한 경우 1% 이상의 indel이 관찰되어, 한쪽 가닥을 자르는 Cas9 니케이즈 형태임을 확인할 수 있었다.

실시예 3. in vitro 시험에서 절단 패턴 (cleavage pattern) 변화 결과 확인

nCas9-H840A와 nCas9-H840A/N863A를 각각 분리된 HAP1 세포의 gDNA에 처리하여 WGS을 통해 절단 패턴의 변화를 관찰하였다. 도 3a에 따르면, 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)를 타겟하여 확인해 본 결과, nCas9-H840A는 모두 일부 이중 가닥 (partial double strand) 절단을 일으키는 반면, nCas9-H840A/N863A를 처리하였을 때 원하는 비타겟 가닥(non-target strand)에서만 절단이 일어나는 패턴의 변화를 확인 할 수 있었다.

다이게놈 시퀀싱 (Digenome sequencing)을 통한 전체 게놈 (whole genome)에서의 패턴 변화를 확인하였다. 다이게놈 시퀀싱 (Digenome sequencing)은 전체 유전자에서 이중 가닥 절단 (double strand break)을 찾아낼 수 있는 방법 중 하나이다. 이를 통해 전체 유전자에서 나타나는 이중 가닥 절단 의 패턴을 비교하여 circos plot을 통해 나타내었다. 도 3b에 따르면, 세 종류의 사이트 (HEK4, EMX1 및 RUNX1)에 nCas9-H840A를 처리하였을 때, 표적 사이트와 오프 타겟 (off-target) 사이트에 이중 가닥 절단들이 관찰 되었다. 반면 nCas9-H840A/N863A를 처리하였을 때, 표적 사이트에서 이중 가닥 절단을 확인 할 수 없었고, 표적사이트를 제외한 오프 타겟 사이트들에서도 이중 가닥 절단이 사라지거나 그 비율이 현저히 줄어드는 것을 확인 할 수 있었다. 이를 통해 in vitro 실험 결과에서도 도 1과 마찬가지로 Cas0-H840A/N863A은 DNA의 한쪽 가닥만 자를 수 있는 니케이즈 (nickase) Cas9 형태임을 확인하였다.

실시예 4. 유전자 교정 및 indel 효율 확인

nCas9과 MMLV 역전사효소로 구성된 PE (Prime Editor)를 도입하고자 하는 돌연변이를 유도할 수 있는 pegRNA와 함께 세포에 전달하고, DNA를 targeted deep-sequencing 방법으로 분석하여, 그 결과를 도 4에 나타내었다.

도 4a 및 도 4b에 따르면, (a) 의도한 유전자 교정의 효율(correct editing)와 (b) 의도치 않은 indel 효율 (unwanted indel activity)을 측정하였다. (c, d) (a)/(b)에 대하여 정규화 (normalization) 하지 않은 NGS 데이터값을 나타내었다.

나타낸 값은 모두 기존 형태인 PEv1(PE-H840A)의 값을 1로 두어 normalization 하였고, 의도한 유전자 교정의 효율이 1보다 높으면 분홍색, 1보다 낮으면 초록색 / 의도치 않은 indel 효율이 1보다 높으면 빨간색, 1보다 낮으면 파란색으로 표시하였다.

실시예 5. 결실 변이 포함 Cas9 변이체를 통한 유전자 교정 및 indel 효율 확인

추가 아미노산 잔기 결실을 포함하는 Cas9 변이체를 통한 유전자 교정 및 indel 효율을 확인하였다.

의도치 않은 indel 돌연변이를 더 줄이기 위하여 Cas9의 HNH 도메인의 일부를 삭제한 후 다양한 길이의 링커 (아미노산 서열: AS, GGGGS, GGGGSGGGGS) 로 연결시킨 HNH 결실 변이 (HNH deletion variant : HNHΔ1-12) 들을 제작하였다 (도 5a).

Cas9에 HNH 결실을 도입한 다양한 HNH 결실 변이 (HNHΔ1~12)들에 도입되는 indel 효율을 세가지 서로 다른 타겟 사이트 (target site)에서 측정하였다. 도 5b에 따르면, 기존의 Cas9-H840A, 그리고 앞선 실험에서 발견한 Cas9-HNHv5 (Cas9-H840A/N863A)보다 Cas9-HNHΔ1~12는 훨씬 더 낮은 효율로 indel을 도입함을 확인하였다.

다양한 HNH deletion variant (HNHΔ1~12)를 사용하여 PE 변형체를 제작해보았고, 이를 세포에 처리한 후 표적화 딥 시퀀싱 (targeted deep-sequencing) 방법으로 의도한 유전체 교정 효율을 측정하였다. 도 5c에 따르면, 기존 PE 또는 PE-HNHv5와 비교하여 PE-HNHΔ4~9 형태에서 비슷하거나 절반 정도의 효율로 원하는 교정 효율이 잘 일어남을 확인하였다.

PE-HNH 결실 변이 (HNHΔ1~12)들에 의해 도입될 수 있는 원치 않는 indel의 빈도를 측정하였다. 도 5d에 따르면, PE-HNHΔ4~9 형태에서는 의도치 않은 indel이 확연히 줄어드는 것을 확인하였다. 그리고 이는 앞선 HNH 포인트 뮤테이션 변이체 (point mutation variant : HNHv1~14)를 사용했을 때 보다도 개선됨을 확인하였다. 이를 통해 Cas9의 792~897 아미노산 부분 또는 786~885 아미노산 부분이 없는 PE를 사용하면 원치 않는 indel의 도입은 줄이고 의도했던 유전자 교정을 잘 일으킬 수 있음을 확인하였다. 결과적으로Cas9 서열의 100 아미노산 정도가 삭제되어도 PE로의 유전자 교정 기능을 잘 수행할 수 있으며, Cas9 및 PE의 단백질의 크기 또한 더 작아지는 이점이 있다.

이상으로 본 발명의 내용의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서, 이러한 구체적 기술은 단지 바람직한 실시양태일 뿐이며, 이에 의해 본 발명의 범위가 제한되는 것이 아닌 점은 명백할 것이다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항들과 그것들의 등가물에 의하여 정의된다고 할 것이다.

전자파일 첨부하였음.

Claims

서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 뉴클레아제 변이체 또는 이를 코딩하는 핵산.
제1항에 있어서, 다음으로 구성된 군에서 선택되는 하나 이상의 변이를 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산:

서열번호 1의 서열 중 D839이 알라닌으로 치환;

서열번호 1의 서열 중 H840이 알라닌으로 치환;

서열번호 1의 서열 중 N854가 알라닌으로 치환; 및

서열번호 1의 서열 중 N863이 알라닌으로 치환.
제1항에 있어서, 서열번호 2 내지 15로 구성된 군에서 선택되는 서열을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산.
서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산:

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및

서열번호 1 내지 15로 구성된 군에서 선택되는 서열 중 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
제4항에 있어서, 서열번호 16 내지 19로 구성된 군에서 선택되는 서열을 포함하는 뉴클레아제 변이체 또는 이를 코딩하는 핵산.
(1) 뉴클레아제 또는 이의 변이체 및 역전사 효소(reverse transcriptase)를 포함하는 프라임 에디터 단백질 (prime editor protein) 또는 이를 코딩하는 핵산; 및

(2) 교정 대상 유전체에 결합하는 결합 영역 (binding site) 및 교정 서열을 포함하는 프라임 에디팅 가이드 RNA (pegRNA, prime editing guide RNA)를 포함하는, 유전체 교정을 위한 조성물.
제6항에 있어서, 상기 뉴클레아제는 Cas9인 조성물.
제6항에 있어서, 상기 뉴클레아제 변이체는 서열번호 1의 서열 중 D839, H840, N854 및 N863으로 구성된 군에서 선택된 하나 이상의 아미노산이 다른 아미노산으로 치환된, 조성물.
제6항에 있어서, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 변이를 포함하는, 조성물:

서열번호 1의 서열 중 D839이 알라닌으로 치환;

서열번호 1의 서열 중 H840이 알라닌으로 치환;

서열번호 1의 서열 중 N854가 알라닌으로 치환; 및

서열번호 1의 서열 중 N863이 알라닌으로 치환.
제6항에 있어서, 서열번호 2 내지 15로 구성된 군에서 선택되는 서열을 포함하는 조성물.
제6항에 있어서, 상기 뉴클레아제 변이체는 다음으로 구성된 군에서 선택되는 하나 이상의 아미노산 잔기의 결실을 포함하는, 조성물:

서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 824 내지 874 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 792 내지 897 위치 중 하나 이상의 아미노산 잔기 결실;

서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 786 내지 885 위치 중 하나 이상의 아미노산 잔기 결실; 및

서열번호 1 내지 15로 구성된 군에서 선택된 서열 중 어느 하나에서 765 내지 908 위치 중 하나 이상의 아미노산 잔기 결실.
제11항에 있어서, 서열번호 16 내지 19로 구성된 군에서 선택되는 서열을 포함하는 조성물.
제11항에 있어서, 펩타이드 링커를 추가로 포함하는 조성물.
제13항에 있어서, 상기 링커는 (AnS)m (n, m은 각각 1 내지 10), (GS)n, (GGS)n, (GSGGS)n 또는 (GnS)m (n, m은 각각 1 내지 10)인 조성물.
제6항에 있어서, 상기 뉴클레아제 또는 이의 변이체와 역전사 효소는 개별 또는 융합단백질 형태로 포함되는, 조성물.
제6항에 있어서, 상기 역전사 효소는 M-MLV (Moloney Murine Leukemia Virus) 유래인, 조성물.
제6항에 있어서, 상기 역전사 효소는 서열번호 29의 서열을 포함하는, 조성물.
제6항에 있어서, 상기 프라임 에디터 단백질 및 프라임 에디팅 가이드 RNA가 조립된 RNP (ribonucleoprotein)를 포함하는, 조성물.
제6항에 있어서, 상기 프라임 에디터 단백질을 코딩하는 핵산 및 프라임 에디팅 가이드 RNA를 코딩하는 핵산을 모두 또는 별개로 포함하는 벡터를 포함하는 조성물.
제6항에 있어서, 상기 프라임 에디터 단백질 및 프라임 에디팅 가이드 RNA를 코딩하는 핵산을 포함하는 벡터를 포함하는 조성물.
제6항 내지 제20항 중 어느 한 항의 조성물을 세포에 처리하는 단계를 포함하는 유전체 교정 방법.