KR20220045013A

KR20220045013A - Lama1 유전자를 표적으로 하는 근이영양증의 치료 방법

Info

Publication number: KR20220045013A
Application number: KR1020227007882A
Authority: KR
Inventors: 위안보 친; 데쓰야 야마가타
Original assignee: 가부시키가이샤 모달리스
Priority date: 2019-08-16
Filing date: 2020-08-14
Publication date: 2022-04-12
Also published as: IL290249A; EP4013874A1; JP2022544320A; CN114364802A; BR112022002889A2; TW202112797A; WO2021033635A1; MX2022001859A; CA3146751A1; AU2020334462A1; US20230173036A1

Abstract

본 발명은 인간 근이영양증(특히 MDC1A)에 대한 신규한 치료적 접근법을 제공하는 것을 목적으로 한다. 본 발명은 이하의 염기 서열: (a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열, 및 (b) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA, (ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드를 제공한다.

Description

LAMA1 유전자를 표적으로 하는 근이영양증의 치료 방법

본 발명은 라미닌-α1 쇄(Laminin-α1 chain; LAMA1) 유전자 등을 표적으로 하는 근이영양증(muscular dystrophy), 특히 메로신-결핍 선천성 근이영양증(Merosin-Deficient Congenital Muscular Dystrophy; MDC1A)의 치료 방법에 관한 것이다. 보다 구체적으로, 본 발명은 근이영양증을 치료 또는 예방하는 방법으로서, 인간 LAMA1 유전자의 특정 서열을 표적으로 하는 가이드 RNA, 전사 활성화 인자와 CRISPR 이펙터 단백질의 융합 단백질, 및 근이영양증을 치료 또는 예방하기 위한 약제 등을 이용하는 것에 의해 근육 조직에 본질적으로 발현되지 않는 인간 LAMA1 유전자의 발현을 상향 조절함으로써 돌연변이에 의해 결실된 LAMA2 또는 그 기능을 보완하는 것을 포함하는 방법에 관한 것이다.

근이영양증은 진행성 근위축과 근력 손실을 동반하는 유전성 질환의 총칭이다. 현재, 근이영양증에 효과적인 근본적인 치료약은 없고, 대증 요법만이 행해지고 있다. 근이영양증의 한 유형으로서, 상염색체 열성 질환인 메로신-결핍 선천성 근이영양증(MDC1A)이 알려져 있다.

MDC1A는 정신 지체를 수반하지 않는 서구형 선천성 근이영양증으로, 골격근 기저막 성분에서 메로신의 결핍에 의해 발생한다. 메로신은 라미닌 쇄로 구성된 헤테로삼량체이며, 당 쇄 구조를 통해 α-디스트로글리칸(α-dystroglycan)에 결합된다. 메로신이 고갈되면 디스트로핀 당단백질 복합체(dystrophin glycoprotein complex)를 통한 세포 골격과 세포외 기질 사이의 연결이 끊어진다. 이는 유럽과 미국에서 가장 흔한 선천성 근이영양증이다(약 50%). 이는 라미닌 α2 쇄 유전자(LAMA2 유전자)의 6q22.33에서의 돌연변이로 인해 발생한다.

Cohn 등은 MDC1A dy^2J/dy^2J 마우스 모델에서 CRISPR/Cas9 게놈 편집 구성 요소와 함께 아데노 연관 바이러스(adeno-associated virus; AAV)의 전신 전달을 통해 LAMA2 유전자의 돌연변이를 유발하는 스플라이스 부위 돌연변이(splice site mutation)를 교정하는 방법을 보고하였다. 치료 후 dy^2J/dy^2J 마우스는 마비의 징후 없이 근육 조직병리학(histopathology) 및 기능에서 상당한 개선을 나타내었다(비특허문헌 1).

더욱이, Bassi는 LAMA1 유전자가 MDC1A에 대한 질병 변형 유전자일 수 있음을 보여주었다. LAMA1 유전자는 라미닌 α2 쇄와 구조적으로 유사한 라미닌 α1 쇄 단백질을 코딩한다. 구체적으로, 마우스를 사용한 실험에서 황색포도상구균(S. aureus)의 CRISPR/Cas9 시스템이 LAMA1 발현을 상향 조절하고, 라미닌 α2 쇄의 결핍을 보상하는 데 사용될 수 있다는 가능성을 보여주었다(비특허문헌 2 및 3).

Kemaladewi, D. U., Maino, E., Hyatt, E., Hou, H., Ding, M., Place, K. M., Zhu, X., Bassi, P., Baghestani, Z., Deshwar, A. G., Merico, D., Xiong, H. Y., Frey, B. J., Wilson, M. D., Ivakine, E. A., Cohn, R. D. Nat Medicine. 23:8. 2017. Prabhpreet Singh Bassi, A thesis submitted in conformity with the requirements for the degree of Master of Science, Department of Molecular Genetics, University of Toronto. 2017: Assessing the Therapeutic Potential of CRISPR/Cas9-Mediated Gene Modulation in Merosin-Deficient Congenital Muscular Dystrophy Type 1A Dwi U. Kemaladewi, Prabhpreet S. Bassi, Steven erwood, Dhekra Al-Basha, Kinga I. Gawlik, Kyle Lindsay, elzbieta Hyatt, rebekah Kember, Kara M. Place, ryan M. Marks, Madeleine Durbeej, Steven A. Prescott, evgueni A. Ivakine & ronald D. Cohn, Nature 572, p125, 2019: A mutation-independent approach for muscular dystrophy via upregulation of a modifier gene

본 발명은 인간 근이영양증(특히 MDC1A)에 대한 신규한 치료적 접근법을 제공하는 것을 목적으로 한다.

본 발명자들은 상술한 문제에 대해 집중적인 연구를 수행하여 인간 LAMA1 유전자(Gene ID: 284217)의 특정 서열을 표적으로 하는 가이드 RNA, 및 전사 활성화 인자와 뉴클레아제 활성이 없는 CRISPR 이펙터 단백질의 융합 단백질을 이용하여 근세포에서 인간 LAMA1 유전자의 발현이 상향 조절될 수 있음을 발견하였다. 본 발명자들은 이러한 지견에 기초하여 본 발명을 완성하였다.

본 발명은 이하의 발명을 포함할 수 있다.

[1] 이하의 염기 서열을 포함하는 폴리뉴클레오타이드:

(a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열, 및

(b) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA, (ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열.

[2] 가이드 RNA를 코딩하는 염기 서열이

(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열,

(ii) 서열번호: 124에 기재된 염기 서열,

(iii) 서열번호: 178, 193, 또는 195에 기재된 염기 서열,

또는 여기서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 염기 서열을 포함하는, 상기 [1]의 폴리뉴클레오타이드.

[3] 전사 활성화 인자가 VP64, VP160, VPH, VPR, VP64-miniRTA(miniVR) 및 microVR, 및 전사 활성화 능력을 갖는 그의 변이체로 이루어진 군에서 선택되는, 상기 [1] 또는 [2]의 폴리뉴클레오타이드.

[4] 전사 활성화 인자가 miniVR인, 상기 [3]의 폴리뉴클레오타이드.

[5] 뉴클레아제-결핍 CRISPR 이펙터 단백질이 dCas9인, 상기 [1] 내지 [4] 중 어느 하나의 폴리뉴클레오타이드.

[6] dCas9가 황색포도상구균(Staphylococcus aureus)에서 유래하는, 상기 [5]의 폴리뉴클레오타이드.

[7] 가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열 및/또는 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열을 더 포함하는, 상기 [1] 내지 [6] 중 어느 하나의 폴리뉴클레오타이드.

[8] 가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터, SNR6 프로모터, SNR52 프로모터, SCR1 프로모터, RPR1 프로모터, U3 프로모터, 및 H1 프로모터로 이루어진 군에서 선택되는, 상기 [7]의 폴리뉴클레오타이드.

[9] 가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터인, 상기 [8]의 폴리뉴클레오타이드.

[10] 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열이 유비쿼터스 프로모터(ubiquitous promoter) 또는 근육 특이적 프로모터인, 상기 [7] 내지 [9] 중 어느 하나의 폴리뉴클레오타이드.

[11] 유비쿼터스 프로모터가 EFS 프로모터, CMV 프로모터 및 CAG 프로모터로 이루어진 군에서 선택되는, 상기 [10]의 폴리뉴클레오타이드.

[12] 근육 특이적 프로모터가 CK8 프로모터, 마이오신 중쇄 키나아제(myosin heavy chain kinase; MHCK) 프로모터, 근육 크레아틴 키나아제(muscle creatine kinase; MCK) 프로모터, 합성 C5-12(Syn) 프로모터 및 unc45b 프로모터로 이루어진 군에서 선택되는, 상기 [10]의 폴리뉴클레오타이드.

[13] 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드를 포함하는 벡터.

[14] 벡터가 플라스미드 벡터 또는 바이러스성 벡터인, 상기 [13]의 벡터.

[15] 바이러스성 벡터가 아데노 연관 바이러스(AAV) 벡터, 아데노바이러스 벡터, 및 렌티바이러스 벡터로 이루어진 군에서 선택되는, 상기 [14]의 벡터.

[16] AAV 벡터가 AAV1, AAV2, AAV6, AAV7, AAV8, AAV9, 및 그들의 변이체로 이루어진 군에서 선택되는, 상기 [15]의 벡터.

[17] 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터를 포함하는, MDC1A를 치료 또는 예방하기 위한 약제.

[18] 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터를 이를 필요로 하는 대상에 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법.

[19] MDC1A를 치료 또는 예방하기 위한, 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터의 사용.

[20] MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서 상기 [1] 내지 [12] 중 어느 하나의 폴리뉴클레오타이드 또는 상기 [13] 내지 [16] 중 어느 하나의 벡터의 사용.

[21] 세포에서 인간 LAMA1 유전자의 발현을 상향 조절하는 방법으로서,

(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및

(d) 인간 LAMA1의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 상기 세포에서 발현하는 것을 포함하는 방법.

[22] 이하를 포함하는 리보핵단백질(ribonucleoprotein):

(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질 및

(d) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA.

[23] 이하를 포함하는, 인간 LAMA1 유전자 발현의 상향 조절용 키트:

(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및

(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.

[24] 이하의 (e) 및 (f)를 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법:

[25] MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서, 이하의 (e) 및 (f)의 사용:

본 발명에 따르면, 인간 LAMA1 유전자의 발현을 상향 조절할 수 있으며, 그 결과 본 발명이 MDC1A를 치료할 수 있을 것으로 기대된다.

[도 1] 도 1은 인간 LAMA1 유전자에서 표적 게놈 영역의 위치(location)를 나타낸다.
[도 2] 도 2는 서열번호: 1 내지 16에 나타낸 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 골격근 근아세포(skeletal muscle myoblast)(HSMM 세포) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 3] 도 3은 서열번호: 1 내지 16에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #5에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 효과의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 4] 도 4는 서열번호: 10, 11, 15, 17-61에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 5] 도 5는 R1 또는 R2 영역에 위치한 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 공여자 #3에서 유래된 1차 HSMM 세포 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 6] 도 6은 서열번호: 130 내지 221에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #3, #121, #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA를 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 7a] 도 7a는 서열번호: 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #3, #121에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다. 실험을 3회 반복하여 평균값과 SD값을 나타내었다.
[도 7b] 도 7b는 서열번호: 178, 193 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 mini-VR을 사용한, 1차 HSMM 세포(공여자 #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다. 실험을 3회 반복하여 평균값과 SD값을 나타내었다.
[도 8] 도 8은 1차 HSMM 세포(공여자 #3, #121, #368, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 수준을 평가한 결과이며, 가로축은 공여자 번호, 세로축은 HPRT 대조군을 사용하였을 때의 발현 수준을 나타낸다.
[도 9] 도 9는 서열번호: 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩된 crRNA를 포함하는 sgRNA(sgLAMA1-155, sgLAMA1-170, sgLAMA-172) 및 다양한 활성화 모이어티(moiety)를 사용한, 1차 HSMM 세포(공여자 #3에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸 것이다. 가로축은 각 조건을 나타내고, 세로축은 대조군 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준(1로 함)에 대한 각 sgRNA를 사용한 경우의 LAMA1 유전자의 발현 수준의 비율을 나타낸다.
[도 10] 도 10은 단백질 수준에 있어서, 서열번호 178, 193, 또는 195에 나타낸 표적 서열에 의해 코딩되는 crRNA를 포함하는 sgRNA 및 microVR을 사용한, 1차 HSMM 세포(공여자 #3, #617에서 유래됨) 중의 인간 LAMA1 유전자에 대한 발현 증진 작용의 평가 결과를 나타낸다.

이하, 본 발명의 실시태양을 상세히 설명한다.

1. 폴리뉴클레오타이드

본 발명은 이하의 염기 서열을 포함하는 폴리뉴클레오타이드(이하, "본 발명의 폴리뉴클레오타이드"라고 지칭하는 경우도 있음)를 제공한다:

(b) 인간 LAMA1 유전자의 발현 조절 영역에 있어서,

(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA,

(ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는

(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열.

본 발명의 폴리뉴클레오타이드를 원하는 세포에 도입하고 전사하여, 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및 인간 LAMA1 유전자의 발현 조절 영역의 특정 영역을 표적으로 하는 가이드 RNA를 생산한다. 이러한 융합 단백질 및 가이드 RNA는 복합체(이하, 복합체를 "리보핵단백질; RNP"라고 지칭하는 경우도 있음)를 형성하고, 상술한 특정 영역에 협력적으로 작용하여, 인간 LAMA1 유전자의 전사를 활성화시킨다.

(1) 정의

본원에 있어서, "인간 라미닌-α1 쇄(LAMA1) 유전자의 발현 조절 영역"은 그 영역에 RNP가 결합함으로써 인간 LAMA1 유전자의 발현이 활성화될 수 있는 임의의 영역을 의미한다. 즉, 인간 LAMA1 유전자의 발현 조절 영역은 인간 LAMA1 유전자의 발현이 RNP의 결합에 의해 활성화되는 한, 인간 LAMA1 유전자의 프로모터 영역, 인핸서 영역, 인트론 및 엑손과 같은 임의의 영역에 존재할 수 있다. 본원에서 발현 조절 영역이 특정 서열로 표시되는 경우, 발현 조절 영역은 개념적으로 센스 가닥(sense strand) 서열 및 안티센스 가닥(antisense strand) 서열을 모두 포함한다.

본 발명에 있어서, 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질은 가이드 RNA에 의해 인간 LAMA1 유전자의 발현 조절 영역의 특정 영역으로 모집(recruit)된다. 본원에 있어서, "…를 표적으로 하는 가이드 RNA"는 "융합 단백질을 …로 모집하는 가이드 RNA"를 의미한다.

본원에 있어서, "가이드 RNA(이하 'gRNA'로도 지칭함)"는 게놈 특이적 CRISPR-RNA(이하 "crRNA"로 지칭함)를 포함하는 RNA이다. crRNA는 표적 서열의 상보적 서열(후술함)에 결합하는 RNA이다. Cpf1이 CRISPR 이펙터 단백질로 사용되는 경우, "가이드 RNA"는 crRNA로 이루어지는 RNA 및 그의 5'-말단에 부착된 특정 서열을 포함하는 RNA(예를 들어, FnCpf1의 경우 서열번호: 65에 기재된 RNA 서열)를 지칭한다. Cas9가 CRISPR 이펙터 단백질로 사용되는 경우, "가이드 RNA"는 crRNA 및 그의 3'-말단에 부착된 트랜스-활성화 crRNA(이하 "tracrRNA"로 지칭함)를 포함하는 키메라 RNA(이하 "싱글 가이드 RNA(sgRNA)"로 지칭함)를 말한다(예를 들어, 그 전문이 본원에 참조에 의해 원용(incorporated)되는 Zhang F. et al., Hum Mol Genet. 2014 Sep 15; 23(R1):R40-6 및 Zetsche B. et al., Cell. 2015 Oct 22; 163(3): 759-71 참조).

본원에 있어서, 인간 LAMA1 유전자의 발현 조절 영역 중의 crRNA가 결합된 서열의 상보적 서열을 "표적 서열"이라 한다. 즉, 본원에 있어서, "표적 서열"은 인간 LAMA1 유전자의 발현 조절 영역에 존재하고 PAM(protospacer adjacent motif)에 인접한 DNA 서열이다. Cpf1이 CRISPR 이펙터 단백질로 사용되는 경우, PAM은 표적 서열의 5'측에 인접한다. Cas9가 CRISPR 이펙터 단백질로 사용되는 경우, PAM은 표적 서열의 3'측에 인접한다. 표적 서열은 인간 LAMA1 유전자의 발현 조절 영역의 센스 가닥 서열측 또는 안티센스 가닥 서열측에 존재할 수 있다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는, 상술한 Zhang F. et al., Hum Mol Genet. 2014 Sep 15; 23(R1):R40-6 and Zetsche B. et al., Cell. 2015 Oct 22; 163(3): 759-71 참조).

(2) 뉴클레아제-결핍 CRISPR 이펙터 단백질

본 발명에 있어서, 뉴클레아제-결핍 CRISPR 이펙터 단백질을 사용하여, 이에 융합된 전사 활성화 인자를 인간 LAMA1 유전자의 발현 조절 영역에 모집한다. 본 발명에서 사용되는 뉴클레아제-결핍 CRISPR 이펙터 단백질(이하, 간단히 "CRISPR 이펙터 단백질"로 지칭함)은 gRNA와 복합체를 형성하고, 인간 LAMA1 유전자의 발현 조절 영역에 모집되는 한 특별히 제한되지 않는다. 예를 들어, 뉴클레아제-결핍 Cas9(이하, "dCas9"라고 지칭하는 경우도 있음) 또는 뉴클레아제-결핍 Cpf1(이하, "dCpf1"이라고 지칭하는 경우도 있음)이 포함될 수 있다.

상술한 dCas9의 예시로는, 화농성 연쇄상구균(Streptococcus pyogenes) 유래 Cas9(SpCas9; PAM 서열: NGG(N은 A, G, T 또는 C임. 이하 동일)), 스트렙토코커스 써모필러스(Streptococcus thermophilus) 유래 Cas9(StCas9; PAM 서열: NNAGAAW(W는 A 또는 T. 이하 동일)), 수막구균(Neisseria meningitidis) 유래 Cas9(NmCas9; PAM 서열: NNNNGATT), 또는 황색포도상구균 유래 Cas9(SaCas9; PAM 서열: NNGRRT(R은 A 또는 G. 이하 동일)) 등의 뉴클레아제-결핍 변이체를 포함하나, 이에 제한되지 않는다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는 Nishimasu et al., Cell. 2014 Feb 27; 156(5): 935-49, Esvelt KM et al., Nat Methods. 2013 Nov; 10(11):1116-21, Zhang Y. Mol Cell. 2015 Oct 15; 60(2):242-55, 및 Friedland AE et al., Genome Biol. 2015 Nov 24; 16:257 참조). 예를 들어 SpCas9의 경우, 10번째 Asp 잔기가 Ala 잔기로 변환되고, 840번째 His 잔기가 Ala 잔기로 변환된 이중 돌연변이체(이하, "dSpCas9"로 지칭하는 경우가 있음)가 사용될 수 있다(예를 들어, 상술한 Nishimasu et al., Cell. 2014 참조). 대안적으로 SaCas9의 경우, 10번째 Asp 잔기가 Ala 잔기로 변환되고, 580번째 Asn 잔기가 Ala 잔기로 변환된 이중 돌연변이체(서열번호: 66), 또는 10번째 Asp 잔기가 Ala 잔기로 변환되고, 557번째 His 잔기가 Ala 잔기로 변환된 이중 돌연변이체(서열번호: 67)(이하, 이들 이중 돌연변이체 중 임의의 것을 "dSaCas9"라고 지칭하는 경우가 있음)가 사용될 수 있다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는, 상술한 Friedland AE et al., Genome Biol. 2015 참조).

더욱이 본 발명의 일 실시태양에 있어서, dCas9로서, gRNA와 복합체를 형성하고 인간 LAMA1 유전자의 발현 조절 영역에 모집되는, 상술한 dCas9의 아미노산의 일부를 변형시켜 얻은 변이체를 사용할 수도 있다. 이러한 변이체의 예시로는, 부분적으로 결실된 아미노산 서열을 갖는 절단된(truncated) 변이체를 포함한다. 본 발명의 일 실시태양에 있어서, 그 전문이 본원에 참조에 의해 원용되는 미국 가출원 특허번호: 62/682,244 및 62/749,855에 개시된 변이체가 dCas9로서 사용될 수 있다. 구체적으로, 10번째 Asp 잔기가 Ala 잔기로, 580번째 Asn 잔기가 Ala 잔기로 변환된 이중 돌연변이체(서열번호: 68)인 dSaCas9에서 721번째 내지 745번째 아미노산이 결실된 dSaCas9, 또는 결실된 부분이 펩타이드 링커로 치환된 dSaCas9(예컨대, 결실된 부분이 GGSGGS 링커(서열번호: 69)로 치환된 것은 서열번호: 70에 기재되어 있음), 또는 상술한 이중 돌연변이체인 dSaCas9에서 482번째 내지 648번째 아미노산이 결실된 dSaCas9(서열번호 71), 또는 결실된 부분이 펩타이드 링커로 치환된 dSaCas9(결실된 부분이 GGSGGS 링커로 치환된 것은 서열번호: 72에 기재되어 있음)를 사용할 수 있다.

상술한 dCpf1의 예시로는, 프란시셀라 노비시다(Francisella novicida) 유래 Cpf1(FnCpf1; PAM 서열: NTT), 아시다미노코커스종(Acidaminococcus sp.) 유래 Cpf1(AsCpf1; PAM 서열: NTTT), 또는 라크노스피로세(Lachnospiraceae) 박테리아 유래 Cpf1(LbCpf1; PAM 서열: NTTT) 등의 뉴클레아제-결핍 변이체가 포함되나, 이에 제한되지 않는다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는 Zetsche B. et al., Cell. 2015 Oct 22; 163(3):759-71, Yamano T et al., Cell. 2016 May 5; 165(4):949-62, 및 Yamano T et al., Mol Cell. 2017 Aug 17; 67(4):633-45 참조). 예를 들어, FnCpf1의 경우, 917번째 Asp 잔기가 Ala 잔기로 변환되고, 1006번째 Glu 잔기가 Ala 잔기로 변환된 이중 돌연변이체를 사용할 수 있다(예를 들어, 그 전문이 본원에 참조에 의해 원용되는, 상술한 Zetsche B et al., Cell. 2015 참조). 본원의 일 실시태양에 있어서, dCpf1로서, gRNA와 복합체를 형성하고 인간 LAMA1 유전자의 발현 조절 영역에 모집되는, 상술한 dCpf1의 아미노산 일부를 변형시켜 얻은 변이체를 사용할 수도 있다.

본 발명의 일 실시태양에 있어서, dCas9는 CRISPR 이펙터 단백질로서 사용되고, 특정의 실시태양에 있어서 dSaCas9가 사용된다.

CRISPR 이펙터 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는, 예를 들어, 그의 cDNA 서열 정보에 기초하여 단백질의 원하는 부분을 코딩하는 영역을 커버하는 올리고 DNA 프라이머의 합성, 및 단백질을 생산하는 세포로부터 제조된 총 RNA(total RNA) 또는 mRNA 분획을 주형으로 이용하는 PCR 방법에 의한 폴리뉴클레오타이드의 증폭에 의해 클로닝될 수 있다. 또한, CRISPR 이펙터 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는, 클로닝된 CRISPR 이펙터 단백질을 코딩하는 뉴클레오타이드 서열에 공지된 부위-특이적 돌연변이(site-directed mutagenesis) 방법에 의해 돌연변이를 도입하여, DNA 절단 활성에 중요한 위치의 아미노산 잔기(예컨대, SaCas9의 경우 10번째 Asp 잔기, 557번째 His 잔기, 및 580번째 Asn 잔기; FnCpf1의 경우 917번째 Asp 잔기 및 1006번째 Glu 잔기 등이 포함될 수 있으나, 이에 제한되지 않음)를 다른 아미노산으로 변환함으로써 얻을 수 있다.

대안적으로, CRISPR 이펙터 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 그의 cDNA 서열 정보에 기초하여 화학적 합성, 또는 화학적 합성과 PCR 방법 또는 깁슨조립(Gibson Assembly) 방법의 조합에 의해 얻어질 수 있고, 또한 코돈 최적화(codon optimization)를 거친 염기 서열로 추가 구성되어 인간에서의 발현에 적합한 코돈을 제공할 수 있다.

(3) 전사 활성화 인자

본 발명에 있어서, 인간 LAMA1 유전자의 발현은 CRISPR 이펙터 단백질과 융합된 전사 활성화 인자의 작용에 의해 활성화된다. 본원에 있어서, "전사 활성화 인자"는 인간 LAMA1 유전자의 유전자 전사를 활성화시키는 능력을 갖는 단백질 또는 그 기능을 보유하는 펩타이드 단편(fragment)을 의미한다. 본 발명에서 사용되는 전사 활성화 인자는 인간 LAMA1 유전자의 발현을 활성화시킬 수 있는 것이라면 특별히 제한되지 않는다. 예를 들어, VP64, VP160, VPH, VPR, miniVR, 및 microVR, 전사 활성화 능력을 갖는 그들의 변이체 등이 포함된다. VP64는 서열번호: 73에 기재된 50개 아미노산으로 이루어지는 펩타이드로 예시된다. VP160은 서열번호: 84에 기재된 131개의 아미노산으로 이루어지는 펩타이드로 예시된다. VPH는 VP64, p65 및 HSF1의 융합 단백질, 구체적으로 서열번호: 74에 기재된 376개의 아미노산으로 이루어지는 펩타이드로 예시된다. VPR은 VP64, p65 및 엡스타인-바 바이러스(Epstein-Barr virus; RTA)의 복제 및 전사 활성화 인자의 융합 단백질이며, 구체적으로 서열번호: 75에 기재된 523개 아미노산으로 이루어지는 펩타이드로 예시된다. VP64, VPH, 및 VPR은 공지되어 있고, 예를 들어 그 전문이 본원에 참조에 의해 원용되는 Chavez A. et al., Nat Methods. 2016 Jul; 13(7):563-7 및 Chavez A. et al., Nat Methods. 2015 Apr; 12(4):326-8에 개시되어 있다. MiniVR 및 microVR은 VP64 및 RTA의 전사 활성화 도메인을 포함하는 펩타이드이다. RTA의 전사 활성화 도메인은 공지되어 있으며, 예를 들어 그 전문이 본원에 참조에 의해 원용되는 J Virol. 1992 Sep;66(9):5500-8에 개시되어 있다. 구체적으로, miniVR은 서열번호: 76에 기재된 167개의 아미노산으로 이루어지는 펩타이드로 예시되고, microVR은 서열번호: 77에 기재된 140개의 아미노산으로 이루어지는 펩타이드로 예시된다. 서열번호: 76에 기재된 아미노산 서열은 RTA의 493번째 내지 605번째 아미노산 잔기와 VP64가 G-S-G-S 링커(서열번호: 78)로 연결되어 있는 아미노산 서열로 구성된다. 서열번호: 77에 기재된 아미노산 서열은 RTA의 520번째 내지 605번째 아미노산 잔기와 VP64가 G-S-G-S 링커로 연결되어 있는 아미노산 서열로 구성된다. miniVR 및 microVR에 대한 세부 사항은 미국 가출원 특허번호: 62/715,432에 설명되어 있으며, 그 전문이 본원에 참조에 의해 원용된다. 상술한 전사 활성화 인자 중 임의의 것은 그의 전사 활성화 능력을 유지하는 한, 임의로 변형 및/또는 변경될 수 있다.

전사 활성화 인자를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 화학적 합성, 또는 화학적 합성과 PCR 방법 또는 깁슨조립 방법의 조합에 의해 구축(construct)될 수 있다. 뿐만 아니라, 전사 활성화 인자를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드를 코돈 최적화된 DNA 서열로 인간에서의 발현에 적합한 코돈이 되도록 구축할 수 있다.

전사 활성화 인자와 CRISPR 이펙터 단백질의 융합 단백질을 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 CRISPR 이펙터 단백질을 코딩하는 염기 서열에 직접, 또는 링커, NLS(nuclear localization signal)(핵 위치 신호) 및/또는 태그를 코딩하는 염기 서열을 부가한 후 결찰(ligating)시킴으로써 제조될 수 있다. 본 발명에 있어서, 전사 활성화 인자는 N 말단 또는 C 말단과 융합될 수 있다. 링커로서, 아미노산 수가 약 2 내지 50인 링커를 사용할 수 있으며, 그의 구체적인 예시로는 글라이신(G) 및 세린(S)이 번갈아 연결된 G-S-G-S 링커 등을 포함할 수 있으나, 이에 제한되지 않는다.

(4) 가이드 RNA

본 발명에 있어서, CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질은 가이드 RNA에 의해 인간 LAMA1 유전자의 발현 조절 영역으로 모집될 수 있다. 상술한 "(1) 정의"에서 설명한 바와 같이, 가이드 RNA는 crRNA를 포함하고, crRNA는 표적 서열의 상보적 서열에 결합한다. crRNA는 가이드 RNA가 융합 단백질을 표적 영역으로 모집할 수 있는 한, 표적 서열의 상보적 서열에 완전히 상보적이지 않을 수 있으며, 적어도 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 서열일 수 있다.

dCas9가 CRISPR 이펙터 단백질로 사용되는 경우, 예를 들어, 표적 서열은 공개된 gRNA 설계 웹사이트(CRISPR Design Tool, CRISPR direct 등)를 사용하여 결정될 수 있다. 구체적으로, 대상 유전자(즉, 인간 LAMA1 유전자)의 서열로부터, PAM(예컨대, SaCas9의 경우 NNGRRT)이 그의 3'측에 인접한 약 20 뉴클레오타이드의 길이인 후보 표적 서열을 리스트화하고, 이러한 후보 표적 서열 중에서 인간 게놈의 오프 타겟 부위(off-target sites)가 적은 것을 표적 서열로 사용할 수 있다. 표적 서열의 염기 길이는 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 더욱 바람직하게는 21 내지 23 뉴클레오타이드 길이이다. 오프 타겟 부위 수의 예측을 위한 1차 스크리닝으로서, 다수의 바이오인포매틱 툴이 공지되어 있고 공개적으로 입수 가능하며, 오프 타겟 효과가 가장 낮은 표적 서열을 예측하는 데 사용할 수 있다. 그 예시로는 Benchling(https://benchling.com) 및 COSMID(CRISPR Off-target Sites with Mismatches, Insertions and Deletions)(인터넷상 https://crispr.bme.gatech.edu에서 입수 가능)와 같은 바이오인포매틱 툴이 있다. 이들을 이용하여 gRNA가 표적으로 하는 염기 서열과의 유사성을 요약할 수 있다. 사용하고자 하는 gRNA 설계 소프트웨어에 표적 게놈의 오프 타겟 부위를 검색하는 기능이 없는 경우, 예를 들어 오프 타겟 부위는 후보 표적 서열의 3'측의 8 내지 12 뉴클레오타이드(표적 뉴클레오타이드 서열의 높은 식별(discrimination) 능력을 갖는 시드 서열)에 관하여, 표적 게놈을 대상으로 블라스트(Blast) 검색을 실시함으로써 검색할 수 있다.

본 발명의 일 실시태양에 있어서, 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 영역에서, 이하의 영역은 인간 LAMA1 유전자의 발현 조절 영역일 수 있다. 이 영역은 히스톤 변형 패턴(histone modification patterns)에 의해 발현 조절 영역으로 강력하게 제안되고 있다. 따라서, 본 발명의 일 실시태양에 있어서, 표적 서열은 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이일 수 있다:

(1) 7,115,000-7,118,000.

본 발명의 일 실시태양에 있어서, 표적 서열은 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열일 수 있다.

본 발명의 일 실시태양에 있어서, 표적 서열은 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이일 수 있다:

(2) 7,036,000-7,042,000.

(3) 7,083,000-7,087,000

본 발명의 일 실시태양에 있어서, 표적 서열은 서열번호: 124에 기재된 염기 서열일 수 있다.

(4) 7,118,000-7,133,000.

본 발명의 일 실시태양에 있어서, 표적 서열은 서열번호: 178, 193, 또는 195에 기재된 염기 서열일 수 있다. 본 발명의 일 실시태양에 있어서, crRNA를 코딩하는 염기 서열은 표적 서열과 동일한 염기 서열일 수 있다. 예를 들어, 서열번호: 15에 기재된 표적 서열(TCTCGCCTCCGCCGCCACTCG)이 crRNA를 코딩하는 염기 서열로서 세포 내로 도입되면, 그 서열에서 전사된 crRNA는 UCUCGCCUCCGCCGCCACUCG(서열번호 79)이고 CGAGTGGCGGCGGAGGCGAGA(서열번호: 80)에 결합되며, 이는 서열번호: 15에 기재된 염기 서열의 상보적 서열로서 인간 LAMA1 유전자의 발현 조절 영역에 존재하는 것이다. 또 다른 실시태양에 있어서, 가이드 RNA가 융합 단백질을 표적 영역에 모집할 수 있는 한, 적어도 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 표적 서열인 염기 서열은 crRNA를 코딩하는 염기 서열로 사용될 수 있다. 따라서, 본 발명의 일 실시태양에 있어서, crRNA를 코딩하는 염기 서열로서, 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열, 또는 그 서열에서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 것이 사용될 수 있다. 본 발명의 또 다른 실시태양에 있어서, crRNA를 코딩하는 염기 서열로서, 서열번호: 124에 기재된 염기 서열, 또는 그 서열에서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 것이 사용될 수 있다. 본 발명의 추가의 실시태양에 있어서, crRNA를 코딩하는 염기 서열로서, 서열번호: 178, 193, 또는 195에 기재된 염기 서열, 또는 그 서열에서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 것이 사용될 수 있다.

dCpf1이 CRISPR 이펙터 단백질로 사용될 경우, gRNA를 코딩하는 염기 서열은 5'-말단에 특정 RNA가 부착된 crRNA를 코딩하는 DNA 서열로 설계될 수 있다. crRNA의 5'-말단에 부착된 RNA 및 상기 RNA를 코딩하는 DNA 서열은 사용되는 dCpf1에 따라 통상의 기술자가 적절히 선택할 수 있다. 예를 들어, dFnCpf1이 사용되는 경우, gRNA를 코딩하는 염기 서열로서, 서열번호: 81; AATTTCTACTGTTGTAGAT가 표적 서열의 5'측에 부착된 염기 서열을 사용할 수 있다(RNA로 전사될 경우, 밑줄친 부분의 서열은 염기 쌍을 형성하여 스템-루프 구조(stem-loop structure)를 형성한다. 5'-말단에 부가되는 서열은, gRNA가 융합 단백질을 전사 후 발현 조절 영역에 모집할 수 있는 한, 적어도 1 내지 6개의 염기가 결실, 치환, 삽입 및/또는 부가된 다양한 Cpf1 단백질에 일반적으로 사용되는 서열일 수 있다.

dCas9이 CRISPR 이펙터 단백질로 사용될 경우, gRNA를 코딩하는 염기 서열은 공지된 tracrRNA를 코딩하는 DNA 서열이 crRNA를 코딩하는 DNA 서열의 3'-말단에 연결된 DNA 서열로서 설계될 수 있다. 이러한 tracrRNA 및 tracrRNA를 코딩하는 DNA 서열은 사용되는 dCas9에 따라 통상의 기술자가 적절히 선택할 수 있다. 예를 들어, dSaCas9가 사용되는 경우, tracrRNA를 코딩하는 DNA 서열로서 서열번호: 82에 기재된 염기 서열이 사용된다. tracrRNA를 코딩하는 DNA 서열은 gRNA가 전사 후 발현 조절 영역에 융합 단백질을 모집할 수 있는 한, 적어도 1 내지 6개의 염기가 결실, 치환, 삽입 및/또는 부가된 다양한 Cas9 단백질에 일반적으로 사용되는 tracrRNA를 코딩하는 염기 서열일 수 있다.

이러한 방법으로 설계된 gRNA를 코딩하는 염기 서열을 포함하는 폴리뉴클레오타이드는 공지된 DNA 합성법을 이용하여 화학적으로 합성될 수 있다.

본 발명의 또 다른 실시태양에 있어서, 본 발명의 폴리뉴클레오타이드는 crRNA가 상이한 2종 이상의 gRNA를 포함할 수 있다.

(5) 프로모터 서열

본 발명의 일 실시태양에 있어서, 프로모터 서열은 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열 및/또는 gRNA를 코딩하는 염기 서열 각각의 상단부(upstream)에서 작동 가능하게 연결될 수 있다. 연결될 가능성이 있는 프로모터는, 표적 세포에서 프로모터 활성을 나타내는 한 특별히 제한되지 않는다. 융합 단백질을 코딩하는 염기 서열의 상단부에 연결될 가능성이 있는 프로모터 서열의 예시로는, EFS 프로모터, CMV(사이토메갈로바이러스) 프로모터, CK8 프로모터, MHC 프로모터, MYOD 프로모터, hTERT 프로모터, SRα 프로모터, SV40 프로모터, LTR 프로모터, CAG 프로모터, RSV(라우스 육종 바이러스) 프로모터 등을 포함하나, 이에 제한되지 않는다. gRNA를 코딩하는 염기 서열의 상단부에 연결될 가능성이 있는 프로모터 서열의 예시로는, pol III 프로모터인, U6 프로모터, SNR6 프로모터, SNR52 프로모터, SCR1 프로모터, RPR1 프로모터, U3 프로모터, H1 프로모터, 및 tRNA 프로모터 등을 포함하나, 이에 제한되지 않는다. 본 발명의 일 실시태양에 있어서, 근육 특이적 프로모터는 상술한 융합 단백질을 코딩하는 염기 서열의 상단부에 연결된 프로모터 서열로 사용될 수 있다. 근육 특이적 프로모터의 예시로는, CK8 프로모터, CK6 프로모터, CK1 프로모터, CK7 프로모터, CK9 프로모터, 심근 트로포닌 C(cardiac muscle troponin C) 프로모터, α액틴 프로모터, 마이오신 중쇄 키나아제(MHCK) 프로모터, 마이오신 경쇄 2A 프로모터, 디스트로핀 프로모터, 근육 크레아틴 키나아제 프로모터, dMCK 프로모터, tMCK 프로모터, enh348 MCK 프로모터, 합성 C5-12(Syn) 프로모터, unc45b 프로모터, Myf5 프로모터, MLC1/3f 프로모터, MYOD 프로모터, Myog 프로모터, Pax7 프로모터 등을 포함하나, 이에 제한되지 않는다(근육 특이적 프로모터의 상세한 내용은, 예를 들어, 그 전문이 본원에 참조에 의해 원용되는 US2011/0212529A, McCarthy JJ et al., Skeletal Muscle. 2012 May; 2(1):8, Wang B. et al., Gene Ther. 2008 Nov; 15(22):1489-99 등 참조).

(6) 기타 염기 서열

더욱이, 본 발명의 폴리뉴클레오타이드는 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열의 전사에 의해 생성된 mRNA의 번역 효율을 향상시키기 위한 목적으로, 상기 언급된 것 외에 폴리아데닐화(Polyadenylation) 신호, 코작 컨센서스 서열(Kozak consensus sequence) 등과 같은 공지의 서열을 더 포함할 수 있다. 또한, 본 발명의 폴리뉴클레오타이드는 링커 서열을 코딩하는 염기 서열, NLS를 코딩하는 염기 서열 및/또는 태그를 코딩하는 염기 서열을 포함할 수 있다.

2. 벡터

본 발명은 본 발명의 폴리뉴클레오타이드를 포함하는 벡터(이하, "본 발명의 벡터"로 지칭하는 경우가 있음)를 제공한다. 본 발명의 벡터는 플라스미드 벡터 또는 바이러스성 벡터일 수 있다.

본 발명의 벡터가 플라스미드 벡터인 경우, 사용되는 플라스미드 벡터는 특별히 제한되지 않으며, 클로닝 플라스미드 벡터, 발현 플라스미드 벡터 등의 플라스미드 벡터일 수 있다. 플라스미드 벡터는 공지된 방법으로 플라스미드 벡터에 본 발명의 폴리뉴클레오타이드를 삽입함으로써 제조된다.

본 발명의 벡터가 바이러스성 벡터인 경우, 사용되는 바이러스성 벡터는 특별히 제한되지 않으며, 그 예로는 아데노바이러스 벡터, 아데노 연관 바이러스(AAV) 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 센다이바이러스(Sendaivirus) 벡터 등을 포함하나, 이에 제한되지 않는다. 본원에 있어서, "바이러스 벡터" 또는 "바이러스성 벡터"는 그들의 유도체 또한 포함한다. 유전자 요법에서의 사용을 고려할 때, AAV 벡터는 이식유전자(transgene)를 장기간 발현할 수 있고, 비병원성 바이러스 유래로 안전성이 높다는 점에서 바람직하게 사용된다.

본 발명의 폴리뉴클레오타이드를 포함하는 바이러스성 벡터는 공지된 방법에 의해 제조될 수 있다. 요약하면, 본 발명의 폴리뉴클레오타이드가 삽입된 바이러스 발현용 플라스미드 벡터를 제조하고, 그 벡터를 적절한 숙주 세포에 형질감염(transfect)시켜, 본 발명의 폴리뉴클레오타이드를 포함하는 바이러스성 벡터의 일시적 생산을 가능하게 하고, 그 바이러스성 벡터를 수집한다.

본 발명의 일 실시태양에 있어서, AAV 벡터가 사용되는 경우, AAV 벡터의 혈청형(serotype)은 표적에서 인간 LAMA1 유전자의 발현이 활성화될 수 있는 한 특별히 제한되지 않으며, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, 및 그들의 변이체 등 중 임의의 것이 사용될 수 있다(AAV의 다양한 혈청형에 대해서는, 예를 들어, 그 전문이 본원에 참조에 의해 원용되는 WO 2005/033321 참조). AAV의 변이체의 예시로는, 변형된 캡시드를 갖는 새로운 혈청형(예컨대, 그 전문이 본원에 참조에 의해 원용되는 WO 2012/057363) 등을 포함하나, 이에 제한되지 않는다.

AAV 벡터를 제조하는 하나의 예시에 있어서, 먼저, 야생형 AAV 게놈 서열의 양 말단에 역 말단 반복서열(inverted terminal repeat; ITR)과, Rep 단백질 및 캡시드 단백질을 코딩하는 DNA를 대체하여 삽입된 본 발명의 폴리뉴클레오타이드를 포함하는 벡터 플라스미드를 제조한다. 한편, 바이러스 입자 형성에 필수적인 Rep 단백질 및 캡시드 단백질을 코딩하는 DNA를 다른 플라스미드에 삽입한다. 또한, AAV의 증식에 필수적인 아데노바이러스의 헬퍼 작용을 담당하는 유전자(E1A, E1B, E2A, VA 및 E4orf6)를 포함하는 플라스미드를 아데노바이러스 헬퍼 플라스미드로서 제조한다. 이러한 세 종류의 플라스미드를 숙주 세포에 동시에 형질감염시키면 세포에서 재조합 AAV(즉, AAV 벡터)가 생성된다. 숙주 세포로서, 상술한 헬퍼 작용을 담당하는 유전자의 유전자 산물(단백질)의 일부를 공급할 수 있는 세포(예컨대, 293 세포 등)를 사용하는 것이 바람직하다. 이러한 세포를 사용하는 경우, 숙주 세포로부터 공급될 수 있는 단백질을 코딩하는 유전자를 상술한 아데노바이러스성 헬퍼 플라스미드에 운반할 필요는 없다. 생성된 AAV 벡터는 핵에 존재한다. 따라서, 동결-해동으로 숙주 세포를 파괴하고, 바이러스를 수집한 후, 바이러스 분획을 염화세슘을 이용한 밀도 구배 초원심분리법, 컬럼법 등으로 분리 및 정제하여 원하는 AAV 벡터를 제조한다.

AAV 벡터는 안전성, 유전자 형질도입(transduction) 효율 등의 면에서 큰 장점이 있으므로, 유전자 요법에 이용되고 있다. 그러나 패키지될 수 있는 폴리뉴클레오타이드의 크기에는 한계가 있는 것으로 알려져 있다. 예를 들어, 본 발명의 일 실시태양인, dSaCas9와 miniVR 또는 microVR의 융합 단백질을 코딩하는 염기 서열, 인간 LAMA1 유전자의 발현 조절 영역을 표적으로 하는 gRNA를 코딩하는 염기 서열, 및 프로모터 서열로서의 EFS 프로모터 서열 및 U6 프로모터 서열을 포함하는 폴리뉴클레오타이드의 염기 길이와 ITR 부분을 포함하는 전체 길이는 약 4.85kb이며, 이들은 단일 AAV 벡터에 패키지될 수 있다.

3. MDC1A를 치료 또는 예방하기 위한 약제

본 발명은 또한 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 포함하는 MDC1A를 치료 또는 예방하기 위한 약제(이하, "본 발명의 약제"로 지칭하는 경우가 있음)를 제공한다.

본 발명의 약제는 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 유효성분으로 포함하고, 이러한 유효성분(즉, 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터) 및, 일반적으로, 약학적으로 허용되는 담체를 포함하는 제제로서 제조될 수 있다.

본 발명의 약제는 비경구 투여되며, 국소 투여 또는 전신 투여가 가능하다. 본 발명의 약제는 예를 들어, 정맥 내 투여, 동맥 내 투여, 피하 투여, 복강 내 투여 또는 근육 내 투여에 의해 투여될 수 있지만, 이에 제한되지 않는다.

본 발명의 약제의 대상에 대한 투여량은 치료 및/또는 예방을 위한 유효량이라면 특별히 제한되지 않는다. 이는 유효성분, 제형, 대상의 연령 및 체중, 투여 스케쥴, 투여 방법 등에 따라 적절하게 최적화될 수 있다.

본 발명의 일 실시태양에 있어서, 본 발명의 약제는 MDC1A로 이환한 대상에 투여될 뿐만 아니라, 유전적 배경 분석 등에 기초하여 장래에 MDC1A를 발병할 수 있는 대상에 예방적으로 투여될 수 있다. 본원에 있어서, 용어 "치료"는 질병의 치유뿐만 아니라, 질병의 관해(remission)도 포함한다. 또한, 용어 "예방"은 질병의 발증을 예방하는 것뿐만 아니라, 질병의 발증을 지연시키는 것도 포함할 수 있다. 본 발명의 약제는 또한 "본 발명의 약학 조성물" 등으로 지칭될 수 있다.

4. MDC1A를 치료 또는 예방하는 방법

본 발명은 또한 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 이를 필요로 하는 대상에게 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법을 제공한다(이하, "본 발명의 방법"으로 지칭하는 경우가 있음). 또한, 본 발명은 MDC1A의 치료 또는 예방에 사용하기 위한 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터를 포함한다. 나아가, 본 발명은 MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서, 본 발명의 폴리뉴클레오타이드 또는 본 발명의 벡터의 사용을 포함한다.

본 발명의 방법은 본 발명의 상술한 약제를 MDC1A로 이환한 대상에게 투여함으로써 실시할 수 있으며, 용량, 투여 경로, 대상 등은 상술한 바와 같다.

증상의 측정은 치료에 대한 대상의 반응을 결정하기 위해, 본 발명의 방법을 사용한 치료의 시작 전 수행될 수 있고, 치료 후 임의의 시점에 수행될 수 있다.

본 발명의 방법은 대상의 골격근 및/또는 심근의 기능을 개선시킬 수 있다. 그 기능이 개선되는 근육은 특별히 제한되지 않고, 임의의 근육 및 근육 그룹이 예시된다.

5. 리보핵단백질

본 발명은 이하를 포함하는 리보핵단백질(이하, "본 발명의 RNP"로 지칭하는 경우가 있음)을 제공한다:

(d) 인간 LAMA1 유전자의 발현 조절 영역 중의

(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역,

(ii) 서열번호: 124에 기재된 연속 영역; 또는

(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역

을 표적으로 하는 가이드 RNA.

본 발명의 RNP에 포함되는 CRISPR 이펙터 단백질, 전사 활성화 인자 및 가이드 RNA로서, 상기 "1. 폴리뉴클레오타이드" 섹션에서 상세히 설명한 CRISPR 이펙터 단백질, 전사 활성화 인자 및 가이드 RNA를 사용할 수 있다. 본 발명의 RNP에 포함되는 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질은, 예를 들어, 융합 단백질을 코딩하는 폴리뉴클레오타이드를 세포, 박테리아 또는 기타 유기체에 도입하여 발현되도록 하거나, 또는 폴리뉴클레오타이드를 이용한 시험관 내 번역 시스템에 의해 생산될 수 있다. 또한, 본 발명의 RNP에 포함되는 가이드 RNA는, 예를 들면, 화학적 합성에 의해, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드를 이용한 시험관 내 전사 시스템에 의해 생산될 수 있다. 이렇게 제조된 CRISPR 이펙터 단백질과 가이드 RNA를 혼합하여 본 발명의 RNP를 제조한다. 필요한 경우, 금 입자와 같은 다른 물질이 혼합될 수 있다. 본 발명의 RNP는 표적 세포, 조직 등에 직접 전달하기 위해, 공지된 방법에 의해 RNP를 지질 나노입자(lipid nanoparticle; LNP)에 캡슐화(encapsulated)할 수 있다. 본 발명의 RNP는 공지된 방법에 의해 표적 세포, 조직 등에 도입될 수 있다. 예를 들어, 그 전문이 본원에 참조에 의해 원용되는 Lee K., et al., Nat Biomed Eng. 2017; 1:889-901, WO 2016/153012 등이 LNP의 캡슐화 및 도입 방법에 있어서 참조될 수 있다.

본 발명의 일 실시태양에 있어서, 본 발명의 RNP에 포함된 가이드 RNA는 인간 18번 염색체(Chr 18)의 GRCh38.p13 위치에 존재하는 이하의 영역 중 적어도 하나의 영역에서 연속적인 18 내지 24 뉴클레오타이드 길이, 바람직하게는 20 내지 23 뉴클레오타이드 길이, 보다 바람직하게는 21 내지 23 뉴클레오타이드 길이를 표적으로 한다:

(1) 7,115,000-7,118,000.

일 실시태양에 있어서, 가이드 RNA는 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 서열의 전부 또는 일부를 포함하는 영역을 표적으로 한다.

(2) 7,036,000-7,042,000.

(3) 7,083,000-7,087,000

일 실시태양에 있어서, 가이드 RNA는 서열번호: 124에 기재된 서열의 전부 또는 일부를 포함하는 영역을 표적으로 한다.

(4) 7,118,000-7,133,000.

일 실시태양에 있어서, 가이드 RNA는 서열번호: 178, 193, 또는 195에 기재된 서열의 전부 또는 일부를 포함하는 영역을 표적으로 한다.

6. 기타

본 발명은 또한 인간 LAMA1 유전자 발현의 활성화를 위해, 이하를 포함하는 조성물 또는 키트를 제공한다:

(f) 인간 LAMA1 유전자의 발현 조절 영역 중의

(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역;

(ii) 서열번호: 124에 기재된 연속 영역; 또는

(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역

을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.

본 발명은 또한 이하의 (e) 및 (f)를 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법을 제공한다:

(f) 인간 LAMA1 유전자의 발현 조절 영역 중의

(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역,

(ii) 서열번호: 124에 기재된 연속 영역, 또는

(iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역

이들 발명에서 CRISPR 이펙터 단백질, 전사 활성화 인자, 가이드 RNA, 뿐만 아니라 그들을 코딩하는 폴리뉴클레오타이드 및 그들이 운반되는 벡터로서, 상기 "1. 폴리뉴클레오타이드", "2. 벡터" 및 "5. 리보핵단백질" 섹션에서 상세히 설명한 것들이 사용될 수 있다. 상술한 (e) 및 (f)의 용량, 투여 경로, 대상, 제제 등은 "3. MDC1A를 치료 또는 예방하기 위한 약제"의 섹션에서 설명한 것과 동일하다.

본 발명의 다른 특징들은 본 발명의 실증을 위해 제공되고, 본 발명을 제한하는 것을 의도하지 않는 예시적인 실시태양에 관한 이하의 설명 과정에서 명백해질 것이다.

실시예

실험 방법

LAMA1 표적 서열의 선택

인간 골격근 세포에서 게놈의 H3K4me3, H3K27Ac 패턴에 기초하여, 인간 LAMA1 유전자의 2개의 추가적인 추정 유전자 조절 영역(R1 및 R2)을, 촉매-비활성 SaCas9(D10A 및 N580A 돌연변이체; gRNA와 복합된 dSaCas9)의 표적이 될 수 있는 서열(본원에서 표적 서열로 정의됨)에 대해 스캔하였다. LAMA1 유전자에 대한 표적 게놈 영역의 위치는 도 1에 도시되어 있고, 그들의 좌표는 이하에 기재되어 있다:

1. Chr18: GRCh38/hg38; 7,036,000-7,042,000 -> ~6kb (R1)

2. Chr18: GRCh38/hg38; 7,083,000-7,087,000 -> ~4kb (R2)

표적 서열을 NNGRRT 서열을 갖는 프로토스페이서 인접 모티프(PAM)에 인접한 21 뉴클레오타이드 세그먼트에 의해 특정하였다(5'-21nt 표적 서열-NNGRRT-3')(표 1).

또한, 우리는 인간 LAMA1 TSS 부위의 거의 15kb 영역 상단부를 스캔하고, 게잡이원숭이(Macaca fascicularis) 게놈의 해당 영역과 완벽하게 매치하는 표적 서열 및 PAM 서열만을 선택하였다. LAMA1 유전자에 대한 표적 게놈 영역의 위치는 도 1에 도시되어 있으며, 그 좌표는 다음과 같다:

Chr18: GRCh38/hg38; 7,118,000-7,133,000 -> ~15kb (cyno-매치)

[표 1]

LAMA1 유전자의 발현 조절 영역을 스크리닝하는 데 사용되는 표적 서열

[표 1-1]

[표 1-2]

[표 1-3]

[표 1-4]

[표 1-5]

[표 1-6]

[표 1-7]

[표 1-8]

표 1에서, "위치"는 SaCas9가 사용될 때, 나타낸 모든 gRNA에 대한 잠재적인 SaCas9 절단 부위를 가리킨다.

서열번호: 1 내지 61은 TSS 영역에 위치하고, 서열번호: 85 내지 113은 R1 영역에 위치하고, 서열번호: 114 내지 129는 R2 영역에 위치하며, 서열번호: 130 내지 221은 cyno-매치 영역에 위치한다(도 1).

렌티바이러스성 전달 플라스미드의 구축(pED176 및 파생 플라스미드(derivative plasmid))

pLentiCRISPR v2는 Genscript(https://www.genscript.com)에서 구입하였고, 다음과 같이 변형하였다:

SpCas9 gRNA 스캐폴드(scaffold) 서열을 SaCas9 gRNA 스캐폴드 서열로 대체하고; SpCas9-FLAG를 코돈 최적화된 VP64-miniRTA(mini-VR로도 지칭함)에 융합된 dSaCas9로 대체하였다. VP64-miniRTA 전사 활성화 도메인은 전사 활성화에 의해 프로모터에 국소화될 때 유전자 발현을 활성화할 수 있다. VP64-miniRTA는 dSaCas9(D10A 및 N580A 돌연변이체)의 C-말단에 테더링되었고, 이는 이하 dSaCas9-VR로 지칭하고, 표적 서열에 의해 지시된(directed) 인간 LAMA1 유전자 조절 영역을 표적으로 하였다(표 1, 도 1). 생성된 백본 플라스미드는 pED176으로 명명되었다. 우리는 또한 mini-VR을 VP64-EBNA2, VP160, VP64-nanoRTA, VP64-microRTA와 같은 다른 활성화 도메인으로 대체하여 파생 플라스미드를 생성하였다.

gRNA 클로닝

3개의 대조군 비표적 표적 서열 및 164개의 표적 서열(표 1)을 pED176에 클로닝하였다. 정방향 및 역방향 올리고를 Integrated DNA Technologies에 의해 이하의 형식으로 합성하였다: 정방향; 5' CACC(G)-20개 염기 쌍의 표적 서열 - 3', 및 역방향: 5' AAAC - 19-21개의 염기 쌍의 역방향 상보적(reverse complement) 표적 서열- (C) - 3', 여기서 표적이 G로 시작되지 않는 경우 괄호 안의 염기를 부가하였다. 올리고를 100μM에서 Tris-EDTA 완충액(pH8.0)에 재현탁하였다. 각 상보적 올리고 1μl를 NE 완충액 3.1(NEB 카탈로그 번호: B7203S)에서 10μl 반응물로 조합하였다. 반응은 열순환기(thermocycler)에서 95℃로 가열 및 25℃로 냉각함으로써, pED176에 대한 클로닝과 상용성인 접착성 말단(sticky end) 돌출부가 있는 올리고를 어닐링하였다. 어닐링된 올리고를 BsmBI로 소화하고 겔 정제된 렌티바이러스성 전달 플라스미드 pED176과 조합하였고, 제조사의 프로토콜에 따라 T4 DNA 리가아제(NEB 카탈로그 번호: M0202S)로 결찰하였다. 2μl의 결찰 반응물은 제조사의 프로토콜에 따라 10μl의 NEB Stable Competent 세포(NEB 카탈로그 번호: C3040I)로 형질전환하였다. 생성된 구축물은 U6 프로모터에 의해, tracrRNA에 융합된 개별 표적 서열(서열번호: 83)에 의해 코딩된 crRNA를 포함하는 sgRNA의 발현을 유도한다.

렌티바이러스의 생성

HEK293TA 세포를 2ml 성장 배지(10% FBS 및 2mM 신선한 L-글루타민, 1mM 피루브산나트륨 및 비필수 아미노산이 보충된 DMEM 배지)에서 6웰 세포 배양 접시(VWR 카탈로그 번호: 10062-892)에 0.75x10⁶세포/웰로 시딩하고, 37℃/5% CO₂ 조건에서 24시간 동안 배양하였다. 다음날, 1.5μg 패키지 플라스미드 믹스[1μg 패키지 플라스미드(pCMV delta R8.2 참조; addgene #12263) 및 0.5μg 외피(envelope) 발현 플라스미드(pCMV-VSV-G 참조; addgene #8454)]와, dSaCas9-VR 및 지시된 sgRNA를 코딩하는 서열을 함유하는 1μg의 전달 플라스미드를 사용하여, TransIT-VirusGEN 형질감염 반응을 제조사의 프로토콜에 따라 설정하였다. 렌티바이러스는 0.45μM PES 필터(VWR 카탈로그 번호: 10218-488)를 통해 배지 상층액을 통과시켜 형질감염 후 48시간에 회수하였다. 사용할 준비가 될 때까지, 정제 및 분취된(aliquoted) 렌티바이러스를 -80℃ 냉동고에 보관하였다.

HSMM 세포의 형질도입

0 내지 26세의 다양한 연령의 인간 공여자 5명(각각 공여자 #3, 공여자 #5, 공여자 #121, 공여자 #368, 공여자 #617)의 1차 골격근 근아세포(HSMM)를 Lonza Inc.로부터 입수하였다. 세포를 1차 골격근 세포 성장 배지[SkGM-2 골격근 성장 BulletKit 배지(Lonza #CC-3244 & CC-3246)]에서 배양하였다. 형질도입을 위해, 세포를 성장 배지를 함유하는 6웰 세포 배양 접시(VWR 카탈로그 번호: 10062-894)에 0.125-0.33x10⁶세포/웰로 시딩하고, 37℃/5% CO₂ 조건에서 24시간 동안 배양하였다. 다음날, 8μg/ml 폴리브렌(Sigma 카탈로그 번호: TR-1003-G), 및 개별 표적 서열(표 1)에 의해 코딩된 crRNA 및 tracrRNA를 포함하는 각 sgRNA에 상응하는 1.0ml 렌티바이러스 상등액(상기 참조)으로 보충된 1.5ml 성장 배지를 각 웰에 첨가하였다. 세포를 렌티바이러스와 함께 6시간 동안 배양한 후, 바이러스성 배지를 제거하고 신선한 성장 배지로 교체하였다. 형질도입 72시간 후, 세포에 선택 배지[0.5μg/ml 퓨로마이신이 보충된 성장 배지(Sigma Aldrich 카탈로그 번호: P8833)]를 공급하였다. 세포에 2-3일마다 신선한 선택 배지를 제공하였다. 세포가 선택 배지에 있는 7-10일 후, 세포를 회수하고 제조사의 프로토콜에 따라 RNeasy 96 키트(Qiagen 카탈로그 번호: 74182)로 RNA를 추출하였다.

유전자 발현 분석

유전자 발현 분석을 위해, 10μl 부피에서 High-Capacity cDNA Reverse Transcription Kit(Applied Biosystems; ThermoFisher 카탈로그 번호: 4368813) 프로토콜에 따라 ~0.5-0.8μg의 총 RNA로부터 cDNA를 생성하였다. cDNA를 10배 희석하고 제조사의 프로토콜에 따라 Taqman Fast Advanced Master Mix를 사용하여 분석하였다. Taqman 프로브(LAMA1: Assay ID Hs01074489_m1 FAM; HPRT: Assay ID Hs99999909_m1 VIC_PL)는 Life Technologies에서 입수하였다. Taqman 프로브 기반 리얼-타임 PCR 반응물을 Taqman Fast Advanced Master Mix 프로토콜에서의 지시에 따라 QuantStudio 5 리얼-타임 PCR 시스템에 의해 처리 및 분석하였다.

퓨로마이신 선택 7일 후, 제조사의 프로토콜에 따라 QIAGEN Allprep Protein/RNA 키트(Qiagen #80404)를 사용하여 형질도입된 HSMM 세포의 총 단백질을 추출한 후 정량화하고, 1μg/μL의 최종 농도로 정규화하였다. 20μg의 각 단백질 용액을 NuPAGE Tris-Acetate 3-8% 미니 겔(FisherSci EA0375BOX)에서 분리한 다음, 4C에서 70분 동안 35V에서 PVDF 막(Bio-Rad)으로 옮겼다. 이것을 연속적으로 SuperBlock T20(PBS) 블로킹 완충액(LifeTech 37516)에서 실온에 1시간 동안 배양하여, 비특이적인 상호작용 부위를 블로킹하였다. 그 후, 막을 항-LAMA1 항체(1:100)(Santa Cruz Bio sc-74417) 또는 항-b-액틴 항체(1:10000)(LifeTech MA1-140)와 함께 4℃에서 밤새 배양하였다. 막을 세척 용액(1X TBS 및 0.05%의 Tween 20)에서 진탕(agitation)하면서 10분 동안 3회 세척하여, 비특이적인 결합 후 과하거나 느슨하게 결합된 항체를 제거하였다. 블로킹 용액 중 1:10,000으로 희석한 호스래디쉬 퍼옥시다아제(horseradish peroxidase)(HRP; LifeTech)와 결합된 염소 면역글로불린 항-마우스를 실온에서 교반(stirring)하면서 1시간 동안 막상에서 배양하였다. 세 번 더 세척한 후, SuperSignal West Femto Maximum Sensitivity Substrate(LifeTech 34094)에 막을 1분 동안 담궜다. 그 결과를 Azure C400으로 시각화하였다.

데이터 분석

각 샘플 및 3개의 대조군에 대해, LAMA1 프로브의 3가지 기술 복제물에서의 평균 Ct 값으로부터 HPRT 프로브의 그 값을 빼서 deltaCt 값을 산출하였다(평균 Ct LAMA1 - 평균 Ct HPRT). 식 2^-(deltaCt)를 이용하여 각 샘플에 대한 발현 값을 결정하였다. 샘플 발현 값을 각 실험에 대한 3개의 대조군 발현 값의 평균으로 정규화하고, 각 샘플에 대한 상대적인 LAMA1 발현을 결정하였다.

결과

dSaCas9-VR:sgRNA에 의한 LAMA1 유전자 발현의 활성화

각 표적 서열에 대한 VP64-miniRTA 및 sgRNA를 위한 발현 카세트를 1차 HSMM 세포에 전달하는 렌티바이러스를 생산하였다. 형질도입된 세포를 퓨로마이신 내성으로 선택하고, Taqman Assay를 사용하여 LAMA1 발현을 정량화하였다. 각 샘플의 발현 값을 대조군 sgRNA로 형질도입된 세포에서 평균 LAMA1 발현으로 정규화하였다.

도 2에 나타낸 바와 같이, 16개의 테스트된 서열 중 3개의 표적 서열은 HSMM 공여자 #3 세포에서 LAMA1 mRNA 발현에 있어 ~5-7배의 상향 조절을 나타내었고(도 2), 동일한 3개의 서열은 HSMM 공여자 #5 세포에서 LAMA1 mRNA 발현에 있어 ~11-16배의 상향 조절을 나타내었다(도 3).

16개의 sgRNA(서열번호: 1-16)를 사용한 첫 번째 스크리닝에서 유망한 상향 조절 결과를 확인한 후, 우리는 동일한 영역에서 추가로 45개의 sgRNA(서열번호: 17-61)를 설계하고 스크리닝하여, sgRNA 25 및 sgRNA 50과 같이, sgRNA 15보다 거의 두 배 더 강력한 새로운 sgRNA를 확인하였다(도 4).

도 5에 나타낸 바와 같이, R1 및 R2에서 테스트된 40개 서열 중 gRNA#101만이 HSMM 공여자 #3 세포에서 LAMA1 mRNA 발현이 3배 이상 상향 조절된 것을 나타내었다.

도 6에 나타낸 바와 같이, LAMA1 TSS의 상단부에 위치한 92개의 테스트된 가이드 서열 중 소수가 LAMA1 발현 수준을 2배 이상으로 상향 조절할 수 있었다. 3개의 가장 강력한 가이드 서열, 즉 gRNA#155, gRNA#170 및 gRNA#172가, 4가지 상이한 기원을 갖는 1차 HSMM 세포로 테스트된 이하의 밸리데이션 실험에 포함되었으며, 각 처리 조건에 대해 3개의 생물학적 복제물이 포함되었다: 1. 비바이러스성 형질도입; 2. sgRNA가 형질도입되지 않은 dSaCas9-VR; 3. 비표적 sgRNA가 형질도입된 dSaCas9-VR; 4. gRNA#155가 형질도입된 dSaCas9-VR; 5. gRNA#170이 형질도입된 dSaCas9-VR; 6. gRNA#172가 형질도입된 dSaCas9-VR. 도 7에 나타낸 바와 같이, 3개의 sgRNA 모두는 4개의 상이한 기원을 갖는 모든 1차 HSMM 세포에 걸쳐서 LAMA1 발현 수준을 더 높은 수준(적어도 3.5배)으로 일관되게 상향 조절할 수 있었다. 그리고 우리는 상이한 HSMM 기원들 사이에서 다양한 상향 조절 효능을 관찰하였고(예컨대, 공여자 #368에서 >35배와 비교하여, 공여자 #121에서 ~3.5배), 이는 LAMA1의 기본 발현 수준이 상이하기 때문일 수 있다(도 8).

다음으로, 우리는 이러한 sgRNA들이 상이한 활성화 모이어티로 LAMA1 수준을 상향 조절할 수 있는지를 테스트하였다. 도 9에서 나타낸 바와 같이, VP160, nanoVR, microVR 및 miniVR은 모두 LAMA1 발현을 3배 이상으로 상향 조절할 수 있었고, VP64-MyoD는 LAMA1 발현을 약 2배 상향 조절할 수 있었다. 한편, LAMA1 mRNA 수준의 상향 조절이 단백질 수준의 상승으로 바뀌는지 확인하기 위해, 우리는 microVR로 샘플에서 전체 단백질을 추출하고 웨스턴 블롯 분석을 수행하였다. 도 10에 나타낸 바와 같이, 2개의 별개의 HSMM 세포 기원에 있어서, 3개의 sgRNA 모두는 LAMA1 단백질 수준을 1.7배 이상 증가시킬 수 있었다.

위에서 언급한 모든 특허 및 기타 참고 문헌은 상세하게 기재된 바와 마찬가지로, 그 전문이 본원에 참조에 의해 원용된다.

본 발명에 따르면, MDC1A 환자 유래의 근육 세포에서 LAMA1 유전자의 발현이 상향 조절될 수 있다. 따라서, 본 발명은 MDC1A의 치료 및/또는 예방에 매우 유용할 것으로 기대된다.

본 출원은 미국 가출원 특허번호 62/887,863(출원일: 2019년 8월 16일) 및 미국 가출원 특허번호 63/008,059(출원일: 2020년 4월 10일)에 기초한 것으로, 그 내용은 전문이 본원에 원용된다.

SEQUENCE LISTING <110> Modalis Therapeutics Corporation <120> METHOD FOR TREATING MUSCULAR DYSTROPHY BY TARGETING LAMA1 GENE <130> 093060 <150> US62/887,863 <151> 2019-08-16 <150> US63/008,059 <151> 2020-04-10 <160> 221 <170> PatentIn version 3.5 <210> 1 <211> 21 <212> DNA <213> Homo sapiens <400> 1 actagcaggt gatttgcagg t 21 <210> 2 <211> 21 <212> DNA <213> Homo sapiens <400> 2 aggtgggctg atcacgaggt c 21 <210> 3 <211> 21 <212> DNA <213> Homo sapiens <400> 3 tctccgggct gcaggcagga g 21 <210> 4 <211> 21 <212> DNA <213> Homo sapiens <400> 4 cggaaggcaa aaaggcaaac a 21 <210> 5 <211> 21 <212> DNA <213> Homo sapiens <400> 5 tgaacaagtc ccggtttccc a 21 <210> 6 <211> 21 <212> DNA <213> Homo sapiens <400> 6 tggggaggga gaggagcctt a 21 <210> 7 <211> 21 <212> DNA <213> Homo sapiens <400> 7 cagtgcttcc atcatgaatg c 21 <210> 8 <211> 21 <212> DNA <213> Homo sapiens <400> 8 catgacaatg ggcgtattcc c 21 <210> 9 <211> 21 <212> DNA <213> Homo sapiens <400> 9 gggttgtccc ccaaaaggga a 21 <210> 10 <211> 21 <212> DNA <213> Homo sapiens <400> 10 gcccacggtc aatcccgcgc a 21 <210> 11 <211> 21 <212> DNA <213> Homo sapiens <400> 11 tcagtgccct ggacgccgcc t 21 <210> 12 <211> 21 <212> DNA <213> Homo sapiens <400> 12 cggggctgtt ggccgggcgc g 21 <210> 13 <211> 21 <212> DNA <213> Homo sapiens <400> 13 ggctttaacc tcctcgggct t 21 <210> 14 <211> 21 <212> DNA <213> Homo sapiens <400> 14 ggcgcgcatc ctgatccacc t 21 <210> 15 <211> 21 <212> DNA <213> Homo sapiens <400> 15 tctcgcctcc gccgccactc g 21 <210> 16 <211> 21 <212> DNA <213> Homo sapiens <400> 16 ctgccctggc cccgccgctc c 21 <210> 17 <211> 21 <212> DNA <213> Homo sapiens <400> 17 tgacagggaa cgtctaacaa t 21 <210> 18 <211> 21 <212> DNA <213> Homo sapiens <400> 18 tgcagtctcc gggctgcagg c 21 <210> 19 <211> 21 <212> DNA <213> Homo sapiens <400> 19 tgctcaagga ggctagttag g 21 <210> 20 <211> 21 <212> DNA <213> Homo sapiens <400> 20 gttaggaagg gtgagggttg g 21 <210> 21 <211> 21 <212> DNA <213> Homo sapiens <400> 21 tcggcacttg gcctggcggt t 21 <210> 22 <211> 21 <212> DNA <213> Homo sapiens <400> 22 accttcagca gcctgataga c 21 <210> 23 <211> 21 <212> DNA <213> Homo sapiens <400> 23 cgcagagcca ggctgggaag a 21 <210> 24 <211> 21 <212> DNA <213> Homo sapiens <400> 24 gaaacgcagc attgaatagc t 21 <210> 25 <211> 21 <212> DNA <213> Homo sapiens <400> 25 accggagctg gaaacgcagc a 21 <210> 26 <211> 21 <212> DNA <213> Homo sapiens <400> 26 ctccggtcca gtgcttccat c 21 <210> 27 <211> 21 <212> DNA <213> Homo sapiens <400> 27 gcttccatca tgaatgcttg a 21 <210> 28 <211> 21 <212> DNA <213> Homo sapiens <400> 28 aacgtgtgtt tgggcattgt g 21 <210> 29 <211> 21 <212> DNA <213> Homo sapiens <400> 29 attcgagtca aaagtagtgg g 21 <210> 30 <211> 21 <212> DNA <213> Homo sapiens <400> 30 tttaatgaag tttatattcg t 21 <210> 31 <211> 21 <212> DNA <213> Homo sapiens <400> 31 ccacgctgcg aagacagctc t 21 <210> 32 <211> 21 <212> DNA <213> Homo sapiens <400> 32 gaagacagct ctaggggtgg c 21 <210> 33 <211> 21 <212> DNA <213> Homo sapiens <400> 33 tctaggggtg gcgtgggtga c 21 <210> 34 <211> 21 <212> DNA <213> Homo sapiens <400> 34 gattgagaag agaaactcag a 21 <210> 35 <211> 21 <212> DNA <213> Homo sapiens <400> 35 agcaccttgc atgcgcgttg c 21 <210> 36 <211> 21 <212> DNA <213> Homo sapiens <400> 36 caaacccgct cattcactgc g 21 <210> 37 <211> 21 <212> DNA <213> Homo sapiens <400> 37 tcaatcccgc gcagtgaatg a 21 <210> 38 <211> 21 <212> DNA <213> Homo sapiens <400> 38 ttcgcctatt gcacaaaaag c 21 <210> 39 <211> 21 <212> DNA <213> Homo sapiens <400> 39 gcttggctgc caggggcccc g 21 <210> 40 <211> 21 <212> DNA <213> Homo sapiens <400> 40 ggtcgcggcg gccgggaaag g 21 <210> 41 <211> 21 <212> DNA <213> Homo sapiens <400> 41 ctcattgtcc ggctgcgcaa g 21 <210> 42 <211> 21 <212> DNA <213> Homo sapiens <400> 42 atgaatggag aaagagctct c 21 <210> 43 <211> 21 <212> DNA <213> Homo sapiens <400> 43 tagtgccccg gctgcgcggg c 21 <210> 44 <211> 21 <212> DNA <213> Homo sapiens <400> 44 gggcgcccgg agcggggcgc c 21 <210> 45 <211> 21 <212> DNA <213> Homo sapiens <400> 45 gccatctacg cgagcagtgc t 21 <210> 46 <211> 21 <212> DNA <213> Homo sapiens <400> 46 ctgctcgcgt agatggcgct c 21 <210> 47 <211> 21 <212> DNA <213> Homo sapiens <400> 47 tcccgcgctt gccggggagg g 21 <210> 48 <211> 21 <212> DNA <213> Homo sapiens <400> 48 cggagtgggt gtctcggcca c 21 <210> 49 <211> 21 <212> DNA <213> Homo sapiens <400> 49 ggccgagaca cccactccga g 21 <210> 50 <211> 21 <212> DNA <213> Homo sapiens <400> 50 cgcatcctga tccacctcgg a 21 <210> 51 <211> 21 <212> DNA <213> Homo sapiens <400> 51 gacacccact ccgaggtgga t 21 <210> 52 <211> 21 <212> DNA <213> Homo sapiens <400> 52 agcccgtcgc gttggggctg c 21 <210> 53 <211> 21 <212> DNA <213> Homo sapiens <400> 53 aggtgagccc ggcccgggtc c 21 <210> 54 <211> 21 <212> DNA <213> Homo sapiens <400> 54 cggcagagag gtgagcccgg c 21 <210> 55 <211> 21 <212> DNA <213> Homo sapiens <400> 55 gcggctttct ccccagaccc a 21 <210> 56 <211> 21 <212> DNA <213> Homo sapiens <400> 56 gcctggaacg ctccacggga c 21 <210> 57 <211> 21 <212> DNA <213> Homo sapiens <400> 57 gggcggggcg gggcgcagcc g 21 <210> 58 <211> 21 <212> DNA <213> Homo sapiens <400> 58 gggcgccccc gggggagggg t 21 <210> 59 <211> 21 <212> DNA <213> Homo sapiens <400> 59 caagctgggc gcccccgggg g 21 <210> 60 <211> 21 <212> DNA <213> Homo sapiens <400> 60 cgggggcgcc cagcttggcc t 21 <210> 61 <211> 21 <212> DNA <213> Homo sapiens <400> 61 gtcagcccgg cctccccgac t 21 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> control non-targeting targeting sequence <400> 62 acggaggcta agcgtcgcaa 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> control non-targeting targeting sequence <400> 63 cgcttccgcg gcccgttcaa 20 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> control non-targeting targeting sequence <400> 64 gtaggcgcgc cgctctctac 20 <210> 65 <211> 19 <212> RNA <213> Francisella novicid <220> <221> misc_structure <222> (1)..(19) <223> 5'-handle of crRNA <400> 65 aauuucuacu guuguagau <210> 66 <211> 1053 <212> PRT <213> Staphylococcus aureus <220> <221> VARIANT <222> (10)..(10) <223> conversion of Asp residue into Ala residue <220> <221> VARIANT <222> (580)..(580) <223> conversion of Asn residue into Ala residue <400> 66 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 67 <211> 1053 <212> PRT <213> Staphylococcus aureus <220> <221> VARIANT <222> (10)..(10) <223> conversion of Asp residue into Ala residue <220> <221> VARIANT <222> (557)..(557) <223> conversion of His residue into Ala residue <400> 67 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 68 <211> 1028 <212> PRT <213> Artificial Sequence <220> <223> amino acid residues (721st to 745th amino acid residues of dSaCas9) deletion mutant <220> <221> VARIANT <222> (10)..(10) <223> conversion of Asp residue into Ala residue <220> <221> VARIANT <222> (580)..(580) <223> conversion of Asn residue into Ala residue <400> 68 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys 725 730 735 His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys 740 745 750 Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys 755 760 765 Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr 770 775 780 Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu 785 790 795 800 Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys 805 810 815 Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr 820 825 830 Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn 835 840 845 Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala 850 855 860 His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val 865 870 875 880 Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly 885 890 895 Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu 900 905 910 Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu 915 920 925 Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn 930 935 940 Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn 945 950 955 960 Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr 965 970 975 Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile 980 985 990 Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp 995 1000 1005 Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln 1010 1015 1020 Ile Ile Lys Lys Gly 1025 <210> 69 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> GGSGGS linker <400> 69 Gly Gly Ser Gly Gly Ser 1 5 <210> 70 <211> 1034 <212> PRT <213> Artificial Sequence <220> <223> amino acid residues (721st to 745th amino acid residues of dSaCas9) deletion mutant with GGSGGS linker <220> <221> VARIANT <222> (10)..(10) <223> conversion of Asp residue into Ala residue <220> <221> VARIANT <222> (580)..(580) <223> conversion of Asn residue into Ala residue <220> <221> MISC_FEATURE <222> (721)..(726) <223> GGSGGS linker <400> 70 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Gly Gly Ser Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile 725 730 735 Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr 740 745 750 Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr 755 760 765 Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn 770 775 780 Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu 785 790 795 800 Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln 805 810 815 Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys 820 825 830 Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys 835 840 845 Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr 850 855 860 Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn 865 870 875 880 Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp 885 890 895 Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu 900 905 910 Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr 915 920 925 Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile 930 935 940 Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr 945 950 955 960 Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn 965 970 975 Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys 980 985 990 Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile 995 1000 1005 Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys 1010 1015 1020 Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1025 1030 <210> 71 <211> 886 <212> PRT <213> Artificial Sequence <220> <223> amino acid residues (482nd to 648th amino acid residues of dSaCas9) deletion mutant <220> <221> VARIANT <222> (10)..(10) <223> conversion of Asp residue into Ala residue <400> 71 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr 485 490 495 Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly 500 505 510 Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn 515 520 525 Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala 530 535 540 Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val 545 550 555 560 Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu 565 570 575 Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln 580 585 590 Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val 595 600 605 Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr 610 615 620 Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly 625 630 635 640 Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser 645 650 655 Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys 660 665 670 Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr 675 680 685 Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys 690 695 700 Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu 705 710 715 720 Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys 725 730 735 Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp 740 745 750 Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys 755 760 765 Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys 770 775 780 Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr 785 790 795 800 Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly 805 810 815 Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile 820 825 830 Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg 835 840 845 Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser 850 855 860 Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro 865 870 875 880 Gln Ile Ile Lys Lys Gly 885 <210> 72 <211> 892 <212> PRT <213> Artificial Sequence <220> <223> amino acid residues (482nd to 648th amino acid residues of dSaCas9) deletion mutant with GGSGGS linker <220> <221> VARIANT <222> (10)..(10) <223> conversion of Asp residue into Ala residue <220> <221> MISC_FEATURE <222> (482)..(487) <223> GGSGGS linker <400> 72 Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Gly Gly Ser Gly Gly Ser Thr Arg Tyr Ala Thr Arg Gly Leu Met 485 490 495 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 500 505 510 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 515 520 525 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 530 535 540 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 545 550 555 560 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 565 570 575 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 580 585 590 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 595 600 605 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn 610 615 620 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 625 630 635 640 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 645 650 655 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 660 665 670 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 675 680 685 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 690 695 700 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 705 710 715 720 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 725 730 735 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 740 745 750 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 755 760 765 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 770 775 780 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 785 790 795 800 Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu 805 810 815 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 820 825 830 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 835 840 845 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln 850 855 860 Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val 865 870 875 880 Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 885 890 <210> 73 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> VP64 <400> 73 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 1 5 10 15 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 20 25 30 Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp 35 40 45 Met Leu 50 <210> 74 <211> 376 <212> PRT <213> Artificial Sequence <220> <223> VPH <400> 74 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 1 5 10 15 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 20 25 30 Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp 35 40 45 Met Leu Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Pro 50 55 60 Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala 65 70 75 80 Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro Leu 85 90 95 Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln 100 105 110 Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr 115 120 125 Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu 130 135 140 Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu 145 150 155 160 Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val 165 170 175 Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu 180 185 190 Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala 195 200 205 Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp 210 215 220 Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser 225 230 235 240 Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val 245 250 255 Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro 260 265 270 Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu 275 280 285 Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser 290 295 300 Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu 305 310 315 320 Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro 325 330 335 Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly 340 345 350 Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro 355 360 365 Lys Ala Lys Asp Pro Thr Val Ser 370 375 <210> 75 <211> 523 <212> PRT <213> Artificial Sequence <220> <223> VPR <400> 75 Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu 1 5 10 15 Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 20 25 30 Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp 35 40 45 Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser 50 55 60 Gly Ser Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu 65 70 75 80 Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys 85 90 95 Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile 100 105 110 Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln 115 120 125 Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe 130 135 140 Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu 145 150 155 160 Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro 165 170 175 Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro 180 185 190 Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys 195 200 205 Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu 210 215 220 Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp 225 230 235 240 Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln 245 250 255 Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro 260 265 270 Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala 275 280 285 Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu 290 295 300 Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp 305 310 315 320 Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser 325 330 335 Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser 340 345 350 Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro 355 360 365 Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser 370 375 380 Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu 385 390 395 400 Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr 405 410 415 Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln 420 425 430 Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys 435 440 445 Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro 450 455 460 Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu 465 470 475 480 Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu 485 490 495 Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser 500 505 510 Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe 515 520 <210> 76 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> MiniVR <400> 76 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 1 5 10 15 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 20 25 30 Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp 35 40 45 Met Leu Gly Ser Gly Ser Pro Ala Pro Ala Val Thr Pro Glu Ala Ser 50 55 60 His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala 65 70 75 80 Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala 85 90 95 Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu 100 105 110 Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu 115 120 125 Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu 130 135 140 Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser 145 150 155 160 Ile Phe Asp Thr Ser Leu Phe 165 <210> 77 <211> 140 <212> PRT <213> Artificial Sequence <220> <223> MicroVR <400> 77 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 1 5 10 15 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 20 25 30 Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp 35 40 45 Met Leu Gly Ser Gly Ser Arg Glu Met Ala Asp Thr Val Ile Pro Gln 50 55 60 Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro 65 70 75 80 Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr 85 90 95 Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile 100 105 110 Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile 115 120 125 Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe 130 135 140 <210> 78 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GSGS linker <400> 78 Gly Ser Gly Ser <210> 79 <211> 21 <212> RNA <213> Homo sapiens <220> <221> misc_feature <222> (1)..(21) <223> crRNA corresponding to the target sequence (SEQ ID NO:15) <400> 79 ucucgccucc gccgccacuc g 21 <210> 80 <211> 21 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (1)..(21) <223> sequence complementary to the target sequence (SEQ ID NO:15) <400> 80 cgagtggcgg cggaggcgag a 21 <210> 81 <211> 19 <212> DNA <213> Francisella novicid <220> <221> misc_structure <222> (1)..(19) <223> 5'-handle of crRNA <400> 81 aatttctact gttgtagat <210> 82 <211> 83 <212> DNA <213> Staphylococcus aureus <220> <221> misc_feature <222> (1)..(83) <223> sequence encoding tracrRNA <400> 82 gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60 caacttgttg gcgagatttt ttt 83 <210> 83 <211> 82 <212> RNA <213> Staphylococcus aureus <220> <221> misc_feature <222> (1)..(82) <223> tracrRNA <400> 83 guuuuaguac ucuggaaaca gaaucuacua aaacaaggca aaaugccgug uuuaucucgu 60 caacuuguug gcgagauuuu uu 82 <210> 84 <211> 131 <212> PRT <213> Artificial sequence <220> <223> Synthetic peptide <400> 84 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 1 5 10 15 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 20 25 30 Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp 35 40 45 Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly 50 55 60 Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala 65 70 75 80 Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp 85 90 95 Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu 100 105 110 Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 115 120 125 Tyr Ile Asp 130 <210> 85 <211> 21 <212> DNA <213> Homo sapiens <400> 85 aaaattaaga ttttctttct g 21 <210> 86 <211> 21 <212> DNA <213> Homo sapiens <400> 86 aacttgtttt gtatattttt a 21 <210> 87 <211> 21 <212> DNA <213> Homo sapiens <400> 87 taataattga gatgcattct c 21 <210> 88 <211> 21 <212> DNA <213> Homo sapiens <400> 88 aagctcacat ttaggaacag a 21 <210> 89 <211> 21 <212> DNA <213> Homo sapiens <400> 89 ctatggcaaa ctaaacaaag c 21 <210> 90 <211> 21 <212> DNA <213> Homo sapiens <400> 90 cagaagagca gaagttctta t 21 <210> 91 <211> 21 <212> DNA <213> Homo sapiens <400> 91 catctgagac atcgctacct g 21 <210> 92 <211> 21 <212> DNA <213> Homo sapiens <400> 92 gtttacctta aaaacaaatt c 21 <210> 93 <211> 21 <212> DNA <213> Homo sapiens <400> 93 ctcctggtcc tttacaagtg g 21 <210> 94 <211> 21 <212> DNA <213> Homo sapiens <400> 94 agcagggggc aacgaagaag a 21 <210> 95 <211> 21 <212> DNA <213> Homo sapiens <400> 95 ttctggggtg atgggttcaa c 21 <210> 96 <211> 21 <212> DNA <213> Homo sapiens <400> 96 cccagagggc cgtggggcca t 21 <210> 97 <211> 21 <212> DNA <213> Homo sapiens <400> 97 tttccataga gaaatgtgtg t 21 <210> 98 <211> 21 <212> DNA <213> Homo sapiens <400> 98 tgggaggcgc catctgcgcg g 21 <210> 99 <211> 21 <212> DNA <213> Homo sapiens <400> 99 cctcaacgtt ttcctgtaag t 21 <210> 100 <211> 21 <212> DNA <213> Homo sapiens <400> 100 ctaagatctc cagccttgtt c 21 <210> 101 <211> 21 <212> DNA <213> Homo sapiens <400> 101 tgtgcctaag actgcacagg t 21 <210> 102 <211> 21 <212> DNA <213> Homo sapiens <400> 102 attaaacgca gatatgctat t 21 <210> 103 <211> 21 <212> DNA <213> Homo sapiens <400> 103 tcatagaaaa tacataagca a 21 <210> 104 <211> 21 <212> DNA <213> Homo sapiens <400> 104 aagaagtcac agaaatgcct c 21 <210> 105 <211> 21 <212> DNA <213> Homo sapiens <400> 105 ggcttggaga gaaggggcaa g 21 <210> 106 <211> 21 <212> DNA <213> Homo sapiens <400> 106 gctcatcact ggcactgccc a 21 <210> 107 <211> 21 <212> DNA <213> Homo sapiens <400> 107 taaacctctt ttgccttcat g 21 <210> 108 <211> 21 <212> DNA <213> Homo sapiens <400> 108 ttcttatgaa taaagtttta t 21 <210> 109 <211> 21 <212> DNA <213> Homo sapiens <400> 109 cttcttcaaa atgttaagtt a 21 <210> 110 <211> 21 <212> DNA <213> Homo sapiens <400> 110 caaatgttca tcaactgatg a 21 <210> 111 <211> 21 <212> DNA <213> Homo sapiens <400> 111 atatggttcc atttctaagt t 21 <210> 112 <211> 21 <212> DNA <213> Homo sapiens <400> 112 ttgcaccaat acaccaaaac a 21 <210> 113 <211> 21 <212> DNA <213> Homo sapiens <400> 113 actgctctga gctacagcaa a 21 <210> 114 <211> 21 <212> DNA <213> Homo sapiens <400> 114 tttttgtaat tttagtagag a 21 <210> 115 <211> 21 <212> DNA <213> Homo sapiens <400> 115 actgcactcc agcctgggca a 21 <210> 116 <211> 21 <212> DNA <213> Homo sapiens <400> 116 ctttttgccc agactggtaa a 21 <210> 117 <211> 21 <212> DNA <213> Homo sapiens <400> 117 ttggttttac acataaaaat c 21 <210> 118 <211> 21 <212> DNA <213> Homo sapiens <400> 118 tcttccactc aggacacaca a 21 <210> 119 <211> 21 <212> DNA <213> Homo sapiens <400> 119 tttttcacct aatgtttata a 21 <210> 120 <211> 21 <212> DNA <213> Homo sapiens <400> 120 ggtttttgga tttcttccca g 21 <210> 121 <211> 21 <212> DNA <213> Homo sapiens <400> 121 aacatcacct tgattttgag t 21 <210> 122 <211> 21 <212> DNA <213> Homo sapiens <400> 122 atcagggtgg cttctggtgt t 21 <210> 123 <211> 21 <212> DNA <213> Homo sapiens <400> 123 aaagaagaag aagaagaaaa a 21 <210> 124 <211> 21 <212> DNA <213> Homo sapiens <400> 124 aaaaattagc cgggcttggt g 21 <210> 125 <211> 21 <212> DNA <213> Homo sapiens <400> 125 aaattataga tgttcacttg g 21 <210> 126 <211> 21 <212> DNA <213> Homo sapiens <400> 126 aataccttga tattattatc c 21 <210> 127 <211> 21 <212> DNA <213> Homo sapiens <400> 127 tatgcgtcag aaaaagcggc t 21 <210> 128 <211> 21 <212> DNA <213> Homo sapiens <400> 128 gagaagcttc ttctcaccga t 21 <210> 129 <211> 21 <212> DNA <213> Homo sapiens <400> 129 ggaaggatga atagggcgtg a 21 <210> 130 <211> 21 <212> DNA <213> Homo sapiens <400> 130 cgcctcggcc tcccaaagtg c 21 <210> 131 <211> 21 <212> DNA <213> Homo sapiens <400> 131 ccagcacttt gggaggccga g 21 <210> 132 <211> 21 <212> DNA <213> Homo sapiens <400> 132 cactttggga ggccgaggcg g 21 <210> 133 <211> 21 <212> DNA <213> Homo sapiens <400> 133 gcgggtggat cacttgaggt c 21 <210> 134 <211> 21 <212> DNA <213> Homo sapiens <400> 134 ctacttggga ggctgaggca g 21 <210> 135 <211> 21 <212> DNA <213> Homo sapiens <400> 135 agataatttc ctctcacttg t 21 <210> 136 <211> 21 <212> DNA <213> Homo sapiens <400> 136 cctcagaaaa acaggaattg a 21 <210> 137 <211> 21 <212> DNA <213> Homo sapiens <400> 137 aaaaggatgc aatatagttc a 21 <210> 138 <211> 21 <212> DNA <213> Homo sapiens <400> 138 cattttaaat ttagtactgt a 21 <210> 139 <211> 21 <212> DNA <213> Homo sapiens <400> 139 aggcacatag ctattaaaat g 21 <210> 140 <211> 21 <212> DNA <213> Homo sapiens <400> 140 agatcccaaa agataatcta t 21 <210> 141 <211> 21 <212> DNA <213> Homo sapiens <400> 141 gcattcatat agattatctt t 21 <210> 142 <211> 21 <212> DNA <213> Homo sapiens <400> 142 cgcctcggcc tcccaaagtg c 21 <210> 143 <211> 21 <212> DNA <213> Homo sapiens <400> 143 ccagcacttt gggaggccga g 21 <210> 144 <211> 21 <212> DNA <213> Homo sapiens <400> 144 cactttggga ggccgaggcg g 21 <210> 145 <211> 21 <212> DNA <213> Homo sapiens <400> 145 tttttgtatt tttagtggag a 21 <210> 146 <211> 21 <212> DNA <213> Homo sapiens <400> 146 gctcactgca agctccgcct c 21 <210> 147 <211> 21 <212> DNA <213> Homo sapiens <400> 147 gtcttgctct gtcgcccagg c 21 <210> 148 <211> 21 <212> DNA <213> Homo sapiens <400> 148 cacaaggggt gtccccatat t 21 <210> 149 <211> 21 <212> DNA <213> Homo sapiens <400> 149 ccttatcttt gaactgcaag c 21 <210> 150 <211> 21 <212> DNA <213> Homo sapiens <400> 150 gcagggtttt tagaagatgt g 21 <210> 151 <211> 21 <212> DNA <213> Homo sapiens <400> 151 aatcagaatg tctatgttat t 21 <210> 152 <211> 21 <212> DNA <213> Homo sapiens <400> 152 cgcctcagcc tcccaaagtg c 21 <210> 153 <211> 21 <212> DNA <213> Homo sapiens <400> 153 ccagcacttt gggaggctga g 21 <210> 154 <211> 21 <212> DNA <213> Homo sapiens <400> 154 cactttggga ggctgaggcg g 21 <210> 155 <211> 21 <212> DNA <213> Homo sapiens <400> 155 tttttgtatt tttagtagag a 21 <210> 156 <211> 21 <212> DNA <213> Homo sapiens <400> 156 ccattctcct gcctcagcct c 21 <210> 157 <211> 21 <212> DNA <213> Homo sapiens <400> 157 ctactcagga ggctgaggca g 21 <210> 158 <211> 21 <212> DNA <213> Homo sapiens <400> 158 gctcactgca agctccgcct c 21 <210> 159 <211> 21 <212> DNA <213> Homo sapiens <400> 159 gtgggcagat cacttgagct c 21 <210> 160 <211> 21 <212> DNA <213> Homo sapiens <400> 160 cacctcagcc tcccaaagtg c 21 <210> 161 <211> 21 <212> DNA <213> Homo sapiens <400> 161 agcctcccaa agtgctggaa t 21 <210> 162 <211> 21 <212> DNA <213> Homo sapiens <400> 162 ggatttcaac aggatcaccc a 21 <210> 163 <211> 21 <212> DNA <213> Homo sapiens <400> 163 gaactagaat ctggatttca a 21 <210> 164 <211> 21 <212> DNA <213> Homo sapiens <400> 164 cagggatcca gccacggtgc c 21 <210> 165 <211> 21 <212> DNA <213> Homo sapiens <400> 165 tactagaatt ggttatggtg t 21 <210> 166 <211> 21 <212> DNA <213> Homo sapiens <400> 166 actttgcaga tgtgattaaa t 21 <210> 167 <211> 21 <212> DNA <213> Homo sapiens <400> 167 agagccagct gtaaggacac c 21 <210> 168 <211> 21 <212> DNA <213> Homo sapiens <400> 168 ggtgaaaccc attttggact t 21 <210> 169 <211> 21 <212> DNA <213> Homo sapiens <400> 169 tgtattgtta tcttatagtt c 21 <210> 170 <211> 21 <212> DNA <213> Homo sapiens <400> 170 aatactggaa aaaagagaag g 21 <210> 171 <211> 21 <212> DNA <213> Homo sapiens <400> 171 gaaggaagaa tagaggtctc a 21 <210> 172 <211> 21 <212> DNA <213> Homo sapiens 17288 gaagagagcc ctcaccagaa a 21 <210> 173 <211> 21 <212> DNA <213> Homo sapiens <400> 173 cttacaagaa cacaaatcct a 21 <210> 174 <211> 21 <212> DNA <213> Homo sapiens <400> 174 aagaatgggg ctctgatcca a 21 <210> 175 <211> 21 <212> DNA <213> Homo sapiens <400> 175 tagtatttta catttacata g 21 <210> 176 <211> 21 <212> DNA <213> Homo sapiens <400> 176 atggggatat tttatagtaa a 21 <210> 177 <211> 21 <212> DNA <213> Homo sapiens <400> 177 gcatctccct aaagccaagg a 21 <210> 178 <211> 21 <212> DNA <213> Homo sapiens <400> 178 aggaagagga agccaaattg g 21 <210> 179 <211> 21 <212> DNA <213> Homo sapiens <400> 179 ccagcaggca gggatgtcct g 21 <210> 180 <211> 21 <212> DNA <213> Homo sapiens <400> 180 tctgcaggac atccctgcct g 21 <210> 181 <211> 21 <212> DNA <213> Homo sapiens <400> 181 ctactcggga ggctgaggca g 21 <210> 182 <211> 21 <212> DNA <213> Homo sapiens <400> 182 tgattctcct gcctcagcct c 21 <210> 183 <211> 21 <212> DNA <213> Homo sapiens <400> 183 gctcactgca agctctgcct c 21 <210> 184 <211> 21 <212> DNA <213> Homo sapiens <400> 184 ctactcggga ggctgaggca g 21 <210> 185 <211> 21 <212> DNA <213> Homo sapiens <400> 185 ccattctcct gcctcagcct c 21 <210> 186 <211> 21 <212> DNA <213> Homo sapiens <400> 186 tttttgtatt tttagtagag a 21 <210> 187 <211> 21 <212> DNA <213> Homo sapiens <400> 187 tactaaaaat acaaaaatta g 21 <210> 188 <211> 21 <212> DNA <213> Homo sapiens <400> 188 cactttggga ggccgaggtg g 21 <210> 189 <211> 21 <212> DNA <213> Homo sapiens <400> 189 cacctcggcc tcccaaagtg c 21 <210> 190 <211> 21 <212> DNA <213> Homo sapiens <400> 190 aacctaaagt gtaaaatatt g 21 <210> 191 <211> 21 <212> DNA <213> Homo sapiens <400> 191 cactaagcca atgccaggtt t 21 <210> 192 <211> 21 <212> DNA <213> Homo sapiens <400> 192 gctcactgca acctctgcct c 21 <210> 193 <211> 21 <212> DNA <213> Homo sapiens <400> 193 gtgggcagga gttgaaatga g 21 <210> 194 <211> 21 <212> DNA <213> Homo sapiens <400> 194 ggaaacgcag ctgagctctg a 21 <210> 195 <211> 21 <212> DNA <213> Homo sapiens <400> 195 ccacaaggga gcaagtggtt g 21 <210> 196 <211> 21 <212> DNA <213> Homo sapiens <400> 196 aaacaaaggc aagttaatca g 21 <210> 197 <211> 21 <212> DNA <213> Homo sapiens <400> 197 cagcagggag aatggggatc a 21 <210> 198 <211> 21 <212> DNA <213> Homo sapiens <400> 198 ggcttggaaa acaggaacca a 21 <210> 199 <211> 21 <212> DNA <213> Homo sapiens <400> 199 acatttgaag gtcagacagc t 21 <210> 200 <211> 21 <212> DNA <213> Homo sapiens <400> 200 ggacaggaag agctccacga a 21 <210> 201 <211> 21 <212> DNA <213> Homo sapiens <400> 201 ggtcagttta ctccccatgg g 21 <210> 202 <211> 21 <212> DNA <213> Homo sapiens <400> 202 tctcactaat tgctccatgc a 21 <210> 203 <211> 21 <212> DNA <213> Homo sapiens <400> 203 gtcttgctct gtcacccagg c 21 <210> 204 <211> 21 <212> DNA <213> Homo sapiens <400> 204 ctacttggga ggctgaggca g 21 <210> 205 <211> 21 <212> DNA <213> Homo sapiens <400> 205 tttttgtatt tttagtagag a 21 <210> 206 <211> 21 <212> DNA <213> Homo sapiens <400> 206 cactttggga ggctgaggca g 21 <210> 207 <211> 21 <212> DNA <213> Homo sapiens <400> 207 gaaacatgac ttagtgacta a 21 <210> 208 <211> 21 <212> DNA <213> Homo sapiens <400> 208 cagccacaat ctccatctgt c 21 <210> 209 <211> 21 <212> DNA <213> Homo sapiens <400> 209 gctcactgca acctctgctt c 21 <210> 210 <211> 21 <212> DNA <213> Homo sapiens <400> 210 ctacttggga ggctgaggca g 21 <210> 211 <211> 21 <212> DNA <213> Homo sapiens <400> 211 tgcctcagcc tcccaagtag c 21 <210> 212 <211> 21 <212> DNA <213> Homo sapiens <400> 212 caagcaggtt agccagcctc t 21 <210> 213 <211> 21 <212> DNA <213> Homo sapiens <400> 213 cacagaggct ggctaacctg c 21 <210> 214 <211> 21 <212> DNA <213> Homo sapiens <400> 214 gtcaaaggaa gctgatagat c 21 <210> 215 <211> 21 <212> DNA <213> Homo sapiens <400> 215 attagaaatt taaaacaaaa t 21 <210> 216 <211> 21 <212> DNA <213> Homo sapiens <400> 216 aatcaagatg aatccaggca g 21 <210> 217 <211> 21 <212> DNA <213> Homo sapiens <400> 217 aagcttatta ttggagcagc t 21 <210> 218 <211> 21 <212> DNA <213> Homo sapiens <400> 218 aaagaacctc cccatcctag c 21 <210> 219 <211> 21 <212> DNA <213> Homo sapiens <400> 219 gtaaagttct cattccacac c 21 <210> 220 <211> 21 <212> DNA <213> Homo sapiens <400> 220 aaggttaata tgagaatctg t 21 <210> 221 <211> 21 <212> DNA <213> Homo sapiens <400> 221 tctttaggtc ctagatacct t 21

Claims

이하의 염기 서열을 포함하는 폴리뉴클레오타이드:
(a) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자(transcription activator)의 융합 단백질을 코딩하는 염기 서열, 및
(b) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역을 표적으로 하는 가이드 RNA, (ii) 서열번호: 124에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 코딩하는 염기 서열.
제 1 항에 있어서,
가이드 RNA를 코딩하는 염기 서열이
(i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 염기 서열,
(ii) 서열번호: 124에 기재된 염기 서열,
(iii) 서열번호: 178, 193, 또는 195에 기재된 염기 서열,
또는 여기서 1 내지 3개의 염기가 결실, 치환, 삽입 및/또는 부가된 염기 서열을 포함하는, 폴리뉴클레오타이드.
제 1 항 또는 제 2 항에 있어서,
전사 활성화 인자가 VP64, VP160, VPH, VPR, VP64-miniRTA(miniVR) 및 microVR, 및 전사 활성화 능력을 갖는 그의 변이체로 이루어진 군에서 선택되는, 폴리뉴클레오타이드.
제 3 항에 있어서,
전사 활성화 인자가 miniVR인, 폴리뉴클레오타이드.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
뉴클레아제-결핍 CRISPR 이펙터 단백질이 dCas9인, 폴리뉴클레오타이드.
제 5 항에 있어서,
dCas9가 황색포도상구균(Staphylococcus aureus)에서 유래하는, 폴리뉴클레오타이드.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열 및/또는 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열을 더 포함하는, 폴리뉴클레오타이드.
제 7 항에 있어서,
가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터, SNR6 프로모터, SNR52 프로모터, SCR1 프로모터, RPR1 프로모터, U3 프로모터, 및 H1 프로모터로 이루어진 군에서 선택되는, 폴리뉴클레오타이드.
제 8 항에 있어서,
가이드 RNA를 코딩하는 염기 서열에 대한 프로모터 서열이 U6 프로모터인, 폴리뉴클레오타이드.
제 7 항 내지 제 9 항 중 어느 한 항에 있어서,
뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질을 코딩하는 염기 서열에 대한 프로모터 서열이 유비쿼터스 프로모터(ubiquitous promoter) 또는 근육 특이적 프로모터인, 폴리뉴클레오타이드.
제 10 항에 있어서,
유비쿼터스 프로모터가 EFS 프로모터, CMV 프로모터 및 CAG 프로모터로 이루어진 군에서 선택되는, 폴리뉴클레오타이드.
제 10 항에 있어서,
근육 특이적 프로모터가 CK8 프로모터, 마이오신 중쇄 키나아제(MHCK) 프로모터, 근육 크레아틴 키나아제(MCK) 프로모터, 합성 C5-12(Syn) 프로모터 및 unc45b 프로모터로 이루어진 군에서 선택되는, 폴리뉴클레오타이드.
제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드를 포함하는 벡터.
제 13 항에 있어서,
벡터가 플라스미드 벡터 또는 바이러스성 벡터인, 벡터.
제 14 항에 있어서,
바이러스성 벡터가 아데노 연관 바이러스(adeno-associated virus; AAV) 벡터, 아데노바이러스 벡터, 및 렌티바이러스 벡터로 이루어진 군에서 선택되는, 벡터.
제 15 항에 있어서,
AAV 벡터가 AAV1, AAV2, AAV6, AAV7, AAV8, AAV9, 및 그들의 변이체로 이루어진 군에서 선택되는, 벡터.
제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터를 포함하는, MDC1A를 치료 또는 예방하기 위한 약제.
제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터를 이를 필요로 하는 대상에 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법.
MDC1A를 치료 또는 예방하기 위한, 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터의 사용.
MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서 제 1 항 내지 제 12 항 중 어느 한 항의 폴리뉴클레오타이드 또는 제 13 항 내지 제 16 항 중 어느 한 항의 벡터의 사용.
세포에서 인간 LAMA1 유전자의 발현을 상향 조절하는 방법으로서,
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및
(d) 인간 LAMA1의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA를 상기 세포에서 발현하는 것을 포함하는 방법.
이하를 포함하는 리보핵단백질:
(c) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 및
(d) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA.
이하를 포함하는, 인간 LAMA1 유전자 발현의 상향 조절용 키트:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
이하의 (e) 및 (f)를 투여하는 것을 포함하는, MDC1A를 치료 또는 예방하는 방법:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.
MDC1A의 치료 또는 예방용 약학 조성물의 제조에 있어서, 이하의 (e) 및 (f)의 사용:
(e) 뉴클레아제-결핍 CRISPR 이펙터 단백질과 전사 활성화 인자의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오타이드, 및
(f) 인간 LAMA1 유전자의 발현 조절 영역 중의 (i) 서열번호: 15, 20, 25, 50, 56, 또는 61에 기재된 연속 영역, (ii) 서열번호: 124에 기재된 연속 영역, 또는 (iii) 서열번호: 178, 193, 또는 195에 기재된 연속 영역을 표적으로 하는 가이드 RNA, 또는 가이드 RNA를 코딩하는 폴리뉴클레오타이드.