KR20190120287A

KR20190120287A - 게놈 편집 시스템 및 방법

Info

Publication number: KR20190120287A
Application number: KR1020197027456A
Authority: KR
Inventors: 차이샤 가오; 화웨이 장; 딩보 장
Original assignee: 인스티튜트 오브 제네틱스 앤드 디벨롭멘털 바이오롤지, 차이니즈 아카데미 오브 사이언시스
Priority date: 2017-02-20
Filing date: 2018-02-22
Publication date: 2019-10-23
Also published as: BR112019017138A2; EP3583216A4; WO2018149418A1; EA201991849A1; AU2018222092A1; WO2018149418A9; US20240011052A1; EP3583216A1; CA3053861A1; JP2020508046A; CN108546716A; US20200224221A1

Abstract

본 발명은, 야생형 Cas9 뉴클레아제와 비교해 특이성이 높은 Cas9 뉴클레아제 변이체 또는 이의 발현 구조체, 및 tRNA-gRNA 융합체 또는 리보자임-gRNA 융합체의 코딩 서열을 포함하는 발현 구조체를 포함하거나, 또는 Cas9 뉴클레아제 변이체의 코딩 서열과 tRNA-gRNA 융합체 또는 리보자임-gRNA 융합체의 코딩 서열을 모두 포함하는 발현 구조체를 포함하는, 세포의 게놈에서 타겟 서열에 대해 부위-특이적인 변형을 수행하기 위한 게놈 편집 시스템을 제공한다. 또한, 본 발명은 효율과 특이성이 높은 게놈 편집 시스템을 도입함으로써 세포를 유전자 변형하는 방법을 제공한다.

Description

게놈 편집 시스템 및 방법

본 발명은 유전자 조작 분야에 관한 것이다. 보다 상세하게는, 본 발명은 효율과 특이성이 높은 게놈 편집 방법에 관한 것이다. 보다 상세하게는, 본 발명은 고-특이성 Cas9 뉴클레아제 변이체에 의해 유기체의 게놈 내 타겟 서열에 대한 부위-특이적인 변형 효율을 높이는 방법에 관한 것이다.

규칙적으로 반복되는 짧은 회문구조 반복체 클러스터 및 CRISPR 부속 시스템 (clustered regularly interspaced short palindromic repeats and CRISPR associated system, CRISPR/Cas9)은 가장 인기있는 게놈 편집 툴이다. 이 시스템에서, Cas9 단백질은 gRNA의 안내 하에 특정 DNA 서열을 절단하여, 이중 가닥 절단 (DSB)을 형성한다. DSB는 세포에서 DNA 손상을 복구하기 위해 비-상동적인 말단 연결 (NHEJ: non-homologous end joining) 및 상동적인 재조합 (HR)의 세포내 복구 기전을 활성화할 수 있으며, 이로써 복구 과정 중에 특정 DNA 서열이 편집된다. 현재, 가장 흔히 사용되는 Cas9 단백질은 스트렙토코커스 피오게네스 (Streptococcus pyogenes) 유래의 Cas9 (SpCas9)이다. CRISPR/Cas9 게놈 편집 시스템의 한가지 단점은 특이성이 낮고 오프-타겟 효과가 있다는 것으로, 이는 편집 시스템의 활용을 상당히 제한한다.

당해 기술 분야에서는 효율적이고 고-특이적인 게놈 편집이 가능한 방법과 툴이 여전히 필요한 실정이다.

일 측면에서, 본 발명은 세포 게놈에서 타겟 서열에 대해 부위-특이적인 변형을 수행하기 위한 게놈 편집 시스템으로서,

i) Cas9 뉴클레아제 변이체, 및 tRNA-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;

ii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 tRNA-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 및

iii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열과 tRNA-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는, 발현 구조체로부터 선택되는 하나 이상을 포함하며,

Cas9 뉴클레아제 변이체가 야생형 Cas9 뉴클레아제와 비교해 특이성이 더 높고,

가이드 RNA의 5' 말단이 tRNA의 3' 말단과 연결되고,

융합체가 세포에서 전사된 후 가이드 RNA의 5' 말단에서 절단되어, 5' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성되는, 게놈 편집 시스템을 제공한다.

제2 측면에서, 본 발명은, 세포의 게놈에서 타겟 서열에 대해 부위-특이적인 변형을 수행하기 위한 게놈 편집 시스템으로서,

i) Cas9 뉴클레아제 변이체, 및 리보자임-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;

ii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 리보자임-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 및

iii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열과 리보자임-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는, 발현 구조체로부터 선택되는 하나 이상을 포함하며,

가이드 RNA의 5' 말단이 제1 리보자임의 3' 말단과 연결되고,

제1 리보자임이 가이드 RNA의 5' 말단에서 융합체를 절단하도록 설계되어, 5' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성되는, 게놈 편집 시스템을 제공한다.

제3 측면에서, 본 발명은, 세포의 유전자 변형 방법, 본 발명의 게놈 편집 시스템을 세포에 도입하는 단계를 포함하며, 이로써 Cas9 뉴클레아제 변이체가 가이드 RNA에 의해 세포의 게놈 내 타겟 서열을 타겟화하여, 타겟 서열 내 하나 이상의 뉴클레오티드의 치환, 결손 및/또는 부가가 이루어지는, 세포의 유전자 변형 방법을 제공한다.

제4 측면에서, 본 발명은 본 발명의 방법에 의해 제조된 유전자 변형 세포를 포함하는 유전자 변형 유기체를 제공한다.

도 1은 U3 또는 U6를 이용하는 경우 여러가지 5' 말단 뉴클레오티드를 가진 타겟 서열에 대한 sgRNA 설계 전략을 도시한 것이다. A: tRNA와 융합하여, 타겟 서열의 5' 말단 뉴클레오티드를 고려하지 않고 sgRNA를 설계할 수 있다; B: tRNA-sgRNA 융합체에 대한 정확한 절단.
도 2는 WT SpCas9 (야생형 SpCas9), eSpCas9(1.0), eSpCas9(1.1), SpCas9-HF1의 타겟 클래스 (1)에 대한 편집 효율을 나타낸 것이다.
도 3은 WT SpCas9 (야생형 SpCas9), eSpCas9(1.0), eSpCas9(1.1), SpCas9-HF1의 타겟 클래스 (2)에 대한 편집 효율을 나타낸 것이다.
도 4는 U6 프로모터를 사용할 경우 sgRNA의 5' 말단에 위치한 추가의 뉴클레오티드가 편집 효율에 영향을 미친다는 것을 도시한 것이다.
도 5는 tRNA-sgRNA가 sgRNA와 비교해 OsMKK4 유전자 좌에 대한 편집 효율을 향상시키며, 높은 특이성을 유지할 수 있음을 나타낸 것이다.
도 6은 tRNA-sgRNA를 사용함으로써, OsCDKB2 유전자 좌에 대해 높은 특이성을 유지하면서도 편집 효율을 야생형 SpCas9의 수준으로 높일 수 있음을 나타낸 것이다.
도 7은 gRNA와 타겟 서열 간의 미스매치에 대한 Cas9 변이체의 편집 효율을 나타낸 것이다.
도 8은 인간 세포에서 tRNA-sgRNA가 eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율을 야생형 SpCas9의 수준으로 향상시킨다는 것을 나타낸 것이다.
도 9는 tRNA-sgRNA 융합체를 발현하기 위한 pUC57-U3-tRNA-sgRNA 벡터의 서열 구조를 나타낸 것이다.

1. 정의

본 발명에서, 달리 언급되지 않은 한, 본원에 사용되는 과학 용어 및 기술 용어는 당해 기술 분야의 당업자들이 일반적으로 이해하는 의미로 사용된다. 또한, 단백질 및 뉴클레오티드 화학, 분자 생물학, 세포 및 조직 배양, 미생물학, 면역학과 관련하여 본원에 사용되는 용어 및 실험 과정들은 모두 당해 기술 분야에서 일반적으로 사용되는 용어 및 통상적인 방법에 속한다. 예를 들어, 본원에 사용되는 표준 DNA 재조합 및 분자 클로닝 기술은 당해 기술 분야의 당업자들에게 잘 알려져 있으며, 다음과 같은 참조문헌들에 상세히 기술되어 있다: Sambrook，J.，Fritsch，E.F.and Maniatis，T.，Molecular Cloning：A Laboratory Manual；Cold Spring Harbor Laboratory Press：Cold Spring Harbor，1989. 또한, 본 발명에 대한 보다 나은 이해를 구하기 위해, 관련 용어에 대한 정의 및 설명을 이하 제공한다.

"Cas9 뉴클레아제" 및 "Cas9"은 본원에서 상호 호환적으로 사용되며, Cas 단백질 또는 이의 단편 (예, Cas9의 활성형의 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질) 등의, RNA 특이 뉴클레아제 (RNA directed nuclease)를 지칭한다. Cas9은 가이드 RNA의 안내 하에 DNA 타겟 서열을 타겟팅 및 절단하여 DNA 이중 가닥 절단 (DSB)을 형성하는, CRISPR/Cas (규칙적으로 반복되는 짧은 회문구조 반복체 클러스터 및 이의 부속 시스템) 게놈 편집 시스템의 구성 성분이다.

"가이드 RNA" 및 "gRNA"는 본원에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 crRNA와 tracrRNA 분자로 구성되며, crRNA는 혼성화하기 위한 타겟 서열에 충분히 상보적이며; CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.

본원에서, 용어 "tRNA" 및 "transfer RNA"는 본원에서 상호 호환적으로 아미노산을 운반 및 수송하는 기능을 가진 소분자 RNA를 지칭하기 위해 사용된다. tRNA 분자는 일반적으로 클로버 형태로 접히는 뉴클레오티드 약 70-90개로 된 단쇄로 이루어져 있다. 진핵생물의 경우, 게놈의 tRNA 유전자는 tRNA 전구체로 전사된 다음 RNase P 및 RNase Z에 의해 5' 및 3'의 부가적인 서열이 절단되어 성숙한 tRNA로 가공된다.

본원에서, 용어 "리보자임"은 트랜스포스페이트 및 포스포다이에스테르 결합의 가수분해 반응을 촉매함으로써, RNA의 절단 및 가공에 관여하는 촉매 기능을 가진 RNA 분자를 지칭한다.

본원에서, "게놈"은 핵에 존재하는 염색체 DNA 뿐만 아니라 세포 하위 구성 성분 (예, 미토콘드리아, 색소체)에 존재하는 기관 DNA를 포괄한다.

본원에서, "유기체"는 게놈 편집에 적합한 임의의 유기체를 포함한다. 예시적인 유기체로는, 비-제한적으로, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소, 고양이와 같은 포유류; 닭, 오리, 거위와 같은 가금류; 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩, 아라비돕시스 등과 같은 외떡잎 식물 및 쌍떡잎 식물 등의 식물이 있다.

"유전자 변형 유기체" 또는 "유전자 변형 세포"는 자신의 게놈에 외인성 폴리뉴클레오티드 또는 변형된 유전자 또는 발현 조절 서열을 포함하는, 유기체 또는 세포를 의미한다. 예를 들어, 외인성 폴리뉴클레오티드는 유기체 또는 세포의 게놈에 안정적으로 삽입되어, 이후 세대로 유전된다. 외인성 폴리뉴클레오티드는 단독으로 또는 재조합 DNA 구조체의 일부로서 게놈에 삽입될 수 있다. 변형된 유전자 또는 발현 조절 서열은 하나 또는 복수의 데옥시뉴클레오티드 치환, 결손 및 부가를 포함하는 유기체 또는 세포의 게놈 내 서열이다.

서열과 관련하여 용어 "외인성"은 외래 종으로부터 기원하거나, 또는 동일 종으로부터 유래되는 경우, 인간 개입을 고려하여 조성 및/또는 게놈 유전자 좌 측면에서 천연적인 상태로부터 실질적으로 변형된, 서열을 의미한다.

"폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 또는 "핵산 단편"은 상호 호환적으로 합성, 비-천연 또는 변형된 뉴클레오티드 염기를 선택적으로 포함하는, 단일 가닥 또는 이중 가닥의 RNA 또는 DNA로 된 폴리머를 지칭하기 위해 사용된다. 뉴클레오티드 (일반적으로 5'-모노포스페이트 형태로 발견됨)는 다음과 같이 단문자명으로 지칭된다: "A" = 아데닐레이트 또는 데옥시아데닐레이트 (각각 RNA 또는 DNA), "C" = 시티딜레이트 또는 데옥시시티딜레이트, "G" = 구아닐레이트 또는 데옥시구아닐레이트, "U" = 우리딜레이트, "T" = 데옥시티미딜레이트, "R" = 퓨린 (A 또는 G), "Y" = 피리미딘 (C 또는 T), "K" = G 또는 T, "H" = A 또는 C 또는 T, "I" = 이노신, "N" = 임의의 뉴클레오티드.

"폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 본원에서 상호 호환적으로 아미노산 잔기들로 된 폴리머를 지칭하기 위해 사용된다. 이들 용어는 하나 이상의 아미노산 잔기가 대응되는 천연 아미노산의 인공적인 화학 유사체인 아미노산 폴리머 뿐만 아니라 천연 아미노산 폴리머에도 적용된다. 용어 "폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 또한 비-제한적인 예로, 당화, 지질 결합, 황산화, 글루탐산 잔기의 감마-카르복시화, 하이드록시화 및 ADP-화라이보실화 (ribosylation) 등의 변형을 포함한다.

본원에서, "발현 구조체"는 재조합 벡터와 같이 유기체에서 대상 뉴클레오티드 서열을 발현시키기에 적합한 벡터를 의미한다. "발현"은 기능성 산물의 생성을 의미한다. 예를 들어, 뉴클레오티드 서열의 발현은 뉴클레오티드 서열의 전사 (예, 전사하여 mRNA 또는 기능성 RNA를 생성함) 및/또는 RNA를 단백질 전구체 또는 성숙한 단백질로 번역하는 것을 의미할 수 있다.

본 발명의 "발현 구조체"는 선형의 핵산 단편, 환형의 플라스미드, 바이러스 벡터 또는 일부 구현예에서 번역될 수 있는 RNA (예, mRNA)일 수 있다.

본 발명의 "발현 구조체"는 서로 다른 소스로부터 유래될 수 있는 대상 뉴클레오티드 서열 및 조절 서열, 또는 동일한 소스로부터 유래되지만 통상 천연적으로 발견되는 방식과는 다른 방식으로 정렬된 대상 뉴클레오티드 서열 및 조절 서열을 포함할 수 있다.

"조절 서열" 또는 "조절 인자"는 상호 호환적으로 사용되며, 조합된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는, 코딩 서열의 상류 (5' 비-코딩 서열), 내부 또는 하류 (3' 비-코딩 서열)에 위치하는, 뉴클레오티드 서열을 지칭한다. 조절 서열은, 비-제한적으로, 프로모터, 번역 리더 서열, 인트론 및 폴리아데닐화 인지 서열을 포함할 수 있다.

"프로모터"는 다른 핵산 단편의 전사를 통제할 수 있는 핵산 단편을 지칭한다. 본 발명의 일부 구현예에서, 프로모터는 세포로부터 유래되거나 또는 유래되지 않던 간에 세포에서 유전자의 전사를 통제할 수 있는 프로모터이다. 프로모터는 구성적인 프로모터 (constitutive promoter) 또는 조직-특이적인 프로모터 또는 발생-조절성 프로모터 (developmentally-regulated promoter) 또는 유도성 프로모터일 수 있다.

"구성적인 프로모터"는 대부분의 세포 타입들에서 대부분의 상황에서 유전자의 발현을 유도할 수 있는 프로모터를 지칭한다. "조직-특이적인 프로모터" 및 "조직-선호적인 프로모터"는 상호 호환적으로 사용되며, 선호적으로 발현되지만 하나의 조직 또는 장기에서만 반드시 발현되는 것은 아닌 프로모터를 지칭한다. "발생-조절성 프로모터"는 활성이 발생 이벤트에 의해 결정되는 프로모터를 지칭한다. "유도성 프로모터"는 내인성 또는 외인성 자극 (환경, 호르몬 또는 화학적 신호 등)에 반응하여 이와 작동가능하게 연결된 DNA 서열을 선택적으로 발현시킨다.

본원에서, 용어 "작동가능하게 연결된"은, 뉴클레오티드 서열의 전사가 전사 조절 인자에 의해 통제 및 조절되도록 조절 인자 (예, 비-제한적으로, 프로모터 서열, 전사 종결 서열 등)가 핵산 서열과 조합된 것을 의미한다. 조절 인자 영역을 핵산 분자와 작동가능하게 연결하는 기법들은 당해 기술 분야에 공지되어 있다.

핵산 분자 (예, 플라스미드, 선형의 핵산 단편, RNA 등) 또는 단백질을 유기체에 "도입"하는 것은, 핵산 또는 단백질을 사용해 핵산 또는 단백질이 세포에서 기능하도록 유기체의 세포를 형질전환하는 것을 의미한다. 본원에서, "형질전환"은 안정적인 형질전환 및 일시적인 형질전환을 모두 포함한다. "안정적인 형질전환"은 외인성 뉴클레오티드 서열을 게놈에 도입하여, 외래 유전자의 안정적인 유전을 달성하는 것을 의미한다. 안정적으로 형질전환되면, 외인성 핵산 서열이 유기체 및 이의 연속 후속 세대의 게놈에 안정적으로 삽입된다. "일시적인 형질전환"은 핵산 분자 또는 단백질이 세포에 도입되어, 외인성 유전자가 안정적으로 유전되지 않으면서 그 기능을 수행하는 것을 의미한다. 일시적인 형질전환의 경우, 외인성 핵산 서열이 게놈에 삽입되지 않는다.

2. 효율과 특이성이 높은 게놈 편집 시스템

Cas9 뉴클레아제 변이체 eSpCas9 (1.0) (K810A/K1003A/R1060A), Feng Zhang et al.의 eSpCas9(1.1) (K848A/K1003A/R1060A), 및 J. Keith Joung et al.에 의해 개발된 Cas9 뉴클레아제 변이체 SpCas9-HF1 (N497A/R661A/Q695A/Q926A)은 게놈 편집시 오프-타겟 비율을 현저하게 낮출 수 있으며, 즉 특이성이 높은 것으로, 보고된 바 있다. 그러나, 놀랍게도, 본 발명자들은, 이들 3종의 Cas9 뉴클레아제 변이체가, 높은 특이성을 가지면서도, 야생형 Cas9와 비교해 유전자 편집 효율이 훨씬 낮다는 것을, 확인하였다.

본 발명자들은, 가이드 RNA의 5' 말단에 tRNA를 융합함으로써, 높은 특이성을 유지하면서, 고-특이성 Cas9 뉴클레아제 변이체의 편집 효율을 심지어 야생형 수준까지 높일 수 있다는 것을, 놀랍게도 확인하였다.

임의 이론으로 제한하고자 하는 것은 아니나, 고 특이성 Cas9 뉴클레아제 변이체의 낮은 편집 효율은 가이드 RNA의 전사가 정확하게 개시될 수 있는 지의 여부와 관련있는 것으로 생각된다. 당해 기술 분야에서, 가이드 RNA를 생체내에서 생산하기 위해 통상적으로 사용되는 프로모터로는, 예를 들어, RNA 중합효소 III에 의해 전사가 구동되는 U6 또는 U3 snRNA 프로모터들이 있다. U6 프로모터는 G에서 전사를 개시하여야 하므로, 첫번째 뉴클레오티드가 A, C 또는 T인 타겟 서열의 경우, 전사되는 sgRNA의 5' 말단에 부가적인 G가 제공될 것이다. U3 프로모터는 A에서 전사를 개시하므로, 첫번째 뉴클레오티드가 G, C 또는 T인 타겟 서열의 경우, 부가적인 A가 전사되는 sgRNA의 5' 말단에 제공될 것이다. 본 발명자들은, 고-특이성 Cas9 뉴클레아제 변이체의 편집 효율이 sgRNA의 5' 말단에 부가적인 뉴클레오티드가 존재하는 경우에 감소된다는 것을 확인하였다. tRNA와 융합 전사함으로써, tRNA의 정확한 프로세싱 기전으로 인해 (tRNA 전구체의 5' 및 3'의 부가적인 서열을 정확하게 제거하여 성숙한 tRNA를 형성함), 5' 말단에 부가적인 뉴클레오티드가 없는 sgRNA를 심지어 U6 또는 U3 프로모터를 사용하여 쉽게 수득할 수 있으며, 타겟 서열의 첫번째 뉴클레오티드의 타입을 고려하지 않아도 된다. 이로써, 고 특이성 Cas9 뉴클레아제 변이체의 편집 효율을 개선할 수 있으며, 타겟 서열의 선택가능한 범위는 넓어질 수 있다. 또한, 어떤 이론으로 제한하고자 하는 것은 아니지만, tRNA와 융합하여 sgRNA의 발현 수준을 높일 수 있으며, 이는 고-특이성 Cas9 뉴클레아제 변이체의 편집 효율을 개선하는데에도 기여할 수 있다.

이에, 본 발명은 세포의 게놈에서 타겟 서열에 대해 부위-특이적인 변형을 수행하기 위한 게놈 편집 시스템으로서,

가이드 RNA의 5' 말단이 tRNA의 3' 말단과 연결되고,

융합체가 세포에서 전사된 다음 가이드 RNA의 5' 말단에서 절단되어, 5' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성되는, 게놈 편집 시스템을 제공한다.

일부 구현예에서, tRNA와 변형시킬 세포는 동일 종으로부터 유래된다.

구체적인 일부 구현예에서, tRNA는 다음과 같은 서열에 의해 코딩된다: aacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgca (서열번호 1).

tRNA-가이드 RNA 융합체의 설계는 당해 기술 분야의 당업자의 능력 내에서 이루어진다. 예를 들어, Xie et al., PNAS, Mar 17, 2015; vol. 112, no. 11, 3570-3575를 참조할 수 있다.

또한, 본 발명은 가이드 RNA 및 리보자임의 융합체를 고려한다. 본 발명에서 고-특이성 Cas9 뉴클레아제 변이체의 편집 효율이 sgRNA의 정확한 전사 개시와 관련있다는 발견 사실을 토대로, 특정 부위에서 RNA를 절단하는 리보자임의 능력을 이용함으로써, RNA와 리보자임의 융합체를 합리적으로 설계하여 5' 말단에 부가적인 뉴클레오티드 없이 sgRNA를 생산할 수 있으며, 그래서 고 특이성을 유지하면서도 편집 효율을 개선시킬 수 있다.

이에, 본 발명은 또한 세포의 게놈에서 타겟 서열에 대해 부위-특이적인 변형을 수행하기 위한 게놈 편집 시스템으로서,

가이드 RNA의 5' 말단이 제1 리보자임의 3' 말단과 연결되고,

일 구현예에서, 가이드 RNA의 3' 말단이 제2 리보자임의 5' 말단과 연결되고, 제2 리보자임이 융합체를 가이드 RNA의 3' 말단에서 절단하여, 3' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성된다.

제1 리보자임 또는 제2 리보자임의 설계는 당해 기술 분야의 당업자의 능력 내에서 이루어진다. 예를 들어, Gao et al., JIPB, Apr, 2014; Vol 56, Issue 4, 343-349를 참조할 수 있다.

일 특정 구현예에서, 제1 리보자임은 서열: 5'-(N)₆CTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTC-3' (서열번호 12)에 의해 코딩되며, 여기서 N은 독립적으로 A, G, C 및 T로부터 선택되고, (N)₆는 가이드 RNA의 5' 말단 위치에서 처음 뉴클레오티드 6개에 역순으로 상보적인 서열이다. 일 특정 구현예에서, 제2 리보자임은 서열: 5'-GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGAC-3' (서열번호 13)에 의해 코딩된다.

본 발명에서 야생형 Cas9 뉴클레아제와 비교해 특이성이 더 높은 Cas9 뉴클레아제 변이체는 다양한 종들의 Cas9으로부터, 예를 들어, 스트렙토코커스 피오게네스의 Cas9 (SpCas9, 서열번호 2의 뉴클레오티드 서열, 서열번호 3으로 표시되는 아미노산 서열)로부터 유래될 수 있다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체는, 서열번호 2의 855번 위치에 아미노산 치환을 포함하는, 서열번호 2의 변이체이다. 일부 특정 구현예에서, 855번 위치에서 아미노산 치환은 K855A이다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체는, 서열번호 2의 810, 1003 및 1060번 위치에 아미노산 치환들을 포함하는, 서열번호 2의 변이체이다. 일부 특정 구현예에서, 아미노산 치환은 각각 K810A, K1003A 및 R1060A이다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체는, 서열번호 2의 848, 1003 및 1060번 위치에 아미노산 치환들을 포함하는, 서열번호 2의 변이체이다. 일부 특정 구현예에서, 아미노산 치환은 각각 K848A, K1003A 및 R1060A이다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체는, 서열번호 2의 611, 695 및 926번 위치에 아미노산 치환들을 포함하는, 서열번호 2의 변이체이다. 일부 특정 구현예에서, 아미노산 치환은 각각 R611A, Q695A 및 Q926A이다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체는, 서열번호 2의 497, 611, 695 및 926번 위치에 아미노산 치환들을 포함하는, 서열번호 2의 변이체이다. 일부 특정 구현예에서, 아미노산 치환은 각각 N497A, R611A, Q695A 및 Q926A이다.

본 발명의 일부 특정 구현예에서, Cas9 뉴클레아제 변이체는 서열번호 4 (eSpCas9(1.0)), 서열번호 5 (eSpCas9(1.1)) 또는 서열번호 6 (SpCas9-HF1)에 나타낸 아미노산 서열을 포함한다.

본 발명의 일부 구현예에서, 본 발명의 Cas9 뉴클레아제 변이체는 핵 위치화 서열 (nuclear localization sequence, NLS)을 더 포함한다. 일반적으로, Cas9 뉴클레아제 변이체의 경우, 하나 이승의 NLS는, Cas9 뉴클레아제 변이체를 게놈 편집 기능을 위한 충분한 양으로 세포의 핵 내에 축적시킬 수 있을 만큼, 충분한 강도를 가져야 한다. 일반적으로, 핵 위치화 활성 강도는 NLS의 갯수 및 위치, Cas9 뉴클레아제 변이체에 사용된 하나 이상의 구체적인 NLS 또는 이들의 조합에 의해 결정된다.

본 발명의 일부 구현예에서, 본 발명의 Cas9 뉴클레아제 변이체에서 NLS는 N-말단 및/또는 C-말단에 위치할 수 있다. 일부 구현예에서, Cas9 뉴클레아제 변이체는 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. 일부 구현예에서, Cas9 뉴클레아제 변이체는 N-말단에 또는 근처에서 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. 일부 구현예에서, Cas9 뉴클레아제 변이체는 C-말단에 또는 그 근처에서 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. 일부 구현예에서, Cas9 뉴클레아제 변이체는, N-말단에 하나 이상의 NLS 및 C-말단에 하나 이상의 NLS와 같이, 이들의 조합을 포함한다. NLS가 하나 보다 많이 존재하는 경우, 각각의 NLS는 다른 NLS와 독립적으로 선택될 수 있다. 본 발명의 일부 바람직한 구현예에서, Cas9 뉴클레아제 변이체는 NLS를 2개 포함하며, 예를 들어, 2개의 NLS는 각각 N-말단과 C-말단에 위치한다.

일반적으로, NLS는 단백질의 표면에 노출되는 양으로 하전된 라이신 또는 아르기닌으로 된 짧은 서열 하나 이상으로 구성되지만, 다른 타입의 NLS도 당해 기술 분야에 공지되어 있다. NLS에 대한 비-제한적인 예로는 KKRKV (뉴클레오티드 서열 5'-AAGAAGAGAAAGGTC-3'), PKKKRKV (뉴클레오티드 서열 5'-CCCAAGAAGAAGAGGAAGGTG-3' 또는 CCAAAGAAGAAGAGGAAGGTT)，또는 SGGSPKKKRKV (뉴클레오티드 서열 5'- TCGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG -3') 등이 있다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체의 N-말단은 PKKKRKV로 표시되는 아미노산 서열을 가진 NLS를 포함한다. 본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체의 C-말단은 SGGSPKKKRKV로 표시되는 아미노산 서열을 가진 NLS를 포함한다.

아울러, 본 발명의 Cas9 뉴클레아제 변이체는 또한 편집할 DNA의 위치에 따라 세포질 위치화 서열, 엽록체 위치화 서열, 미토콘드리아 위치화 서열 등과 같은 다른 위치화 서열을 포함할 수 있다.

타겟 서열에서 효과적인 발현을 달성하기 위해, 본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열은 게놈-편집할 세포가 유래된 유기체에 대해 코돈-최적화된다.

코돈-최적화는 천연 서열의 코돈 하나 이상 (예, 코돈 약 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 50개 이상)을, 숙주 세포의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 치환함으로써, 천연 아미노산 서열을 유지하면서도, 대상 숙주 세포에서 발현을 강화하기 위해 핵산 서열을 변형하는 과정을 의미한다. 다양한 종들은 특정 아미노산의 일부 코돈들에 대해 특별한 편향성을 나타낸다. 코돈 편향성 (유기체들 간의 코돈 용법 차이)은 대개 메신저 RNA (mRNA)의 번역 효율과 연관성이 있으며, 이는 특히 번역되는 코돈의 특성 및 특정 트랜스퍼 RNA (tRNA) 분자의 이용가능성에 의존하는 것으로 보인다. 세포에서 선택된 tRNA의 선호성은 일반적으로 펩타이드 합성에서 가장 빈번하게 사용되는 코돈을 반영한다. 즉, 유전자는 코돈 최적화에 토대가 되는 소정의 유기체에서 유전자 발현을 최적화하기 위해 맞춤 조정될 수 있다. 코돈 용법 표는, 예를 들어 www.kazusa.orjp/codon/에서 이용가능한 "코돈 용법 데이타베이스"에서 쉽게 이용가능하며, 이러한 표는 여러가지 방식으로 수정될 수 있다. Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)을 참조한다.

본 발명의 시스템에 의해 게놈 편집될 수 있는 세포가 유래되는 유기체로는, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유류; 닭, 오리 및 거위와 같은 가금류; 외떡잎 식물 및 쌍떡잎 식물과 같은 식물, 예를 들어, 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩 및 아라비돕시스 탈리아나 등이 있으나, 이들로 제한되는 것은 아니다.

본 발명의 일부 특정 구현예에서, Cas9 뉴클레아제 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 서열번호 7 (eSpCas9(1.0)), 서열번호 8 (eSpCas9(1.1)) 또는 서열번호 9 (SpCas9-HF1)로 표시된다.

본 발명의 일부 구현예에서, 가이드 RNA는 싱글 가이드 RNA (sgRNA)이다. 소정의 타겟 서열에 따라 적합한 sgRNA를 구축하는 방법들이 당해 기술 분야에 공지되어 있다. 예를 들어, Wang, Y. et al. Simultaneous editing of three homoeoalleles in hexaploid bread wheat confers heritable resistance to powdery mildew. Nat. Biotechnol. 32, 947-951 (2014); Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013); Liang, Z. et al. Targeted mutagenesis in Zea mays using TALENs and the CRISPR/Cas system. J Genet Genomics. 41, 63-68 (2014)를 참조한다.

본 발명의 일부 구현예에서, Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열 및/또는 가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열은 프로모터와 같은 발현 조절 인자에 작동가능하게 연결된다.

본 발명에 사용될 수 있는 프로모터의 예로는 중합효소 (pol) I, pol II 또는 pol III 프로모터 등이 있으나, 이들로 제한되는 것은 아니다. pol I 프로모터의 예로는 닭 RNA pol I 프로모터가 있다. pol II 프로모터의 예로는 비-제한적으로 사이토메갈로바이러스 최 초기 (cytomegalovirus immediate early, CMV) 프로모터, 라우스 육종 바이러스 긴 말단 리피트 (rous sarcoma virus long terminal repeat, RSV-LTR) 프로모터 및 시미안 바이러스 40 (simian virus 40, SV40) 최 초기 프로모터가 있다. pol III 프로모터의 예로는 U6 프로모터 및 H1 프로모터가 있다. 메탈로티오네인 (metalothionein) 프로모터와 같은 유도성 프로모터도 사용될 수 있다. 프로모터에 대한 다른 예로는 T7 박테리오파지 프로모터, T3 박테리오파지 프로모터, β-갈락토시다제 프로모터 및 Sp6 박테리오파지 프로모터 등이 있다. 식물에 사용하는 경우, 사용될 수 있는 프로모터로는, 비-제한적으로, 콜리플라워 모자? 바이러스 35S 프로모터, 옥수수 Ubi-1 프로모터, 밀 U6 프로모터, 벼 U3 프로모터, 옥수수 U3 프로모터 및 벼 액틴 프로모터 등이 있다.

3. 세포의 유전자 변형 방법

다른 측면에서, 본 발명은, 본 발명의 게놈 편집 시스템을 세포에 도입하는 것을 포함하며, 이로써 Cas9 뉴클레아제 변이체가 가이드 RNA에 의해 세포의 게놈 내 타겟 서열을 타겟팅하여, 타겟 서열 내 하나 이상의 뉴클레오티드의 치환, 결손 및/또는 부가가 이루어지는, 세포의 유전자 변형 방법을 제공한다.

Cas9 및 가이드 RNA 복합체에 의해 인지 및 타겟팅될 수 있는 타겟 서열의 설계는 당해 기술 분야의 당업자의 기술적인 능력 내에서 이루어진다. 일반적으로, 타겟 서열은 가이드 RNA에 포함된 뉴클레오티드 약 20개로 된 리더 서열과 상보적인 서열이며, 이의 3' 말단은 프로토스페이서 인접 모티프 (protospacer adjacent motif, PAM) NGG와 바로 인접하게 위치한다.

예를 들어, 본 발명의 일부 구현예에서, 타겟 서열은 구조 5'-N_X-NGG-3'을 가지며, 여기서 N은 독립적으로 A, G, C 및 T로부터 선택되며; X는 14≤X≤30의 정수이며; NX는 X개의 연속적인 뉴클레오티드를 의미하며, NGG는 PAM 서열이다. 본 발명의 일부 특정 구현예에서, X는 20이다.

본 발명에서, 변형시킬 타겟 서열은 게놈 내 임의 위치, 예를 들어, 단백질-코딩 유전자와 같은 기능성 유전자 내에 위치할 수 있거나, 또는 예를 들어 프로모터 영역 또는 인핸서 영역과 같은 유전자 발현 조절 영역에 위치할 수 있으며, 따라서 유전자의 기능적인 변형 또는 유전자 발현의 변형이 달성될 수 있다.

세포의 타겟 서열에서의 치환, 결손 및/또는 부가는 T7EI, PCR/RE 또는 서열분석 방법에 의해, 예를 들어, Shan, Q., Wang, Y., Li, J. & Gao, C. Genome editing in rice and wheat using the CRISPR/Cas system. Nat. Protoc. 9, 2395-2410 (2014)의 방법에 의해 검출할 수 있다.

본 발명의 방법에서, 게놈 편집 시스템은 당해 기술 분야의 당업자들에게 널리 공지된 다양한 방법을 이용해 세포에 도입할 수 있다.

본 발명의 게놈 편집 시스템을 세포에 도입하는 방법으로는, 칼슘 포스페이트 형질감염, 프로토플라스트 융합 (protoplast fusion), 전기천공 (electroporation), 리포좀 형질감염, 미세주입법, 바이러스 감염 (예, 베큘로바이러스, 백시니아 바이러스, 아데노바이러스 및 기타 바이러스), 유전자 총 (particle bombardment), PEG-매개 프로토플라스트 형질전환 (PEG-mediated protoplast transformation) 또는 아그로박테리움-매개 형질전환 (agrobacterium-mediated transformation) 등이 있으나, 이들로 제한되는 것은 아니다.

본 발명의 방법으로 게놈 편집을 수행할 수 있는 세포는, 예를 들어, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유류; 닭, 오리 및 거위와 같은 가금류; 외떡잎 식물 및 쌍떡잎 식물과 같은 식물, 예를 들어, 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩 및 아라비돕시스 탈리아나 등으로부터 유래될 수 있다.

일부 구현예에서, 본 발명의 방법은 시험관내에서 수행된다. 예를 들어, 세포는 단리된 세포 (isolated cell)이다. 일부 다른 구현예에서, 본 발명의 방법은 생체내에서 수행될 수 있다. 예를 들어, 세포는 유기체의 체내 세포이며, 본 발명의 시스템은 예를 들어 바이러스-매개 방법을 이용해 세포에 생체내 도입될 수 있다. 일부 구현예에서, 세포는 생식 세포 (germ cell)이다. 일부 구현예에서, 세포는 체세포이다.

다른 측면에서, 본 발명은 본 발명의 방법에 의해 제조된 유전자 변형 세포를 포함하는 유전자 변형 유기체를 추가로 제공한다.

유기체로는, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유류; 닭, 오리 및 거위와 같은 가금류; 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩 및 아라비돕시스 탈리아나와 같은 외떡잎 식물 및 쌍떡잎 식물 등의 식물 등이 있으나, 이들로 제한되는 것은 아니다.

실시예

재료 및 방법

바이너리 발현 벡터 pJIT163 - SpCas9 , pJIT163 - eSpCas9 (1.0), pJIT163 -eSpCas9(1.1) 및 pJIT163 - SpCas9 -HF1 구축

SpCas9, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1 서열을 벼에 대해 코돈-최적화하였다. 주형으로서 pJIT163-SpCas9 플라스미드 (서열번호 10)에 대해 Fast MultiSite Mutagenesis System (TransGen)을 이용한 부위-특이적인 돌연변이 유발을 실시하여, SpCas9, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1을 수득하였다.

sgRNA 발현 벡터 구축

실험에 사용된 sgRNA 타겟 서열들을 아래 표 1에 나타낸다:

표 1. 타겟 유전자 및 sgRNA 타겟 서열

sgRNA	타겟 서열	Oligo -F	Oligo -R
OsCDKB2	AGGTCGGGGAGGGGACGTACGGG	GGCAAGGTCGGGGAGGGGACGTAC	AAACGTACGTCCCCTCCCCGACCT
OsMKK4	GACGTCGGCGAGGAAGGCCTCGG	GGCAGACGTCGGCGAGGAAGGCCT	AAACAGGCCTTCCTCGCCGACGTC
A1	CATGGTGGGGAAAGCTTGGAGGG	GGCACATGGTGGGGAAAGCTTGGA	AAACTCCAAGCTTTCCCCACCATG
A2	CCGGACGACGACGTCGACGACGG	GGCACCGGACGACGACGTCGACGA	AAACTCGTCGACGTCGTCGTCCGG
A3	TTGAAGTCCCTTCTAGATGGAGG	GGCATTGAAGTCCCTTCTAGATGG	AAACCCATCTAGAAGGGACTTCAA
A4	ACTGCGACACCCAGATATCGTGG	GGCAACTGCGACACCCAGATATCG	AAACCGATATCTGGGTGTCGCAGT
PDS	GTTGGTCTTTGCTCCTGCAGAGG	GGCAGTTGGTCTTTGCTCCTGCAG	AAACCTGCAGGAGCAAAGACCAAC

sgRNA 발현 벡터: pOsU3-CDKB2-sgRNA, pOsU3-MKK4-sgRNA, pOsU3-A1-sgRNA 뿐만 아니라 pOsU3-A2-sgRNA, pOsU3-A3-sgRNA, pOsU3-A4-sgRNA 및 pOsU3-PDS-sgRNA를 기존에 공지된 바와 같이 (Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688, 2013), pOsU3-sgRNA(Addgene ID53063)를 기초로 구축하였다.

tRNA-sgRNA 발현 벡터 구축

tRNA-sgRNA 발현 벡터는 pUC57-U3-tRNA-sgRNA 벡터 (서열번호 11, 도 6)를 토대로 구축하였다. pUC57-U3-tRNA-sgRNA를 BsaI로 절단한 다음 대응되는 oligo-F 및 oligo-R을 어닐링하여 선형 벡터로 연결함으로써 선형 벡터를 수득하였으며, 이후 단계는 sgRNA 발현 벡터의 구축 과정과 동일하였다.

표 2. tRNA-sgRNA 발현 벡터를 구축하기 위한 타겟 유전자 및 올리고뉴클레오티드 서열

sgRNA	타겟 서열	Oligo-F	Oligo-R
OsCDKB2	AGGTCGGGGAGGGGACGTACGGG	TGCAAGGTCGGGGAGGGGACGTAC	AAACGTACGTCCCCTCCCCGACCT
OsMKK4	GACGTCGGCGAGGAAGGCCTCGG	TGCAGACGTCGGCGAGGAAGGCCT	AAACAGGCCTTCCTCGCCGACGTC
A1	CATGGTGGGGAAAGCTTGGAGGG	TGCACATGGTGGGGAAAGCTTGGA	AAACTCCAAGCTTTCCCCACCATG
A2	CCGGACGACGACGTCGACGACGG	TGCACCGGACGACGACGTCGACGA	AAACTCGTCGACGTCGTCGTCCGG
A3	TTGAAGTCCCTTCTAGATGGAGG	TGCATTGAAGTCCCTTCTAGATGG	AAACCCATCTAGAAGGGACTTCAA
A4	ACTGCGACACCCAGATATCGTGG	TGCACTGCGACACCCAGATATCG	AAACCGATATCTGGGTGTCGCAGT
PDS	GTTGGTCTTTGCTCCTGCAGAGG	TGCAGTTGGTCTTTGCTCCTGCAG	AAACCTGCAGGAGCAAAGACCAAC

프로토플라스트 분석

본 실험에서는 벼 품종 니폰바레 (nipponbare)를 사용하였다. 프로토플라스트 형질전환을 후술한 바와 같이 수행하였다. 형질전환은 PEG-매개 형질감염에 의해 각 플라스미드 10 ㎍을 사용해 수행하였다. 프로토플라스트를 48시간 후 수집하고, PCR-RE 분석을 위해 DNA를 추출하였다.

벼 프로토플라스트의 준비 및 형질전환

1) 모종의 잎집 (leaf sheath)을 프로토플라스트 분리에 사용하였으며, 날카로운 칼로 약 0.5 mm 폭으로 절단하였다.

2) 절단 즉시, 0.6M 만니톨 용액에 넣고, 10분간 암 조건 하에 두었다.

3) 만니톨 용액을 여과 제거하고, 산물을 효소분해 용액으로 옮긴 다음 30분간 인큐베이션하였다.

4) 효소분해는 천천히 교반하면서 (탈색 셰이커 (decolorization shaker), 속도 10) 암 조건 하에 5-6시간 동안 수행하였다.

5) 효소분해가 완료되면, 동일 부피의 W5를 첨가하고, 10초간 수평 교반 (horizontal shake)하여 프로토플라스트를 분리시하였다.

6) 프로토플라스트를 40 ㎛ 나일론 막을 사용해 50 ml 둥근 바닥 원심분리관으로 여과하여 수집한 다음, W5 용액으로 헹구었다.

7) 3분간 250 g로 수평 원심분리하여 프로토플라스트를 침전시키고, 상층액을 제거하였다.

8) 프로토플라스트에 W5 10 ml을 첨가하여 재현탁한 다음 250 g로 3분간 원심분리한 다음 상층액을 제거하였다.

9) 적량의 MMG 용액을 첨가하여 프로토플라스트를 2 x 10⁶/ml 농도로 재현탁하였다.

주의: 상기한 단계들 모두 실온에서 수행하였다.

10) 플라스미드 10-20 ㎍, 프로토플라스트 200 ㎕ (세포 약 4 x 10⁵개) 및 신선한 PEG 용액 220 ㎕를 2 ml 원심분리 관에 넣어 혼합한 다음, 실온 및 암 조건에서 10-20분간 두어 형질전환을 유도하였다.

11) 형질전환을 완료한 후, W5 용액 880 ㎕를 천천히 첨가하고, 시험관을 부드럽게 상하 뒤집어 혼합한 다음 3분간 250 g에서 수평 원심분리하였으며, 상층액을 제거하였다.

12) 산물을 WI 용액 2 ml에 재현탁하고, 6웰 플레이트로 옮긴 다음 실온 (또는 25℃) 및 암 조건에서 배양하였다. 프로토플라스트 게놈 DNA를 추출하기 위해, 산물을 48시간 동안 배양하여야 한다.

심층 서열분석 (depth sequencing)에 의한 돌연변이 동정

심층 서열분석은 Liang, Z., Chen, K., Li, T., Zhang, Y., Wang, Y., Zhao, Q., Liu, J., Zhang, H., Liu, C., Ran, Y., et al. (2017). Efficient DNA-free genome editing of bread wheat using CRISPR/Cas9 ribonucleoprotein complexes. Nature Communications 8, 14261을 참조하여 수행하였다.

실시예 1: WT SpCas9와 이의 변이체의 타겟 부위에 대한 편집능 비교

WT SpCas9, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1을 각각 일시적인 발현 벡터 pJIT163에서 구축하였으며, WT SpCas9, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 발현은 옥수수 유비퀴틴 유전자 프로모터에 의해 작동시켰다. sgRNA는 pOsU3-sgRNA 벡터에 구축하였으며, sgRNA의 발현은 OsU3 프로모터에 의해 작동시켰다. 벼 프로토플라스트를 형질전환하고, PCR-RE 분석을 위해 프로토플라스트 DNA를 추출하여 돌연변이 효율을 평가하였다. 야생형 SpCas9과 eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 능력 차이를 비교하기 위해, 타겟 부위 5곳 (A1, A2, A3, A4 및 PDS, 도 2 및 도 3 참조)을 선정하였다.

OsU3 프로모터는 뉴클레오티드 A를 이용해 전사를 개시하므로, 타겟 부위에 대한 sgRNA 발현 벡터 설계는 다음과 같이 2가지 경우로 나눌 수 있다:

(1) 바람직한 sgRNA 타겟 서열 (20bp)의 5' 말단에 위치한 첫번째 뉴클레오티드가 G/T/C 중 어느 하나인 경우, U3 프로모터는 A를 사용해 전사를 개시하므로, 전사되는 sgRNA의 5' 말단에 부가적인 A가 첨가될 것이며, 그래서 전사되는 sgRNA는 타겟 서열과 완전히 일치할 순 없다. sgRNA 발현 벡터는 도 1의 U3+AN₂₀과 같이 구축할 수 있으며, N₂₀은 타겟 서열이고, A는 5' 말단에 위치한 부가적인 뉴클레오티드이다.

(2) 바람직한 sgRNA 타겟 서열 (20bp)의 5' 말단에 위치한 첫번째 뉴클레오티드가 A인 경우, 전사 개시를 위해 U3 프로모터가 사용될 수 있으며, 즉 전사되는 sgRNA의 5' 말단에 부가적인 뉴클레오티드가 존재하지 않을 것이다. sgRNA 발현 벡터는 도 1의 U3+AN₁₉와 같이 구축할 수 있으며, AN₁₉는 타겟 서열이다.

선택한 타겟 부위 A1, A2, A3 및 PDS는 클래스 (1)의 타겟 부위에 속하고, 타겟 부위 A4는 클래스 (2)의 타겟 부위에 속한다.

실험 결과, 클래스 (1)의 타겟 부위에 대한 eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율은 매우 낮은 것으로, 확인되었다 (도 2). 클래스 (2)의 타겟 부위에 대한, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율은, WT SpCas9의 편집 효율과 차이가 현저하지 않았다. 이는, 전사에 의해 생성된 sgRNA의 5' 말단에 위치한 부가적인 뉴클레오티드가 eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율을 낮출 수 있다는 것을, 보여준다.

OsU3 프로모터와 마찬가지로, 옥수수 U6 프로모터 (TaU6)는 뉴클레오티드 G를 사용해 전사를 개시하므로, 타겟 부위에 대한 sgRNA 발현 벡터의 설계는 다음과 같이 2가지 경우로 나눌 수 있다:

(1) 바람직한 sgRNA 타겟 서열 (20bp)의 5' 말단에 위치한 첫번째 뉴클레오티드가 A/T/C 중 어느 하나인 경우, U6 프로모터는 G를 사용해 전사를 개시하므로, 전사되는 sgRNA의 5' 말단에 부가적인 A가 첨가될 것이며, 또한 전사된 sgRNA는 타겟 서열과 완전히 일치할 순 없다.

(2) 바람직한 sgRNA 타겟 서열 (20bp)의 5' 말단에 위치한 첫번째 뉴클레오티드가 G인 경우, 전사 개시를 위해 U6 프로모터가 사용될 수 있으며, 따라서 전사되는 sgRNA의 5' 말단 위치에 부가적인 뉴클레오티드는 존재하지 않을 것이다.

OsPDS 타겟 부위는 클래스 (2)의 타겟 부위에 속한다. TaU6 프로모터를 사용해 OsPDS 타겟 부위로부터 GN₁₉ 및 GN₂₀ sgRNA의 전사를 작동시킬 수 있었으며, GN₂₀은 클래스 (1)의 타겟 부위를 모방할 수 있으며, 즉 sgRNA의 5' 말단에 부가적인 G를 가진다.

표 3. TaU6-sgRNA 발현 벡터를 구축하기 위한 타겟 유전자 및 올리고뉴클레오티드 서열

sgRNA	타겟 서열	Oligo -F	Oligo -R
OsPDS-GN₁₉	GTTGGTCTTTGCTCCTGCAGAGG	GGCGTTGGTCTTTGCTCCTGCAG	AAACCTGCAGGAGCAAAGACCAA
OsPDS-GN₂₀	GTTGGTCTTTGCTCCTGCAGAGG	GGCGGTTGGTCTTTGCTCCTGCAG	AAACCTGCAGGAGCAAAGACCAAC

그 결과, sgRNA의 5' 말단에 위치한 부가적인 하나의 G가 eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율을 현저하게 감소시키는 것으로 확인되었다 (도 2).

실시예 2: tRNA - sgRNA 융합체에 의한 Cas9 변이체의 편집 효율 강화

실시예 1의 결과에 따르면, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율에 영향을 미치는 주된 인자는 sgRNA의 정확한 개시 여부이다.

기존에 보고된 바에 따르면, sgRNA의 5' 말단에 tRNA를 융합하면, sgRNA의 발현이 상향 조절되고 sgRNA의 5' 말단에서 정확하게 절단될 수 있으며, 따라서 sgRNA의 5' 말단 위치에 부가적인 뉴클레오티드가 존재하는 것을 피할 수 있다 (Xie K, Minkenberg B, Yang Y. Boosting CRISPR/Cas9 multiplex editing capability with the endogenous tRNA-processing system. Proc Natl Acad Sci U S A. 2015 Mar 17;112(11):3570-5. doi: 10.1073/pnas.1420294112. Epub 2015 Mar 2.).

실시예 1에서 각 타겟 부위에 대한 sgRNA에 tRNA를 융합시키고, OsU3 프로모터의 통제 하에 발현시켰다. 실험은 sgRNA 대신 tRNA-sgRNA를 사용해 실시예 1의 방법으로 수행하였다. 도 2에 나타낸 바와 같이, 타겟 부위 A1, A2, A3 및 PDS에 대한 eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율은, sgRNA 대신 tRNA-sgRNA를 사용하였을 때 현저하게 증가되었다.

실시예 3: tRNA - sgRNA 융합체가 Cas9 변이체의 편집 특이성에 미치는 효과

3.1 벼 OsMKK4 타겟 부위

sgRNA 및 tRNA-sgRNA를 설계하기 위해, 벼 유전자 MKK4에서 타겟 부위 GACGTCGGCGAGGAAGGCCTCGG를 선택하였다. 이 타겟 부위는 도 5에 나타낸 바와 같이 가능한 오프-타겟 부위 (off-target site)를 2곳 가지고 있다. sgRNA 또는 tRNA-sgRNA를 발현하기 위한 벡터 및 WTSpCas9, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1을 발현하기 위한 벡터를 각각 벼 프로토플라스트에 공동-형질전환하였다. 형질전환하고 2일 후, 프로토플라스트 DNA를 추출하고, 특이적인 프라이머를 사용해 타겟 부위와 오프-타겟 부위의 게놈 단편들을 증폭시켰다. 이들 3가지 부위에서 돌연변이 비율을 2세대 서열분석 기법으로 분석하였다.

실험 결과는 도 5에 나타낸다:

sgRNA를 사용한 경우, WTSpCas9와 비교해, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1은 오프-타겟 효과가 현저하게 낮았지만, 편집 효율이 현저하게 낮았다.

tRNA-sgRNA를 사용한 경우, 각 그룹은 편집 효율이 증가하였으며, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1은 비교적 높은 특이성을 유지할 수 있었다. 특히 SpCas9-HF1의 경우, 2개의 오프-타겟 부위 모두에서 돌연변이를 매우 낮은 수준으로 검출할 수 있었다. 즉, tRNA-sgRNA와 SpCas9-HF1의 조합은 효율과 특이성이 높은 게놈 편집에 특히 적합하다.

3.2 벼 OsCDKB2 타겟 부위

sgRNA를 설계하기 위해 벼 유전자 OsCDKB2에서 타겟 부위 AGGTCGGGGAGGGGACGTACGGG를 선택하였다. 이 타겟 부위는 도 6에 나타낸 바와 같이 가능성있는 오프-타겟 부위 3곳을 가지고 있다. sgRNA 또는 tRNA-sgRNA를 발현하기 위한 벡터 및 WTSpCas9, eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1을 발현하기 위한 벡터를 각각 벼 프로토플라스트에 공동-형질전환하였다. 형질전환한 지 2일 후, 프로토플라스트 DNA를 추출하고, 특이적인 프라이머를 사용해 타겟 부위와 오프-타겟 부위의 게놈 단편들을 증폭시켰다. 이들 4가지 부위에서 돌연변이 비율을 심층 서열분석으로 분석하였다.

실험 결과를 도 6에 나타낸다. 타겟 부위에 대한 eSpCas9(1.0), eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율은, sgRNA 대신 tRNA-sgRNA를 사용함으로써, 효과적으로 증가되었다. 특히, SpCas9-HF1의 편집 효율을 야생형 수준으로 복원할 수 있었으며, 고 특이성도 유지할 수 있었다. 이 타겟 서열은 U3 프로모터에 의해 정확하게 전사를 개시할 수 있는 A로 시작하기 때문에, 편집 효율 증가는 tRNA와의 융합으로 인한 sgRNA의 발현 수준 증가로 인한 것일 수 있다.

실시예 4: gRNA 및 타겟 서열 간의 미스매치에 대한 Cas9 변이체의 편집 특이성

벼 유전자 MKK4에서 타겟 부위 GACGTCGGCGAGGAAGGCCTCGG에 대해 sgRNA를 설계할 경우, 인접 염기 2개의 미스매치를 인공적으로 도입하였다 (퓨린의 경우 퓨린으로, 피리미딘의 경우 피리미딘으로). sgRNA가 타겟 부위와 완전히 매칭되지 않는 상황에서 편집을 검출하였다. 편집이 검출된다면, 오프-타겟으로 간주한다. 실험은 실시예 3.1과 비슷한 방식으로 수행하였다.

실험 결과를 도 7에 나타내었다. tRNA-sgRNA를 사용한 경우, SpCas9 변이체는 gRNA와 타겟 서열 간의 미스매치 (특히 양쪽 말단에 인접한 미스매치)에 대해 높은 민감성을 나타내었다.

실시예 5: 인간 배아 신장 293 세포에서 Cas9 변이체의 편집 효율과 특이성

인간 VEGFA 유전자 내 타겟 서열 GGTGAGTGAGTGTGTGCGTGTGG에 대해 sgRNA를 설계하였다. U6:sgRNA-GN₁₉ 및 U6:tRNA-sgRNA-N₂₀은, U6 프로모터를 사용해 전사되는 sgRNA가 20 nt 길이이고 타겟 서열과 완전히 매칭되는 것이며; U6:sgRNA-GN₂₀은 U6 프로모터를 사용해 전사되는 sgRNA가 20 nt 길이이고 5' 말단에 부가적인 G를 포함하는 것이다.

T7E1 분석 결과 (도 8), WT Cas9은 여러가지 전략으로 전사되는 sgRNA에 대해 비슷한 편집 효율을 나타내었다. 그러나, eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율은, sgRNA의 5' 말단에 부가적인 뉴클레오티드가 존재할 경우, 현저하게 감소하였다. tRNA-sgRNA 융합체를 사용한 경우, eSpCas9(1.1) 및 SpCas9-HF1의 편집 효율이 WT Cas9의 수준으로 또는 심지어 더 높은 수준으로 증가하였다.

편집 특이성과 관련하여, WT Cas9은 오프 타겟 1 및 오프 타겟 2 둘다에 대해 오프-타겟 편집을 수행하였다. eSpCas9(1.1) 및 SpCas9-HF1은 tRNA-sgRNA 융합체를 사용하였을 때 오프-타겟 편집을 이행하지 않았다.

표 4. sgRNA 발현 벡터를 구축하기 위한 타겟 유전자 및 올리고뉴클레오티드 서열

sgRNA	타겟 서열	Oligo -F	Oligo -R
VEGFA-GN₁₉	GGTGAGTGAGTGTGTGCGTGTGG	CACCGGTGAGTGAGTGTGTGCGTG	AAACCACGCACACACTCACTCACC
VEGFA-GN₂₀	GGTGAGTGAGTGTGTGCGTGTGG	CACCGGGTGAGTGAGTGTGTGCGTG	AAACCACGCACACACTCACTCACCC
VEGFA-tRNA-N₂₀	GGTGAGTGAGTGTGTGCGTGTGG	CACCGaacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgcaGGTGAGTGAGTGTGTGCGTG	AAACCACGCACACACTCACTCACCtgcaccagccgggaatcgaacccgggtctgtaccgtggcagggtactattctaccactagaccactggtgctttgttC

SEQUENCE LISTING <110> Institute of Genetics and Developmental Biology, Chinese Academy of Sciences <120> Genome editing method <130> P20182391 <140> PCT/CN2018/076949 <141> 2018-02-22 <160> 13 <170> PatentIn version 3.5 <210> 1 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> tRNA encoding sequence <400> 1 aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60 gattcccggc tggtgca 77 <210> 2 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> SpCas9 nucleotide sequence <400> 2 atggccccta agaagaagag aaaggtcggt attcacggcg ttcctgcggc gatggacaag 60 aagtatagta ttggtctgga cattgggacg aattccgttg gctgggccgt gatcaccgat 120 gagtacaagg tcccttccaa gaagtttaag gttctgggga acaccgatcg gcacagcatc 180 aagaagaatc tcattggagc cctcctgttc gactcaggcg agaccgccga agcaacaagg 240 ctcaagagaa ccgcaaggag acggtataca agaaggaaga ataggatctg ctacctgcag 300 gagattttca gcaacgaaat ggcgaaggtg gacgattcgt tctttcatag attggaggag 360 agtttcctcg tcgaggaaga taagaagcac gagaggcatc ctatctttgg caacattgtc 420 gacgaggttg cctatcacga aaagtacccc acaatctatc atctgcggaa gaagcttgtg 480 gactcgactg ataaggcgga ccttagattg atctacctcg ctctggcaca catgattaag 540 ttcaggggcc attttctgat cgagggggat cttaacccgg acaatagcga tgtggacaag 600 ttgttcatcc agctcgtcca aacctacaat cagctctttg aggaaaaccc aattaatgct 660 tcaggcgtcg acgccaaggc gatcctgtct gcacgccttt caaagtctcg ccggcttgag 720 aacttgatcg ctcaactccc gggcgaaaag aagaacggct tgttcgggaa tctcattgca 780 ctttcgttgg ggctcacacc aaacttcaag agtaattttg atctcgctga ggacgcaaag 840 ctgcagcttt ccaaggacac ttatgacgat gacctggata accttttggc ccaaatcggc 900 gatcagtacg cggacttgtt cctcgccgcg aagaatttgt cggacgcgat cctcctgagt 960 gatattctcc gcgtgaacac cgagattaca aaggccccgc tctcggcgag tatgatcaag 1020 cgctatgacg agcaccatca ggatctgacc cttttgaagg ctttggtccg gcagcaactc 1080 ccagagaagt acaaggaaat cttctttgat caatccaaga acggctacgc tggttatatt 1140 gacggcgggg catcgcagga ggaattctac aagtttatca agccaattct ggagaagatg 1200 gatggcacag aggaactcct ggtgaagctc aatagggagg accttttgcg gaagcaaaga 1260 actttcgata acggcagcat ccctcaccag attcatctcg gggagctgca cgccatcctg 1320 agaaggcagg aagacttcta cccctttctt aaggataacc gggagaagat cgaaaagatt 1380 ctgacgttca gaattccgta ctatgtcgga ccactcgccc ggggtaattc cagatttgcg 1440 tggatgacca gaaagagcga ggaaaccatc acaccttgga acttcgagga agtggtcgat 1500 aagggcgctt ccgcacagag cttcattgag cgcatgacaa attttgacaa gaacctgcct 1560 aatgagaagg tccttcccaa gcattccctc ctgtacgagt atttcactgt ttataacgaa 1620 ctcacgaagg tgaagtatgt gaccgaggga atgcgcaagc ccgccttcct gagcggcgag 1680 caaaagaagg cgatcgtgga ccttttgttt aagaccaatc ggaaggtcac agttaagcag 1740 ctcaaggagg actacttcaa gaagattgaa tgcttcgatt ccgttgagat cagcggcgtg 1800 gaagacaggt ttaacgcgtc actggggact taccacgatc tcctgaagat cattaaggat 1860 aaggacttct tggacaacga ggaaaatgag gatatcctcg aagacattgt cctgactctt 1920 acgttgtttg aggataggga aatgatcgag gaacgcttga agacgtatgc ccatctcttc 1980 gatgacaagg ttatgaagca gctcaagaga agaagataca ccggatgggg aaggctgtcc 2040 cgcaagctta tcaatggcat tagagacaag caatcaggga agacaatcct tgactttttg 2100 aagtctgatg gcttcgcgaa caggaatttt atgcagctga ttcacgatga ctcacttact 2160 ttcaaggagg atatccagaa ggctcaagtg tcgggacaag gtgacagtct gcacgagcat 2220 atcgccaacc ttgcgggatc tcctgcaatc aagaagggta ttctgcagac agtcaaggtt 2280 gtggatgagc ttgtgaaggt catgggacgg cataagcccg agaacatcgt tattgagatg 2340 gccagagaaa atcagaccac acaaaagggt cagaagaact cgagggagcg catgaagcgc 2400 atcgaggaag gcattaagga gctggggagt cagatcctta aggagcaccc ggtggaaaac 2460 acgcagttgc aaaatgagaa gctctatctg tactatctgc aaaatggcag ggatatgtat 2520 gtggaccagg agttggatat taaccgcctc tcggattacg acgtcgatca tatcgttcct 2580 cagtccttcc ttaaggatga cagcattgac aataaggttc tcaccaggtc cgacaagaac 2640 cgcgggaagt ccgataatgt gcccagcgag gaagtcgtta agaagatgaa gaactactgg 2700 aggcaacttt tgaatgccaa gttgatcaca cagaggaagt ttgataacct cactaaggcc 2760 gagcgcggag gtctcagcga actggacaag gcgggcttca ttaagcggca actggttgag 2820 actagacaga tcacgaagca cgtggcgcag attctcgatt cacgcatgaa cacgaagtac 2880 gatgagaatg acaagctgat ccgggaagtg aaggtcatca ccttgaagtc aaagctcgtt 2940 tctgacttca ggaaggattt ccaattttat aaggtgcgcg agatcaacaa ttatcaccat 3000 gctcatgacg catacctcaa cgctgtggtc ggaacagcat tgattaagaa gtacccgaag 3060 ctcgagtccg aattcgtgta cggtgactat aaggtttacg atgtgcgcaa gatgatcgcc 3120 aagtcagagc aggaaattgg caaggccact gcgaagtatt tcttttactc taacattatg 3180 aatttcttta agactgagat cacgctggct aatggcgaaa tccggaagag accacttatt 3240 gagaccaacg gcgagacagg ggaaatcgtg tgggacaagg ggagggattt cgccacagtc 3300 cgcaaggttc tctctatgcc tcaagtgaat attgtcaaga agactgaagt ccagacgggc 3360 gggttctcaa aggaatctat tctgcccaag cggaactcgg ataagcttat cgccagaaag 3420 aaggactggg acccgaagaa gtatggaggt ttcgactcac caacggtggc ttactctgtc 3480 ctggttgtgg caaaggtgga gaagggaaag tcaaagaagc tcaagtctgt caaggagctc 3540 ctgggtatca ccattatgga gaggtccagc ttcgaaaaga atccgatcga ttttctcgag 3600 gcgaagggat ataaggaagt gaagaaggac ctgatcatta agcttccaaa gtacagtctt 3660 ttcgagttgg aaaacggcag gaagcgcatg ttggcttccg caggagagct ccagaagggt 3720 aacgagcttg ctttgccgtc caagtatgtg aacttcctct atctggcatc ccactacgag 3780 aagctcaagg gcagcccaga ggataacgaa cagaagcaac tgtttgtgga gcaacacaag 3840 cattatcttg acgagatcat tgaacagatt tcggagttca gtaagcgcgt catcctcgcc 3900 gacgcgaatt tggataaggt tctctcagcc tacaacaagc accgggacaa gcctatcaga 3960 gagcaggcgg aaaatatcat tcatctcttc accctgacaa accttggggc tcccgctgca 4020 ttcaagtatt ttgacactac gattgatcgg aagagataca cttctacgaa ggaggtgctg 4080 gatgcaaccc ttatccacca atcgattact ggcctctacg agacgcggat cgacttgagt 4140 cagctcgggg gggataagag accagcggca accaagaagg caggacaagc gaagaagaag 4200 aagtag 4206 <210> 3 <211> 1401 <212> PRT <213> Streptococcus pyogenes <400> 3 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1010 1015 1020 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1025 1030 1035 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1040 1045 1050 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1055 1060 1065 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1070 1075 1080 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1085 1090 1095 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1100 1105 1110 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1115 1120 1125 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1130 1135 1140 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1145 1150 1155 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1160 1165 1170 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1175 1180 1185 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1190 1195 1200 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1205 1210 1215 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1220 1225 1230 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1250 1255 1260 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1265 1270 1275 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1280 1285 1290 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1295 1300 1305 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1310 1315 1320 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1325 1330 1335 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1340 1345 1350 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1355 1360 1365 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1370 1375 1380 Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1385 1390 1395 Lys Lys Lys 1400 <210> 4 <211> 1401 <212> PRT <213> Artificial Sequence <220> <223> eSpCas9(1.0) amino acid sequence <400> 4 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Ala Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Ala Leu Glu Ser 1010 1015 1020 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1025 1030 1035 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1040 1045 1050 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1055 1060 1065 Leu Ala Asn Gly Glu Ile Arg Lys Ala Pro Leu Ile Glu Thr Asn 1070 1075 1080 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1085 1090 1095 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1100 1105 1110 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1115 1120 1125 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1130 1135 1140 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1145 1150 1155 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1160 1165 1170 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1175 1180 1185 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1190 1195 1200 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1205 1210 1215 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1220 1225 1230 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1250 1255 1260 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1265 1270 1275 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1280 1285 1290 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1295 1300 1305 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1310 1315 1320 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1325 1330 1335 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1340 1345 1350 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1355 1360 1365 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1370 1375 1380 Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1385 1390 1395 Lys Lys Lys 1400 <210> 5 <211> 1401 <212> PRT <213> Artificial Sequence <220> <223> eSpCas9(1.1) amino acid sequence <400> 5 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Ala Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Ala Leu Glu Ser 1010 1015 1020 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1025 1030 1035 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1040 1045 1050 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1055 1060 1065 Leu Ala Asn Gly Glu Ile Arg Lys Ala Pro Leu Ile Glu Thr Asn 1070 1075 1080 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1085 1090 1095 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1100 1105 1110 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1115 1120 1125 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1130 1135 1140 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1145 1150 1155 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1160 1165 1170 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1175 1180 1185 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1190 1195 1200 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1205 1210 1215 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1220 1225 1230 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1250 1255 1260 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1265 1270 1275 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1280 1285 1290 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1295 1300 1305 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1310 1315 1320 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1325 1330 1335 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1340 1345 1350 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1355 1360 1365 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1370 1375 1380 Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1385 1390 1395 Lys Lys Lys 1400 <210> 6 <211> 1401 <212> PRT <213> Artificial Sequence <220> <223> SpCas9-HF1 amino acid sequence <400> 6 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Ala Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Ala Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Ala Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Ala Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1010 1015 1020 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1025 1030 1035 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1040 1045 1050 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1055 1060 1065 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1070 1075 1080 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1085 1090 1095 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1100 1105 1110 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1115 1120 1125 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1130 1135 1140 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1145 1150 1155 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1160 1165 1170 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1175 1180 1185 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1190 1195 1200 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1205 1210 1215 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1220 1225 1230 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1250 1255 1260 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1265 1270 1275 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1280 1285 1290 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1295 1300 1305 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1310 1315 1320 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1325 1330 1335 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1340 1345 1350 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1355 1360 1365 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1370 1375 1380 Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1385 1390 1395 Lys Lys Lys 1400 <210> 7 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> eSpCas9(1.0) codon-optimized nucleotide sequence <400> 7 atggccccta agaagaagag aaaggtcggt attcacggcg ttcctgcggc gatggacaag 60 aagtatagta ttggtctgga cattgggacg aattccgttg gctgggccgt gatcaccgat 120 gagtacaagg tcccttccaa gaagtttaag gttctgggga acaccgatcg gcacagcatc 180 aagaagaatc tcattggagc cctcctgttc gactcaggcg agaccgccga agcaacaagg 240 ctcaagagaa ccgcaaggag acggtataca agaaggaaga ataggatctg ctacctgcag 300 gagattttca gcaacgaaat ggcgaaggtg gacgattcgt tctttcatag attggaggag 360 agtttcctcg tcgaggaaga taagaagcac gagaggcatc ctatctttgg caacattgtc 420 gacgaggttg cctatcacga aaagtacccc acaatctatc atctgcggaa gaagcttgtg 480 gactcgactg ataaggcgga ccttagattg atctacctcg ctctggcaca catgattaag 540 ttcaggggcc attttctgat cgagggggat cttaacccgg acaatagcga tgtggacaag 600 ttgttcatcc agctcgtcca aacctacaat cagctctttg aggaaaaccc aattaatgct 660 tcaggcgtcg acgccaaggc gatcctgtct gcacgccttt caaagtctcg ccggcttgag 720 aacttgatcg ctcaactccc gggcgaaaag aagaacggct tgttcgggaa tctcattgca 780 ctttcgttgg ggctcacacc aaacttcaag agtaattttg atctcgctga ggacgcaaag 840 ctgcagcttt ccaaggacac ttatgacgat gacctggata accttttggc ccaaatcggc 900 gatcagtacg cggacttgtt cctcgccgcg aagaatttgt cggacgcgat cctcctgagt 960 gatattctcc gcgtgaacac cgagattaca aaggccccgc tctcggcgag tatgatcaag 1020 cgctatgacg agcaccatca ggatctgacc cttttgaagg ctttggtccg gcagcaactc 1080 ccagagaagt acaaggaaat cttctttgat caatccaaga acggctacgc tggttatatt 1140 gacggcgggg catcgcagga ggaattctac aagtttatca agccaattct ggagaagatg 1200 gatggcacag aggaactcct ggtgaagctc aatagggagg accttttgcg gaagcaaaga 1260 actttcgata acggcagcat ccctcaccag attcatctcg gggagctgca cgccatcctg 1320 agaaggcagg aagacttcta cccctttctt aaggataacc gggagaagat cgaaaagatt 1380 ctgacgttca gaattccgta ctatgtcgga ccactcgccc ggggtaattc cagatttgcg 1440 tggatgacca gaaagagcga ggaaaccatc acaccttgga acttcgagga agtggtcgat 1500 aagggcgctt ccgcacagag cttcattgag cgcatgacaa attttgacaa gaacctgcct 1560 aatgagaagg tccttcccaa gcattccctc ctgtacgagt atttcactgt ttataacgaa 1620 ctcacgaagg tgaagtatgt gaccgaggga atgcgcaagc ccgccttcct gagcggcgag 1680 caaaagaagg cgatcgtgga ccttttgttt aagaccaatc ggaaggtcac agttaagcag 1740 ctcaaggagg actacttcaa gaagattgaa tgcttcgatt ccgttgagat cagcggcgtg 1800 gaagacaggt ttaacgcgtc actggggact taccacgatc tcctgaagat cattaaggat 1860 aaggacttct tggacaacga ggaaaatgag gatatcctcg aagacattgt cctgactctt 1920 acgttgtttg aggataggga aatgatcgag gaacgcttga agacgtatgc ccatctcttc 1980 gatgacaagg ttatgaagca gctcaagaga agaagataca ccggatgggg aaggctgtcc 2040 cgcaagctta tcaatggcat tagagacaag caatcaggga agacaatcct tgactttttg 2100 aagtctgatg gcttcgcgaa caggaatttt atgcagctga ttcacgatga ctcacttact 2160 ttcaaggagg atatccagaa ggctcaagtg tcgggacaag gtgacagtct gcacgagcat 2220 atcgccaacc ttgcgggatc tcctgcaatc aagaagggta ttctgcagac agtcaaggtt 2280 gtggatgagc ttgtgaaggt catgggacgg cataagcccg agaacatcgt tattgagatg 2340 gccagagaaa atcagaccac acaaaagggt cagaagaact cgagggagcg catgaagcgc 2400 atcgaggaag gcattaagga gctggggagt cagatcctta aggagcaccc ggtggaaaac 2460 acgcagttgc aaaatgaggc cctctatctg tactatctgc aaaatggcag ggatatgtat 2520 gtggaccagg agttggatat taaccgcctc tcggattacg acgtcgatca tatcgttcct 2580 cagtccttcc ttaaggatga cagcattgac aataaggttc tcaccaggtc cgacaagaac 2640 cgcgggaagt ccgataatgt gcccagcgag gaagtcgtta agaagatgaa gaactactgg 2700 aggcaacttt tgaatgccaa gttgatcaca cagaggaagt ttgataacct cactaaggcc 2760 gagcgcggag gtctcagcga actggacaag gcgggcttca ttaagcggca actggttgag 2820 actagacaga tcacgaagca cgtggcgcag attctcgatt cacgcatgaa cacgaagtac 2880 gatgagaatg acaagctgat ccgggaagtg aaggtcatca ccttgaagtc aaagctcgtt 2940 tctgacttca ggaaggattt ccaattttat aaggtgcgcg agatcaacaa ttatcaccat 3000 gctcatgacg catacctcaa cgctgtggtc ggaacagcat tgattaagaa gtacccggcg 3060 ctcgagtccg aattcgtgta cggtgactat aaggtttacg atgtgcgcaa gatgatcgcc 3120 aagtcagagc aggaaattgg caaggccact gcgaagtatt tcttttactc taacattatg 3180 aatttcttta agactgagat cacgctggct aatggcgaaa tccggaaggc gccacttatt 3240 gagaccaacg gcgagacagg ggaaatcgtg tgggacaagg ggagggattt cgccacagtc 3300 cgcaaggttc tctctatgcc tcaagtgaat attgtcaaga agactgaagt ccagacgggc 3360 gggttctcaa aggaatctat tctgcccaag cggaactcgg ataagcttat cgccagaaag 3420 aaggactggg acccgaagaa gtatggaggt ttcgactcac caacggtggc ttactctgtc 3480 ctggttgtgg caaaggtgga gaagggaaag tcaaagaagc tcaagtctgt caaggagctc 3540 ctgggtatca ccattatgga gaggtccagc ttcgaaaaga atccgatcga ttttctcgag 3600 gcgaagggat ataaggaagt gaagaaggac ctgatcatta agcttccaaa gtacagtctt 3660 ttcgagttgg aaaacggcag gaagcgcatg ttggcttccg caggagagct ccagaagggt 3720 aacgagcttg ctttgccgtc caagtatgtg aacttcctct atctggcatc ccactacgag 3780 aagctcaagg gcagcccaga ggataacgaa cagaagcaac tgtttgtgga gcaacacaag 3840 cattatcttg acgagatcat tgaacagatt tcggagttca gtaagcgcgt catcctcgcc 3900 gacgcgaatt tggataaggt tctctcagcc tacaacaagc accgggacaa gcctatcaga 3960 gagcaggcgg aaaatatcat tcatctcttc accctgacaa accttggggc tcccgctgca 4020 ttcaagtatt ttgacactac gattgatcgg aagagataca cttctacgaa ggaggtgctg 4080 gatgcaaccc ttatccacca atcgattact ggcctctacg agacgcggat cgacttgagt 4140 cagctcgggg gggataagag accagcggca accaagaagg caggacaagc gaagaagaag 4200 aagtag 4206 <210> 8 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> eSpCas9(1.1) codon-optimized nucleotide sequence <400> 8 atggccccta agaagaagag aaaggtcggt attcacggcg ttcctgcggc gatggacaag 60 aagtatagta ttggtctgga cattgggacg aattccgttg gctgggccgt gatcaccgat 120 gagtacaagg tcccttccaa gaagtttaag gttctgggga acaccgatcg gcacagcatc 180 aagaagaatc tcattggagc cctcctgttc gactcaggcg agaccgccga agcaacaagg 240 ctcaagagaa ccgcaaggag acggtataca agaaggaaga ataggatctg ctacctgcag 300 gagattttca gcaacgaaat ggcgaaggtg gacgattcgt tctttcatag attggaggag 360 agtttcctcg tcgaggaaga taagaagcac gagaggcatc ctatctttgg caacattgtc 420 gacgaggttg cctatcacga aaagtacccc acaatctatc atctgcggaa gaagcttgtg 480 gactcgactg ataaggcgga ccttagattg atctacctcg ctctggcaca catgattaag 540 ttcaggggcc attttctgat cgagggggat cttaacccgg acaatagcga tgtggacaag 600 ttgttcatcc agctcgtcca aacctacaat cagctctttg aggaaaaccc aattaatgct 660 tcaggcgtcg acgccaaggc gatcctgtct gcacgccttt caaagtctcg ccggcttgag 720 aacttgatcg ctcaactccc gggcgaaaag aagaacggct tgttcgggaa tctcattgca 780 ctttcgttgg ggctcacacc aaacttcaag agtaattttg atctcgctga ggacgcaaag 840 ctgcagcttt ccaaggacac ttatgacgat gacctggata accttttggc ccaaatcggc 900 gatcagtacg cggacttgtt cctcgccgcg aagaatttgt cggacgcgat cctcctgagt 960 gatattctcc gcgtgaacac cgagattaca aaggccccgc tctcggcgag tatgatcaag 1020 cgctatgacg agcaccatca ggatctgacc cttttgaagg ctttggtccg gcagcaactc 1080 ccagagaagt acaaggaaat cttctttgat caatccaaga acggctacgc tggttatatt 1140 gacggcgggg catcgcagga ggaattctac aagtttatca agccaattct ggagaagatg 1200 gatggcacag aggaactcct ggtgaagctc aatagggagg accttttgcg gaagcaaaga 1260 actttcgata acggcagcat ccctcaccag attcatctcg gggagctgca cgccatcctg 1320 agaaggcagg aagacttcta cccctttctt aaggataacc gggagaagat cgaaaagatt 1380 ctgacgttca gaattccgta ctatgtcgga ccactcgccc ggggtaattc cagatttgcg 1440 tggatgacca gaaagagcga ggaaaccatc acaccttgga acttcgagga agtggtcgat 1500 aagggcgctt ccgcacagag cttcattgag cgcatgacaa attttgacaa gaacctgcct 1560 aatgagaagg tccttcccaa gcattccctc ctgtacgagt atttcactgt ttataacgaa 1620 ctcacgaagg tgaagtatgt gaccgaggga atgcgcaagc ccgccttcct gagcggcgag 1680 caaaagaagg cgatcgtgga ccttttgttt aagaccaatc ggaaggtcac agttaagcag 1740 ctcaaggagg actacttcaa gaagattgaa tgcttcgatt ccgttgagat cagcggcgtg 1800 gaagacaggt ttaacgcgtc actggggact taccacgatc tcctgaagat cattaaggat 1860 aaggacttct tggacaacga ggaaaatgag gatatcctcg aagacattgt cctgactctt 1920 acgttgtttg aggataggga aatgatcgag gaacgcttga agacgtatgc ccatctcttc 1980 gatgacaagg ttatgaagca gctcaagaga agaagataca ccggatgggg aaggctgtcc 2040 cgcaagctta tcaatggcat tagagacaag caatcaggga agacaatcct tgactttttg 2100 aagtctgatg gcttcgcgaa caggaatttt atgcagctga ttcacgatga ctcacttact 2160 ttcaaggagg atatccagaa ggctcaagtg tcgggacaag gtgacagtct gcacgagcat 2220 atcgccaacc ttgcgggatc tcctgcaatc aagaagggta ttctgcagac agtcaaggtt 2280 gtggatgagc ttgtgaaggt catgggacgg cataagcccg agaacatcgt tattgagatg 2340 gccagagaaa atcagaccac acaaaagggt cagaagaact cgagggagcg catgaagcgc 2400 atcgaggaag gcattaagga gctggggagt cagatcctta aggagcaccc ggtggaaaac 2460 acgcagttgc aaaatgagaa gctctatctg tactatctgc aaaatggcag ggatatgtat 2520 gtggaccagg agttggatat taaccgcctc tcggattacg acgtcgatca tatcgttcct 2580 cagtccttcc ttgcggatga cagcattgac aataaggttc tcaccaggtc cgacaagaac 2640 cgcgggaagt ccgataatgt gcccagcgag gaagtcgtta agaagatgaa gaactactgg 2700 aggcaacttt tgaatgccaa gttgatcaca cagaggaagt ttgataacct cactaaggcc 2760 gagcgcggag gtctcagcga actggacaag gcgggcttca ttaagcggca actggttgag 2820 actagacaga tcacgaagca cgtggcgcag attctcgatt cacgcatgaa cacgaagtac 2880 gatgagaatg acaagctgat ccgggaagtg aaggtcatca ccttgaagtc aaagctcgtt 2940 tctgacttca ggaaggattt ccaattttat aaggtgcgcg agatcaacaa ttatcaccat 3000 gctcatgacg catacctcaa cgctgtggtc ggaacagcat tgattaagaa gtacccggcg 3060 ctcgagtccg aattcgtgta cggtgactat aaggtttacg atgtgcgcaa gatgatcgcc 3120 aagtcagagc aggaaattgg caaggccact gcgaagtatt tcttttactc taacattatg 3180 aatttcttta agactgagat cacgctggct aatggcgaaa tccggaaggc gccacttatt 3240 gagaccaacg gcgagacagg ggaaatcgtg tgggacaagg ggagggattt cgccacagtc 3300 cgcaaggttc tctctatgcc tcaagtgaat attgtcaaga agactgaagt ccagacgggc 3360 gggttctcaa aggaatctat tctgcccaag cggaactcgg ataagcttat cgccagaaag 3420 aaggactggg acccgaagaa gtatggaggt ttcgactcac caacggtggc ttactctgtc 3480 ctggttgtgg caaaggtgga gaagggaaag tcaaagaagc tcaagtctgt caaggagctc 3540 ctgggtatca ccattatgga gaggtccagc ttcgaaaaga atccgatcga ttttctcgag 3600 gcgaagggat ataaggaagt gaagaaggac ctgatcatta agcttccaaa gtacagtctt 3660 ttcgagttgg aaaacggcag gaagcgcatg ttggcttccg caggagagct ccagaagggt 3720 aacgagcttg ctttgccgtc caagtatgtg aacttcctct atctggcatc ccactacgag 3780 aagctcaagg gcagcccaga ggataacgaa cagaagcaac tgtttgtgga gcaacacaag 3840 cattatcttg acgagatcat tgaacagatt tcggagttca gtaagcgcgt catcctcgcc 3900 gacgcgaatt tggataaggt tctctcagcc tacaacaagc accgggacaa gcctatcaga 3960 gagcaggcgg aaaatatcat tcatctcttc accctgacaa accttggggc tcccgctgca 4020 ttcaagtatt ttgacactac gattgatcgg aagagataca cttctacgaa ggaggtgctg 4080 gatgcaaccc ttatccacca atcgattact ggcctctacg agacgcggat cgacttgagt 4140 cagctcgggg gggataagag accagcggca accaagaagg caggacaagc gaagaagaag 4200 aagtag 4206 <210> 9 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> SpCas9-HF1 codon-optimized nucleotide sequence <400> 9 atggccccta agaagaagag aaaggtcggt attcacggcg ttcctgcggc gatggacaag 60 aagtatagta ttggtctgga cattgggacg aattccgttg gctgggccgt gatcaccgat 120 gagtacaagg tcccttccaa gaagtttaag gttctgggga acaccgatcg gcacagcatc 180 aagaagaatc tcattggagc cctcctgttc gactcaggcg agaccgccga agcaacaagg 240 ctcaagagaa ccgcaaggag acggtataca agaaggaaga ataggatctg ctacctgcag 300 gagattttca gcaacgaaat ggcgaaggtg gacgattcgt tctttcatag attggaggag 360 agtttcctcg tcgaggaaga taagaagcac gagaggcatc ctatctttgg caacattgtc 420 gacgaggttg cctatcacga aaagtacccc acaatctatc atctgcggaa gaagcttgtg 480 gactcgactg ataaggcgga ccttagattg atctacctcg ctctggcaca catgattaag 540 ttcaggggcc attttctgat cgagggggat cttaacccgg acaatagcga tgtggacaag 600 ttgttcatcc agctcgtcca aacctacaat cagctctttg aggaaaaccc aattaatgct 660 tcaggcgtcg acgccaaggc gatcctgtct gcacgccttt caaagtctcg ccggcttgag 720 aacttgatcg ctcaactccc gggcgaaaag aagaacggct tgttcgggaa tctcattgca 780 ctttcgttgg ggctcacacc aaacttcaag agtaattttg atctcgctga ggacgcaaag 840 ctgcagcttt ccaaggacac ttatgacgat gacctggata accttttggc ccaaatcggc 900 gatcagtacg cggacttgtt cctcgccgcg aagaatttgt cggacgcgat cctcctgagt 960 gatattctcc gcgtgaacac cgagattaca aaggccccgc tctcggcgag tatgatcaag 1020 cgctatgacg agcaccatca ggatctgacc cttttgaagg ctttggtccg gcagcaactc 1080 ccagagaagt acaaggaaat cttctttgat caatccaaga acggctacgc tggttatatt 1140 gacggcgggg catcgcagga ggaattctac aagtttatca agccaattct ggagaagatg 1200 gatggcacag aggaactcct ggtgaagctc aatagggagg accttttgcg gaagcaaaga 1260 actttcgata acggcagcat ccctcaccag attcatctcg gggagctgca cgccatcctg 1320 agaaggcagg aagacttcta cccctttctt aaggataacc gggagaagat cgaaaagatt 1380 ctgacgttca gaattccgta ctatgtcgga ccactcgccc ggggtaattc cagatttgcg 1440 tggatgacca gaaagagcga ggaaaccatc acaccttgga acttcgagga agtggtcgat 1500 aagggcgctt ccgcacagag cttcattgag cgcatgacag cctttgacaa gaacctgcct 1560 aatgagaagg tccttcccaa gcattccctc ctgtacgagt atttcactgt ttataacgaa 1620 ctcacgaagg tgaagtatgt gaccgaggga atgcgcaagc ccgccttcct gagcggcgag 1680 caaaagaagg cgatcgtgga ccttttgttt aagaccaatc ggaaggtcac agttaagcag 1740 ctcaaggagg actacttcaa gaagattgaa tgcttcgatt ccgttgagat cagcggcgtg 1800 gaagacaggt ttaacgcgtc actggggact taccacgatc tcctgaagat cattaaggat 1860 aaggacttct tggacaacga ggaaaatgag gatatcctcg aagacattgt cctgactctt 1920 acgttgtttg aggataggga aatgatcgag gaacgcttga agacgtatgc ccatctcttc 1980 gatgacaagg ttatgaagca gctcaagaga agaagataca ccggatgggg agccctgtcc 2040 cgcaagctta tcaatggcat tagagacaag caatcaggga agacaatcct tgactttttg 2100 aagtctgatg gcttcgcgaa caggaatttt atggccctga ttcacgatga ctcacttact 2160 ttcaaggagg atatccagaa ggctcaagtg tcgggacaag gtgacagtct gcacgagcat 2220 atcgccaacc ttgcgggatc tcctgcaatc aagaagggta ttctgcagac agtcaaggtt 2280 gtggatgagc ttgtgaaggt catgggacgg cataagcccg agaacatcgt tattgagatg 2340 gccagagaaa atcagaccac acaaaagggt cagaagaact cgagggagcg catgaagcgc 2400 atcgaggaag gcattaagga gctggggagt cagatcctta aggagcaccc ggtggaaaac 2460 acgcagttgc aaaatgagaa gctctatctg tactatctgc aaaatggcag ggatatgtat 2520 gtggaccagg agttggatat taaccgcctc tcggattacg acgtcgatca tatcgttcct 2580 cagtccttcc ttaaggatga cagcattgac aataaggttc tcaccaggtc cgacaagaac 2640 cgcgggaagt ccgataatgt gcccagcgag gaagtcgtta agaagatgaa gaactactgg 2700 aggcaacttt tgaatgccaa gttgatcaca cagaggaagt ttgataacct cactaaggcc 2760 gagcgcggag gtctcagcga actggacaag gcgggcttca ttaagcggca actggttgag 2820 actagagcca tcacgaagca cgtggcgcag attctcgatt cacgcatgaa cacgaagtac 2880 gatgagaatg acaagctgat ccgggaagtg aaggtcatca ccttgaagtc aaagctcgtt 2940 tctgacttca ggaaggattt ccaattttat aaggtgcgcg agatcaacaa ttatcaccat 3000 gctcatgacg catacctcaa cgctgtggtc ggaacagcat tgattaagaa gtacccgaag 3060 ctcgagtccg aattcgtgta cggtgactat aaggtttacg atgtgcgcaa gatgatcgcc 3120 aagtcagagc aggaaattgg caaggccact gcgaagtatt tcttttactc taacattatg 3180 aatttcttta agactgagat cacgctggct aatggcgaaa tccggaagag accacttatt 3240 gagaccaacg gcgagacagg ggaaatcgtg tgggacaagg ggagggattt cgccacagtc 3300 cgcaaggttc tctctatgcc tcaagtgaat attgtcaaga agactgaagt ccagacgggc 3360 gggttctcaa aggaatctat tctgcccaag cggaactcgg ataagcttat cgccagaaag 3420 aaggactggg acccgaagaa gtatggaggt ttcgactcac caacggtggc ttactctgtc 3480 ctggttgtgg caaaggtgga gaagggaaag tcaaagaagc tcaagtctgt caaggagctc 3540 ctgggtatca ccattatgga gaggtccagc ttcgaaaaga atccgatcga ttttctcgag 3600 gcgaagggat ataaggaagt gaagaaggac ctgatcatta agcttccaaa gtacagtctt 3660 ttcgagttgg aaaacggcag gaagcgcatg ttggcttccg caggagagct ccagaagggt 3720 aacgagcttg ctttgccgtc caagtatgtg aacttcctct atctggcatc ccactacgag 3780 aagctcaagg gcagcccaga ggataacgaa cagaagcaac tgtttgtgga gcaacacaag 3840 cattatcttg acgagatcat tgaacagatt tcggagttca gtaagcgcgt catcctcgcc 3900 gacgcgaatt tggataaggt tctctcagcc tacaacaagc accgggacaa gcctatcaga 3960 gagcaggcgg aaaatatcat tcatctcttc accctgacaa accttggggc tcccgctgca 4020 ttcaagtatt ttgacactac gattgatcgg aagagataca cttctacgaa ggaggtgctg 4080 gatgcaaccc ttatccacca atcgattact ggcctctacg agacgcggat cgacttgagt 4140 cagctcgggg gggataagag accagcggca accaagaagg caggacaagc gaagaagaag 4200 aagtag 4206 <210> 10 <211> 9182 <212> DNA <213> Artificial Sequence <220> <223> pJIT163-SpCas9 vector sequence <400> 10 gagctcggta cctgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 60 gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 120 ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 180 atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 240 tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 300 tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 360 tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 420 gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata atttagatat 480 aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 540 actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgtcgac 600 gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 660 ggcacggcat ctctgtcgct gcctctggac ccctctcgat cgagagttcc gctccaccgt 720 tggacttgct ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg 780 cacggcaggc ggcctcctcc tcctctcacg gcaccggcag ctacggggga ttcctttccc 840 accgctcctt cgctttccct tcctcgcccg ccgtaataaa tagacacccc ctccacaccc 900 tctttcccca acctcgtgtt gttcggagcg cacacacaca caaccagatc tcccccaaat 960 ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc ccccctctct 1020 accttctcta gatcggcgtt ccggtccatg gttagggccc ggtagttcta cttctgttca 1080 tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc 1140 gacctgtacg tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc 1200 tgggatggct ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg 1260 catagggttt ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg 1320 gtcatctttt catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg 1380 ttctagatcg gagtagaatt aattctgttt caaactacct ggtggattta ttaattttgg 1440 atctgtatgt gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata 1500 tcgatctagg ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct 1560 ttttgttcgc ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat 1620 cggagtagaa tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt 1680 gtgtcataca tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg 1740 tatacatgtt gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt 1800 catatgctct aaccttgagt acctatctat tataataaac aagtatgttt tataattatt 1860 ttgatcttga tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc 1920 ctgccttcat acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt 1980 gtttggtgtt acttctgcaa agcttccacc atggcgtgca ggtcgactct agaggatccc 2040 catggcccct aagaagaaga gaaaggtcgg tattcacggc gttcctgcgg cgatggacaa 2100 gaagtatagt attggtctgg acattgggac gaattccgtt ggctgggccg tgatcaccga 2160 tgagtacaag gtcccttcca agaagtttaa ggttctgggg aacaccgatc ggcacagcat 2220 caagaagaat ctcattggag ccctcctgtt cgactcaggc gagaccgccg aagcaacaag 2280 gctcaagaga accgcaagga gacggtatac aagaaggaag aataggatct gctacctgca 2340 ggagattttc agcaacgaaa tggcgaaggt ggacgattcg ttctttcata gattggagga 2400 gagtttcctc gtcgaggaag ataagaagca cgagaggcat cctatctttg gcaacattgt 2460 cgacgaggtt gcctatcacg aaaagtaccc cacaatctat catctgcgga agaagcttgt 2520 ggactcgact gataaggcgg accttagatt gatctacctc gctctggcac acatgattaa 2580 gttcaggggc cattttctga tcgaggggga tcttaacccg gacaatagcg atgtggacaa 2640 gttgttcatc cagctcgtcc aaacctacaa tcagctcttt gaggaaaacc caattaatgc 2700 ttcaggcgtc gacgccaagg cgatcctgtc tgcacgcctt tcaaagtctc gccggcttga 2760 gaacttgatc gctcaactcc cgggcgaaaa gaagaacggc ttgttcggga atctcattgc 2820 actttcgttg gggctcacac caaacttcaa gagtaatttt gatctcgctg aggacgcaaa 2880 gctgcagctt tccaaggaca cttatgacga tgacctggat aaccttttgg cccaaatcgg 2940 cgatcagtac gcggacttgt tcctcgccgc gaagaatttg tcggacgcga tcctcctgag 3000 tgatattctc cgcgtgaaca ccgagattac aaaggccccg ctctcggcga gtatgatcaa 3060 gcgctatgac gagcaccatc aggatctgac ccttttgaag gctttggtcc ggcagcaact 3120 cccagagaag tacaaggaaa tcttctttga tcaatccaag aacggctacg ctggttatat 3180 tgacggcggg gcatcgcagg aggaattcta caagtttatc aagccaattc tggagaagat 3240 ggatggcaca gaggaactcc tggtgaagct caatagggag gaccttttgc ggaagcaaag 3300 aactttcgat aacggcagca tccctcacca gattcatctc ggggagctgc acgccatcct 3360 gagaaggcag gaagacttct acccctttct taaggataac cgggagaaga tcgaaaagat 3420 tctgacgttc agaattccgt actatgtcgg accactcgcc cggggtaatt ccagatttgc 3480 gtggatgacc agaaagagcg aggaaaccat cacaccttgg aacttcgagg aagtggtcga 3540 taagggcgct tccgcacaga gcttcattga gcgcatgaca aattttgaca agaacctgcc 3600 taatgagaag gtccttccca agcattccct cctgtacgag tatttcactg tttataacga 3660 actcacgaag gtgaagtatg tgaccgaggg aatgcgcaag cccgccttcc tgagcggcga 3720 gcaaaagaag gcgatcgtgg accttttgtt taagaccaat cggaaggtca cagttaagca 3780 gctcaaggag gactacttca agaagattga atgcttcgat tccgttgaga tcagcggcgt 3840 ggaagacagg tttaacgcgt cactggggac ttaccacgat ctcctgaaga tcattaagga 3900 taaggacttc ttggacaacg aggaaaatga ggatatcctc gaagacattg tcctgactct 3960 tacgttgttt gaggataggg aaatgatcga ggaacgcttg aagacgtatg cccatctctt 4020 cgatgacaag gttatgaagc agctcaagag aagaagatac accggatggg gaaggctgtc 4080 ccgcaagctt atcaatggca ttagagacaa gcaatcaggg aagacaatcc ttgacttttt 4140 gaagtctgat ggcttcgcga acaggaattt tatgcagctg attcacgatg actcacttac 4200 tttcaaggag gatatccaga aggctcaagt gtcgggacaa ggtgacagtc tgcacgagca 4260 tatcgccaac cttgcgggat ctcctgcaat caagaagggt attctgcaga cagtcaaggt 4320 tgtggatgag cttgtgaagg tcatgggacg gcataagccc gagaacatcg ttattgagat 4380 ggccagagaa aatcagacca cacaaaaggg tcagaagaac tcgagggagc gcatgaagcg 4440 catcgaggaa ggcattaagg agctggggag tcagatcctt aaggagcacc cggtggaaaa 4500 cacgcagttg caaaatgaga agctctatct gtactatctg caaaatggca gggatatgta 4560 tgtggaccag gagttggata ttaaccgcct ctcggattac gacgtcgatc atatcgttcc 4620 tcagtccttc cttaaggatg acagcattga caataaggtt ctcaccaggt ccgacaagaa 4680 ccgcgggaag tccgataatg tgcccagcga ggaagtcgtt aagaagatga agaactactg 4740 gaggcaactt ttgaatgcca agttgatcac acagaggaag tttgataacc tcactaaggc 4800 cgagcgcgga ggtctcagcg aactggacaa ggcgggcttc attaagcggc aactggttga 4860 gactagacag atcacgaagc acgtggcgca gattctcgat tcacgcatga acacgaagta 4920 cgatgagaat gacaagctga tccgggaagt gaaggtcatc accttgaagt caaagctcgt 4980 ttctgacttc aggaaggatt tccaatttta taaggtgcgc gagatcaaca attatcacca 5040 tgctcatgac gcatacctca acgctgtggt cggaacagca ttgattaaga agtacccgaa 5100 gctcgagtcc gaattcgtgt acggtgacta taaggtttac gatgtgcgca agatgatcgc 5160 caagtcagag caggaaattg gcaaggccac tgcgaagtat ttcttttact ctaacattat 5220 gaatttcttt aagactgaga tcacgctggc taatggcgaa atccggaaga gaccacttat 5280 tgagaccaac ggcgagacag gggaaatcgt gtgggacaag gggagggatt tcgccacagt 5340 ccgcaaggtt ctctctatgc ctcaagtgaa tattgtcaag aagactgaag tccagacggg 5400 cgggttctca aaggaatcta ttctgcccaa gcggaactcg gataagctta tcgccagaaa 5460 gaaggactgg gacccgaaga agtatggagg tttcgactca ccaacggtgg cttactctgt 5520 cctggttgtg gcaaaggtgg agaagggaaa gtcaaagaag ctcaagtctg tcaaggagct 5580 cctgggtatc accattatgg agaggtccag cttcgaaaag aatccgatcg attttctcga 5640 ggcgaaggga tataaggaag tgaagaagga cctgatcatt aagcttccaa agtacagtct 5700 tttcgagttg gaaaacggca ggaagcgcat gttggcttcc gcaggagagc tccagaaggg 5760 taacgagctt gctttgccgt ccaagtatgt gaacttcctc tatctggcat cccactacga 5820 gaagctcaag ggcagcccag aggataacga acagaagcaa ctgtttgtgg agcaacacaa 5880 gcattatctt gacgagatca ttgaacagat ttcggagttc agtaagcgcg tcatcctcgc 5940 cgacgcgaat ttggataagg ttctctcagc ctacaacaag caccgggaca agcctatcag 6000 agagcaggcg gaaaatatca ttcatctctt caccctgaca aaccttgggg ctcccgctgc 6060 attcaagtat tttgacacta cgattgatcg gaagagatac acttctacga aggaggtgct 6120 ggatgcaacc cttatccacc aatcgattac tggcctctac gagacgcgga tcgacttgag 6180 tcagctcggg ggggataaga gaccagcggc aaccaagaag gcaggacaag cgaagaagaa 6240 gaagtagggg cgagctcgaa ttcgctgaaa tcaccagtct ctctctacaa atctatctct 6300 ctctattttc tccataaata atgtgtgagt agtttcccga taagggaaat tagggttctt 6360 atagggtttc gctcatgtgt tgagcatata agaaaccctt agtatgtatt tgtatttgta 6420 aaatacttct atcaataaaa tttctaattc ctaaaaccaa aatccagtac taaaatccag 6480 atctcctaaa gtccctatag atctttgtcg tgaatataaa ccagacacga gacgactaaa 6540 cctggagccc agacgccgtt cgaagctaga agtaccgctt aggcaggagg ccgttaggga 6600 aaagatgcta aggcagggtt ggttacgttg actcccccgt aggtttggtt taaatatgat 6660 gaagtggacg gaaggaagga ggaagacaag gaaggataag gttgcaggcc ctgtgcaagg 6720 taagaagatg gaaatttgat agaggtacgc tactatactt atactatacg ctaagggaat 6780 gcttgtattt ataccctata ccccctaata accccttatc aatttaagaa ataatccgca 6840 taagcccccg cttaaaaatt ggtatcagag ccatgaatag gtctatgacc aaaactcaag 6900 aggataaaac ctcaccaaaa tacgaaagag ttcttaactc taaagataaa agatctttca 6960 agatcaaaac tagttccctc acaccggagc atgcgatatc ctcgagagat ctaggcgtaa 7020 tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 7080 cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 7140 attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 7200 tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 7260 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 7320 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 7380 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 7440 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 7500 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 7560 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 7620 caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 7680 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 7740 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 7800 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 7860 actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 7920 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 7980 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 8040 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 8100 aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 8160 atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 8220 gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 8280 atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 8340 ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 8400 cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 8460 agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 8520 cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 8580 tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 8640 agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 8700 gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 8760 gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 8820 ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 8880 tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 8940 tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 9000 gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 9060 caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 9120 atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 9180 gt 9182 <210> 11 <211> 3243 <212> DNA <213> Artificial Sequence <220> <223> pUC57-U3-tRNA-sgRNA vector sequence <400> 11 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accagatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgcctg caggtcgacg attaaggaat 420 ctttaaacat acgaacagat cacttaaagt tcttctgaag caacttaaag ttatcaggca 480 tgcatggatc ttggaggaat cagatgtgca gtcagggacc atagcacaag acaggcgtct 540 tctactggtg ctaccagcaa atgctggaag ccgggaacac tgggtacgtc ggaaaccacg 600 tgatgtgaag aagtaagata aactgtagga gaaaagcatt tcgtagtggg ccatgaagcc 660 tttcaggaca tgtattgcag tatgggccgg cccattacgc aattggacga caacaaagac 720 tagtattagt accacctcgg ctatccacat agatcaaagc tgatttaaaa gagttgtgca 780 gatgatccgt ggcaacaaag caccagtggt ctagtggtag aatagtaccc tgccacggta 840 cagacccggg ttcgattccc ggctggtgca agagaccgat atcccatggc tcgagggtct 900 cggttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 960 gtggcaccga gtcggtgctt tttttccaca taatctctag aggatccccg gcgtaatcat 1020 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 1080 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 1140 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 1200 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 1260 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 1320 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 1380 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 1440 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 1500 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 1560 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 1620 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 1680 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 1740 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 1800 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 1860 gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 1920 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 1980 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 2040 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 2100 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 2160 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 2220 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 2280 gggagggctt accatctggc cccagtgctg caatgatacc gcgactccca cgctcaccgg 2340 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 2400 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 2460 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 2520 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 2580 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 2640 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 2700 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 2760 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 2820 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 2880 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 2940 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 3000 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 3060 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 3120 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 3180 aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 3240 gtc 3243 <210> 12 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> sequence of 5' end ribozyme <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or t <400> 12 nnnnnnctga tgagtccgtg aggacgaaac gagtaagctc gtc 43 <210> 13 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> sequence of 3' end ribozyme <400> 13 ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60 aatgggac 68

Claims

세포의 게놈에서 타겟 서열에 대한 부위-특이적인 변형 (site-directed modification)을 수행하기 위한 게놈 편집 시스템 (genome editing system)으로서,
하기 i) 내지 iii)로부터 선택되는 하나 이상을 포함하며:
i) Cas9 뉴클레아제 변이체, 및 tRNA-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;
ii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 tRNA-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 및
iii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열과 tRNA-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는, 발현 구조체,
상기 Cas9 뉴클레아제 변이체는 야생형 Cas9 뉴클레아제와 비교해 특이성이 더 높고,
상기 가이드 RNA의 5' 말단은 tRNA의 3' 말단과 연결되고,
상기 융합체는 세포에서 전사된 후 가이드 RNA의 5' 말단에서 절단되어, 5' 말단에 추가의 (extra) 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성되는, 게놈 편집 시스템.
세포의 게놈에서 타겟 서열에 대한 부위-특이적인 변형을 수행하기 위한 게놈 편집 시스템으로서,
하기 i) 내지 iii)로부터 선택되는 하나 이상을 포함하며:
i) Cas9 뉴클레아제 변이체, 및 리보자임-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;
ii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 리보자임-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 및
iii) Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열과 리보자임-가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열을 포함하는, 발현 구조체,
상기 Cas9 뉴클레아제 변이체는 야생형 Cas9 뉴클레아제와 비교해 특이성이 더 높고,
상기 가이드 RNA의 5' 말단은 제1 리보자임의 3' 말단과 연결되고,
상기 제1 리보자임은 가이드 RNA의 5' 말단에서 융합체를 절단하도록 설계되어, 5' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성되는, 게놈 편집 시스템.
제1항에 있어서,
tRNA와 변형될 세포가 동일한 종으로부터 유래되는, 게놈 편집 시스템.
제1항에 있어서,
상기 tRNA가 서열번호 1로 표시된 서열에 의해 코딩되는, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체가 서열번호 2의 변이체이고, 서열번호 2의 855번 위치에서 아미노산 치환을 포함하며, 예를 들어 아미노산 치환이 K855A인, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체가 서열번호 2의 변이체이고, 서열번호 2의 810, 1003 및 1060번 위치에서 아미노산 치환을 포함하며, 예를 들어, 아미노산 치환이 K810A, K1003A 및 R1060A인, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체가 서열번호 2의 변이체이고, 서열번호 2의 848, 1003 및 1060번 위치에서 아미노산 치환을 포함하며, 예를 들어, 아미노산 치환이 K848A, K1003A 및 R1060A인, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체가 서열번호 2의 변이체이고, 서열번호 2의 611, 695 및 926번 위치에서 아미노산 치환을 포함하며, 예를 들어, 아미노산 치환이 R611A, Q695A 및 Q926A인, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체가 서열번호 2의 변이체이고, 서열번호 2의 497, 611, 695 및 926번 위치에서 아미노산 치환을 포함하며, 예를 들어, 아미노산 치환이 N497A, R611A, Q695A 및 Q926A인, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체가 서열번호 4, 서열번호 5 또는 서열번호 6으로 표시되는 아미노산 서열을 포함하는, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 Cas9 뉴클레아제 변이체를 코딩하는 뉴클레오티드 서열이 변형될 세포가 유래된 유기체에 대해 코돈-최적화된 (codon-optimized) 서열인, 게놈 편집 시스템.
제1항 또는 제2항에 있어서,
상기 가이드 RNA가 싱글 가이드 RNA (single guide RNA, sgRNA)인, 게놈 편집 시스템.
세포의 유전자 변형 방법으로서,
제1항 내지 제12항 중 어느 한 항에 따른 시스템을 세포에 도입하는 것을 포함하며,
Cas9 뉴클레아제 변이체가 가이드 RNA에 의해 세포의 게놈 내 타겟 서열을 타겟팅하여, 상기 타겟 서열 내 하나 이상의 뉴클레오티드의 치환, 결손 및/또는 부가가 달성되는, 세포의 유전자 변형 방법.
제13항에 있어서,
상기 세포가 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유류; 닭, 오리 및 거위와 같은 가금류; 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩 및 아라비돕시스 탈리아나 (Arabidopsis thaliana)와 같은 외떡잎 식물 및 쌍떡잎 식물을 포함하는 식물로부터 유래되는, 세포의 유전자 변형 방법.
제13항 또는 제14항에 있어서,
상기 시스템이 칼슘 포스페이트 형질감염, 프로토플라스트 융합 (protoplast fusion), 전기천공 (electroporation), 리포좀 형질감염, 미세주입법, 바이러스 감염 (예, 베큘로바이러스, 백시니아 바이러스, 아데노바이러스 및 기타 바이러스), 유전자 총 (particle bombardment), PEG-매개 프로토플라스트 형질전환 (PEG-mediated protoplast transformation) 및 아그로박테리움-매개 형질전환 (agrobacterium-mediated transformation)으로부터 선택되는 방법에 의해 세포에 도입되는, 세포의 유전자 변형 방법.