KR20200015700A

KR20200015700A - Dna가 편집된 진핵 세포를 제조하는 방법 및 당해 방법에 사용되는 키트

Info

Publication number: KR20200015700A
Application number: KR1020207000115A
Authority: KR
Inventors: 도모지 마시모; 준지 다케다; 히로유키 모리사카; 가즈토 요시미
Original assignee: 고꾸리쯔 다이가꾸 호우징 오사까 다이가꾸
Priority date: 2017-06-08
Filing date: 2018-06-08
Publication date: 2020-02-12
Also published as: CA3066599A1; JP2019062922A; EP3636753A1; MX2019014497A; EP4349973A3; JP2023054185A; JP6480647B1; US11807869B2; CN117778466A; US20200102580A1; JP7301332B2; JP7430358B2; CN110770342B; EP3636753B1; BR112019025717A2; JPWO2018225858A1; DK3636753T3; EP4349973A2; AU2018279457B2; US20240124898A1

Abstract

진핵 세포에 있어서 CRISPR-Cas3 시스템을 확립하는 것에 성공했다.

Description

DNA가 편집된 진핵 세포를 제조하는 방법 및 당해 방법에 사용되는 키트

본 발명은 DNA가 편집된 진핵 세포, 동물 및 식물을 제조하는 방법, 그리고 당해 방법에 사용되는 키트에 관한 것이다.

세균, 고세균은, 외래로부터 침입하려고 하는 파지 등의 생물을 특이적으로 인식하고, 배제하는 적응 면역 기구를 갖고 있다. CRISPR-Cas 시스템이라고 불리는 이 시스템은, 먼저, 외래 생물의 게놈 정보를 자기 게놈에 받아들인다(어댑테이션). 그리고, 다시 동일한 외래 생물이 침입하려고 할 때, 자기 게놈에 받아들인 정보와 게놈 서열의 상보성을 이용해서 외래 게놈을 절단하고, 배제한다(인터피어런스).

최근에 되서야, 상기의 CRISPR-Cas 시스템을, 「DNA 편집용 도구」로서 사용한, 게놈 편집(DNA 편집) 기술이 개발되게 되었다(비특허문헌 1).

CRISPR-Cas 시스템은, DNA를 절단하는 과정에서 작용하는 이펙터가, 복수의Cas로 이루어지는 「클래스 1」과, 단일의 Cas로 이루어지는 「클래스 2」로 크게 구별된다. 특히, 클래스 1의 CRISPR-Cas 시스템으로서는, Cas3 및 캐스케이드 복합체(캐스케이드와 crRNA와의 복합체를 의미한다. 이하 마찬가지.)가 관여하는 「타입 I」이 널리 알려져 있고, 클래스 2의 CRISPR-Cas 시스템으로서는, Cas9가 관여하는 「타입 II」가 널리 알려져 있다(이하, CRISPR-Cas 시스템에 관해서, 「클래스 1 타입 I」 및 「클래스 2 타입 II」를 각각 단순히 「타입 I」 및 「타입 II」라고 칭하기도 한다.). 그리고, 지금까지의 DNA 편집 기술에 있어서 광범위하게 사용되었던 것은, Cas9가 관여하는 클래스 2의 CRISPR-Cas 시스템이다(이하, 「CRISPR-Cas9 시스템」이라고 칭하는 경우도 있다.). 예를 들어, 비특허문헌 1은, Cas9를 사용해서 DNA를 절단하는, 클래스 2의 CRISPR-Cas 시스템을 보고하고 있다.

한편, Cas3 및 캐스케이드 복합체를 사용해서 DNA를 절단하는, 클래스 1의 CRISPR-Cas 시스템(이하, 「CRISPR-Cas3 시스템」이라고 칭하는 경우도 있다.)에 대해서는, 많은 노력에도 불구하고, 진핵 세포에 있어서 게놈 편집의 성공예의 보고는 이루어져 있지 않다. 예를 들어, 비특허문헌 2 및 3에서는, 단순히, CRISPR-Cas3 시스템을 사용함으로써, 무세포계에서 표적 DNA가 완전히 분해된 것이나, 특정한 대장균주를 선택적으로 제거할 수 있던 것을 보고하고 있지만, 이들은 게놈 편집의 성공을 의미하는 것은 아니고, 또한 진핵 세포에서는 전혀 실증되지 않았다. 또한, 특허문헌 1에 있어서는, CRISPR-Cas3 시스템이, Cas3의 헬리카제 활성과 엑소뉴클레아제 활성에 의해, 대장균에 있어서 표적 DNA를 분해해버리는 점에서(실시예 5, 도 6), 진핵 세포에 있어서는, Cas3 대신에, FokI 뉴클레아제를 사용해서 게놈 편집을 행할 것을 제안하고 있다(실시예 7, 도 7, 도 11). 또한, 특허문헌 2에서는, CRISPR-Cas3 시스템은, 대장균에 있어서 표적 DNA를 분해해버리는 점에서(도 4), cas3을 결실시키거나, 불활성화된 Cas3(Cas3'와 Cas3")을 사용함으로써, 프로그램화 가능한 유전자 억제에 재목적화할 것을 제안하고 있다(예를 들어, 실시예 15, 청구항 4(e)).

일본특허공표 제2015-503535호 공보 일본특허공표 제2017-512481호 공보

Jinek M et al. (2012) A Programmable Dual-RNA Guided DNA Endonuclease in Adaptive Bacterial Immunity, Science, Vol.337(Issue 6096), pp.816-821 Mulepati S & Bailey S (2013) In Vitro Reconstitution of an Escherichia coli RNA-guided Immune System Reveals Unidirectional, ATP-dependent Degradation of DNA Target, Journal of Biological Chemistry, Vol.288(No.31), pp.22184-22192 Ahmed A. Gomaa et al. (2014) Programmable Reomoval of Bacterial Strains by Use of Genome Targeting CRISPR-Cas Systems, mbio. asm. org, Volume 5, Issue 1, e00928-13

본 발명은, 이러한 상황을 감안하여 이루어진 것으로, 그 목적은, 진핵 세포에 있어서 CRISPR-Cas3 시스템을 확립하는 것에 있다.

본 발명자들은, 상기 목적을 달성하기 위해서 예의 검토를 거듭한 결과, 마침내, 진핵 세포에 있어서 CRISPR-Cas3 시스템을 확립하는 것에 성공했다. 가장 널리 이용되고 있는 CRISPR-Cas9 시스템은, 여러 진핵 세포에 있어서 게놈 편집에 성공하고 있지만, 이 시스템에서는, 통상, crRNA로서 성숙 crRNA가 사용되고 있다. 그러나, 놀랍게도, CRISPR-Cas3 시스템에서는, 성숙 crRNA를 사용한 경우에는 진핵 세포에 있어서 게놈 편집이 곤란하여, 통상, 시스템의 구성 요소로서는 사용되지 않는 프리 crRNA를 사용함으로써 비로소, 효율적인 게놈 편집이 가능했다. 즉, CRISPR-Cas3 시스템을 진핵 세포에서 기능시키기 위해서는, 캐스케이드를 구성하는 단백질에 의한 crRNA의 절단이 중요한 것이 판명되었다. 이 프리 crRNA를 사용한 CRISPR-Cas3 시스템은, 타입 I-E의 시스템뿐만 아니라, 타입 I-F 및 타입 I-G의 시스템에도 널리 적용하는 것이 가능했다. 또한, Cas3에 핵 이행 시그널, 특히 바이파타이트(bipartite) 핵 이행 시그널을 부가함으로써, 진핵 세포에 있어서의 CRISPR-Cas3 시스템의 게놈 편집 효율을 더욱 향상시킬 수 있었다. 또한, 본 발명자는, CRISPR-Cas3 시스템에 의하면, CRISPR-Cas9 시스템과 달리, PAM 서열을 포함하거나, 그의 상류역에 있어서, 큰 결실을 초래하는 것이 가능한 것을 알아내고, 본 발명을 완성하기에 이르렀다.

즉, 본 발명은, 진핵 세포에 있어서의 CRISPR-Cas3 시스템에 관한 것으로, 보다 상세히는, 이하의 발명을 제공하는 것이다.

[1] DNA가 편집된 진핵 세포를 제조하는 방법으로서, 진핵 세포에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.

(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,

(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및

(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터

[2] DNA가 편집된 동물(단 인간을 제외함) 또는 식물을 제조하는 방법으로서, 동물(단 인간을 제외함) 또는 식물에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.

[3] 진핵 세포에 CRISPR-Cas3 시스템을 도입한 후에, 캐스케이드 단백질을 구성하는 단백질에 의해 crRNA가 절단되는 공정을 포함하는, [1] 또는 [2]에 기재된 방법.

[4] crRNA가 프리 crRNA인, [1] 또는 [2]에 기재된 방법.

[5] Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, [1] 내지 [4] 중 어느 하나에 기재된 방법.

[6] 핵 이행 시그널이 바이파타이트 핵 이행 시그널인, [5]에 기재된 방법.

[7] 이하의 (A) 및 (B)를 포함하는, [1] 내지 [6] 중 어느 하나에 기재된 방법에 사용하기 위한 키트.

(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및

(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터

[8] crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 더 포함하는, [7]에 기재된 키트.

[9] crRNA가 프리 crRNA인, [8]에 기재된 키트.

[10] Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, [7] 내지 [9] 중 어느 하나에 기재된 키트.

[11] 핵 이행 시그널이 바이파타이트 핵 이행 시그널인, [10]에 기재된 키트.

또한, 본 명세서에 있어서, 용어 「폴리뉴클레오티드」란 뉴클레오티드의 중합체를 의도하고, 용어 「유전자」, 「핵산」 또는 「핵산 분자」와 동일한 의미로 사용된다. 폴리뉴클레오티드는, DNA의 형태(예를 들어, cDNA 혹은 게놈 DNA)로도 존재할 수 있고, RNA(예를 들어, mRNA)의 형태로도 존재할 수 있다. 또한, 용어 「단백질」은, 「펩티드」 또는 「폴리펩티드」와 동일한 의미로 사용된다.

본 발명의 CRISPR-Cas3 시스템을 사용함으로써, 진핵 세포에 있어서 DNA를 편집하는 것이 가능하게 되었다.

도 1은 외인성 DNA에 대한 절단 활성을 측정한 SSA 검정의 결과이다.
도 2는 CCR5 유전자 중에 있어서의 표적 서열의 위치를 나타내는 개략도이다.
도 3a는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 1)를 나타내는 도면이다.
도 3b는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 2)를 나타내는 도면이다.
도 3c는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 3)를 나타내는 도면이다.
도 3d는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 CCR5 유전자(클론 4)를 나타내는 도면이다.
도 4의 (a)는 캐스케이드 플라스미드의 구조를 나타내는 모식도이다. (b)는 Cas3 플라스미드의 구조를 나타내는 모식도이다. (c)는 프리 crRNA 플라스미드의 구조를 나타내는 모식도이다. (d)는 리포터 벡터(표적 서열을 포함한다)의 구조를 나타내는 모식도이다.
도 5는 EMX1 유전자 중에 있어서의 표적 서열의 위치를 나타내는 개략도이다.
도 6a는 CRISPR-Cas3 시스템에 의해, 염기 서열의 일부를 결실한 EMX1 유전자(클론 1)를 나타내는 도면이다.
도 6b는 CRISPR-Cas3 시스템에 의해, 염기 서열의 다른 일부를 결실한 EMX1 유전자(클론 2)를 나타내는 도면이다.
도 7은 bpNLS를 부가한 Cas3/캐스케이드 플라스미드의 구조를 나타내는 모식도이다.
도 8은 캐스케이드(2A) 플라스미드의 구조를 나타내는 모식도이다.
도 9는 외인성 DNA에 대한 절단 활성을 측정한 SSA 검정의 결과이다.
도 10a는 본 실시예에 사용한 프리 crRNA(LRSR 및 RSR)와 성숙 crRNA의 구조를 나타내는 도면이다. 도면 중의 언더라인은, 5' 핸들(Cas5 핸들)을, 이중 언더라인은 3' 핸들(Cas6 핸들)을 나타낸다.
도 10b는 프리 crRNA(LRSR 및 RSR)와 성숙 crRNA를 사용해서 SSA 검정을 행한 결과를 나타내는 도면이다.
도 11은 1개의 NLS 또는 2개의 NLS(bpNLS)를 Cas3/캐스케이드 유전자의 발현 위해서 플라스미드에 사용해서 SSA 검정을 행한 결과를 나타내는 도면이다.
도 12는 CRISPR-Cas3 시스템의 DNA 절단 활성에 대한 PAM 서열의 효과를 나타내는 도면이다.
도 13은 CRISPR-Cas3 시스템의 DNA 절단 활성에 대한 스페이서의 단일 미스매치의 효과를 나타내는 도면이다.
도 14는 HD 뉴클레아제 도메인(H74A), SF2 헬리카제 도메인 모티브1(K320A), 모티프 3(S483/T485A)에서의 Cas3의 변이의 효과를 나타내는 도면이다.
도 15는 타입 I-E, 타입 I-F 및 타입 I-G의 CRISPR-Cas3 시스템의 DNA 절단 활성의 비교를 나타내는 도면이다.
도 16은 PCR 산물의 TA 클로닝 샘플의 시퀀싱에 의해 검출한 CRISPR-Cas3 시스템에 의한 결실의 크기를 나타내는 도면이다.
도 17은 TA 클론(n=49)의 대량 처리 시퀀싱에 의해 검출한 CRISPR-Cas3 시스템에 의한 결실의 위치를 나타내는 도면이다.
도 18a는 표적으로 한 EMX1 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용하여, CRISPR-Cas3 시스템에 의한 결실 사이즈마다 검출한 수를 나타내는 도면이다.
도 18b는 표적으로 한 CCR5 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용하여, CRISPR-Cas3 시스템에 의한 결실 사이즈마다 검출한 수를 나타내는 도면이다.

[1] DNA가 편집된 진핵 세포, 동물, 식물을 제조하는 방법

본 발명의 방법은, 진핵 세포에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법이다.

클래스 1의 CRISPR-Cas 시스템은, 타입 I 및 타입 III으로 분류되며, 또한 타입 I은, 캐스케이드를 구성하는 단백질(이하, 단순히 「캐스케이드」 또는 「캐스케이드 단백질」이라고 칭한다.)의 종류에 따라, 타입 I-A, 타입 I-B, 타입 I-C, 타입 I-D, 타입 I-E 및 타입 I-F의 6종류, 그리고 타입 I-B의 서브타입인 타입 I-G로 분류된다(예를 들어, [van der Oost J et al. (2014) Unravelling the structural and mechanistic basis of CRISPR-Cas systems, Nature Reviews Microbiologym, Vol.12 (No.7), pp.479-492], [Jackson RN et al. (2014) Fitting CRISPR-associated Cas3 into the Helicase Family Tree, Current Opinion in Structural Biology, Vol.24, pp.106-114]를 참조).

타입 I의 CRISPR-Cas 시스템은, Cas3(뉴클레아제 활성 및 헬리카제 활성을 갖는 단백질), 캐스케이드 및 crRNA가 협동함으로써, DNA를 절단하는 기능을 갖는다. 뉴클레아제로서 Cas3을 사용하는 점에서, 본 발명에 있어서 「CRISPR-Cas3 시스템」이라고 칭한다.

본 발명의 CRISPR-Cas3 시스템을 사용함으로써, 예를 들어 하기의 이점이 얻어진다.

먼저, CRISPR-Cas3 시스템에서 사용되는 crRNA는, 일반적으로는, 32 내지 37염기의 표적 서열을 인식한다(Ming Li et al., Nucleic Acids Res. 2017 May 5;45(8):4642-4654). 이에 반해, CRISPR-Cas9 시스템에서 사용되는 crRNA는, 일반적으로 18 내지 24염기의 표적 서열을 인식한다. 이 때문에, CRISPR-Cas3 시스템은, CRISPR-Cas9 시스템보다, 보다 정확하게 표적 서열을 인식할 수 있다고 생각된다.

또한, 클래스 2의 타입 II의 시스템인 CRISPR-Cas9 시스템의 PAM 서열은, 표적 서열의 3'측에 인접하는 「NGG(N은 임의의 염기)」이다. 또한, 클래스 2의 타입 V의 시스템인 CRISPR-Cpf1 시스템의 PAM 서열은, 표적 서열의 5'측에 인접하는 「AA」이다. 이에 반해, 본 발명의 CRISPR-Cas3 시스템의 PAM 서열은, 표적 서열의 5'측에 인접하는 「AAG」 또는 그것에 유사한 염기 서열(예를 들어, 「AGG」, 「GAG」, 「TAC」, 「ATG」, 「TAG」 등)이다(도 12). 따라서, 본 발명의 CRISPR-Cas3 시스템을 사용하면, 종래법에서는 인식할 수 없었던 영역을, DNA 편집의 대상으로 할 수 있다고 생각된다.

또한, CRISPR-Cas3 시스템은, 상기 클래스 2의 CRISPR-Cas 시스템과 달리, 복수 개소에 DNA 절단을 발생시킨다. 이 때문에, 본 발명의 CRISPR-Cas3 시스템을 사용하면, 100 내지 수천염기, 경우에 따라 그 이상의 광범위한 결실 변이를 발생시킬 수 있다(도 3, 6, 16 내지 18). 이 기능에 의해, 긴 게놈 영역을 녹-아웃하거나, 긴 DNA를 녹-인하거나 하는 것에 이용할 수 있다고 생각된다. 녹-인을 행하는 경우에는, 통상, 도너 DNA가 사용되고, 당해 도너 DNA도 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자가 된다.

또한, 본 명세서에 있어서, 단순히 「Cas3」이라고 기재한 경우에는, 「Cas3 단백질」을 의미하는 것으로 한다. 캐스케이드 단백질에 대해서도 마찬가지이다.

본 발명의 CRISPR-Cas3 시스템은, 타입 I의 6종류의 서브타입 모두를 포함한다. 즉, CRISPR-Cas3 시스템을 구성하는 단백질은, 서브타입에 따라, 약간 그 구성 등이 상이한 경우가 있지만(예를 들어, 캐스케이드를 구성하는 단백질이 상이하지만), 본 발명은 이들 단백질 모두를 포함한다. 실제로, 본 실시예에 있어서, 타입 I-E 뿐만 아니라, 타입 1-G나 타입 I-F의 시스템에 있어서도, 게놈 편집이 가능한 것이 판명되었다(도 15).

타입 I의 CRISPR-Cas3 시스템 중에서도 일반적인 타입 I-E의 CRISPR-Cas3 시스템은, crRNA가 Cas3 및 캐스케이드(Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7)와 협동함으로써, DNA를 절단한다.

타입 I-A의 시스템에서는, 캐스케이드로서 Cas8a1, Csa5(Cas11), Cas5, Cas6 및 Cas7을 구성 요소로 하고, 타입 I-B에서는, 캐스케이드로서 Cas8b1, Cas5, Cas6 및 Cas7을 구성 요소로 하고, 타입 I-C에서는, 캐스케이드로서 Cas8c, Cas5 및 Cas7을 구성 요소로 하고, 타입 I-D에서는, 캐스케이드로서 Cas10d, Csc1(Cas5), Cas6 및 Csc2(Cas7)을 구성 요소로 하고, 타입 I-F에서는, 캐스케이드로서 Csy1(Cas8f), Csy2(Cas5), Cas6 및 Csy3(Cas7)을 구성 요소로 하고, 타입 I-G의 시스템에서는, 캐스케이드로서 Cst1(Cas8a1), Cas5, Cas6 및 Cst2(Cas7)을 구성 요소로 한다. 본 발명에 있어서는, Cas3 및 캐스케이드를 총칭해서 「Cas 단백질군」이라고 칭한다.

이하, 타입 I-E의 CRISPR-Cas3 시스템을 대표예로서 설명하지만, 그 외의 타입의 CRISPR-Cas3 시스템에 대해서는, 시스템을 구성하는 캐스케이드를, 적절히, 바꿔 읽으면 된다.

-Cas 단백질군-

본 발명의 CRISPR-Cas3 시스템에 있어서, Cas 단백질군은, 단백질의 형태로, 당해 단백질을 코딩하는 폴리뉴클레오티드의 형태로, 혹은 당해 폴리뉴클레오티드를 포함하는 발현 벡터의 형태로, 진핵 세포에 도입할 수 있다. Cas 단백질군을 단백질의 형태로 진핵 세포에 도입하는 경우에는, 각 단백질의 양 등을 적절히 제조하는 것이 가능하고, 핸들링의 관점에서 우수하다. 또한, 세포 내에서의 절단 효율 등을 고려하여, Cas 단백질군의 복합체를 먼저 형성시킨 후에, 진핵 세포에 도입할 수도 있다.

본 발명에 있어서는, Cas 단백질군에, 핵 이행 시그널을 부가하는 것이 바람직하다. 핵 이행 시그널은, Cas 단백질군의 N 말단측 및/또는 C 말단측(각 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 5' 말단측 및/또는 3' 말단측)에 부가될 수 있다. 이와 같이, Cas 단백질군에 핵 이행 시그널을 부가함으로써, 세포 내에서 핵으로의 국재가 촉진되고, 그 결과, DNA의 편집이 효율적으로 행해진다고 하는 이점을 갖는다.

상기의 핵 이행 시그널은, 수개 내지 수십개의 염기성 아미노산을 포함하는 펩티드 서열이며, 단백질을 핵 안으로 이행시키는 것이면, 그의 서열은 특별히 한정되지 않는다. 이러한 핵 이행 시그널의 구체예는, 예를 들어 [Wu J et al. (2009) The Intracellular Mobility of Nuclear Import Receptors and NLS Cargoes, Biophysical journal, Vol.96(Issue 9), pp.3840-3849]에 기재되어 있어, 당해 기술 분야에서 통상 사용되는 임의의 핵 이행 시그널이, 본 발명에 있어서 사용될 수 있다.

핵 이행 시그널은, 예를 들어 PKKKRKV(서열 번호 52)(염기 서열 CCCAAGAAGAAGCGGAAGGTG(서열 번호 53)에 의해 코딩)일 수 있다. 상기 핵 이행 시그널을 사용하는 경우, 예를 들어 Cas 단백질군을 코딩하는 각 폴리뉴클레오티드의 5' 말단측에, 서열 번호 53의 염기 서열을 포함하는 폴리뉴클레오티드를 배치하는 것이 바람직하다. 또한, 핵 이행 시그널은, 예를 들어 KRTADGSEFESPKKKRKVE(서열 번호 54)(염기 서열 AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGGAA(서열 번호 55)에 의해 코딩)일 수 있다. 상기 핵 이행 시그널을 사용하는 경우, 예를 들어 Cas 단백질군을 코딩하는 각 폴리뉴클레오티드의 양 끝에, 서열 번호 55의 염기 서열을 포함하는 폴리뉴클레오티드를 배치하는 것(즉, 「바이파타이트 핵 이행 시그널(bpNLS)」을 사용하는 것)이 바람직하다.

이러한 개변은, 후술하는 프리 crRNA의 이용과 아울러, 본 발명의 CRISPR-Cas3 시스템을 진핵 세포 내에서 효율적으로 발현 및 기능시키는 데 있어서 중요다.

본 발명에 사용되는 Cas 단백질군의 하나의 바람직한 형태는, 이하이다.

Cas3; 서열 번호 1 또는 서열 번호 7로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질

Cse1(Cas8); 서열 번호 2 또는 서열 번호 8로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질

Cse2(Cas11); 서열 번호 3 또는 서열 번호 9로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질

Cas5; 서열 번호 4 또는 서열 번호 10으로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질

Cas6; 서열 번호 5 또는 서열 번호 11로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질

Cas7; 서열 번호 6 또는 서열 번호 12로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드에 의해 코딩되는 단백질

상기 Cas 단백질군은, (1) 야생형 대장균의 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6, Cas7의 N 말단에, 핵 이행 시그널로서 PKKKRKV(서열 번호 52)를 부가한 단백질 또는 (2) 야생형 대장균의 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6, Cas7의 N 말단 및 C 말단에, 핵 이행 시그널로서 KRTADGSEFESPKKKRKVE(서열 번호 54)를 부가한 단백질이다. 이러한 아미노산 서열의 단백질로 함으로써, 상기 Cas 단백질군을 진핵 세포의 핵 안으로 이행시킬 수 있다. 이와 같이 해서 핵 안으로 이행한 상기 Cas 단백질군은, 표적의 DNA를 절단한다. 또한, CRISPAR-Cas9 시스템에서는 곤란하다고 생각되는, 견고한 구조를 갖는 DNA 영역(이질염색질 등)에 있어서도, 표적 DNA의 편집이 가능해진다.

본 발명에 사용되는 Cas 단백질군의 각 단백질의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 90% 이상의 서열 동일성을 갖는 염기 서열에 의해 코딩되는 단백질이다. 본 발명에 사용되는 Cas 단백질군의 각 단백질의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 상보적인 염기 서열을 포함하는 폴리뉴클레오티드와 엄격한 조건에서 하이브리다이즈하는 폴리뉴클레오티드에 의해 코딩되는 단백질이다. 상기의 각 단백질은, Cas 단백질군을 구성하는 다른 단백질과 복합체를 형성했을 때 DNA 절단 활성을 갖는 것이다. 또한, 「서열 동일성」, 「엄격한 조건」 등의 용어의 의미는 후술한다.

-Cas 단백질군을 코딩하는 폴리뉴클레오티드-

타입 I-E의 CRISPR-Cas 시스템을 구성하는 야생형의 단백질을 코딩하는 폴리뉴클레오티드는, 진핵 세포 내에서 효율적으로 발현하도록 개변을 실시한 폴리뉴클레오티드를 포함한다. 즉, Cas 단백질군을 코딩하고, 개변이 실시된 폴리뉴클레오티드를 사용할 수 있다. 폴리뉴클레오티드의 개변의 하나의 바람직한 형태는, 진핵 세포 내에서의 발현에 적합한 염기 서열로의 개변이며, 예를 들어 진핵 세포 내에서 발현하도록 코돈을 최적화하는 것이다.

본 발명에 사용되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 하나의 바람직한 형태는, 이하이다.

Cas3; 서열 번호 1 또는 서열 번호 7로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드

Cse1(Cas8); 서열 번호 2 또는 서열 번호 8로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드

Cse2(Cas11); 서열 번호 3 또는 서열 번호 9로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드

Cas5; 서열 번호 4 또는 서열 번호 10으로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드

Cas6; 서열 번호 5 또는 서열 번호 11로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드

Cas7; 서열 번호 6 또는 서열 번호 12로 나타나는 염기 서열을 포함하는 폴리뉴클레오티드

이들은, 대장균의 야생형 Cas 단백질군을 코딩하는 염기 서열(Cas3; 서열 번호 13, Cse1(Cas8); 서열 번호 14, Cse2(Cas11); 서열 번호 15, Cas5; 서열 번호 16, Cas6; 서열 번호 17, Cas7; 서열 번호 18)을, 인공적으로 개변함으로써, 포유 동물 세포에 있어서 발현 및 기능할 수 있도록 한 폴리뉴클레오티드이다.

상기의 폴리뉴클레오티드의 인공적인 개변은, 진핵 세포 내에서의 발현에 적합한 염기 서열로 개변하고, 또한 핵 이행 시그널을 부가하는 것이다. 염기 서열의 개변 및 핵 이행 시그널의 부가에 대해서는, 상기한 바와 같다. 이에 의해, 보다 충분한 Cas 단백질군의 발현량의 상승, 그리고 기능의 증대를 기대할 수 있다.

본 발명에 사용되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 90% 이상의 서열 동일성을 갖는 염기 서열을 포함하는, 야생형의 Cas 단백질군을 코딩하는 염기 서열을 개변한 폴리뉴클레오티드이다. 이들 각 폴리뉴클레오티드로부터 발현한 단백질은, Cas 단백질군을 구성하는 다른 폴리뉴클레오티드로부터 발현한 단백질과 복합체를 형성했을 때 DNA 절단 활성을 갖는 것이다.

염기 서열의 서열 동일성은, 염기 서열 전체(또는 Cse3의 기능에 필요한 부분을 코딩하고 있는 영역)에 있어서, 적어도 90% 이상, 보다 바람직하게는 95% 이상(예를 들어, 95%, 96%, 97%, 98%, 99% 이상)일 수 있다. 염기 서열의 동일성은, BLASTN 등의 프로그램을 이용하여, 결정할 수 있다([Altschul SF (1990) Basic local alig㎚ent search tool, Journal of Molecular Biology, Vol.215(Issue 3), pp.403-410]을 참조). BLASTN에 의해 염기 서열을 해석하는 경우의 파라미터의 일례로서는, 스코어(score)=100, 단어길이(wordlength)=12의 설정을 들 수 있다. BLASTN에 의한 해석을 행하기 위한 구체적인 방법은, 당업자에게 알려져 있다. 비교 대상의 염기 서열을 최적의 상태로 얼라인먼트하기 위해서, 부가 또는 결실(갭 등)을 허용해도 된다.

또한, 「DNA 절단 활성을 갖는다」란, 폴리뉴클레오티드쇄를 적어도 1군데에 있어서 절단할 수 있는 것을 의도한다.

본 발명의 CRISPR-Cas3 시스템은, 표적 서열을 특이적으로 인식해서 DNA를 절단하는 것이 바람직하다. CRISPR-Cas3 시스템이 표적 서열을 특이적으로 인식 하고 있는지의 여부는, 예를 들어 실시예 A-1에 설명되고 있는 듀얼-루시페라아제(dual-Luciferase) 검정에 의해 알 수 있다.

본 발명에 사용되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 다른 하나의 양태는, 상기 Cas 단백질군의 염기 서열과 상보적인 염기 서열을 포함하는 폴리뉴클레오티드와 엄격한 조건에서 하이브리다이즈하는 폴리뉴클레오티드이다. 이들 각 폴리뉴클레오티드로부터 발현한 단백질은, Cas 단백질군을 구성하는 다른 폴리뉴클레오티드로부터 발현한 단백질과 복합체를 형성했을 때 DNA 절단 활성을 갖는 것이다.

여기에서 「엄격한 조건」이란, 2개의 폴리뉴클레오티드쇄가, 염기 서열에 특이적인 2중쇄의 폴리뉴클레오티드를 형성하지만, 비특이적인 2중쇄의 폴리뉴클레오티드는 형성하지 않는 조건을 말한다. 「엄격한 조건에서 하이브리다이즈한다」란, 환언하면, 서열 동일성이 높은 핵산끼리(예를 들어 완전히 매칭된 하이브리드)의 융해 온도(Tm값)로부터 15℃ 낮은 온도, 바람직하게는 10℃ 낮은 온도, 보다 바람직하게는 5℃ 낮은 온도까지의 온도 범위에 있어서, 하이브리다이즈할 수 있는 조건이라고도 할 수 있다.

엄격한 조건의 일례를 나타내면, 이하와 같다. 먼저, 0.25M Na₂HPO₄, 7% SDS, 1mM EDTA, 1×덴하르트 용액을 포함하는 완충액(pH7.2) 중, 60 내지 68℃(바람직하게는 65℃, 보다 바람직하게는 68℃)에서, 16 내지 24시간, 2종류의 폴리뉴클레오티드를 하이브리다이즈시킨다. 그 후, 20mM Na₂HPO₄, 1% SDS, 1mM EDTA를 포함하는 완충액(pH7.2) 중, 60 내지 68℃(바람직하게는 65℃, 보다 바람직하게는 68℃)에서, 15분간의 세정을 2회 행한다.

다른 예로서는, 이하의 방법을 들 수 있다. 먼저, 25% 포름아미드(보다 엄격한 조건에서는 50% 포름아미드), 4×SSC(염화나트륨/시트르산나트륨), 50mM Hepes(pH7.0), 10×덴하르트 용액, 20㎍/mL 변성 연어 정자 DNA를 포함하는 하이브리다이제이션 용액 중, 42℃에서, 밤새 프리하이브리다이제이션을 행한 후, 표지한 프로브를 첨가하고, 42℃에서 밤새 보온함으로써, 2종류의 폴리뉴클레오티드의 하이브리다이제이션을 행한다.

이어서, 하기의 조건 중 어느 하나로 세정을 행한다. 통상의 조건; 1×SSC 및 0.1% SDS를 세정액으로 하여, 37℃ 정도에서 세정. 엄격한 조건; .5×SSC 및 0.1% SDS 세정액으로 하여, 42℃ 정도에서 세정. 더욱 엄격한 조건; 0.2×SSC 및 0.1% SDS를 세정액으로 하여, 65℃ 정도에서 세정.

이와 같이 하이브리다이제이션의 세정 조건이 엄격해질수록, 특이성이 높은 하이브리다이즈가 된다. 또한, 상기 SSC, SDS 및 온도의 조건 조합은, 단순한 예시에 지나지 않는다. 하이브리다이제이션의 엄격함을 결정하는 상술한 요소 또는 다른 요소(예를 들어, 프로브 농도, 프로브의 길이, 하이브리다이제이션 반응 시간 등)를 적절히 조합함으로써, 상기와 마찬가지의 엄격함을 실현할 수 있다. 이것은, 예를 들어 [Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001] 등에 기재되어 있다.

-Cas 단백질군을 코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터-

본 발명에 있어서는, Cas 단백질군을 발현시키기 위한 발현 벡터를 이용할 수 있다. 발현 벡터는, 기재 벡터로서, 일반적으로 사용되는 여러 벡터를 사용할 수 있고, 도입되는 세포 또는 도입 방법에 따라서 적절히 선택될 수 있다. 구체적으로는, 플라스미드, 파지, 코스미드 등을 사용할 수 있다. 벡터의 구체적인 종류는 특별히 한정되는 것이 아니고, 숙주 세포 중에서 발현 가능한 벡터를 적절히 선택하면 된다.

상술한 발현 벡터의 예로서는, 파지 벡터, 플라스미드 벡터, 바이러스 벡터, 레트로바이러스 벡터, 염색체 벡터, 에피솜 벡터 및 바이러스 유래 벡터(세균 플라스미드, 박테리오 파지, 효모 에피솜 등), 효모 염색체 엘리먼트 및 바이러스(바큘로 바이러스, 파포바 바이러스, 백시니아 바이러스, 아데노 바이러스, 조류 폭스 바이러스, 가성 광견병 바이러스, 헤르페스 바이러스, 렌티 바이러스, 레트로 바이러스 등), 및 그들의 조합에서 유래하는 벡터(코스미드, 파지미드 등)를 들 수 있다.

발현 벡터는, 전사 개시 및 전사 종결을 위한 부위를 더 포함하고 있고, 또한 전사 영역 중에 리보솜 결합 부위를 포함하고 있는 것이 바람직하다. 벡터 중의 성숙 전사물의 코딩 부분은, 번역되어야 할 폴리펩티드의 처음에 전사 개시 코돈 AUG를 포함하고, 그리고 종료에 적절하게 위치되는 종지 코돈을 포함하게 된다.

본 발명에 있어서, Cas 단백질군을 발현시키기 위한 발현 벡터는, 프로모터 서열을 포함하고 있어도 된다. 상기 프로모터 서열은, 숙주가 되는 진핵 세포의 종류에 따라 적절히 선택하면 된다. 또한, 발현 벡터는, DNA로부터의 전사를 항진시키기 위한 서열, 예를 들어 인핸서 서열을 포함하고 있어도 된다. 인핸서로서는, 예를 들어 SV40 인핸서(이것은, 복제 기점의 하류의 100 내지 270bp에 배치된다), 사이토메갈로 바이러스의 초기 프로모터 인핸서, 복제 기점의 하류에 배치되는 폴리오머 인핸서 및 아데노 바이러스 인핸서를 들 수 있다. 또한, 발현 벡터는, 전사된 RNA를 안정화시키기 위한 서열, 예를 들어 폴리 A 부가 서열(폴리아데닐화 서열, polyA)을 포함하고 있어도 된다. 폴리 A 부가 서열의 예로서는, 성장 호르몬 유전자 유래의 폴리 A 부가 서열, 소 성장 호르몬 유전자 유래의 폴리 A 부가 서열, 인간 성장 호르몬 유전자 유래 폴리 A 부가 서열, SV40 바이러스 유래 폴리 A 부가 서열, 인간 또는 토끼의 β 글로빈 유전자 유래의 폴리 A 부가 서열을 들 수 있다.

동일한 벡터 내에 혼입되는 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 수는, 발현 벡터를 도입한 숙주 세포 내에서 CRISPR-Cas 시스템의 기능을 발휘할 수 있는 한에 있어서, 특별히 한정되지 않는다. 예를 들어, Cas 단백질군을 코딩하는 폴리뉴클레오티드를 1종류의(동일한) 벡터에 탑재한다고 하는 설계가 가능하고, 또한 추가로, 각 Cas 단백질군을 코딩하는 폴리뉴클레오티드의 모두 또는 일부를 따로따로 벡터에 탑재한다고 하는 설계도 가능하다. 예를 들어, 캐스케이드 단백질을 코딩하는 폴리뉴클레오티드를 1종류의(동일한) 벡터에 탑재하고, Cas3을 코딩하는 폴리뉴클레오티드를 다른 벡터에 탑재한다고 하는 설계가 가능하다. 바람직하게는, 발현 효율 등의 관점에서, 각 Cas 단백질군을 코딩하는 폴리뉴클레오티드를 따로따로 6종류의 벡터에 탑재하는 방법이 사용된다.

그 외, 발현량을 조절하는 등의 목적을 위해, 동일한 벡터 중에, 동일한 단백질을 코딩하는 폴리뉴클레오티드를 복수 탑재해도 된다. 예를 들어, Cas3을 코딩하는 폴리뉴클레오티드를 1종류의(동일한) 벡터 내의 2군데에 배치한다고 하는 설계가 가능하다.

또한, Cas 단백질군을 코딩하는 복수의 염기 서열을 포함하고 있고, 당해 복수의 염기 서열 사이에는, 세포 내의 프로테아제에 의해 절단되는 아미노산 서열(2A 펩티드 등)을 코딩하는 염기 서열이 삽입되어 있는 발현 벡터를 사용해도 된다(예를 들어, 도 8의 벡터 구조를 참조). 이러한 염기 서열을 갖는 폴리뉴클레오티드가 전사·번역되면, 세포 내에서 하나로 연결된 폴리펩티드쇄가 발현한다. 그 후, 세포 내 프로테아제의 작용에 의해, Cas 단백질군이 분리되어, 개별의 단백질이 된 후에 복합체를 형성하고, 기능한다. 이에 의해, 세포 내에서 발현하는 Cas 단백질군의 양비를 조정할 수 있다. 예를 들어, 「Cas3을 코딩하는 염기 서열과 Cse1(Cas8)을 코딩하는 염기 서열을 1개씩 포함하는 발현 벡터」로부터는, Cas3과 Cse1(Cas8)이, 등량 발현하는 것이 예측된다. 또한, 1종류의 발현 벡터로 복수의 Cas 단백질군을 발현시키는 것이 가능하기 때문에, 핸들링성이 우수한 점에서 유리하다. 한편, DNA 절단 활성의 높이의 관점에서는, 통상, Cas 단백질군을 각각 다른 발현 벡터에 의해 발현시키는 양태 쪽이 우수하다.

본 발명에 사용되는 발현 벡터는, 공지된 방법에 의해 제작할 수 있다. 이러한 방법으로서는, 벡터를 제작용 키트에 부속하는 실시 매뉴얼에 기재된 방법에 더하여, 다양한 안내서에 기재된 방법을 들 수 있다. 예를 들어, [Joseph Sambrook & David W. Russell, Molecular cloning: a laboratory manual 3rd Ed., New York: Cold Spring Harbor Laboratory Press, 2001]은, 포괄적인 안내서이다.

-crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터-

본 발명의 CRISPR-Cas3 시스템은, 게놈 편집을 행하는 DNA에 대한 표적화를 위해서, crRNA, crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 포함한다.

crRNA는 CRISPR-Cas 시스템의 일부를 형성하는 RNA이며, 표적 서열과 상보적인 염기 서열을 갖는다. 본 발명의 CRISPR-Cas3 시스템은, crRNA에 의해, 표적 서열을 특이적으로 인식해서 그 서열을 절단하는 것을 가능하게 한다. CRISPR-Cas9 시스템을 대표로 하는 CRISPR-Cas 시스템에 있어서는, 지금까지 cRNA로서, 통상, 성숙 crRNA가 사용되어 왔다. 그러나, CRISPR-Cas3 시스템을 진핵 세포로 기능시키는 경우에 있어서는, 그 이유는 명백하지 않지만, 성숙 crRNA의 이용은 적합하지 않은 것이 명확해졌다. 그리고, 놀랍게도, 성숙 crRNA 대신에, 프리 crRNA를 이용함으로써, 진핵 세포에 있어서 고효율로 게놈 편집을 행하는 것이 가능한 것이 판명되었다. 이 사실은, 성숙 crRNA와 프리 crRNA와의 대비 실험으로부터 명백하다(도 10). 따라서, 본 발명의 crRNA로서는, 프리 crRNA를 사용하는 것이 특히 바람직하다.

본 발명에 사용하는 프리 crRNA는, 전형적으로는, 「리더 서열-반복 서열-스페이서 서열-반복 서열(LRSR 구조)」 또는 「반복 서열-스페이서 서열-반복 서열(RSR 구조)」의 구조를 갖는다. 리더 서열은, AT 풍부한 서열로, 프리 crRNA를 발현시키는 프로모터로서 기능한다. 반복 서열은, 스페이서 서열을 개재해서 반복하고 있는 서열이며, 스페이서 서열은, 표적 DNA에 상보적인 서열로서 본 발명에 있어서 설계하는 서열이다(본래는, 어댑테이션의 과정에 있어서 받아들인, 외래 DNA 유래의 서열이다). 프리 crRNA는, 캐스케이드를 구성하는 단백질(예를 들어, 타입 I-A, B, D 내지 E에서는 Cas6, 타입 I-C에서는 Cas5)에 의해 절단되면 성숙 crRNA가 된다.

전형적으로는, 리더 서열의 쇄길이는 86염기, 반복 서열의 쇄길이는 29염기이다. 스페이서 서열의 쇄길이는, 예를 들어 10 내지 60염기, 바람직하게는 20 내지 50염기, 보다 바람직하게는 25 내지 40염기, 전형적으로는 32 내지 37염기이다. 따라서, 본 발명에 있어서 사용되는 프리 crRNA의 쇄길이는, LRSR 구조의 경우, 예를 들어 154 내지 204염기, 바람직하게는 164 내지 194염기, 보다 바람직하게는 169 내지 184염기, 전형적으로는 176 내지 181염기이다. 또한, RSR 구조의 경우, 예를 들어 68 내지 118염기, 바람직하게는 78 내지 108염기, 보다 바람직하게는 83 내지 98염기, 전형적으로는 90 내지 95염기이다.

본 발명의 CRISPR-Cas3 시스템을 진핵 세포에 있어서 기능시키기 위해서는, 프리 crRNA의 반복 서열이, 캐스케이드를 구성하는 단백질에 의해 절단되는 과정이 중요하다고 생각된다. 따라서, 상기 반복 서열은, 이러한 절단이 발생하는 한, 상기 쇄길이보다 짧아도 되고 길어도 되는 것은, 이해하기 바란다. 즉, 프리 crRNA는, 후술하는 성숙 crRNA의 양 끝에, 캐스케이드를 구성하는 단백질에 의한 절단에 충분한 서열이 부가된 crRNA라 할 수 있다. 본 발명의 방법의 바람직한 형태는, 이와 같이, CRISPR-Cas3 시스템을 진핵 세포에 도입한 후에, 캐스케이드를 구성하는 단백질에 의해 crRNA가 절단되는 공정을 포함한다.

한편, 프리 crRNA가 절단되어 생성하는 성숙 crRNA는, 「5' 핸들 서열-스페이서 서열-3' 핸들 서열」의 구조를 갖는다. 전형적으로는, 5' 핸들 서열은, 반복 서열의 22 내지 29번째의 8염기로 이루어지고 Cas5에 홀딩된다. 또한, 전형적으로는, 3' 핸들 서열은, 반복 서열의 1 내지 21번째의 21염기로 이루어지고, 6 내지 21번째의 염기로 스템-루프 구조를 형성하여, Cas6에 홀딩된다. 따라서, 성숙 crRNA의 쇄길이는 통상 61 내지 66염기이다. 단, CRISPR-Cas3 시스템의 타입에 따라서는, 3' 핸들 서열을 가지지 않는 성숙 crRNA도 있는 점에서, 이 경우에는 쇄길이는 21염기 짧아진다.

또한, RNA의 서열은, DNA의 편집을 원하는 표적 서열에 따라서 적절히 설계하면 된다. 또한, RNA의 합성은, 당해 분야에서 기지인 임의의 방법을 사용해서 행할 수 있다.

-진핵 세포-

본 발명에 있어서의 「진핵 세포」로서는, 예를 들어 동물 세포, 식물 세포, 조세포, 진균 세포를 들 수 있다. 또한 동물 세포로서는, 예를 들어 포유 동물 세포 외에, 어류, 조류, 파충류, 양서류, 곤충류의 세포를 들 수 있다.

「동물 세포」에는, 예를 들어 동물의 개체를 구성하고 있는 세포, 동물로부터 적출된 기관·조직을 구성하는 세포, 동물의 조직에서 유래하는 배양 세포 등이 포함된다. 구체적으로는, 예를 들어 난모 세포나 정자 등의 생식 세포; 각 단계의 배의 배세포(예를 들어, 1세포기 배, 2세포기 배, 4세포기 배, 8세포기 배, 16세포기 배, 상실기 배 등); 유도 다능성 줄기(iPS) 세포나 배성 줄기(ES) 세포 등의 줄기 세포; 섬유아 세포, 조혈 세포, 뉴런, 근세포, 골세포, 간세포, 췌장 세포, 뇌세포, 신장 세포 등의 체세포 등을 들 수 있다. 게놈 편집 동물의 작성에 사용되는 난모 세포로서는, 수정 전 및 수정 후의 난모 세포를 이용할 수 있지만, 바람직하게는 수정 후의 난모 세포, 즉 수정란이다. 특히 바람직하게는, 수정란은 전핵기 배의 것이다. 난모 세포는, 동결 보존된 것을 해동해서 사용할 수 있다.

본 발명에 있어서 「포유 동물」이란, 인간 및 비인간 포유 동물을 포함하는 개념이다. 비인간 포유 동물의 예로서는, 소, 멧돼지, 돼지, 양, 염소 등의 우제류, 말 등의 기제류, 마우스, 래트, 모르모트, 햄스터, 다람쥐 등의 설치류, 토끼 등의 토끼목, 개, 고양이, 페렛 등의 식육류 등을 들 수 있다. 상술한 비인간 포유 동물은, 가축 또는 컴패니언 애니멀(애완 동물)이어도 되고, 야생 동물이어도 된다.

「식물 세포」로서는, 예를 들어 곡물류, 유료 작물, 사료 작물, 과일, 채소류의 세포를 들 수 있다. 「식물 세포」에는, 예를 들어 식물의 개체를 구성하고 있는 세포, 식물로부터 분리한 기관이나 조직을 구성하는 세포, 식물의 조직에서 유래하는 배양 세포 등이 포함된다. 식물의 기관이나 조직으로서는, 예를 들어 잎, 줄기, 경정(생장점), 뿌리, 괴경, 캘러스 등을 들 수 있다. 식물의 예로서는, 벼, 옥수수, 바나나, 피넛, 해바라기, 토마토, 유채, 담배, 소맥, 대맥, 감자, 대두, 목화, 카네이션 등을 들 수 있고, 그의 번식 재료(예를 들어, 종자, 괴근, 괴경 등)도 포함된다.

-DNA의 편집-

본 발명에 있어서, 「진핵 세포의 DNA를 편집한다」란, 진핵 세포의 DNA의 편집을 생체 내에서 행하는 공정이어도 되고, 시험관 내에서 행하는 공정이어도 된다. 또한, 「DNA를 편집한다」란, 이하의 유형에 예시되는 조작(그의 조합을 포함한다)을 의도한다.

또한, 본 명세서에 있어서, 상기의 문맥에서 사용되는 DNA는, 세포핵 내에 존재하는 DNA뿐만 아니라, 미토콘드리아 DNA 등의 세포핵 이외에 존재하는 DNA 및 외래성 DNA도 포함한다.

1. 표적 부위에 있어서의 DNA쇄를 절단한다.

2. 표적 부위에 있어서의 DNA쇄의 염기를 결실시킨다.

3. 표적 부위에 있어서의 DNA쇄에 염기를 삽입한다.

4. 표적 부위에 있어서의 DNA쇄의 염기를 치환한다.

5. 표적 부위에 있어서의 DNA쇄의 염기를 수식한다.

6. 표적 부위에 있어서의 DNA(유전자)의 전사를 조절한다.

본 발명의 CRISPR-Cas3 시스템의 하나의 양태에 있어서는, DNA 절단을 도입하는 것 이외의 방법으로, 표적 DNA를 수식하는 효소 활성을 갖는 단백질을 이용한다. 이 양태는, 예를 들어 Cas3 혹은 캐스케이드를 원하는 효소 활성을 갖는 이종 단백질과 융합하여, 키메라 단백질로 함으로써 달성할 수 있다. 따라서, 본 발명에 있어서의 「Cas3」 및 「캐스케이드」에는, 이러한 융합 단백질도 포함된다. 융합하는 단백질의 효소 활성으로서는, 예를 들어 데아미나아제 활성(예를 들어, 시티딘 데아미나아제 활성, 아데노신 데아미나아제 활성), 메틸트랜스퍼라아제 활성, 탈메틸화 효소 활성, DNA 수복 활성, DNA 손상 활성, 디스뮤타아제 활성, 알킬화 활성, 탈퓨린 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사아제 활성, 리컴비나아제 활성, 폴리머라아제 활성, 리가아제 활성, 광회복 효소 활성 및 글리코실라아제 활성이 포함되지만, 이들에 제한되지 않는다. 이 경우, 반드시, Cas3의 뉴클레아제 활성이나 헬리카제 활성은 필요가 없는 것이므로, Cas3으로서는, 이들 활성의 일부 혹은 전부를 결실시킨 변이체(예를 들어, D 도메인 H74A의 변이체(dnCas3), SF2 도메인 모티프 1의 K320N의 변이체(dhCas3) 및 SF2 도메인 모티프 3의 S483A/T485A의 더블의 변이체(dh2Cas3))를 이용할 수 있다. 예를 들어, Cas3의 뉴클레아제 활성의 일부 또는 전부를 소실시킨 변이체와 데아미나아제와의 융합 단백질을 본 발명의 CRISPR-Cas3 시스템의 구성 요소로 함으로써, 표적 부위에 있어서의 큰 결실을 발생시키지 않고, 염기를 치환함으로써, 정밀한 게놈 편집이 가능해진다. CRISPR-Cas 시스템으로의 데아미나아제의 적용의 방법은 공지이며(Nishida K. et al., Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems, Science, DOI: 10.1126/science.aaf8729, (2016)), 그것을 본 발명의 CRISPR-Cas3 시스템에 응용하면 된다.

본 발명의 CRISPR-Cas3 시스템의 다른 양태에 있어서는, DNA 절단하지 않고, 본 시스템의 결합 부위에 있어서의 유전자의 전사를 조절한다. 이 양태는, 예를 들어 Cas3 혹은 캐스케이드를 원하는 전사 조절 단백질과 융합하고, 키메라 단백질로 함으로써 달성할 수 있다. 따라서, 본 발명에 있어서의 「Cas3」 및 「캐스케이드」에는, 이러한 융합 단백질도 포함된다. 전사 조절 단백질로서는, 예를 들어 광 유도성 전사 제어 인자, 소분자/약제 반응성 전사 제어 인자, 전사 인자, 전사 억제 인자 등을 들 수 있지만, 이들에 제한되지 않는다. 이 경우, 반드시, Cas3의 뉴클레아제 활성이나 헬리카제 활성은 필요가 없는 것이므로, Cas3으로서는, 이들 활성의 일부 혹은 전부를 결실시킨 변이체(예를 들어, D 도메인 H74A의 변이체(dnCas3), SF2 도메인 모티프 1의 K320N의 변이체(dhCas3) 및 SF2 도메인 모티프3의 S483A/T485A의 더블의 변이체(dh2Cas3))를 이용할 수 있다. CRISPR-Cas 시스템으로의 전사 조절 단백질의 적용 방법은, 당업자에게 공지이다.

또한, 본 발명의 CRISPR-Cas3 시스템에 있어서, 예를 들어 Cas3의 뉴클레아제 활성의 일부 혹은 전부를 결실시킨 변이체를 이용하는 경우, 다른 뉴클레아제 활성을 갖는 단백질을 Cas3 또는 캐스케이드와 융합해도 된다. 이러한 양태도, 본 발명에 포함된다.

또한, 본 발명의 CRISPR-Cas3 시스템에 있어서, Cas3의 뉴클레아제 활성의 일부 혹은 전부를 결실시킨 변이체를 이용하고, DNA의 편집에 있어서, 다른 단백질의 활성을 이용하는 경우에는, 본 명세서에 있어서의 「DNA의 절단 활성」은, 적절히, 당해 다른 단백질이 갖는 각종 활성으로 바꿔서 읽는 것으로 한다.

또한, DNA의 편집은, 개체 내의 특정한 세포에 포함되는 DNA에 대하여 행해지는 것이어도 된다. 이러한 DNA의 편집은, 예를 들어 동식물의 개체를 구성하는 세포 중, 특정한 세포를 표적으로 하여 행할 수 있다.

본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터의 형태로 진핵 세포에 도입하는 방법은, 특별히 한정되지 않는다. 예를 들어, 전기 천공법, 인산 칼슘법, 리포솜법, DEAE 덱스트란법, 미세주입법, 양이온성 지질 매개 트랜스펙션, 일렉트로포레이션, 형질 도입, 바이러스 벡터를 사용한 감염 등의 방법을 들 수 있다. 이러한 방법은, 「Leonard G. Daviset al., Basic methods in molecular biology, New York: Elsevier, 1986」 등, 많은 표준적 연구실 매뉴얼에 기재되어 있다.

본 발명의 CRISPR-Cas3 시스템을 분자를 단백질의 형태로 진핵 세포에 도입하는 방법은, 특별히 한정되지 않는다. 예를 들어, 일렉트로포레이션, 양이온성 지질 매개 트랜스펙션, 미세주입 등을 들 수 있다.

본 발명에 의한 DNA의 편집은, 여러 분야에 응용할 수 있다. 응용에는, 예를 들어 유전자 치료, 품종 개량, 트랜스제닉 동물 또는 세포의 제작, 유용 물질의 생산, 생명 과학 연구 등이 포함된다.

세포로부터 비인간 개체를 제작하는 방법으로서는, 공지된 방법을 이용할 수 있다. 동물에 있어서 세포로부터 비인간 개체를 제작하는 경우, 통상, 생식 세포 또는 다능성 줄기 세포가 이용된다. 예를 들어, 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를 난모 세포에 도입하고, 얻어진 난모 세포를 뒤이어, 거짓 임신 상태로 한 암컷 비인간 포유 동물의 자궁에 이식하고, 그 후 산자를 얻는다. 이식은 1세포기 배, 2세포기 배, 4세포기 배, 8세포기 배, 16세포기 배, 또는 상실기 배의 수정란에서 행할 수 있다. 난모 세포는 필요에 따라, 이식될 때까지 적당한 조건 하에서 배양할 수 있다. 난모 세포의 이식 및 배양은 종래 공지된 방법에 기초해서 행할 수 있다(Nagy A. et al., Manipulating the Mouse Embryo. Cold Spring Harbour, New York:Cold Spring Harbour Laboratory Press, 2003). 얻어진 비인간 개체로부터는, 원하는 DNA가 편집된 자손이나 클론을 얻을 수도 있다.

또한, 식물에 있어서는, 옛부터, 그의 체세포가 분화 전능성을 갖고 있는 것이 알려져 있고, 여러 식물에 있어서, 식물 세포로부터 식물체를 재생하는 방법이 확립되어 있다. 따라서, 예를 들어 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를 식물 세포에 도입하고, 얻어진 식물 세포로부터 식물체를 재생함으로써, 원하는 DNA가 녹-인된 식물체를 얻을 수 있다. 얻어진 식물체로부터는, 원하는 DNA가 편집된 자손, 클론 또는 번식 재료를 얻을 수도 있다. 조직 배양에 의해 식물의 조직을 재분화시켜서 개체를 얻는 방법으로서는, 본 기술 분야에 있어서 확립된 방법을 이용할 수 있다(형질 전환 프로토콜 [식물편] 다베이 유타카·편 가가꾸 도진 pp.340-347(2012)).

[2] CRISPR-Cas3 시스템에 사용되는 키트

본 발명의 CRISPR-Cas3 시스템에 사용되는 키트는, 이하의 (A) 및 (B)를 포함한다.

추가로, crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 포함해도 된다.

본 발명의 키트의 구성 요소는, 모두 또는 일부가 혼합된 양태여도 되고, 각각이 독립되어 있는 양태여도 된다.

본 발명의 키트는, 예를 들어 의약품, 식품, 축산, 수산, 공업, 바이오 공학, 생명과학 연구 등의 분야에 이용할 수 있다.

이하, 본 발명의 키트에 대해서, 의약품(약제)을 상정해서 설명한다. 또한, 상기 키트를 축산, 바이오 공학, 생명 과학 연구 등의 분야에서 사용하는 경우에는, 이하의 설명을, 당해 분야의 기술 상식에 기초하여 적절히 치환함으로써 실시할 수 있다.

본 발명의 CRISPR-Cas3 시스템을 사용하여, 인간을 포함하는 동물 세포의 DNA를 편집하기 위한 의약품은, 통상의 방법에 의해 제조될 수 있다. 보다 구체적으로는, 상기 본 발명의 CRISPR-Cas3 시스템을 구성하는 분자를, 예를 들어 의약품 첨가물과 조합함으로써 제조될 수 있다.

여기서 「의약품 첨가물」이란, 의약품에 포함되는 유효 성분 이외의 물질을 의도한다. 의약품 첨가물은, 제제화를 용이하게 하고, 품질의 안정화를 도모하고, 유용성을 높이는 등의 목적을 위해, 의약품에 포함되는 물질이다. 일례에 있어서, 상기 의약품 첨가물은, 부형제, 결합제, 붕괴제, 활택제, 유동화제(고형 방지제), 착색제, 캡슐 피막, 코팅제, 가소제, 교미제, 감미제, 착향제, 용제, 용해 보조제, 유화제, 현탁화제(점착제), 점조제, pH 조정제(산성화제, 알칼리화제, 완충제), 습윤제(가용화제), 항균성 보존제, 킬레이트제, 좌제 기재, 연고 기제, 경화제, 연화제, 의료용수, 분사제, 안정제, 보존제일 수 있다. 이들 의약품 첨가물은, 의도된 제형 및 투여 경로, 그리고 표준적인 약학적 관행에 따라, 당업자에 의해 용이하게 선택될 수 있다.

또한, 본 발명의 CRISPR-Cas3 시스템을 이용해서 동물 세포의 DNA를 편집하기 위한 의약품은, 가일층의 유효 성분을 포함하고 있어도 된다. 상기 가일층의 유효 성분으로서는, 특별히 한정되지 않고 당업자에 의해 적절히 설계할 수 있다.

이상으로 설명한 유효 성분 및 의약품 첨가물의 구체예는, 예를 들어 미국 식품 의약품국(FDA), 유럽 의약품청(EMA), 일본 후생 노동성 등이 책정하고 있는 기준에 의해, 알 수 있다.

의약품을 원하는 세포에 송달하는 방법으로서는, 예를 들어, 해당 세포를 표적으로 하는 바이러스 벡터(아데노 바이러스 벡터, 아데노 수반 바이러스 벡터, 렌티 바이러스 벡터, 센다이 바이러스 벡터 등), 해당 세포를 특이적으로 인식하는 항체 등을 사용한 방법을 들 수 있다. 의약품은, 목적에 따라 임의의 제형을 취할 수 있다. 또한 상기 의약품은, 의사 또는 의료 종사자에 의해, 적절히 처방된다.

본 발명의 키트는, 추가로 사용설명서를 구비하고 있는 것이 바람직하다.

실시예

이하, 실시예에 의해 본 발명을 더욱 상세히 설명하지만, 본 발명은 하기 실시예에만 한정되는 것은 아니다.

A. 진핵 세포에 있어서의 CRISPR-Cas3 시스템의 확립

〔재료와 방법〕

[1] 표적 서열을 포함하는 리포터 벡터의 제작

표적 서열은, 인간 CCR5 유전자 유래의 서열(서열 번호 19) 및 대장균의 CRISPR의 스페이서 서열(서열 번호 22)로 했다.

표적 서열을 벡터에 삽입하기 위해서, 인간 CCR5 유전자 유래의 표적 서열(서열 번호 19)을 포함하는 합성 폴리뉴클레오티드(서열 번호 20) 및 상기 표적 서열(서열 번호 19)에 상보적인 서열을 포함하는 합성 폴리뉴클레오티드(서열 번호 21)를 준비했다. 마찬가지로, 대장균의 CRISPR의 스페이서 서열 유래의 표적 서열(서열 번호 22)을 포함하는 합성 폴리뉴클레오티드(서열 번호 23) 및 상기 표적 서열(서열 번호 22)에 상보적인 서열을 포함하는 합성 폴리뉴클레오티드(서열 번호 24)를 준비했다. 상기 합성 폴리뉴클레오티드는, 모두 홋카이도 시스템 사이언스 가부시키가이샤로부터 입수했다.

상기의 폴리뉴클레오티드를, [Sakuma T et al. (2013) Efficient TALEN construction and evaluation methods for human cell and animal applications, Genes to Cells, Vol.18(Issue 4), pp.315-326]에 기재된 방법에 의해, 리포터 벡터에 삽입했다. 개략을 나타내면 이하와 같다. 먼저, 서로 상보적인 서열을 갖는 폴리뉴클레오티드(서열 번호 20의 폴리뉴클레오티드 및 서열 번호 21의 폴리뉴클레오티드; 서열 번호 23의 폴리뉴클레오티드 및 서열 번호 24의 폴리뉴클레오티드)를, 95℃에서 5분간 가열하고, 그 후 실온까지 냉각하고, 하이브리다이즈시켰다. 상기의 공정에는, 블록 인큐베이터(BI-515A, 아스텍크사)를 사용했다. 이어서, 하이브리다이즈시켜서 2중쇄 구조를 형성한 폴리뉴클레오티드를, 기재 벡터에 삽입하고, 리포터 벡터로 했다.

제작한 리포터 벡터의 서열을, 서열 번호 31(인간 CCR5 유전자 유래의 표적 서열을 포함하는 리포터 벡터) 및 서열 번호 32(대장균의 CRISPR의 스페이서 서열 유래의 표적 서열을 포함하는 리포터 벡터)에 나타낸다. 또한, 리포터 벡터의 구조를, 도 4의 (d)에 나타낸다.

[2] Cse1(Cas8), Cse2(Cas11), Cas5, Cas6, Cas7 및 crRNA 발현 벡터의 제작

[인서트의 증폭 및 제조]

Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7을 코딩하는, 개변된 염기 서열을 갖는 폴리뉴클레오티드(각각, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5 및 서열 번호 6)에 대해서는, 먼저, 서열 번호 2-서열 번호 3-서열 번호 6-서열 번호 4-서열 번호 5의 순으로 연결된 폴리뉴클레오티드(Cse1(Cas8)-Cse2(Cas11)-Cas7-Cas5-Cas6의 순으로, 각각을 코딩하는 염기 서열이 연결된 폴리뉴클레오티드)를, 젠스크립트사에 제조 위임하고, 입수했다. Cse1(Cas8)-Cse2(Cas11)-Cas7-Cas5-Cas6의 각 단백질을 코딩하는 염기 서열간은, 2A 펩티드(아미노산 서열: GSGATNFSLLKQAGDVEENPGP(서열 번호 58))로 연결했다.

또한, 2A 펩티드를 코딩하는 염기 서열은, 각각의 Cas 단백질 연결부에 따라 약간 상이하고, 이하와 같았다. Cse1(Cas8)과 Cse2(Cas11) 사이에 있어서의 서열: GGAAGCGGAGCAACCAACTTCAGCCTGCTGAAGCAGGCCGGCGATGTGGAGGAGAATCCAGGCCCC(서열 번호 59). Cse2(Cas11)와 Cas7 사이에 있어서의 서열: GGCTCCGGCGCCACCAATTTTTCTCTGCTGAAGCAGGCAGGCGATGTGGAGGAGAACCCAGGACCT(서열 번호 60). Cas7과 Cas5 사이에 있어서의 서열: GGATCTGGAGCCACCAATTTCAGCCTGCTGAAGCAAGCAGGCGACGTGGAAGAAAACCCAGGACCA(서열 번호 61). Cas5와 Cas6 사이에 있어서의 서열: GGATCTGGGGCTACTAATTTTTCTCTGCTGAAGCAAGCCGGCGACGTGGAAGAGAATCCAGGACCG(서열 번호 62).

이어서, 하기 표의 PCR 조건(프라이머 및 타임 코스)에서, 각 폴리뉴클레오티드를 증폭했다. PCR에는, 2720 Thermal cycler(applied biosystems사)를 사용했다.

crRNA를 발현시키기 위한 염기 서열을 갖는 폴리뉴클레오티드로서, 하기의 상보적인 서열을 갖는 폴리뉴클레오티드를 입수했다.

1. 인간 CCR5 유전자 유래의 서열에 대응하는 crRNA를 발현시키기 위한 폴리뉴클레오티드(서열 번호 25 및 26, 홋카이도 시스템 사이언스사에서 입수)

2. 대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키기 위한 폴리뉴클레오티드(서열 번호 27 및 28, 홋카이도 시스템 사이언스사에서 입수)

3. 인간 EMX1 유전자 유래의 서열에 대응하는 crRNA를 발현시키기 위한 폴리뉴클레오티드(서열 번호 29 및 30, 파스맥사에서 입수).

[라이게이션 및 형질 전환]

기재 플라스미드로서, pPB-CAG-EBNXN(Sanger Center로부터 공여)을 사용했다. NEB 버퍼 중에서, 기재 플라스미드 1.6㎍과, 제한 효소 BglII(New England Biolabs사) 1μl 및 XhoI(New England Biolabs사) 0.5μl를 혼합하고, 37℃에서 2시간 반응시켰다. 절단된 기재 플라스미드는, 겔 추출 키트(Gel extraction kit)(Qiagen사)로 정제했다.

이와 같이 제조한 기재 플라스미드 및 상기 인서트를, Gibson Assembly 시스템에서 라이게이션했다. 라이게이션에서는, 기재 플라스미드와 인서트와의 비율이 1:1이 되도록 하고, Gibson Assembly 시스템의 프로토콜에 따라 행하였다(50℃에서 25분간, 반응액의 전체 용량: 8μL).

이어서, 상기에서 얻어진 플라스미드의 용액(라이게이션 반응액) 6μL와, 컴피턴트 세포(다케다 연구실 제작)를 사용해서, 통상의 방법에 의해, 형질 전환을 행하였다.

그 후, 알칼리 프렙법으로, 형질 전환한 대장균으로부터 플라스미드 벡터를 정제했다. 간결하게는, QIAprep 스핀 미니프렙 키트(Spin Miniprep Kit)(Qiagen사)를 사용해서 플라스미드 벡터를 회수하고, 회수한 플라스미드 벡터를 에탄올 침전법으로 정제 후, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.

각 플라스미드 벡터의 구조를, 도 4의 (a) 내지 (c)에 나타낸다. 또한, 프리 crRNA의 발현 벡터의 염기 서열을, 서열 번호 33(인간 CCR5 유전자 유래의 서열에 대응하는 crRNA를 발현시키는 발현 벡터), 서열 번호 34(대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키는 발현 벡터) 및 서열 번호 35(인간 EMX1 유전자 유래의 서열에 대응하는 crRNA를 발현시키는 발현 벡터)에 나타낸다.

[3] Cas3 발현 벡터의 제작

Cas3을 코딩하는, 개변된 염기 서열을 갖는 폴리뉴클레오티드(서열 번호 1)는, 젠스크립트사에서 입수했다. 구체적으로는, 상기의 폴리뉴클레오티드가 혼입되어 있는 pUC57 벡터를, 젠스크립트사에서 입수했다.

상기의 벡터를, 제한 효소 NotI로 절단했다. 이어서, 클레나우 프래그먼트(Klenow Fragment)(다카라 바이오사)를 2U 및 2.5mM dNTP 혼합물(다카라 바이오사)을 1μL를 사용하여, 프래그먼트의 단 끝을 평활화시켰다. 그 후, 겔 추출(Qiagen사)을 사용하여, 상기 프래그먼트를 정제했다. 정제된 프래그먼트를, 제한 효소 XhoI로 더 절단하고, 겔 추출(Qiagen사)을 사용해서 정제했다.

정제된 프래그먼트를, 기재 플라스미드(pTL2-CAG-IRES-NEO 벡터, 다케다 연구실 제작) 및 라이게이션 키트(Mighty Mix, 다카라 바이오사)를 사용하여, 라이게이션했다. 그 후, [2]와 동일한 조작에 의해, 형질 전환 및 정제를 행하였다. 회수한 플라스미드 벡터는, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.

[4] BPNLS를 포함하는 플라스미드 벡터의 제작

BPNLS를 5' 말단 및 3' 말단에 연결시킨, Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7 발현 벡터를 제작했다(도 7을 참조).

BPNLS를 양 말단에 포함하는 각 Cas 단백질군에 관한 인서트의 제작은, Thermo Fisher Scientific에 의뢰했다. 상기 인서트의 구체적인 서열은, (AGATCTTAATACGACTCACTATAGGGAGAGCCGCCACCATGGCC: 서열 번호 56)-(서열 번호 7 내지 12 중 어느 하나)-(TAATATCCTCGAG: 서열 번호 57)이다. 서열 번호 56은, BgIII에 의한 절단 개소를 마련한 서열이다. 서열 번호 57은, XhoI에 의한 절단 개소를 마련한 서열이다.

상기 서열이 혼입되어 있는 pMK 벡터를, 제한 효소 BgIII 및 XhoI로 절단하고, 겔 추출(Qiagen사)을 사용해서 정제했다. 정제한 프래그먼트를, 기재 플라스미드(pPB-CAG-EBNXN, Sanger Center로부터 공여) 및 라이게이션 키트(Mighty Mix, 다카라 바이오사)를 사용하여, 라이게이션했다. 그 후, [2]와 동일한 조작에 의해, 형질 전환 및 정제를 행하였다. 회수한 플라스미드 벡터는, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.

[5] 캐스케이드(2A)를 포함하는 플라스미드 벡터의 제작

Cse1(Cas8), Cse2(Cas11), Cas7, Cas5 및 Cas6이, 이 순으로 연결된 염기 서열의 발현 벡터를 제작했다. 보다 구체적으로는, (NLS-Cse1(Cas8): 서열 번호 2)-2A-(NLS-Cse2(Cas11): 서열 번호 3)-2A-(NLS-Cas7: 서열 번호 6)-2A-(NLS-Cas5: 서열 번호 4)-2A-(NLS-Cas6: 서열 번호 5)의 순으로 배치된 발현 벡터를 제작했다(도 8 참조). 또한, NLS의 아미노산 서열은 PKKKRKV(서열 번호 52), 염기 서열은 CCCAAGAAGAAGCGGAAGGTG(서열 번호 53)이다. 또한, 2A 펩티드의 아미노산 서열은 GSGATNFSLLKQAGDVEENPGP(서열 번호 58)이다(대응하는 염기 서열은, 각각 서열 번호 59 내지 62이다).

상술한 염기 서열을 갖는 폴리펩티드를, 젠스크립트로부터 입수했다. 상기 서열이 혼입되어 있는 pUC57 벡터를, 제한 효소 EcoRI-HF로 절단하고, 겔 추출(Qiagen사)을 사용해서 정제했다. 정제한 프래그먼트를, 기재 플라스미드(pTL2-CAG-IRES-Puro 벡터, 다케다 연구실 제작) 및 라이게이션 키트(Mighty Mix, 다카라 바이오사)를 사용하여, 라이게이션했다. 그 후, [2]와 동일한 조작에 의해, 형질 전환 및 정제를 행하였다. 회수한 플라스미드 벡터는, TE 완충액 중에서 1㎍/μL의 농도가 되도록 제조했다.

〔실시예 A-1〕

염기 서열을 개변하고, 핵 이행 시그널을 부가한 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7과, crRNA를 HEK(human embryonic kidney; 인간 배아 신장) 293T 세포에 발현시키고, 외인성 DNA의 표적 서열의 절단 활성을 평가했다.

트랜스펙션에 앞서, HEK293T 세포를 10㎝ 디쉬 중에서 배양했다. HEK293T 세포의 배양은, EF 배지(GIBCO사)에서, 37℃, 5% CO₂ 분위기 하에서 행하였다. EF 배지 중에 있어서의 HEK293T 세포의 밀도는, 3×10⁴/100μL로 제조했다.

또한, 상기 리포터 벡터 100ng; Cas3 플라스미드, Cse1(Cas8) 플라스미드, Cse2(Cas11) 플라스미드, Cas5 플라스미드, Cas6 플라스미드, Cas7 플라스미드 및 crRNA 플라스미드 각 200ng; pRL-TK 벡터(레닐라 루시페라아제를 발현 가능, Promega사) 60ng; 그리고, pBluecscriptII KS(+) 벡터(Agilent Technologies사) 300ng를, Opti-MEM(Thermo Fisher Scientific사) 25μL에 혼합했다. 리포터 벡터로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터를 사용한 조건이 도 1의 1에 상당하고, 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터를 사용한 조건이 도 1의 10에 상당한다.

리포펙타민(lipofectamine) 2000(Thermo Fisher Scientific사) 1.5μL와 OptiMEM(Thermo Fisher Scientific사) 25μL를 혼합하고, 실온에서 5분간 인큐베이트했다. 그 후, 상기의 플라스미드+OptiMEM 혼합물과 리포펙타민 2000+OptiMEM 혼합물을 혼합하고, 실온에서 20분간 인큐베이트했다. 얻어진 혼합물을, HEK293T 세포를 포함하는 상기 EF 배지 1mL와 혼합하고, 96웰 플레이트에 파종했다(각각의 벡터의 조합당 1웰씩, 합계 12웰에 파종했다).

37℃, 5% CO₂ 분위기 하에서 24시간 배양 후, 듀얼-글로 루시페라아제 검정 시스템(Dual-Glo Luciferase assay system)(Promega사)의 프로토콜에 따라, 듀얼- 루시페라아제 검정을 행하였다. 루시페라아제 및 레닐라 루시페라아제의 측정에는, Centro XS³ LB 960(BERTHOLD TECHNOLOGIES사)를 사용했다.

대조 실험으로서, 이하의 조건에서 마찬가지 실험을 행하였다.

1. Cas3 플라스미드, Cse1(Cas8) 플라스미드, Cse2(Cas11) 플라스미드, Cas5 플라스미드, Cas6 플라스미드 또는 Cas7 플라스미드 중 어느 하나 대신에 동량의 pBluecscriptII KS(+) 벡터(Agilent Technologies사)를 혼합하고, 발현시켰다(도 1의 2 내지 7).

2. 상기 조작 수순에서 사용한 crRNA 플라스미드 대신에, 표적 서열과는 상보적이지 않은 crRNA를 발현시키는 플라스미드를 혼합했다. 즉, CCR5 유전자 유래의 표적 서열에 대해서는, 대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키는 플라스미드를 혼합시키고(도 1의 8), 대장균의 CRISPR의 스페이서 서열을 표적으로 하는 경우에는, CCR5 유전자 유래의 서열에 대응하는 crRNA를 발현시키는 플라스미드를 혼합하고, 발현시켰다(도 1의 11).

3. 네거티브 컨트롤로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터만(도 1의 9), 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터만(도 1의 12)을 발현시켰다.

(결과)

듀얼-루시페라아제 검정의 결과를 도 1의 위의 그래프로, 실험 조건을 도 1의 아래의 표로 나타냈다. 도 1의 (b) 중, 「CCR5-표적」 및 「스페이서-표적」은, 각각 CCR5 유래의 표적 서열 및 대장균의 CRISPR의 스페이서 서열을 나타낸다. 또한, 「CCR5-crRNA」 및 「스페이서-crRNA」는, 각각 상기 CCR5-표적과 상보적인 서열 및 스페이서-표적과 상보적인 서열을 나타낸다.

도 1에 있어서, Cas3 플라스미드, Cse1(Cas8) 플라스미드, Cse2(Cas11) 플라스미드, Cas5 플라스미드, Cas6 플라스미드 및 Cas7 플라스미드 모두와, 표적 서열에 상보적인 crRNA 플라스미드를 도입한 시스템은, 그 밖의 시스템과 비교하여, 높은 절단 활성을 나타냈다(1과 2 내지 8, 10과 11을 각각 비교). 따라서, 본 발명의 일 실시 형태에 따른 발현 벡터를 사용함으로써, 인간 세포 중에 있어서, Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7을 발현시키는 것이 가능한 것을 알 수 있다.

또한, 상기 발현 벡터를 인간 세포에 도입함으로써, 인간 세포 중에서 Cas3, 캐스케이드 및 crRNA의 복합체가 형성되고, 표적 서열을 절단하는 것이 시사되었다.

또한, 도 1에 있어서, 8과 9 및 11과 12를 비교하면, 표적 서열과 상보적이지 않은 crRNA를 발현시킨 시스템에 있어서는, 절단 활성이 네거티브 컨트롤과 동등한 레벨이었다. 즉, 본 발명의 CRISPR-Cas3 시스템은, 포유 동물 세포 내에 있어서, crRNA와 상보적인 서열을 특이적으로 절단할 수 있는 것이 시사되었다.

〔실시예 A-2〕

실시예 A-1과 마찬가지 방법을 사용하여, 타입 I의 CRISPR-Cas 시스템에 의해 인간 세포의 내인성 DNA를 절단할 수 있는지 여부를 평가하기 위한 실험을 행하였다.

구체적으로는, 인간 세포에 있어서 염기 서열을 개변하고, 핵 이행 시그널을 부가한 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7과, 프리 crRNA를 발현시키고, 상기 세포의 내인성 CCR5 유전자의 서열이 절단되는지의 여부를 평가했다.

실시예 A-1과 동일한 HEK239T 세포를, 1×10⁵개/웰의 밀도로, 24웰 플레이트에 파종하고, 24시간 배양했다.

Cas3 플라스미드 1㎍, Cse1(Cas8) 플라스미드 1.3㎍, Cse2(Cas11) 플라스미드 1.3㎍, Cas5 플라스미드 1.1㎍, Cas6 플라스미드 0.8㎍, Cas7 플라스미드 0.3㎍ 및 crRNA 플라스미드 1㎍을, Opti-MEM(Thermo Fisher Scientific사) 50μL에 혼합했다. 이어서, 리포펙타민(등록상표) 2000(Thermo Fisher Scientific사) 5μL, Opti-MEM(Thermo Fisher Scientific사) 50μL 및 EF 배지 1mL의 혼합물을, 상기의 DNA 혼합물에 첨가했다. 그 후, 얻어진 혼합물 1mL를, 상기 24웰 플레이트에 첨가했다.

37℃, 5% CO₂ 분위기 하에서 24시간 배양 후, EF 배지 1mL로 배지를 교환했다. 트랜스펙션으로부터 48시간 후(배지 교환으로부터 24시간 후), 세포를 회수하고, PBS 중에서 1×10⁴개/5μL의 농도로 조정했다.

상기 세포를, 95℃에서 10분간 가열했다. 이어서, 프로테이나제 K를 10㎎ 첨가하고, 55℃에서 70분간 인큐베이트했다. 또한, 95℃에서 10분간 가열 처리를 한 것을, PCR의 주형으로서 사용했다.

상기 주형 10μL를, 2스텝 PCR을 35사이클 실시함으로써, 증폭시켰다. 이때, PCR의 프라이머에는, 서열 번호 47 및 48의 서열을 갖는 프라이머를 사용했다. 또한, DNA 폴리머라아제에는 KOD FX(도요보사)를 사용하고, 2스텝 PCR의 수순은 KOD FX에 첨부된 프로토콜에 따랐다. PCR에 의해 증폭된 산물은, QIAquick PCR 정제 키트(QIAGEN사)를 사용해서 정제했다. 구체적인 수순은, 상기 키트에 첨부된 프로토콜에 따랐다.

rTaq DNA 폴리머라아제(도요보사)를 사용하여, 얻어진 정제 DNA의 3' 말단에 dA를 부가했다. 상기 정제 DNA를 2% 아가로오스 겔 중에서 전기 영동시켜서, 약 500 내지 700bp의 밴드를 잘라낸 후, 겔 추출 키트(QIAGEN사)를 사용하여, 잘라낸 겔로부터 DNA를 추출, 정제했다. 이어서, pGEM-T 이지 벡터 시스템즈(easy vector Systems)(Promega사)를 사용해서 TA 클로닝을 행하고, 상기 DNA를 클로닝했다. 마지막으로, 알칼리 프렙법에 의해 클로닝된 DNA를 추출하고, 생어 시퀀싱으로 해석했다. 해석에는, BigDye(등록상표) 종결인자 v3.1 사이클 시퀀싱 키트(Terminator v3.1 Cycle Sequencing Kit)(Thermo Fisher Scientific사) 및 Applied Biosystems 3730 DNA 분석기(Thermo Fisher Scientific사)를 사용했다.

본 실시예에 있어서의 CRISPR-Cas 시스템의 표적이 되는 내인성 CCR5 유전자 서열의 개요를, 도 2에 기초하여 설명한다. 또한 도 2에서는, 엑손은 대문자로, 인트론은 소문자로 나타냈다.

본 실시예에서는, 제3 염색체 단완(P) 21 영역에 위치하는, CCR5 유전자 내의 서열을 표적으로 했다(도 2; 서열 번호 46에 CCR5의 염기 서열의 전장을 나타낸다). 구체적으로는, CCR5 유전자의 엑손 3 내의 서열을 표적 서열로 했다. 컨트롤로서, Cas9의 표적 서열도, 거의 동일 위치에 배치했다. 즉, 하선부의 서열 전체가 타입 I의 CRISPR-Cas 시스템의 표적 서열(AAG 및 그것에 이어지는 32염기)이며, 이중 하선부의 서열이 Cas9의 표적 서열(CGG 및 그것에 앞서는 20염기)이다. 타입 I의 CRISPR-Cas 시스템의 표적 서열(AAG 및 그것에 이어지는 32 염기)에 대한 가이드를 가능하게 하도록, crRNA의 서열을 설계했다.

(결과)

상기 실험의 결과, 원래의 염기 서열과 비교하여, 401bp가 결실하고 있는 클론 1, 341bp가 결실하고 있는 클론 2, 268bp가 결실하고 있는 클론 3 및 344bp가 결실하고 있는 클론 4가 얻어졌다(도 3a 내지 d). 이러한 점에서, 본 발명의 CRISPR-Cas3 시스템에 의해, 인간 세포의 내인성 DNA를 결실할 수 있는 것이 나타났다. 즉, 상기 CRISPR-Cas 시스템에 의해, 인간 세포의 DNA의 편집이 가능한 것이 시사되었다.

본 실시예에서는, 염기쌍을 결실하고 있는 클론이 관찰되었다. 이 사실은, 본 발명의 CRISPR-Cas3 시스템에 의하면, 복수의 개소에서 DNA 절단이 발생하는 것을 지지하고 있다.

본 발명의 CRISPR-Cas3 시스템에 의해, 수백염기쌍(268 내지 401bp)의 DNA가 결실했다. 이것은, Cas9를 사용한 CRISPR-Cas 시스템에 의해 얻어지는 결실(통상 DNA 상의 1개소만에서 절단)보다, 광범위하게 걸치는 것이었다.

〔실시예 A-3〕

실시예 A-1과 마찬가지 방법을 사용하여, CRISPR-Cas3 시스템에 의해 인간 세포의 내인성 DNA를 절단할 수 있는지 여부를 평가하기 위한, 실험을 행하였다.

구체적으로는, 인간 세포에 있어서 염기 서열을 개변하고, 핵 이행 시그널을 부가한 Cas3, Cse1(Cas8), Cse2(Cas11), Cas5, Cas6 및 Cas7과, 프리 crRNA를 발현시키고, 상기 세포의 내인성 EMX1 유전자의 서열이 절단되는지 여부를 평가했다.

실시예 A-1과 동일한 HEK293T 세포를, 1×10⁵개/웰의 밀도로, 24웰 플레이트에 파종하고, 24시간 배양했다.

Cas3 플라스미드 500ng, Cse1(Cas8) 플라스미드 500ng, Cse2(Cas11) 플라스미드 1㎍, Cas5 플라스미드 1㎍, Cas6 플라스미드 1㎍, Cas7 플라스미드 3㎍ 및 crRNA 플라스미드 500㎍을, Opti-MEM(Thermo Fisher Scientific사) 50μL에 혼합했다. 상기의 혼합물에, 리포펙타민(등록상표) 2000(Thermo Fisher Scientific사) 4μL, Opti-MEM(Thermo Fisher Scientific사) 50μL를, 더 첨가하고, 혼합했다. 얻어진 혼합물을, 실온에서 20분간 인큐베이트한 후, 상기 HEK293T 세포에 첨가했다.

여기서, 실시예 A-3에 있어서 사용한, Cas 단백질군의 발현 벡터의 구조를, 도 7에 도시한다. 도 7에 도시한 바와 같이, 상기 발현 벡터는, Cas 단백질군을 코딩하는 서열의 전후를 BPNLS(바이파타이트 NLS) 사이에 끼운 것이다([Suzuki K et al. (2016) In vivo genome editing via CRISPR/Cas9 mediated homology-independent targeted integration, Nature, Vol.540(Issue 7631), pp.144-149]를 참조). BPNLS의 아미노산 서열은 KRTADGSEFESPKKKRKVE(서열 번호 54), 염기 서열은 AAGCGGACTGCTGATGGCAGTGAATTTGAGTCCCCAAAGAAGAAGAGAAAGGTGGAA(서열 번호 55)이다.

상기 HEK293T 세포를, 37℃, 5% CO₂ 분위기 하에서 24시간 배양한 후, EF 배지 1mL(1웰당 1mL)와 배지를 교환했다. 트랜스펙션으로부터 48시간 후(배지 교환으로부터 24시간 후), 세포를 회수하고, PBS 중에서 1×10⁴개/5μL의 농도로 조정했다.

상기 세포를, 95℃에서 10분간 가열했다. 이어서, 프로테이나제 K를 10㎎ 첨가하고, 55℃에서 70분간 인큐베이트했다. 추가로, 95℃에서 10분간 가열 처리를 한 것을, PCR의 주형으로서 사용했다.

상기 주형 10μL를, 3스텝 PCR을 40사이클 실시함으로써, 증폭시켰다. 이때, PCR의 프라이머에는, 서열 번호 50 및 51의 서열을 갖는 프라이머를 사용했다. 또한, DNA 폴리머라아제에는 Hotstartaq(QIAGEN사)를 사용하여, 3스텝 PCR의 수순은 Hotstartaq에 첨부된 프로토콜에 따랐다. PCR에 의해 증폭된 산물은, 2% 아가로오스 겔 중에서 전기 영동시켜서, 약 900 내지 1100bp의 밴드를 잘라낸 후, 겔 추출 키트(QIAGEN사)를 사용하여, 잘라낸 겔로부터 DNA를 추출, 정제했다. 구체적인 수순은, 상기 키트에 첨부된 프로토콜에 따랐다.

이어서, pGEM-T 이지 벡터 시스템즈(Promega사)를 사용해서 TA 클로닝을 행하고, 상기 DNA를 클로닝했다. 마지막으로, 알칼리 프렙법에 의해 클로닝된 DNA를 추출하고, 생어 시퀀싱으로 해석했다. 해석에는, BigDye(등록상표) 종결인자 v3.1 사이클 시퀀싱 키트(Thermo Fisher Scientific사) 및 Applied Biosystems 3730 DNA 분석기(Thermo Fisher Scientific사)를 사용했다.

실시예 A-3에 있어서 CRISPR-Cas3 시스템의 표적이 되는, 내인성 EMX1 유전자 서열의 개요를, 도 5에 기초하여 설명한다. 또한 도 5에서는, 엑손은 대문자로, 인트론은 소문자로 나타냈다.

실시예 A-3에서는, 제2 염색체 단완(P) 13 영역에 위치하는, EMX1 유전자 내의 서열을 표적으로 했다(도 5; 서열 번호 49에 EMX1의 염기 서열의 전장을 나타낸다). 구체적으로는, EMX1 유전자의 엑손 3 내의 서열을 표적 서열로 했다. 컨트롤로서, Cas9의 표적 서열도, 거의 동일 위치에 배치했다. 즉, 보다 상류에 있는 하선부의 서열이 타입 I의 CRISPR-Cas 시스템의 표적 서열(AAG 및 그것에 이어지는 32 염기)이며, 보다 하류에 있는 하선부의 서열이 Cas9의 표적 서열(TGG 및 그것에 앞서는 20염기)이다. 실시예 A-3에서 사용한 crRNA의 서열은, CRISPR-Cas3 시스템의 표적 서열(AAG 및 그것에 이어지는 32염기)에 대한 가이드를 가능하게 하도록 설계되어 있었다.

(결과)

상기 실험의 결과, 원래의 염기 서열과 비교하여, 513bp 및 363bp의 2군데가 결실하고 있는 클론 1, 그리고 694bp가 결실하고 있는 클론 2가 얻어졌다(도 6a, b). 이 실험 결과로부터도, 본 발명의 CRISPR-Cas3 시스템에 의해, 인간 세포의 내인성 DNA를 결실할 수 있는 것이 나타났다. 즉, 상기 CRISPR-Cas3 시스템에 의해, 인간 세포의 DNA의 편집이 가능한 것이 시사되었다.

또한, 2중쇄 DNA의 2군데 이상에 있어서 절단이 발생하고 있는 것 및 수백 염기쌍의 DNA가 결실하는 것도 실시예 A-2와 마찬가지였다. 따라서, 실시예 A-3의 결과는, 실시예 A-2에서 얻어진 시사를, 보다 견고하게 지지하는 것이다.

〔실시예 A-4〕

염기 서열을 개변하고, 추가로 캐스케이드 단백질을 코딩하는 염기 서열을 연결한 CRISPR-Cas3 시스템을, HEK293T 세포에 발현시키고, 외인성 DNA의 표적 서열의 절단 활성을 평가했다.

실시예 A-4에 있어서는, 리포터 벡터 100ng; Cas3 플라스미드, 캐스케이드(2A) 플라스미드 및 crRNA 플라스미드 각 200ng; pRL-TK 벡터(레닐라 루시페라아제를 발현 가능, Promega사) 60ng; 그리고, pBluecscriptII KS(+) 벡터(Agilent Technologies사) 300ng를, Opti-MEM(Thermo Fisher Scientific사) 25μL에 혼합했다. 리포터 벡터로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터를 사용한 조건이 도 9의 (b)의 1에 상당하며, 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터를 사용한 조건이 도 9의 (b)의 6에 상당한다.

여기서, 상기 리포터 벡터는, 〔제조예〕의 [1]에서 제작한 2종류의 리포터 벡터(즉, 도 4의 (d)에 나타나 있는 구조의 벡터)를 사용했다. 또한, 상기 캐스케이드(2A) 플라스미드는, 〔제조예〕의 [4]에서 제작한 발현 벡터(즉, 도 8에 나타나 있는 구조의 벡터)를 사용했다.

상기의 발현 벡터를 사용한 것 이외에는, 실시예 A-1과 마찬가지 방법에 의해, 듀얼-루시페라아제 검정을 행하였다.

또한, 대조 실험으로서, 이하의 조건에서 마찬가지 실험을 행하였다.

1. Cas3 플라스미드 및 캐스케이드(2A) 플라스미드의 어느 한쪽 대신에, 동량의 pBluscriptII KS(+) 벡터(Agilent Technologies사)를 혼합하고, 발현시켰다(도 9의 2 및 3).

2. 상기의 조작 수순에서 사용한 crRNA 플라스미드 대신에, 표적 서열과는 상보적이지 않은 crRNA를 발현시키는 플라스미드를 혼합했다. 즉, CCR5 유전자 유래의 표적 서열에 대해서는, 대장균의 CRISPR의 스페이서 서열에 대응하는 crRNA를 발현시키는 플라스미드를 혼합시키고(도 9의 4), 대장균의 CRISPR의 스페이서 서열을 표적으로 하는 경우에는, CCR5 유전자 유래의 서열에 대응하는 gRNA를 발현시키는 플라스미드를 혼합하고, 발현시켰다(도 9의 7).

3. 네거티브 컨트롤로서, CCR5 유래의 표적 서열을 갖는 리포터 벡터만(도 9의 5), 대장균의 CRISPR의 스페이서 서열을 갖는 리포터 벡터만(도 9의 8)을 발현시켰다.

(결과)

듀얼-루시페라아제 검정의 결과를 도 9의 위의 그래프로, 실험 조건을 도 9의 아래의 표로 나타냈다. 도 9에 있어서, 「CCR5-표적」 및 「스페이서-표적」은, 각각 CCR5 유래의 표적 서열 및 대장균의 CRISPR의 스페이서 서열을 나타낸다. 또한, 「CCR5-crRNA」 및 「스페이서-crRNA」는, 각각, 상기 CCR5-표적과 상보적인 서열 및 스페이서-표적과 상보적인 서열을 나타낸다.

도 9에 도시한 바와 같이, Cas3 플라스미드 및 캐스케이드(2A) 플라스미드의 양쪽과, 표적 서열에 상보적인 crRNA 플라스미드를 도입한 시스템은, 그 외의 시스템과 비교하여, 유의미하게 높은 절단 활성을 나타냈다(1과 2 내지 5, 6과 7 내지 8을 각각 비교). 이러한 점에서, 캐스케이드 단백질을 코딩하는 염기 서열을 연결해서 발현시킨 시스템에 있어서도, 본 발명의 일 실시 형태에 관한 CRISPR-Cas 시스템에 의하면, 포유 동물 세포 내에 있어서, crRNA와 상보적인 서열을 특이적으로 절단할 수 있는 것이 시사되었다.

B. 진핵 세포에 있어서의 CRISPR-Cas3 시스템에 의한 게놈 편집에 영향을 주는 요소 등의 검증

〔재료와 방법〕

[1] Cas 유전자와 crRNA의 구성

bpNLS를 각각의 5'측 및 3'측에 부가한, 대장균 K-12주 유래의 Cas3과 캐스케이드의 구성 유전자(Cse1, Cse2, Cas5, Cas6, Cas7)를 설계하고, 포유 동물 세포에 코돈 옵티마이즈 후에 유전자 합성에 의해 클로닝했다. 이들 유전자는, 생어 연구소로부터 기증받은 pPB-CAG.EBNXN 플라스미드의 CAG 프로모터의 하류에 서브 클로닝했다. H74A(데드 니카제(dead nickase); dn), K320N(데드 헬리카제(dead helicase); dh), S483A와 T485A의 이중 변이체(데드 헬리카제 ver.2; dh2)라고 하는 Cas3의 변이체는, PrimeSTAR MAX의 PCR 산물을 셀프라이게이션함으로써 제작했다. crRNA의 발현 플라스미드에 관해서, U6 프로모터 하의 스페이서의 위치에 2군데의 BbsI 제한 효소 부위를 가지고 있는 crRNA의 서열을 합성했다. 모든 crRNA 발현 플라스미드는, BbsI 제한 효소 사이트에, 표적 서열의 32염기쌍에 2중쇄 올리고를 삽입함으로써 제작했다.

Cas9-sgRNA 발현 플라스미드인 pX330-U6-Chimeric_BB-CBh-hSpCas9는, Addgene으로부터 입수했다. gRNA를 설계하기 위해서, 인간 게놈에서의 유니크한 표적 부위를 예측하는 CRISPR 웹 툴, CRISPR 디자인 툴 및/또는 CRISPRdirect를 사용했다. 표적 서열은, Feng Zhang 연구소의 프로토콜에 따라, pX330의 sgRNA 스캐폴드에 클로닝했다.

2군데의 BsaI 제한 효소 부위를 포함하는 SSA 리포터 플라스미드는, 히로시마 대학의 야마모토 타카시 교수로부터 기증되었다. 게놈 영역의 표적 서열은, BsaI 사이트에 삽입했다. 레닐라 루시페라아제 벡터로서, pRL-TK(Promega사)를 입수했다. 모든 플라스미드는, PureLink 하이퓨어 플라스미드 정제 키트(HiPure Plasmid Purification Kit)(Thermo Fisher사)를 사용하여, 미디프렙 혹은 맥시프렙법에 의해 준비했다.

[2] HEK293T 세포에서의 DNA 절단 활성의 평가

포유 동물 세포에서 DNA 절단 활성을 검출하기 위해서, 실시예 A와 마찬가지로, SSA 검정을 실시했다. HEK293T 세포는, 10% 태아 소 혈청을 첨가한 고-글루코스 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium)(Thermo fisher사)에서, 37℃, 5% CO₂ 하에서 배양했다. 0.5×10⁴개의 세포를 96구멍 플레이트의 웰에 파종하고, 24 시간 후에, Cas3, Cse1, Cse2, Cas7, Cas5, Cas6, crRNA 발현 플라스미드(각각 100ng), SSA 리포터 벡터(100ng), 레닐라 루시페라아제 벡터(60ng)를, 리포펙타민 2000 및 OptiMEM(Life Technologies사)를 사용하여, 조금 수정한 프로토콜에 따라, HEK293T 세포에 트랜스펙션했다. 트랜스펙션의 24시간 후에, 듀얼-글로 루시페라아제 검정 시스템(Promega사)을 사용하여, 프로토콜에 따라, 듀얼 루시페라아제 검정을 행하였다.

[3] HEK293T 세포에서의 인델의 검출

2.5×10⁴개의 세포를 24구멍 플레이트의 웰에 파종한 24시간 후에, Cas3, Cse1, Cse2, Cas7, Cas5, Cas6, crRNA 발현 플라스미드(각각 250ng)를, 리포펙타민 2000과 OptiMEM(Life Technologies사)을 사용해서, 조금 수정한 프로토콜에 따라, HEK293T 세포에 트랜스펙션했다. 트랜스펙션의 2일 후, Tissue XS kit(다카라 바이오사)를 사용하여, 프로토콜에 따라, 회수한 세포로부터 전체 DNA를 추출했다. 표적 유전자좌를 Gflex(다카라 바이오사) 또는 Quick Taq HS DyeMix(TOYOBO사)를 사용해서 증폭하고, 아가로오스 겔로 전기 영동했다. PCR 산물에 있어서의 작은 삽입/결실 변이를 검출하기 위해서, SURVEYOR 변이 검출 기트(Mutation Detection Kit)(Integrated DNA Technologies사)를 프로토콜에 따라 사용했다. TA 클로닝에서는, pCR4Blunt-TOPO 플라스미드 벡터(Life Technologies사)를 프로토콜에 따라 사용했다. 서열 해석에는, BigDye 종결인자 사이클 시퀀싱 키트 및 ABI PRISM 3130 유전 분석기(Life Technologies사)를 사용했다.

진귀한 여러 변이를 검출하기 위해서, TruSeq 나노 DNA 라이브러리 프렙 키트(Illumina사)를 사용해서 PCR 증폭 산물의 DNA 라이브러리를 제조하고, Macrogen의 표준 수순에 따라서 MiSeq(2x150bp)로 앰플리콘 시퀀싱을 행하였다. 각각의 샘플의 로 리드(raw reads)를, BWA-MEM에 의해 인간 게놈의 hg38에 맵핑했다. 커버리지 데이터는, Integrative Genomics Viewer(IGV)로 시각화하고, 표적 영역에서의 히스토그램을 추출했다.

포유 동물 세포에서의 SNP-KI(스닙 녹-인)을 검출하기 위한, mCherry-P2A-EGFP c321C>G를 갖는 리포터 HEK293T 세포는, 나카다 신이치로 교수로부터 기증받았다. 리포터 세포는, 1㎍/ml의 퓨로마이신으로 배양했다. 500ng의 도너 플라스미드 또는 1중쇄 DNA를, CRISPR-Cas3과 함께, 상기의 방법으로 함께 도입했다. 트랜스펙션 5일 후에 전체 세포를 회수하고, AriaIIIu(BD)를 사용해서 FACS 해석을 행하였다. GFP 양성 세포를 분류하고, 상기 방법으로 전체 DNA를 추출했다. 게놈에 있어서의 SNP 교환은, HiDi DNA 폴리머라아제(myPOLS Biotec사)를 사용한 PCR 증폭에 의해 검출했다.

[4] 오프 타깃 부위의 후보 검출

타입 I-E CRISPR의 오프 타깃 후보는, 인간 게놈의 hg38에 있어서, 2개의 상이한 수순에 의해 GGGenome을 사용해서 검출했다. PAM 후보의 서열로서는, 기보(Leenay, R.T, et al. Mol. Cell 62, 137-147(2016), Jung, et al. Mol. Cell. 2017 Jung et al., Cell 170, 35-47(2017))에 따라, AAG, ATG, AGG, GAG, TAG, AAC를 선택했다. 6의 배수의 포지션은 표적 부위로서 인식되지 않는 것이 보고되고 있었던 점에서(Kunne et al., Molecular Cell 63, 1-13(2016)), 최초의 어프로치에서는, 이들을 제외한 표적 서열의 32염기쌍에 대하여, 보다 미스매치가 적은 것을 선택했다. 다음 어프로치에서는, 표적 서열의 PAM측 5'끝에 완전히 매칭하고 있는 영역을 검출하고, 높은 순으로 열거했다.

[5] 오프 타깃 해석의 딥 시퀀싱

전체 게놈 서열에서는, 트랜스펙션된 HEK293T 세포로부터 게놈 DNA를 추출하고, 코바리스 소니케이터(Covaris sonicator)를 사용해서 절단했다. TruSeq DNA PCR-프리 LT 라이브러리 프렙 키트(Illumina사)를 사용해서 DNA 라이브러리를 준비하고, 다카라 바이오의 표준 수순에 따라, HiSeq X(2×150bp)를 사용해서 게놈 시퀀싱을 행하였다. 각각의 샘플의 로 리드(raw reads)를, BWA-MEM에 의해 인간 게놈의 hg38에 맵핑하고, 트림모매틱 프로그램(Trimmomatic program)에 의해 클리닝했다. 디스코던트 리드 페어(Discordant read pairs)와 스플릿 리드(split reads)는, 각각 samtools와 Lumpy-sv에 의해 제외했다. 동일한 염색체에서의 큰 결실만을 검출하기 위해서, 게놈 분석 툴키트 프로그램(Genome Analysis Toolkit program)의 BadMateFilter를 사용하여, 다른 염색체에 맵핑된 리드 페어를 제거했다. 각각 100kb 영역에서의 디스코던트 리드 페어 또는 스플릿 리드의 총 수를 Bedtools로 카운트하여, 네거티브 컨트롤과의 에러율을 산출했다. 시퀀싱 전의 오프 타깃 후보를 풍부하게 하기 위해서, SureSelectXT 커스텀 DNA 프로브를 SureDesign에 의해 적절하게 엄격한 조건에서 설계하고, Agilent technologies가 제작했다. 표적 영역은, 이하와 같이, 선택했다. 표적 영역 부근의 프로브는, PAM의 상류 800kb와 하류 200kb를 커버했다. CRISPR-Cas3의 오프 타깃 영역 부근에서는, PAM 후보의 9kb 상류와 1kb 하류를 커버했다. CRISPR-Cas9의 오프 타깃 영역 부근에서는, PAM의 상류, 하류 각각 1kb를 커버했다. SureSelectXT 시약 키트(reagent kit)와 커스텀 프로프 키트(custom probe kit)에 의한 DNA 라이브러리의 준비 후, 다카라 바이오의 표준 수순에 따라, Hiseq 2500(2×150bp)에 의해, 게놈 시퀀싱을 행하였다. 동일한 염색체에서의 디스코던트 리드 페어와 스플릿 리드는, 상기의 방법으로 제외했다. 각각 10kb 영역에서의 디스코던트 리드 페어 또는 스플릿 리드의 총 수를 Bedtools로 카운트하고, 네거티브 컨트롤과의 에러율을 산출했다.

〔실시예 B-1〕 DNA 절단 활성에 있어서의 crRNA와 핵 이행 시그널의 종류의 영향

실시예 A에서는, 우연히도, crRNA로서 프리 crRNA(LRSR; 리더 서열-반복 서열-스페이서 서열-반복 서열)를 포함하는 CRISPR-Cas3 시스템을 이용해서 진핵 세포에 있어서의 게놈 편집에 성공했다. 여기서, 본 발명자는, 지금까지 오랜 세월에 걸쳐서 CRISPR-Cas3 시스템을 이용한 진핵 세포에서의 게놈 편집에 성공하지 못한 이유가, crRNA로서 성숙 crRNA가 사용되어 온 것에 있는 것은 아닌지 생각되었다. 그래서, crRNA로서, 프리 crRNA(LRSR) 외에, 프리 crRNA(RSR; 반복 서열-스페이서 서열-반복 서열)와 성숙 crRNA(5' 핸들 서열-스페이서 서열-3' 핸들 서열)를 제조하고, 실시예 A의 리포터 시스템에 의해 게놈 편집 효율을 검증했다(도 10a, b). 또한, 프리 crRNA(LRSR), 프리 crRNA(RSR), 성숙 crRNA의 염기 서열을, 각각 서열 번호: 63, 64, 65로 나타낸다.

그 결과, 성숙 crRNA를 사용한 CRISPR-Cas3 시스템에서는, 표적 DNA의 절단 활성이 확인되지 않았다. 그 반면, 놀랍게도, 프리 crRNA(LRSR, RSR)를 사용한 경우에는, 매우 높은 표적 DNA의 절단 활성이 확인되었다. CRISPR-Cas3 시스템에 있어서의 이 결과는, 성숙 crRNA를 사용함으로써 높은 DNA 절단 활성이 확인되는 CRISPR-Cas9 시스템과 대조적이다. 또한, 이 사실은, CRISPR-Cas3 시스템에 의해, 지금까지 진핵 세포에 있어서의 게놈 편집에 성공하지 않은 주된 이유 중 하나로서, 성숙 crRNA가 사용되어 온 것을 들 수 있는 것을 시사한다.

또한, Cas3에 부가하는 핵 이행 시그널로서, SV40 핵 이행 시그널과 바이파타이트 핵 이행 시그널을 사용한 검증도 행하였다(도 11). 그 결과, 바이파타이트 핵 이행 시그널을 사용한 경우에, 더 높은 표적 DNA의 절단 활성이 확인되었다.

따라서, 이후의 실험에서는, crRNA로서 프리 crRNA(LRSR)를, 핵 이행 시그널로서 바이파타이트 핵 이행 시그널을 사용했다.

〔실시예 B-2〕 DNA 절단 활성에 있어서의 PAM 서열의 영향

CRISPR-Cas3 시스템의 표적 특이성을 확인하기 위해서, DNA 절단 활성에 있어서의 여러 PAM 서열의 효과를 조사했다(도 12). SSA 검정에서는, 다른 PAM 서열에 의해 DNA 절단 활성은 다양한 결과가 되었다. 5'-AAG PAM이 가장 높은 활성을 나타내고, AGG, GAG, TAC, ATG, TAG도 주목해야 할 활성을 보였다.

〔실시예 B-3〕 DNA 절단 활성에 있어서의 crRNA와 스페이서 서열의 미스매치 영향

대장균의 캐스케이드의 결정 구조의 과거의 연구에서는, crRNA와 스페이서DNA 사이에서 5염기 구획의 헤테로 2중쇄를 형성하는 것이 나타나 있고, 이것은 Cas7 이펙터의 섬 엘리먼트에 의해, 6번째의 포지션마다 염기 접합이 파탄하는 것에 의한 것이다(도 13). DNA 절단 활성에서의 crRNA와 스페이서 서열의 미스매치의 영향을 평가했다(도 1g). 표적으로서 인식되지 않는 염기(포지션 6)를 제외하고, 시드(seed) 영역(포지션 1-8)에서의 어느 단일 미스매치에서도 절단 활성은 극적으로 떨어졌다.

〔실시예 B-4〕 DNA 절단 활성에 있어서의 Cas3의 각 도메인의 필요성의 검증

Cas3 단백의 촉매적 특징의 시험관 내에서의 성질 결정에서는, N 말단의 HD 뉴클레아제 도메인이 DNA 기질의 1중쇄 영역을 절단하고, 계속해서, C 말단의 SF2헬리카제 도메인이, ATP 의존적으로, 표적 DNA 상을 3'에서 5' 방향으로 진행해서 풀어 가는 것이 밝혀졌다. 3개의 Cas3의 변이체, 즉 HD 도메인 H74A의 변이체(dnCas3), SF2 도메인 모티프 1의 K320N의 변이체(dhCas3) 및 SF2 도메인 모티프3의 S483A/T485A의 더블의 변이체(dh2Cas3)를 제작하여, Cas3 도메인이 DNA 절단에 필요한지 여부를 검증했다(도 14). 그 결과, 3개 모든 Cas3 단백의 변이체에서 DNA 절단 활성이 완전히 소실되어 있어, Cas3은 HD 뉴클레아제 도메인과 SF2 헬리카제 도메인을 통해서 표적 DNA를 절단할 수 있는 것이 판명되었다.

〔실시예 B-5〕 여러 타입의 CRISPR-Cas3 시스템에 있어서의 DNA 절단 활성의 검증

타입 1의 CRISPR-Cas3 시스템은 고도로 다양화되어 있다(타입 1의 A 내지 G의 7종류). 상기 실시예에서는, 타입 I-E의 CRISPR-Cas3 시스템에 있어서의 진핵 세포에서의 DNA 절단 활성을 검증했지만, 본 실시예에서는, 그 이외의 타입 1의 CRISPR-Cas3 시스템(타입 I-F와 타입 I-G)에 있어서의 DNA 절단 활성의 검증을 행하였다. 구체적으로는, 타입 I-F의 쉬와넬라·푸트레파시엔스의 Cas3, Cas5-7 및 타입 I-G의 파이로코커스·퓨리어서스의 Cas5-8을 코돈 옵티마이즈하여 클로닝했다(도 15). 그 결과, DNA 절단 활성의 강도에 차이는 있기는 하지만, 293T 세포를 사용한 SSA 검정에 있어서, 이들 타입 1의 CRISPR-Cas3 시스템에도 DNA 절단 활성이 확인되었다.

〔실시예 B-6〕 CRISPR-Cas3 시스템에 의해 내인성 유전자에 도입된 변이의 검증

CRISPR-Cas3 시스템에 의해 내인성 유전자에 도입된 변이를, 타입 I-E 시스템을 이용해서 검증했다. EMX1 유전자와 CCR5 유전자를 표적 유전자로서 선택하고, 프리 crRNA(LRSR) 플라스미드를 제조했다. 293T 세포에 프리 crRNA와 6개의 Cas(3, 5-8, 11) 이펙터를 코딩하는 플라스미드를 리포펙션한 결과, CRISPR-Cas3에 의해 수백 내지 수천염기쌍의 결실이 주로 표적 영역의 스페이서 서열의 5'PAM의 상류 방향에서 일어난 것이 명백해졌다(도 16). 수복된 정션에서의 5-10염기쌍의 미세상동성을 확인할 수 있어, 어닐링 의존성의 수복 경로에 의한 상보쇄의 어닐링에 의해 일어난 것일지도 모른다. 또한, 성숙 crRNA 플라스미드에서는, EMX1과 CCR5 영역에서의 게놈 편집은 보이지 않았다.

PCR 산물의 TA 클로닝과 생어 시퀀싱에 의해, Cas3에 의한 게놈 편집을 특징짓기 위해서, 96개의 TA 클론을 픽업하고, 시퀀싱으로 야생형의 EMX1의 서열과 비교했다(도 17). 서열의 삽입을 확인할 수 있었던 49클론 중 24클론에서 최소 596염기쌍, 최대 1447염기쌍, 평균 985염기쌍의 결실을 확인했다(46.3%의 효율). 절반의 클론(n=12)에서 PAM과 스페이서의 서열을 포함해서 큰 결실을 만들고 있고, 나머지 절반에서는 PAM의 상류에서 결실하였다.

EMX1 유전자의 3.8kb, CCR5의 9.7kb라고 하는 보다 광역의 영역에 있어서의 프라이머 세트에서의 PCR 증폭 산물에서의 차세대 시퀀싱에 의해 가일층의 Cas3의 특징 지음을 행하였다. 또한, 타입 I-E CRISPR에서의 표적화를 위한 복수의 PAM 사이트(AAG, ATG, TTT)를 검증했다. 앰플리콘 시퀀싱에서는, AAG는 38.2%, ATG는 56.4%이고, TTT의 86.4%, EMX1을 표적으로 한 Cas9의 86.4%와 비교해서 PAM 사이트의 상류의 광범위한 게놈 영역에서의 커버리지율이 크게 감소하고 있었다. 커버리지의 감소는 CCR5 영역을 표적으로 한 경우도 마찬가지였다. 대조적으로, Cas9는 표적 부위에서의 작은 삽입, 작은 결실(인델)을 유발하고, 반면에 Cas3은 PAM이나 표적 부위에서의 작은 인델 변이는 전혀 없었다. 이들 결과는, CRISPR-Cas3 시스템이, 인간 세포에 있어서, 표적 부위의 상류의 폭넓은 영역에서 결실을 일으키는 것을 시사했다.

10kb 미만의 증폭이나 보다 짧은 PCR 단편에 유리한 강한 바이어스와 같은 PCR 해석의 한계를 고려하여, 표적으로 한 EMX1과 CCR5 유전자좌의 주위 1000kb 이상의 마이크로어레이-기반의 캡처 시퀀싱을 이용했다(도 18a, b). EMX1 유전자좌에서는 최대로 24kb, CCR5 유전자좌에서는 최대 43kb의 결실을 확인했지만, EMX1에서의 90%, CCR5에서의 95%의 변이는 10kb 미만이었다. 이들 결과는, CRISPR-Cas3 시스템이, 진핵 세포 게놈에서도 강력한 뉴클레아제와 헬리카제의 활성을 가질 수 있는 것을 시사했다.

또한, CRISPR-Cas9 시스템에서 나타낸 바와 같이, 비표적 게놈 영역에서 바람직하지 않은 오프 타깃 변이를 유발할 수 있는지 여부는, 특히 임상 적용에 관해서 큰 우려 사항이지만, CRISPR-Cas3 시스템에서는, 현저한 오프 타깃 효과는 보이지 않았다.

본 발명의 CRISPR-Cas3 시스템은, 진핵 세포의 DNA를 편집할 수 있기 때문에, 게놈 편집이 요구되고 있는 분야, 예를 들어 의약, 농림수산, 공업, 생명과학, 생명공학, 유전자 치료 등의 분야에 널리 이용할 수 있다.

SEQUENCE LISTING <110> Osaka University <120> ＤＮＡが編集された眞核細胞を製造する方法、および當該方法に用いられるキット <130> G2018005(PCT) <150> JP2017-113747 <151> 2017-06-08 <160> 65 <170> PatentIn version 3.5 <210> 1 <211> 2685 <212> DNA <213> Artificial Sequence <220> <223> modified Cas3 with NLS <400> 1 atgcccaaga agaagcggaa ggtggaacct tttaaatata tatgccatta ctggggaaaa 60 tcctcaaaaa gcttgacgaa aggaaatgat attcatctgt taatttatca ttgccttgat 120 gttgctgctg ttgcagattg ctggtgggat caatcagtcg tactgcaaaa tactttttgc 180 cgaaatgaaa tgctatcaaa acagagggtg aaggcctggc tgttattttt cattgctctt 240 catgatattg gaaagtttga tatacgattc caatataaat cagcagaaag ttggctgaaa 300 ttaaatcctg caacgccatc acttaatggt ccatcaacac aaatgtgccg taaatttaat 360 catggtgcag ccggtctgta ttggtttaac caggattcac tttcagagca atctctcggg 420 gattttttca gtttttttga tgccgctcct catccttatg agtcctggtt tccatgggta 480 gaggccgtta caggacatca tggttttata ttacattccc aggatcaaga taagtcgcgt 540 tgggaaatgc cagcttctct ggcatcttat gctgcgcaag ataaacaggc tcgtgaggag 600 tggatatctg tactggaagc attattttta acgccagcgg ggttatctat aaacgatata 660 ccacctgatt gttcatcact gttagcaggt ttttgctcgc ttgctgactg gttaggctcc 720 tggactacaa cgaatacctt tctgtttaat gaggatgcgc cttccgacat aaatgctctg 780 agaacgtatt tccaggaccg acagcaggat gcgagccggg tattggagtt gagtggactt 840 gtatcaaata agcgatgtta tgaaggtgtt catgcactac tggacaatgg ctatcaaccc 900 agacaattac aggtgttagt tgatgctctt ccagtagctc ccgggctgac ggtaatagag 960 gcacctacag gctccggtaa aacggaaaca gcgctggcct atgcttggaa acttattgat 1020 caacaaattg cggatagtgt tatttttgcc ctcccaacac aagctaccgc gaatgctatg 1080 cttacgagaa tggaagcgag cgcgagccac ttattttcat ccccaaatct tattcttgct 1140 catggcaatt cacggtttaa ccacctcttt caatcaataa aatcacgcgc gattactgaa 1200 caggggcaag aagaagcgtg ggttcagtgt tgtcagtggt tgtcacaaag caataagaaa 1260 gtgtttcttg ggcaaatcgg cgtttgcacg attgatcagg tgttgatatc ggtattgcca 1320 gttaaacacc gctttatccg tggtttggga attggtcgaa gtgttttaat tgttgatgaa 1380 gttcatgctt acgacaccta tatgaacggc ttgctggagg cagtgctcaa ggctcaggct 1440 gatgtgggag ggagtgttat tcttctttcc gcaaccctac caatgaaaca aaaacagaaa 1500 cttctggata cttatggtct gcatacagat ccagtggaaa ataactccgc atatccactc 1560 attaactggc gaggtgtgaa tggtgcgcaa cgttttgatc tgctagctca tccagaacaa 1620 ctcccgcccc gcttttcgat tcagccagaa cctatttgtt tagctgacat gttacctgac 1680 cttacgatgt tagagcgaat gatcgcagcg gcaaacgcgg gtgcacaggt ctgtcttatt 1740 tgcaatttgg ttgacgttgc acaagtatgc taccaacggc taaaggagct aaataacacg 1800 caagtagata tagatttgtt tcatgcgcgc tttacgctga acgatcgtcg tgaaaaagag 1860 aatcgagtta ttagcaattt cggcaaaaat gggaagcgaa atgttggacg gatacttgtc 1920 gcaacccagg tcgtggaaca atcactcgac gttgattttg attggttaat tactcagcat 1980 tgtcctgcag atttgctttt ccaacgattg ggccgtttac atcgccatca tcgcaaatat 2040 cgtcccgctg gttttgagat tcctgttgcc accattttgc tgcctgatgg cgagggttac 2100 ggacgacatg agcatattta tagcaacgtt agagtcatgt ggcggacgca gcaacatatt 2160 gaggagctta atggagcatc cttatttttc cctgatgctt accggcaatg gctggatagc 2220 atttacgatg atgcggaaat ggatgagcca gaatgggtcg gcaatggcat ggataaattt 2280 gaaagcgccg agtgtgaaaa aaggttcaag gctcgcaagg tcctgcagtg ggctgaagaa 2340 tatagcttgc aggataacga tgaaaccatt cttgcggtaa cgagggatgg ggaaatgagc 2400 ctgccattat tgccttatgt acaaacgtct tcaggtaaac aactgctcga tggccaggtc 2460 tacgaggacc taagtcatga acagcagtat gaggcgcttg cacttaatcg cgtcaatgta 2520 cccttcacct ggaaacgtag tttttctgaa gtagtagatg aagatgggtt actttggctg 2580 gaagggaaac agaatctgga tggatgggtc tggcagggta acagtattgt tattacctat 2640 acaggggatg aagggatgac cagagtcatc cctgcaaatc ccaaa 2685 <210> 2 <211> 1527 <212> DNA <213> Artificial Sequence <220> <223> modified Cse1 with NLS <400> 2 atgcccaaga agaagcggaa ggtgaacctg ctgattgaca actggatccc tgtgcgccca 60 cggaacggag gaaaagtcca gattattaat ctgcagagcc tgtactgctc ccgggatcag 120 tggagactga gcctgcccag agacgatatg gagctggccg ccctggccct gctggtgtgc 180 atcggccaga tcatcgcccc tgccaaggac gatgtggagt tcaggcaccg catcatgaac 240 cctctgaccg aggatgagtt tcagcagctg atcgccccat ggatcgacat gttctatctg 300 aatcacgccg agcacccctt catgcagaca aagggcgtga aggccaacga cgtgaccccc 360 atggagaagc tgctggcagg cgtgtccgga gcaacaaatt gcgccttcgt gaaccagcca 420 ggacagggag aggccctgtg cggaggctgt accgccatcg ccctgtttaa tcaggcaaac 480 caggcacctg gattcggagg aggctttaag tctggactga ggggaggaac cccagtgacc 540 acattcgtga gaggcatcga tctgaggagc acagtgctgc tgaatgtgct gaccctgcca 600 cggctgcaga agcagtttcc caatgagagc cacacagaga accagcccac ctggatcaag 660 cctatcaagt ctaacgagag catccctgcc agctccatcg gcttcgtgag aggcctgttt 720 tggcagccag cccacatcga gctgtgcgac cccatcggca tcggcaagtg ttcttgctgt 780 ggccaggaaa gcaatctgag gtacaccggc ttcctgaagg agaagttcac ctttacagtg 840 aacggcctgt ggccccaccc tcactctcca tgtctggtga cagtgaagaa gggcgaggtg 900 gaggagaagt tcctggcctt taccacatcc gccccctctt ggacccagat cagcagagtg 960 gtggtggaca agatcatcca gaacgagaat ggcaacagag tggccgccgt ggtgaatcag 1020 ttcaggaaca tcgccccaca gtctcccctg gagctgatca tgggcggcta caggaacaat 1080 caggccagca tcctggagcg gagacacgat gtgctgatgt ttaatcaggg ctggcagcag 1140 tatggcaatg tgatcaacga gatcgtgaca gtgggcctgg gctacaagac cgccctgaga 1200 aaggccctgt atacattcgc cgagggcttt aagaacaagg acttcaaggg agcaggcgtg 1260 agcgtgcacg agaccgccga gaggcacttt taccgccagt ccgagctgct gatccccgat 1320 gtgctggcca atgtgaactt ctcccaggcc gacgaagtga tcgccgatct gagggacaag 1380 ctgcaccagc tgtgcgagat gctgtttaac cagtctgtgg ccccatacgc ccaccacccc 1440 aagctgatca gcacactggc cctggcaagg gccaccctgt ataagcacct gagggagctg 1500 aagccacagg gaggaccttc taatgga 1527 <210> 3 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> modified Cse2 with NLS <400> 3 atgcccaaga agaagcggaa ggtggccgat gagatcgacg caatggcact gtacagggca 60 tggcagcagc tggacaacgg atcttgcgca cagatcaggc gcgtgagcga gcctgatgag 120 ctgagggaca tcccagcctt ctatcggctg gtgcagccct ttggctggga gaatcctaga 180 caccagcagg ccctgctgag gatggtgttt tgtctgagcg ccggcaagaa cgtgatccgg 240 caccaggaca agaagagcga gcagaccaca ggaatctccc tgggacgcgc cctggccaat 300 tccggccgga tcaacgagcg gagaatcttc cagctgatca gggccgatcg cacagccgac 360 atggtgcagc tgaggcgcct gctgacccac gcagagcctg tgctggattg gccactgatg 420 gcccgcatgc tgacatggtg gggcaagcgg gagagacagc agctgctgga ggacttcgtg 480 ctgaccacaa ataagaacgc c 501 <210> 4 <211> 693 <212> DNA <213> Artificial Sequence <220> <223> modified Cas5 with NLS <400> 4 atgcccaaga agaagcggaa ggtgcgctcc tacctgatcc tgagactggc aggaccaatg 60 caggcatggg gacagcctac attcgaggga accaggccaa caggccgctt tcctacccgg 120 tctggactgc tgggactgct gggagcctgc ctgggcatcc agagggacga tacctctagc 180 ctgcaggccc tgagcgagtc cgtgcagttc gccgtgcgct gtgatgagct gatcctggac 240 gataggcgcg tgtccgtgac aggcctgcgg gattaccaca ccgtgctggg cgccagagag 300 gactataggg gcctgaagtc ccacgagacc atccagacat ggcgcgagta cctgtgcgac 360 gcctctttta cagtggccct gtggctgacc ccacacgcaa caatggtcat cagcgagctg 420 gagaaggccg tgctgaagcc acggtacacc ccctatctgg gccggagaag ctgccctctg 480 acacacccac tgttcctggg cacctgtcag gcctccgatc cccagaaggc cctgctgaac 540 tacgagcctg tgggcggcga catctattct gaggagagcg tgacaggcca ccacctgaag 600 ttcaccgcca gggatgagcc aatgatcaca ctgccaaggc agtttgcatc cagggagtgg 660 tatgtgatca agggaggaat ggacgtgagc cag 693 <210> 5 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> modified Cas6 with NLS <400> 5 atgcccaaga agaagcggaa ggtgtacctg agcaaagtga tcatcgcaag ggcatggtcc 60 agggacctgt atcagctgca ccagggcctg tggcacctgt tccctaatag accagatgcc 120 gccagggact tcctgtttca cgtggagaag aggaacacac ccgagggctg tcacgtgctg 180 ctgcagtccg cccagatgcc cgtgagcacc gcagtggcca cagtgatcaa gaccaagcag 240 gtggagttcc agctgcaagt gggcgtgcca ctgtacttta ggctgcgcgc caatcccatc 300 aagaccatcc tggataacca gaagcgcctg gactctaagg gcaatatcaa gcggtgcaga 360 gtgcctctga tcaaggaggc cgagcagatc gcctggctgc agagaaagct gggcaacgcc 420 gccagggtgg aggatgtgca ccctatcagc gagcggccac agtatttcag cggcgacggc 480 aagtccggca agatccagac cgtgtgcttt gagggcgtgc tgaccatcaa cgatgcccca 540 gccctgatcg acctggtgca gcagggaatc ggacctgcta agtcaatggg atgtgggctg 600 ctgtcactgg cacctctg 618 <210> 6 <211> 1110 <212> DNA <213> Artificial Sequence <220> <223> modified Cas7 with NLS <400> 6 atgcccaaga agaagcggaa ggtgtccaat ttcatcaaca tccacgtgct gatctcccac 60 tctccaagct gcctgaatag agacgatatg aacatgcaga aggacgccat ctttggcggc 120 aagcggagag tgaggatctc tagccagtcc ctgaagcggg ccatgagaaa gtctggctac 180 tatgcccaga atatcggcga gtcctctctg aggaccatcc acctggcaca gctgagggac 240 gtgctgagac agaagctggg cgagcggttt gatcagaaga tcatcgacaa gacactggcc 300 ctgctgagcg gcaagtccgt ggatgaggcc gagaagatca gcgccgacgc agtgacccca 360 tgggtggtgg gagagatcgc atggttctgt gagcaggtgg ccaaggccga ggccgataat 420 ctggacgata agaagctgct gaaggtgctg aaggaggata tcgccgccat cagagtgaac 480 ctgcagcagg gagtggacat cgccctgagc ggcaggatgg ccacatccgg catgatgacc 540 gagctgggca aggtggacgg agcaatgtcc atcgcacacg ccatcaccac acaccaggtg 600 gactctgata tcgactggtt cacagccgtg gacgatctgc aggagcaggg aagcgcccac 660 ctgggaaccc aggagttcag ctccggcgtg ttttacagat atgccaatat caacctggca 720 cagctgcagg agaacctggg aggagcatcc agggagcagg ccctggagat cgccacacac 780 gtggtgcaca tgctggcaac cgaggtgcca ggagcaaagc agcgcaccta cgccgccttc 840 aatcctgccg atatggtcat ggtgaacttt tccgacatgc cactgtctat ggccaatgcc 900 ttcgagaagg ccgtgaaggc caaggatggc ttcctgcagc cttccatcca ggcctttaac 960 cagtactggg accgcgtggc caatggatat ggcctgaacg gagctgccgc ccagttttcc 1020 ctgtctgatg tggaccctat cacagcccag gtgaagcaga tgccaaccct ggagcagctg 1080 aagagctggg tgcggaacaa tggagaggca 1110 <210> 7 <211> 2775 <212> DNA <213> Artificial Sequence <220> <223> modified Cas3 with BPNLS <400> 7 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaagaa 60 ccttttaaat atatatgcca ttactgggga aaatcctcaa aaagcttgac gaaaggaaat 120 gatattcatc tgttaattta tcattgcctt gatgttgctg ctgttgcaga ttgctggtgg 180 gatcaatcag tcgtactgca aaatactttt tgccgaaatg aaatgctatc aaaacagagg 240 gtgaaggcct ggctgttatt tttcattgct cttcatgata ttggaaagtt tgatatacga 300 ttccaatata aatcagcaga aagttggctg aaattaaatc ctgcaacgcc atcacttaat 360 ggtccatcaa cacaaatgtg ccgtaaattt aatcatggtg cagccggtct gtattggttt 420 aaccaggatt cactttcaga gcaatctctc ggggattttt tcagtttttt tgatgccgct 480 cctcatcctt atgagtcctg gtttccatgg gtagaggccg ttacaggaca tcatggtttt 540 atattacatt cccaggatca agataagtcg cgttgggaaa tgccagcttc tctggcatct 600 tatgctgcgc aagataaaca ggctcgtgag gagtggatat ctgtactgga agcattattt 660 ttaacgccag cggggttatc tataaacgat ataccacctg attgttcatc actgttagca 720 ggtttttgct cgcttgctga ctggttaggc tcctggacta caacgaatac ctttctgttt 780 aatgaggatg cgccttccga cataaatgct ctgagaacgt atttccagga ccgacagcag 840 gatgcgagcc gggtattgga gttgagtgga cttgtatcaa ataagcgatg ttatgaaggt 900 gttcatgcac tactggacaa tggctatcaa cccagacaat tacaggtgtt agttgatgct 960 cttccagtag ctcccgggct gacggtaata gaggcaccta caggctccgg taaaacggaa 1020 acagcgctgg cctatgcttg gaaacttatt gatcaacaaa ttgcggatag tgttattttt 1080 gccctcccaa cacaagctac cgcgaatgct atgcttacga gaatggaagc gagcgcgagc 1140 cacttatttt catccccaaa tcttattctt gctcatggca attcacggtt taaccacctc 1200 tttcaatcaa taaaatcacg cgcgattact gaacaggggc aagaagaagc gtgggttcag 1260 tgttgtcagt ggttgtcaca aagcaataag aaagtgtttc ttgggcaaat cggcgtttgc 1320 acgattgatc aggtgttgat atcggtattg ccagttaaac accgctttat ccgtggtttg 1380 ggaattggtc gaagtgtttt aattgttgat gaagttcatg cttacgacac ctatatgaac 1440 ggcttgctgg aggcagtgct caaggctcag gctgatgtgg gagggagtgt tattcttctt 1500 tccgcaaccc taccaatgaa acaaaaacag aaacttctgg atacttatgg tctgcataca 1560 gatccagtgg aaaataactc cgcatatcca ctcattaact ggcgaggtgt gaatggtgcg 1620 caacgttttg atctgctagc tcatccagaa caactcccgc cccgcttttc gattcagcca 1680 gaacctattt gtttagctga catgttacct gaccttacga tgttagagcg aatgatcgca 1740 gcggcaaacg cgggtgcaca ggtctgtctt atttgcaatt tggttgacgt tgcacaagta 1800 tgctaccaac ggctaaagga gctaaataac acgcaagtag atatagattt gtttcatgcg 1860 cgctttacgc tgaacgatcg tcgtgaaaaa gagaatcgag ttattagcaa tttcggcaaa 1920 aatgggaagc gaaatgttgg acggatactt gtcgcaaccc aggtcgtgga acaatcactc 1980 gacgttgatt ttgattggtt aattactcag cattgtcctg cagatttgct tttccaacga 2040 ttgggccgtt tacatcgcca tcatcgcaaa tatcgtcccg ctggttttga gattcctgtt 2100 gccaccattt tgctgcctga tggcgagggt tacggacgac atgagcatat ttatagcaac 2160 gttagagtca tgtggcggac gcagcaacat attgaggagc ttaatggagc atccttattt 2220 ttccctgatg cttaccggca atggctggat agcatttacg atgatgcgga aatggatgag 2280 ccagaatggg tcggcaatgg catggataaa tttgaaagcg ccgagtgtga aaaaaggttc 2340 aaggctcgca aggtcctgca gtgggctgaa gaatatagct tgcaggataa cgatgaaacc 2400 attcttgcgg taacgaggga tggggaaatg agcctgccat tattgcctta tgtacaaacg 2460 tcttcaggta aacaactgct cgatggccag gtctacgagg acctaagtca tgaacagcag 2520 tatgaggcgc ttgcacttaa tcgcgtcaat gtacccttca cctggaaacg tagtttttct 2580 gaagtagtag atgaagatgg gttactttgg ctggaaggga aacagaatct ggatggatgg 2640 gtctggcagg gtaacagtat tgttattacc tatacagggg atgaagggat gaccagagtc 2700 atccctgcaa atcccaaaaa gcggactgct gatggcagtg aatttgagtc cccaaagaag 2760 aagagaaagg tggaa 2775 <210> 8 <211> 1617 <212> DNA <213> Artificial Sequence <220> <223> modified Cse1 with BPNLS <400> 8 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaaaac 60 ctgctgattg acaactggat ccctgtgcgc ccacggaacg gaggaaaagt ccagattatt 120 aatctgcaga gcctgtactg ctcccgggat cagtggagac tgagcctgcc cagagacgat 180 atggagctgg ccgccctggc cctgctggtg tgcatcggcc agatcatcgc ccctgccaag 240 gacgatgtgg agttcaggca ccgcatcatg aaccctctga ccgaggatga gtttcagcag 300 ctgatcgccc catggatcga catgttctat ctgaatcacg ccgagcaccc cttcatgcag 360 acaaagggcg tgaaggccaa cgacgtgacc cccatggaga agctgctggc aggcgtgtcc 420 ggagcaacaa attgcgcctt cgtgaaccag ccaggacagg gagaggccct gtgcggaggc 480 tgtaccgcca tcgccctgtt taatcaggca aaccaggcac ctggattcgg aggaggcttt 540 aagtctggac tgaggggagg aaccccagtg accacattcg tgagaggcat cgatctgagg 600 agcacagtgc tgctgaatgt gctgaccctg ccacggctgc agaagcagtt tcccaatgag 660 agccacacag agaaccagcc cacctggatc aagcctatca agtctaacga gagcatccct 720 gccagctcca tcggcttcgt gagaggcctg ttttggcagc cagcccacat cgagctgtgc 780 gaccccatcg gcatcggcaa gtgttcttgc tgtggccagg aaagcaatct gaggtacacc 840 ggcttcctga aggagaagtt cacctttaca gtgaacggcc tgtggcccca ccctcactct 900 ccatgtctgg tgacagtgaa gaagggcgag gtggaggaga agttcctggc ctttaccaca 960 tccgccccct cttggaccca gatcagcaga gtggtggtgg acaagatcat ccagaacgag 1020 aatggcaaca gagtggccgc cgtggtgaat cagttcagga acatcgcccc acagtctccc 1080 ctggagctga tcatgggcgg ctacaggaac aatcaggcca gcatcctgga gcggagacac 1140 gatgtgctga tgtttaatca gggctggcag cagtatggca atgtgatcaa cgagatcgtg 1200 acagtgggcc tgggctacaa gaccgccctg agaaaggccc tgtatacatt cgccgagggc 1260 tttaagaaca aggacttcaa gggagcaggc gtgagcgtgc acgagaccgc cgagaggcac 1320 ttttaccgcc agtccgagct gctgatcccc gatgtgctgg ccaatgtgaa cttctcccag 1380 gccgacgaag tgatcgccga tctgagggac aagctgcacc agctgtgcga gatgctgttt 1440 aaccagtctg tggccccata cgcccaccac cccaagctga tcagcacact ggccctggca 1500 agggccaccc tgtataagca cctgagggag ctgaagccac agggaggacc ttctaatgga 1560 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaa 1617 <210> 9 <211> 591 <212> DNA <213> Artificial Sequence <220> <223> modified Cse2 with BPNLS <400> 9 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaagcc 60 gatgagatcg acgcaatggc actgtacagg gcatggcagc agctggacaa cggatcttgc 120 gcacagatca ggcgcgtgag cgagcctgat gagctgaggg acatcccagc cttctatcgg 180 ctggtgcagc cctttggctg ggagaatcct agacaccagc aggccctgct gaggatggtg 240 ttttgtctga gcgccggcaa gaacgtgatc cggcaccagg acaagaagag cgagcagacc 300 acaggaatct ccctgggacg cgccctggcc aattccggcc ggatcaacga gcggagaatc 360 ttccagctga tcagggccga tcgcacagcc gacatggtgc agctgaggcg cctgctgacc 420 cacgcagagc ctgtgctgga ttggccactg atggcccgca tgctgacatg gtggggcaag 480 cgggagagac agcagctgct ggaggacttc gtgctgacca caaataagaa cgccaagcgg 540 actgctgatg gcagtgaatt tgagtcccca aagaagaaga gaaaggtgga a 591 <210> 10 <211> 783 <212> DNA <213> Artificial Sequence <220> <223> modified Cas5 with BPNLS <400> 10 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaacgc 60 tcctacctga tcctgagact ggcaggacca atgcaggcat ggggacagcc tacattcgag 120 ggaaccaggc caacaggccg ctttcctacc cggtctggac tgctgggact gctgggagcc 180 tgcctgggca tccagaggga cgatacctct agcctgcagg ccctgagcga gtccgtgcag 240 ttcgccgtgc gctgtgatga gctgatcctg gacgataggc gcgtgtccgt gacaggcctg 300 cgggattacc acaccgtgct gggcgccaga gaggactata ggggcctgaa gtcccacgag 360 accatccaga catggcgcga gtacctgtgc gacgcctctt ttacagtggc cctgtggctg 420 accccacacg caacaatggt catcagcgag ctggagaagg ccgtgctgaa gccacggtac 480 accccctatc tgggccggag aagctgccct ctgacacacc cactgttcct gggcacctgt 540 caggcctccg atccccagaa ggccctgctg aactacgagc ctgtgggcgg cgacatctat 600 tctgaggaga gcgtgacagg ccaccacctg aagttcaccg ccagggatga gccaatgatc 660 acactgccaa ggcagtttgc atccagggag tggtatgtga tcaagggagg aatggacgtg 720 agccagaagc ggactgctga tggcagtgaa tttgagtccc caaagaagaa gagaaaggtg 780 gaa 783 <210> 11 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> modified Cas6 with BPNLS <400> 11 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaatac 60 ctgagcaaag tgatcatcgc aagggcatgg tccagggacc tgtatcagct gcaccagggc 120 ctgtggcacc tgttccctaa tagaccagat gccgccaggg acttcctgtt tcacgtggag 180 aagaggaaca cacccgaggg ctgtcacgtg ctgctgcagt ccgcccagat gcccgtgagc 240 accgcagtgg ccacagtgat caagaccaag caggtggagt tccagctgca agtgggcgtg 300 ccactgtact ttaggctgcg cgccaatccc atcaagacca tcctggataa ccagaagcgc 360 ctggactcta agggcaatat caagcggtgc agagtgcctc tgatcaagga ggccgagcag 420 atcgcctggc tgcagagaaa gctgggcaac gccgccaggg tggaggatgt gcaccctatc 480 agcgagcggc cacagtattt cagcggcgac ggcaagtccg gcaagatcca gaccgtgtgc 540 tttgagggcg tgctgaccat caacgatgcc ccagccctga tcgacctggt gcagcaggga 600 atcggacctg ctaagtcaat gggatgtggg ctgctgtcac tggcacctct gaagcggact 660 gctgatggca gtgaatttga gtccccaaag aagaagagaa aggtggaa 708 <210> 12 <211> 1200 <212> DNA <213> Artificial Sequence <220> <223> modified Cas7 with BPNLS <400> 12 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaatcc 60 aatttcatca acatccacgt gctgatctcc cactctccaa gctgcctgaa tagagacgat 120 atgaacatgc agaaggacgc catctttggc ggcaagcgga gagtgaggat ctctagccag 180 tccctgaagc gggccatgag aaagtctggc tactatgccc agaatatcgg cgagtcctct 240 ctgaggacca tccacctggc acagctgagg gacgtgctga gacagaagct gggcgagcgg 300 tttgatcaga agatcatcga caagacactg gccctgctga gcggcaagtc cgtggatgag 360 gccgagaaga tcagcgccga cgcagtgacc ccatgggtgg tgggagagat cgcatggttc 420 tgtgagcagg tggccaaggc cgaggccgat aatctggacg ataagaagct gctgaaggtg 480 ctgaaggagg atatcgccgc catcagagtg aacctgcagc agggagtgga catcgccctg 540 agcggcagga tggccacatc cggcatgatg accgagctgg gcaaggtgga cggagcaatg 600 tccatcgcac acgccatcac cacacaccag gtggactctg atatcgactg gttcacagcc 660 gtggacgatc tgcaggagca gggaagcgcc cacctgggaa cccaggagtt cagctccggc 720 gtgttttaca gatatgccaa tatcaacctg gcacagctgc aggagaacct gggaggagca 780 tccagggagc aggccctgga gatcgccaca cacgtggtgc acatgctggc aaccgaggtg 840 ccaggagcaa agcagcgcac ctacgccgcc ttcaatcctg ccgatatggt catggtgaac 900 ttttccgaca tgccactgtc tatggccaat gccttcgaga aggccgtgaa ggccaaggat 960 ggcttcctgc agccttccat ccaggccttt aaccagtact gggaccgcgt ggccaatgga 1020 tatggcctga acggagctgc cgcccagttt tccctgtctg atgtggaccc tatcacagcc 1080 caggtgaagc agatgccaac cctggagcag ctgaagagct gggtgcggaa caatggagag 1140 gcaaagcgga ctgctgatgg cagtgaattt gagtccccaa agaagaagag aaaggtggaa 1200 <210> 13 <211> 2664 <212> DNA <213> Escherichia coli <400> 13 atggagccat tcaaatacat ctgccactac tgggggaaat catctaaaag cctgacaaag 60 gggaacgata tccacctgct gatctaccac tgcctggacg tggcagcagt ggcagattgt 120 tggtgggacc agagcgtggt gctgcagaat accttctgcc ggaacgagat gctgtccaag 180 cagagagtga aggcctggct gctgttcttt atcgccctgc acgatatcgg caagttcgac 240 atcaggtttc agtataagtc tgccgagagc tggctgaagc tgaatccagc cacaccctcc 300 ctgaacggcc cttctaccca gatgtgcagg aagttcaatc acggagcagc aggactgtac 360 tggtttaacc aggacagcct gtccgagcag tctctgggcg atttctttag cttctttgac 420 gccgcccctc acccatatga gagctggttc ccatgggtgg aggcagtgac aggacaccac 480 ggctttatcc tgcactccca ggaccaggat aagtctagat gggagatgcc agcatccctg 540 gcatcttacg cagcacagga taagcaggca agggaggagt ggatctctgt gctggaggcc 600 ctgttcctga ccccagcagg cctgagcatc aatgatatcc cacctgactg cagctccctg 660 ctggcaggct tttgtagcct ggcagactgg ctgggatcct ggaccacaac caatacattc 720 ctgtttaacg aggatgcccc ttctgacatc aacgccctgc gcacctactt ccaggatcgg 780 cagcaggacg ccagcagagt gctggagctg tctggcctgg tgagcaataa gcggtgctac 840 gagggagtgc acgcactgct ggataacggc tatcagccta gacagctgca ggtgctggtg 900 gacgcactgc ctgtggcacc aggactgaca gtgatcgagg caccaaccgg ctctggcaag 960 acagagaccg ccctggccta tgcctggaag ctgatcgatc agcagatcgc cgacagcgtg 1020 atcttcgcac tgccaacaca ggcaaccgca aatgccatgc tgaccaggat ggaggcctct 1080 gccagccacc tgttttctag ccctaacctg atcctggccc acggcaacag ccggttcaat 1140 cacctgtttc agagcatcaa gtccagagcc atcacagagc agggacagga ggaggcatgg 1200 gtgcagtgct gtcagtggct gtcccagtct aacaagaagg tgttcctggg ccagatcggc 1260 gtgtgcacca tcgatcaggt gctgatctcc gtgctgccag tgaagcacag gtttatcagg 1320 ggactgggaa tcggccgctc tgtgctgatc gtggatgagg tgcacgccta cgacacatat 1380 atgaacggcc tgctggaggc cgtgctgaag gcacaggcag acgtgggagg aagcgtgatc 1440 ctgctgtccg ccaccctgcc catgaagcag aagcagaagc tgctggatac atacggcctg 1500 cacaccgacc ctgtggagaa caatagcgcc tatccactga tcaattggag gggagtgaac 1560 ggagcacagc ggttcgacct gctggcacac ccagagcagc tgccaccacg gttttccatc 1620 cagcccgagc ctatctgcct ggccgatatg ctgcccgacc tgaccatgct ggagagaatg 1680 atcgctgccg ccaatgcagg agcacaggtg tgcctgatct gtaacctggt ggatgtggcc 1740 caggtgtgct accagcggct gaaggagctg aacaatacac aggtggacat cgatctgttc 1800 cacgccaggt ttaccctgaa tgaccggaga gagaaggaga accgcgtgat ctccaacttc 1860 ggcaagaatg gcaagagaaa cgtgggcagg atcctggtgg ccacacaggt ggtggagcag 1920 tctctggacg tggatttcga ctggctgatc acccagcact gccctgccga tctgctgttt 1980 cagcggctgg gcagactgca cagacaccac aggaagtaca ggccagcagg atttgagatc 2040 ccagtggcca caatcctgct gccagacgga gagggatacg gccggcacga gcacatctat 2100 agcaatgtgc gcgtgatgtg gcggacccag cagcacatcg aggagctgaa cggcgcctcc 2160 ctgttctttc ccgatgccta cagacagtgg ctggactcta tctatgacga tgccgagatg 2220 gatgagcctg agtgggtggg caatggcatg gacaagttcg agtccgccga gtgtgagaag 2280 cggttcaagg ccaggaaggt gctgcagtgg gccgaggagt acagcctgca ggataacgac 2340 gagacaatcc tggccgtgac cagggatggc gagatgtccc tgcccctgct gccttatgtg 2400 cagacatcct ctggcaagca gctgctggat ggccaggtgt acgaggacct gagccacgag 2460 cagcagtatg aggccctggc cctgaacagg gtgaatgtgc ccttcacctg gaagcgcagc 2520 ttttccgaag tggtggatga ggacggcctg ctgtggctgg agggcaagca gaatctggac 2580 ggctgggtgt ggcagggcaa ctccatcgtg attacctaca ccggagacga agggatgaca 2640 agagtgattc ctgctaaccc aaag 2664 <210> 14 <211> 1506 <212> DNA <213> Escherichia coli <400> 14 atgaatttgc ttattgataa ctggatccct gtacgcccgc gaaacggggg gaaagtccaa 60 atcataaatc tgcaatcgct atactgcagt agagatcagt ggcgattaag tttgccccgt 120 gacgatatgg aactggccgc tttagcactg ctggtttgca ttgggcaaat tatcgccccg 180 gcaaaagatg acgttgaatt tcgacatcgc ataatgaatc cgctcactga agatgagttt 240 caacaactca tcgcgccgtg gatagatatg ttctacctta atcacgcaga acatcccttt 300 atgcagacca aaggtgtcaa agcaaatgat gtgactccaa tggaaaaact gttggctggg 360 gtaagcggcg cgacgaattg tgcatttgtc aatcaaccgg ggcagggtga agcattatgt 420 ggtggatgca ctgcgattgc gttattcaac caggcgaatc aggcaccagg ttttggtggt 480 ggttttaaaa gcggtttacg tggaggaaca cctgtaacaa cgttcgtacg tgggatcgat 540 cttcgttcaa cggtgttact caatgtcctc acattacctc gtcttcaaaa acaatttcct 600 aatgaatcac atacggaaaa ccaacctacc tggattaaac ctatcaagtc caatgagtct 660 atacctgctt cgtcaattgg gtttgtccgt ggtctattct ggcaaccagc gcatattgaa 720 ttatgcgatc ccattgggat tggtaaatgt tcttgctgtg gacaggaaag caatttgcgt 780 tataccggtt ttcttaagga aaaatttacc tttacagtta atgggctatg gccccatccg 840 cattcccctt gtctggtaac agtcaagaaa ggggaggttg aggaaaaatt tcttgctttc 900 accacctccg caccatcatg gacacaaatc agccgagttg tggtagataa gattattcaa 960 aatgaaaatg gaaatcgcgt ggcggcggtt gtgaatcaat tcagaaatat tgcgccgcaa 1020 agtcctcttg aattgattat ggggggatat cgtaataatc aagcatctat tcttgaacgg 1080 cgtcatgatg tgttgatgtt taatcagggg tggcaacaat acggcaatgt gataaacgaa 1140 atagtgactg ttggtttggg atataaaaca gccttacgca aggcgttata tacctttgca 1200 gaagggttta aaaataaaga cttcaaaggg gccggagtct ctgttcatga gactgcagaa 1260 aggcatttct atcgacagag tgaattatta attcccgatg tactggcgaa tgttaatttt 1320 tcccaggctg atgaggtaat agctgattta cgagacaaac ttcatcaatt gtgtgaaatg 1380 ctatttaatc aatctgtagc tccctatgca catcatccta aattaataag cacattagcg 1440 cttgcccgcg ccacgctata caaacattta cgggagttaa aaccgcaagg agggccatca 1500 aatggc 1506 <210> 15 <211> 480 <212> DNA <213> Escherichia coli <400> 15 atggctgatg aaattgatgc aatggcttta tatcgagcct ggcaacaact ggataatgga 60 tcatgtgcgc aaattagacg tgtttcagaa cctgatgaat tacgcgatat ccctgcgttt 120 tataggctgg tgcaaccttt tggttgggaa aacccacgtc accagcaggc tcttttgcgc 180 atggtgtttt gcctgagcgc aggaaagaat gtcatccgac atcaggacaa aaaatcggag 240 caaacaacag gtatctcgtt gggaagagct ttagccaata gtggaagaat taacgagcgc 300 cgtatctttc aattaattcg ggctgacaga acagccgata tggtccagtt acgtcgatta 360 cttactcacg ccgaacccgt acttgactgg ccattaatgg ccaggatgtt gacctggtgg 420 ggaaagcgcg aacgccagca acttctggaa gattttgtat tgaccacaaa caaaaatgcg 480 <210> 16 <211> 672 <212> DNA <213> Escherichia coli <400> 16 atgagatctt atttgatctt gcggcttgct gggccaatgc aagcctgggg gcagccgacc 60 tttgaaggaa cgcgacctac cggaagattt ccgacccgaa gcgggttatt agggctactc 120 ggggcttgtc ttgggatcca acgtgatgat acttcttcat tacaggcgtt atcagagagt 180 gtgcaatttg cagtgcgctg cgatgaactc attcttgacg atcgtcgtgt gtctgtaacg 240 gggttgcgtg attaccatac agtccttgga gcgcgagaag attaccgtgg tttgaaaagt 300 catgaaacga ttcaaacatg gcgcgaatat ttatgtgatg cctcctttac cgtcgctctc 360 tggttaacac cccatgcaac gatggttatc tcagaacttg aaaaagcagt attaaagcct 420 cggtatacac cttacctggg gcggagaagt tgcccactaa cacacccgct ttttttgggg 480 acatgtcagg catcggatcc tcagaaggcg ctattaaatt atgagcccgt tggcggcgat 540 atatatagtg aggaatcagt tacagggcat catttaaaat ttacggcgcg cgacgaaccg 600 atgatcacct tgcctcgaca atttgcttcc cgagaatggt atgtgattaa aggaggtatg 660 gatgtatctc ag 672 <210> 17 <211> 597 <212> DNA <213> Escherichia coli <400> 17 atgtatctca gtaaagtcat cattgccagg gcctggagca gggatcttta ccaacttcac 60 cagggattat ggcatttatt tccaaacaga ccggatgctg ctcgtgattt tctttttcat 120 gttgagaagc gaaacacacc agaaggctgt catgttttat tgcagtcagc gcaaatgcct 180 gtttcaactg ccgttgcgac agtcattaaa actaaacagg ttgaatttca acttcaggtt 240 ggtgttccac tctattttcg gcttcgggca aatccgatca aaactattct cgacaatcaa 300 aagcgcctgg acagtaaagg gaatattaaa cgctgtcggg ttccgttaat aaaagaagca 360 gaacaaatcg cgtggttgca acgtaaattg ggcaatgcgg cgcgcgttga agatgtgcat 420 cccatatcgg aacggccaca gtatttttct ggtgatggta aaagtggaaa gatccaaacg 480 gtttgctttg aaggtgtgct caccatcaac gacgcgccag cgttaataga tcttgtacag 540 caaggtattg ggccagctaa atcgatggga tgtggcttgc tatctttggc tccactg 597 <210> 18 <211> 1086 <212> DNA <213> Escherichia coli <400> 18 tctaacttta tcaatattca tgttctgatc tctcacagcc cttcatgtct gaaccgcgac 60 gatatgaaca tgcagaaaga cgctattttc ggcggcaaaa gacgagtaag aatttcaagt 120 caaagcctta aacgtgcgat gcgtaaaagt ggttattacg cacaaaatat tggtgaatcc 180 agtctcagaa ccattcatct tgcacaatta cgtgatgttc ttcggcaaaa acttggtgaa 240 cgttttgacc aaaaaatcat cgataagaca ttagcgctgc tctccggtaa atcagttgat 300 gaagccgaaa agatttctgc cgatgcggtt actccctggg ttgtgggaga aatagcctgg 360 ttctgtgagc aggttgcaaa agcagaggct gataatctgg atgataaaaa gctgctcaaa 420 gttcttaagg aagatattgc cgccatacgt gtgaatttac agcagggtgt tgatattgcg 480 cttagtggaa gaatggcaac cagcggcatg atgactgagt tgggaaaagt tgatggtgca 540 atgtccattg cgcatgcgat cactactcat caggttgatt ctgatattga ctggttcacc 600 gctgtagatg atttacagga acaaggttct gcacatctgg gaactcagga attttcatcg 660 ggtgtttttt atcgttatgc caacattaac ctcgctcaac ttcaggaaaa tttaggtggt 720 gcctccaggg agcaggctct ggaaattgca acccatgttg ttcatatgct ggcaacagag 780 gtccctggag caaaacagcg tacttatgcc gcttttaacc ctgcggatat ggtaatggtt 840 aatttctccg atatgccact ttctatggca aatgcttttg aaaaagcggt taaagcgaaa 900 gatggctttt tgcaaccgtc tatacaggcg tttaatcaat attgggatcg cgttgccaat 960 ggatatggtc tgaacggagc tgctgcgcaa ttcagcttat ctgatgtaga cccaattact 1020 gctcaagtta aacaaatgcc tactttagaa cagttaaaat cctgggttcg taataatggc 1080 gaggcg 1086 <210> 19 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> target (CCR5) <400> 19 tcaagtccaa tctatgacat caattattat acatcggag 39 <210> 20 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> reporter vector insert1 (CCR5) <400> 20 gtcggattca agtccaatct atgacatcaa ttattataca tcggagaggt 50 <210> 21 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> reporter vector insert2 (CCR5) <400> 21 cggtacctct ccgatgtata ataattgatg tcatagattg gacttgaatc 50 <210> 22 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> target (E. coli) <400> 22 aagagcacaa atatcatcgc tcaaaccact tacgg 35 <210> 23 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> reporter vector insert1 (E. coli) <400> 23 gtcggataag agcacaaata tcatcgctca aaccacttac ggaggt 46 <210> 24 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> reporter vector insert2 (E. coli) <400> 24 cggtacctcc gtaagtggtt tgagcgatga tatttgtgct cttatc 46 <210> 25 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> crRNA insert1 (CCR5) <400> 25 accgtccaat ctatgacatc aattattata catcgg 36 <210> 26 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> crRNA insert 2(CCR5) <400> 26 acacccgatg tataataatt gatgtcatag attgga 36 <210> 27 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> crRNA insert1 (E.coli) <400> 27 accgagcaca aatatcatcg ctcaaaccac ttacgg 36 <210> 28 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> crRNA insert 2(E.coli) <400> 28 acacccgtaa gtggtttgag cgatgatatt tgtgct 36 <210> 29 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> crRNA insert 1(EMX1) <400> 29 accgcaggcc aatggggagg acatcgatgt cacctc 36 <210> 30 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> crRNA insert 2(EMX1) <400> 30 acacgaggtg acatcgatgt cctccccatt ggcctg 36 <210> 31 <211> 5701 <212> DNA <213> Artificial Sequence <220> <223> reporter vector (CCR5) <400> 31 ggcctaactg gccggtacct agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420 agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480 tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540 aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctggt ttagtgaacc 600 gtcagatccg ctagcgctac cggactcaga tctcgagctc aagcttggca atccggtact 660 gttggtaaag ccaccatgga agatgccaaa aacattaaga agggcccagc gccattctac 720 ccactcgaag acgggaccgc cggcgagcag ctgcacaaag ccatgaagcg ctacgccctg 780 gtgcccggca ccatcgcctt taccgacgca catatcgagg tggacattac ctacgccgag 840 tacttcgaga tgagcgttcg gctggcagaa gctatgaagc gctatgggct gaatacaaac 900 catcggatcg tggtgtgcag cgagaatagc ttgcagttct tcatgcccgt gttgggtgcc 960 ctgttcatcg gtgtggctgt ggccccagct aacgacatct acaacgagcg cgagctgctg 1020 aacagcatgg gcatcagcca gcccaccgtc gtattcgtga gcaagaaagg gctgcaaaag 1080 atcctcaacg tgcaaaagaa gctaccgatc atacaaaaga tcatcatcat ggatagcaag 1140 accgactacc agggcttcca aagcatgtac accttcgtga cttcccattt gccacccggc 1200 ttcaacgagt acgacttcgt gcccgagagc ttcgaccggg acaaaaccat cgccctgatc 1260 atgaacagta gtggcagtac cggattgccc aagggcgtag ccctaccgca ccgcaccgct 1320 tgtgtccgat tcagtcatgc ccgcgacccc atcttcggca accagatcat ccccgacacc 1380 gctatcctca gcgtggtgcc atttcaccac ggcttcggca tgttcaccac gctgggctac 1440 ttgatctgcg gctttcgggt cgtgctcatg taccgcttcg aggaggagct attcttgcgc 1500 agcttgcaag actataagat tcaatctgcc ctgctggtgc ccacactatt tagcttcttc 1560 gctaagagca ctctcatcga caagtacgac ctaagcaact tgcacgagat cgccagcggc 1620 ggggcgccgc tcagcaagga ggtaggtgag gccgtggcca aacgcttcca cctaccaggc 1680 atccgccagg gctacggcct gacagaaaca accagcgcca ttctgatcac ccccgaaggg 1740 gacgacaagc ctggcgcagt aggcaaggtg gtgcccttct tcgaggctaa ggtggtggac 1800 ttggactagg gtctctgtcg gattcaagtc caatctatga catcaattat tatacatcgg 1860 agaggtaccg tgagacctag gagcgcgagc tgctgaacag catgggcatc agccagccca 1920 ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa aagaagctac 1980 cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc ttccaaagca 2040 tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac ttcgtgcccg 2100 agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc agtaccggat 2160 tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt catgcccgcg 2220 accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg gtgccatttc 2280 accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt cgggtcgtgc 2340 tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat aagattcaat 2400 ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc atcgacaagt 2460 acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc aaggaggtag 2520 gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac ggcctgacag 2580 aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc gcagtaggca 2640 aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag acactgggtg 2700 tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc tacgttaaca 2760 accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc ggcgacatcg 2820 cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc ctgatcaaat 2880 acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa caccccaaca 2940 tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg cccgccgcag 3000 tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac tatgtggcca 3060 gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac gaggtgccta 3120 aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt aaggccaaga 3180 agggcggcaa gatcgccgtg aattcttaac tgcagtctag agtcggggcg gccggccgct 3240 tcgagcagac atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg 3300 aaaaaaatgc tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag 3360 ctgcaataaa caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga 3420 ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa tgtggtaaaa tcgataagga 3480 tccgtcgacc gatgcccttg agagccttca acccagtcag ctccttccgg tgggcgcggg 3540 gcatgactat cgtcgccgca cttatgactg tcttctttat catgcaactc gtaggacagg 3600 tgccggcagc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 3660 cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 3720 aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 3780 gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 3840 tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 3900 agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 3960 ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 4020 taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 4080 gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 4140 gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 4200 ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 4260 ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 4320 gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 4380 caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 4440 taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 4500 aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagcggccgc 4560 aaatgctaaa ccactgcagt ggttaccagt gcttgatcag tgaggcaccg atctcagcga 4620 tctgcctatt tcgttcgtcc atagtggcct gactccccgt cgtgtagatc actacgattc 4680 gtgagggctt accatcaggc cccagcgcag caatgatgcc gcgagagccg cgttcaccgg 4740 cccccgattt gtcagcaatg aaccagccag cagggagggc cgagcgaaga agtggtcctg 4800 ctactttgtc cgcctccatc cagtctatga gctgctgtcg tgatgctaga gtaagaagtt 4860 cgccagtgag tagtttccga agagttgtgg ccattgctac tggcatcgtg gtatcacgct 4920 cgtcgttcgg tatggcttcg ttcaactctg gttcccagcg gtcaagccgg gtcacatgat 4980 cacccatatt atgaagaaat gcagtcagct ccttagggcc tccgatcgtt gtcagaagta 5040 agttggccgc ggtgttgtcg ctcatggtaa tggcagcact acacaattct cttaccgtca 5100 tgccatccgt aagatgcttt tccgtgaccg gcgagtactc aaccaagtcg ttttgtgagt 5160 agtgtatacg gcgaccaagc tgctcttgcc cggcgtctat acgggacaac accgcgccac 5220 atagcagtac tttgaaagtg ctcatcatcg ggaatcgttc ttcggggcgg aaagactcaa 5280 ggatcttgcc gctattgaga tccagttcga tatagcccac tcttgcaccc agttgatctt 5340 cagcatcttt tactttcacc agcgtttcgg ggtgtgcaaa aacaggcaag caaaatgccg 5400 caaagaaggg aatgagtgcg acacgaaaat gttggatgct catactcgtc ctttttcaat 5460 attattgaag catttatcag ggttactagt acgtctctca aggataagta agtaatatta 5520 aggtacggga ggtattggac aggccgcaat aaaatatctt tattttcatt acatctgtgt 5580 gttggttttt tgtgtgaatc gatagtacta acatacgctc tccatcaaaa caaaacgaaa 5640 caaaacaaac tagcaaaata ggctgtcccc agtgcaagtg caggtgccag aacatttctc 5700 t 5701 <210> 32 <211> 5697 <212> DNA <213> Artificial Sequence <220> <223> reporter vector (E. coli) <400> 32 ggcctaactg gccggtacct agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420 agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480 tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540 aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctggt ttagtgaacc 600 gtcagatccg ctagcgctac cggactcaga tctcgagctc aagcttggca atccggtact 660 gttggtaaag ccaccatgga agatgccaaa aacattaaga agggcccagc gccattctac 720 ccactcgaag acgggaccgc cggcgagcag ctgcacaaag ccatgaagcg ctacgccctg 780 gtgcccggca ccatcgcctt taccgacgca catatcgagg tggacattac ctacgccgag 840 tacttcgaga tgagcgttcg gctggcagaa gctatgaagc gctatgggct gaatacaaac 900 catcggatcg tggtgtgcag cgagaatagc ttgcagttct tcatgcccgt gttgggtgcc 960 ctgttcatcg gtgtggctgt ggccccagct aacgacatct acaacgagcg cgagctgctg 1020 aacagcatgg gcatcagcca gcccaccgtc gtattcgtga gcaagaaagg gctgcaaaag 1080 atcctcaacg tgcaaaagaa gctaccgatc atacaaaaga tcatcatcat ggatagcaag 1140 accgactacc agggcttcca aagcatgtac accttcgtga cttcccattt gccacccggc 1200 ttcaacgagt acgacttcgt gcccgagagc ttcgaccggg acaaaaccat cgccctgatc 1260 atgaacagta gtggcagtac cggattgccc aagggcgtag ccctaccgca ccgcaccgct 1320 tgtgtccgat tcagtcatgc ccgcgacccc atcttcggca accagatcat ccccgacacc 1380 gctatcctca gcgtggtgcc atttcaccac ggcttcggca tgttcaccac gctgggctac 1440 ttgatctgcg gctttcgggt cgtgctcatg taccgcttcg aggaggagct attcttgcgc 1500 agcttgcaag actataagat tcaatctgcc ctgctggtgc ccacactatt tagcttcttc 1560 gctaagagca ctctcatcga caagtacgac ctaagcaact tgcacgagat cgccagcggc 1620 ggggcgccgc tcagcaagga ggtaggtgag gccgtggcca aacgcttcca cctaccaggc 1680 atccgccagg gctacggcct gacagaaaca accagcgcca ttctgatcac ccccgaaggg 1740 gacgacaagc ctggcgcagt aggcaaggtg gtgcccttct tcgaggctaa ggtggtggac 1800 ttggactagg gtctctgtcg gataagagca caaatatcat cgctcaaacc acttacggag 1860 gtaccgtgag acctaggagc gcgagctgct gaacagcatg ggcatcagcc agcccaccgt 1920 cgtattcgtg agcaagaaag ggctgcaaaa gatcctcaac gtgcaaaaga agctaccgat 1980 catacaaaag atcatcatca tggatagcaa gaccgactac cagggcttcc aaagcatgta 2040 caccttcgtg acttcccatt tgccacccgg cttcaacgag tacgacttcg tgcccgagag 2100 cttcgaccgg gacaaaacca tcgccctgat catgaacagt agtggcagta ccggattgcc 2160 caagggcgta gccctaccgc accgcaccgc ttgtgtccga ttcagtcatg cccgcgaccc 2220 catcttcggc aaccagatca tccccgacac cgctatcctc agcgtggtgc catttcacca 2280 cggcttcggc atgttcacca cgctgggcta cttgatctgc ggctttcggg tcgtgctcat 2340 gtaccgcttc gaggaggagc tattcttgcg cagcttgcaa gactataaga ttcaatctgc 2400 cctgctggtg cccacactat ttagcttctt cgctaagagc actctcatcg acaagtacga 2460 cctaagcaac ttgcacgaga tcgccagcgg cggggcgccg ctcagcaagg aggtaggtga 2520 ggccgtggcc aaacgcttcc acctaccagg catccgccag ggctacggcc tgacagaaac 2580 aaccagcgcc attctgatca cccccgaagg ggacgacaag cctggcgcag taggcaaggt 2640 ggtgcccttc ttcgaggcta aggtggtgga cttggacacc ggtaagacac tgggtgtgaa 2700 ccagcgcggc gagctgtgcg tccgtggccc catgatcatg agcggctacg ttaacaaccc 2760 cgaggctaca aacgctctca tcgacaagga cggctggctg cacagcggcg acatcgccta 2820 ctgggacgag gacgagcact tcttcatcgt ggaccggctg aagagcctga tcaaatacaa 2880 gggctaccag gtagccccag ccgaactgga gagcatcctg ctgcaacacc ccaacatctt 2940 cgacgccggg gtcgccggcc tgcccgacga cgatgccggc gagctgcccg ccgcagtcgt 3000 cgtgctggaa cacggtaaaa ccatgaccga gaaggagatc gtggactatg tggccagcca 3060 ggttacaacc gccaagaagc tgcgcggtgg tgttgtgttc gtggacgagg tgcctaaagg 3120 actgaccggc aagttggacg cccgcaagat ccgcgagatt ctcattaagg ccaagaaggg 3180 cggcaagatc gccgtgaatt cttaactgca gtctagagtc ggggcggccg gccgcttcga 3240 gcagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 3300 aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 3360 aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 3420 tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaaatcga taaggatccg 3480 tcgaccgatg cccttgagag ccttcaaccc agtcagctcc ttccggtggg cgcggggcat 3540 gactatcgtc gccgcactta tgactgtctt ctttatcatg caactcgtag gacaggtgcc 3600 ggcagcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 3660 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 3720 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 3780 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 3840 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 3900 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 3960 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 4020 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 4080 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 4140 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 4200 agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 4260 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 4320 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 4380 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 4440 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 4500 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagc ggccgcaaat 4560 gctaaaccac tgcagtggtt accagtgctt gatcagtgag gcaccgatct cagcgatctg 4620 cctatttcgt tcgtccatag tggcctgact ccccgtcgtg tagatcacta cgattcgtga 4680 gggcttacca tcaggcccca gcgcagcaat gatgccgcga gagccgcgtt caccggcccc 4740 cgatttgtca gcaatgaacc agccagcagg gagggccgag cgaagaagtg gtcctgctac 4800 tttgtccgcc tccatccagt ctatgagctg ctgtcgtgat gctagagtaa gaagttcgcc 4860 agtgagtagt ttccgaagag ttgtggccat tgctactggc atcgtggtat cacgctcgtc 4920 gttcggtatg gcttcgttca actctggttc ccagcggtca agccgggtca catgatcacc 4980 catattatga agaaatgcag tcagctcctt agggcctccg atcgttgtca gaagtaagtt 5040 ggccgcggtg ttgtcgctca tggtaatggc agcactacac aattctctta ccgtcatgcc 5100 atccgtaaga tgcttttccg tgaccggcga gtactcaacc aagtcgtttt gtgagtagtg 5160 tatacggcga ccaagctgct cttgcccggc gtctatacgg gacaacaccg cgccacatag 5220 cagtactttg aaagtgctca tcatcgggaa tcgttcttcg gggcggaaag actcaaggat 5280 cttgccgcta ttgagatcca gttcgatata gcccactctt gcacccagtt gatcttcagc 5340 atcttttact ttcaccagcg tttcggggtg tgcaaaaaca ggcaagcaaa atgccgcaaa 5400 gaagggaatg agtgcgacac gaaaatgttg gatgctcata ctcgtccttt ttcaatatta 5460 ttgaagcatt tatcagggtt actagtacgt ctctcaagga taagtaagta atattaaggt 5520 acgggaggta ttggacaggc cgcaataaaa tatctttatt ttcattacat ctgtgtgttg 5580 gttttttgtg tgaatcgata gtactaacat acgctctcca tcaaaacaaa acgaaacaaa 5640 acaaactagc aaaataggct gtccccagtg caagtgcagg tgccagaaca tttctct 5697 <210> 33 <211> 3391 <212> DNA <213> Artificial Sequence <220> <223> crRNA vector (CCR5) <400> 33 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 180 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 240 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 300 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 360 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 420 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 480 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 540 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 600 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 660 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 720 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 780 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 840 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 900 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 960 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 1020 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 1080 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 1140 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 1200 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 1260 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 1320 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 1380 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 1440 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 1500 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 1560 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 1620 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1680 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1740 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1800 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 1860 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 1920 aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1980 gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 2040 tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 2100 tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 2160 ccaagcgcgc aattaaccct cactaaaggg aacaaaagct gggtaccggg ccccccctcg 2220 aggtcgacgg tatcgataag cttgatatcg aattgacgtg aattcttccc atgattcctt 2280 catatttgca tatacgatac aaggctgtta gagagataat tggaattaat ttgactgtaa 2340 acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2400 cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2460 tcgatttctt ggctttatat atcttgtgga aaggacgtgg atgtgttgtt tgtgtgatac 2520 tataaagttg gtagattgtg actggcttaa aaaatcatta attaataata ggttatgttt 2580 agagtgttcc ccgcgccagc ggggataaac cgtccaatct atgacatcaa ttattataca 2640 tcgggtgttc cccgcgccag cggggataaa ccgttttttg aattcctgca gcccggggga 2700 tccactagtt ctagagcggc cgccaccgcg gtggagctcc aattcgccct atagtgagtc 2760 gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 2820 tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 2880 ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 2940 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 3000 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 3060 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 3120 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 3180 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 3240 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 3300 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 3360 ttttaacaaa atattaacgc ttacaattta g 3391 <210> 34 <211> 3391 <212> DNA <213> Artificial Sequence <220> <223> crRNA vector (E. coli) <400> 34 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 180 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 240 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 300 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 360 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 420 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 480 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 540 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 600 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 660 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 720 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 780 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 840 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 900 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 960 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 1020 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 1080 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 1140 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 1200 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 1260 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 1320 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 1380 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 1440 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 1500 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 1560 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 1620 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1680 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1740 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1800 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 1860 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 1920 aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1980 gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 2040 tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 2100 tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 2160 ccaagcgcgc aattaaccct cactaaaggg aacaaaagct gggtaccggg ccccccctcg 2220 aggtcgacgg tatcgataag cttgatatcg aattgacgtg aattcttccc atgattcctt 2280 catatttgca tatacgatac aaggctgtta gagagataat tggaattaat ttgactgtaa 2340 acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2400 cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2460 tcgatttctt ggctttatat atcttgtgga aaggacgtgg atgtgttgtt tgtgtgatac 2520 tataaagttg gtagattgtg actggcttaa aaaatcatta attaataata ggttatgttt 2580 agagtgttcc ccgcgccagc ggggataaac cgagcacaaa tatcatcgct caaaccactt 2640 acgggtgttc cccgcgccag cggggataaa ccgttttttg aattcctgca gcccggggga 2700 tccactagtt ctagagcggc cgccaccgcg gtggagctcc aattcgccct atagtgagtc 2760 gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 2820 tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 2880 ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 2940 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 3000 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 3060 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 3120 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 3180 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 3240 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 3300 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 3360 ttttaacaaa atattaacgc ttacaattta g 3391 <210> 35 <211> 3391 <212> DNA <213> Artificial Sequence <220> <223> crRNA vector (EMX1) <400> 35 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 60 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 120 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 180 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 240 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 300 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 360 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 420 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 480 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 540 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 600 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 660 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 720 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 780 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 840 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 900 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 960 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 1020 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 1080 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 1140 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 1200 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 1260 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 1320 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 1380 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 1440 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 1500 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 1560 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 1620 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 1680 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 1740 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 1800 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 1860 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 1920 aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 1980 gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 2040 tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 2100 tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 2160 ccaagcgcgc aattaaccct cactaaaggg aacaaaagct gggtaccggg ccccccctcg 2220 aggtcgacgg tatcgataag cttgatatcg aattgacgtg aattcttccc atgattcctt 2280 catatttgca tatacgatac aaggctgtta gagagataat tggaattaat ttgactgtaa 2340 acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2400 cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2460 tcgatttctt ggctttatat atcttgtgga aaggacgtgg atgtgttgtt tgtgtgatac 2520 tataaagttg gtagattgtg actggcttaa aaaatcatta attaataata ggttatgttt 2580 agagtgttcc ccgcgccagc ggggataaac cgcaggccaa tggggaggac atcgatgtca 2640 cctcgtgttc cccgcgccag cggggataaa ccgttttttg aattcctgca gcccggggga 2700 tccactagtt ctagagcggc cgccaccgcg gtggagctcc aattcgccct atagtgagtc 2760 gtattacgcg cgctcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 2820 tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 2880 ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc 2940 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 3000 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 3060 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 3120 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 3180 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 3240 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 3300 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 3360 ttttaacaaa atattaacgc ttacaattta g 3391 <210> 36 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> primer1 (Cse1) <400> 36 gcaaagaatt cagatctcca ccatgcctaa gaagaagaga aaagtgaacc tgctgattga 60 c 61 <210> 37 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer2 (Cse1) <400> 37 tcatcgatgc atctcgagtt atccattaga aggtcctccc tgtggcttc 49 <210> 38 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> primer1 (Cse2) <400> 38 gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaggtggccg atgagatcga 60 c 61 <210> 39 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer2 (Cse2) <400> 39 tcatcgatgc atctcgagtt aggcgttctt atttgtggtc agcacgaag 49 <210> 40 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> primer1 (Cas5) <400> 40 gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaggtgtcca atttcatcaa 60 c 61 <210> 41 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer2 (Cas5) <400> 41 tcatcgatgc atctcgagtt atgcctctcc attgttccgc acccagctc 49 <210> 42 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> primer1 (Cas6) <400> 42 gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaagtgtacc tgagcaaagt 60 g 61 <210> 43 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> primer2 (Cas6) <400> 43 tcatcgatgc atctcgagtt acagaggtgc cagtgacagc agcccac 47 <210> 44 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> primer1 (Cas7) <400> 44 gcaaagaatt cagatctcca ccatgcccaa gaagaagcgg aaggtgcgct cctacctgat 60 c 61 <210> 45 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> primer2 (Cas7) <400> 45 tcatcgatgc atctcgagtt actggctcac gtccattcct cccttgatc 49 <210> 46 <211> 6265 <212> DNA <213> Homo sapiens <400> 46 tcaccaaccg ccaagagagc ttgatatgac tgtatatagt atagtcataa agaacctgaa 60 cttgaccata tacttatgtc atgtggaaaa tttctcatag cttcagatag attatatctg 120 gagtgaagaa tcctgccacc tatgtatctg gcatagtgtg agtcctcata aatgcttact 180 ggtttgaagg gcaacaaaat agtgaacaga gtgaaaatcc ccactaagat cctgggtcca 240 gaaaaagatg ggaaacctgt ttagctcacc cgtgagccca tagttaaaac tctttagaca 300 acaggttgtt tccgtttaca gagaacaata atattgggtg gtgagcatct gtgtgggggt 360 tggggtggga taggggatac ggggagagtg gagaaaaagg ggacacaggg ttaatgtgaa 420 gtccaggatc cccctctaca tttaaagttg gtttaagttg gctttaatta atagcaactc 480 ttaagataat cagaattttc ttaacctttt agccttactg ttgaaaagcc ctgtgatctt 540 gtacaaatca tttgcttctt ggatagtaat ttcttttact aaaatgtggg cttttgacta 600 gatgaatgta aatgttcttc tagctctgat atcctttatt ctttatattt tctaacagat 660 tctgtgtagt gggatgagca gagaacaaaa acaaaataat ccagtgagaa aagcccgtaa 720 ataaaccttc agaccagaga tctattctct agcttatttt aagctcaact taaaaagaag 780 aactgttctc tgattctttt cgccttcaat acacttaatg atttaactcc accctccttc 840 aaaagaaaca gcatttccta cttttatact gtctatatga ttgatttgca cagctcatct 900 ggccagaaga gctgagacat ccgttcccct acaagaaact ctccccggta agtaacctct 960 cagctgcttg gcctgttagt tagcttctga gatgagtaaa agactttaca ggaaacccat 1020 agaagacatt tggcaaacac caagtgctca tacaattatc ttaaaatata atctttaaga 1080 taaggaaagg gtcacagttt ggaatgagtt tcagacggtt ataacatcaa agatacaaaa 1140 catgattgtg agtgaaagac tttaaaggga gcaatagtat tttaataact aacaatcctt 1200 acctctcaaa agaaagattt gcagagagat gagtcttagc tgaaatcttg aaatcttatc 1260 ttctgctaag gagaactaaa ccctctccag tgagatgcct tctgaatatg tgcccacaag 1320 aagttgtgtc taagtctggt tctctttttt ctttttcctc cagacaagag ggaagcctaa 1380 aaatggtcaa aattaatatt aaattacaaa cgccaaataa aattttcctc taatatatca 1440 gtttcatggc acagttagta tataattctt tatggttcaa aattaaaaat gagcttttct 1500 aggggcttct ctcagctgcc tagtctaagg tgcagggagt ttgagactca cagggtttaa 1560 taagagaaaa ttctcagcta gagcagctga acttaaatag actaggcaag acagctggtt 1620 ataagactaa actacccaga atgcatgaca ttcatctgtg gtggcagacg aaacattttt 1680 tattatatta tttcttgggt atgtatgaca actcttaatt gtggcaactc agaaactaca 1740 aacacaaact tcacagaaaa tgtgaggatt ttacaattgg ctgttgtcat ctatgacctt 1800 ccctgggact tgggcacccg gccatttcac tctgactaca tcatgtcacc aaacatctga 1860 tggtcttgcc ttttaattct cttttcgagg actgagaggg agggtagcat ggtagttaag 1920 agtgcaggct tcccgcattc aaaatcggtt gcttactagc tgtgtggctt tgagcaagtt 1980 actcaccctc tctgtgcttc aaggtccttg tctgcaaaat gtgaaaaata tttcctgcct 2040 cataaggttg ccctaaggat taaatgaatg aatgggtatg atgcttagaa cagtgattgg 2100 catccagtat gtgccctcga ggcctcttaa ttattactgg cttgctcata gtgcatgttc 2160 tttgtgggct aactctagcg tcaataaaaa tgttaagact gagttgcagc cgggcatggt 2220 ggctcatgcc tgtaatccca gcattctagg aggctgaggc aggaggatcg cttgagccca 2280 ggagttcgag accagcctgg gcaacatagt gtgatcttgt atctataaaa ataaacaaaa 2340 ttagcttggt gtggtggcgc ctgtagtccc cagccacttg gaggggtgag gtgagaggat 2400 tgcttgagcc cgggatggtc caggctgcag tgagccatga tcgtgccact gcactccagc 2460 ctgggcgaca gagtgagacc ctgtctcaca acaacaacaa caacaacaaa aaggctgagc 2520 tgcaccatgc ttgacccagt ttcttaaaat tgttgtcaaa gcttcattca ctccatggtg 2580 ctatagagca caagatttta tttggtgaga tggtgctttc atgaattccc ccaacagagc 2640 caagctctcc atctagtgga cagggaagct agcagcaaac cttcccttca ctacaaaact 2700 tcattgcttg gccaaaaaga gagttaattc aatgtagaca tctatgtagg caattaaaaa 2760 cctattgatg tataaaacag tttgcattca tggagggcaa ctaaatacat tctaggactt 2820 tataaaagat cactttttat ttatgcacag ggtggaacaa gatggattat caagtgtcaa 2880 gtccaatcta tgacatcaat tattatacat cggagccctg ccaaaaaatc aatgtgaagc 2940 aaatcgcagc ccgcctcctg cctccgctct actcactggt gttcatcttt ggttttgtgg 3000 gcaacatgct ggtcatcctc atcctgataa actgcaaaag gctgaagagc atgactgaca 3060 tctacctgct caacctggcc atctctgacc tgtttttcct tcttactgtc cccttctggg 3120 ctcactatgc tgccgcccag tgggactttg gaaatacaat gtgtcaactc ttgacagggc 3180 tctattttat aggcttcttc tctggaatct tcttcatcat cctcctgaca atcgataggt 3240 acctggctgt cgtccatgct gtgtttgctt taaaagccag gacggtcacc tttggggtgg 3300 tgacaagtgt gatcacttgg gtggtggctg tgtttgcgtc tctcccagga atcatcttta 3360 ccagatctca aaaagaaggt cttcattaca cctgcagctc tcattttcca tacagtcagt 3420 atcaattctg gaagaatttc cagacattaa agatagtcat cttggggctg gtcctgccgc 3480 tgcttgtcat ggtcatctgc tactcgggaa tcctaaaaac tctgcttcgg tgtcgaaatg 3540 agaagaagag gcacagggct gtgaggctta tcttcaccat catgattgtt tattttctct 3600 tctgggctcc ctacaacatt gtccttctcc tgaacacctt ccaggaattc tttggcctga 3660 ataattgcag tagctctaac aggttggacc aagctatgca ggtgacagag actcttggga 3720 tgacgcactg ctgcatcaac cccatcatct atgcctttgt cggggagaag ttcagaaact 3780 acctcttagt cttcttccaa aagcacattg ccaaacgctt ctgcaaatgc tgttctattt 3840 tccagcaaga ggctcccgag cgagcaagct cagtttacac ccgatccact ggggagcagg 3900 aaatatctgt gggcttgtga cacggactca agtgggctgg tgacccagtc agagttgtgc 3960 acatggctta gttttcatac acagcctggg ctgggggtgg ggtgggagag gtctttttta 4020 aaaggaagtt actgttatag agggtctaag attcatccat ttatttggca tctgtttaaa 4080 gtagattaga tcttttaagc ccatcaatta tagaaagcca aatcaaaata tgttgatgaa 4140 aaatagcaac ctttttatct ccccttcaca tgcatcaagt tattgacaaa ctctcccttc 4200 actccgaaag ttccttatgt atatttaaaa gaaagcctca gagaattgct gattcttgag 4260 tttagtgatc tgaacagaaa taccaaaatt atttcagaaa tgtacaactt tttacctagt 4320 acaaggcaac atataggttg taaatgtgtt taaaacaggt ctttgtcttg ctatggggag 4380 aaaagacatg aatatgatta gtaaagaaat gacacttttc atgtgtgatt tcccctccaa 4440 ggtatggtta ataagtttca ctgacttaga accaggcgag agacttgtgg cctgggagag 4500 ctggggaagc ttcttaaatg agaaggaatt tgagttggat catctattgc tggcaaagac 4560 agaagcctca ctgcaagcac tgcatgggca agcttggctg tagaaggaga cagagctggt 4620 tgggaagaca tggggaggaa ggacaaggct agatcatgaa gaaccttgac ggcattgctc 4680 cgtctaagtc atgagctgag cagggagatc ctggttggtg ttgcagaagg tttactctgt 4740 ggccaaagga gggtcaggaa ggatgagcat ttagggcaag gagaccacca acagccctca 4800 ggtcagggtg aggatggcct ctgctaagct caaggcgtga ggatgggaag gagggaggta 4860 ttcgtaagga tgggaaggag ggaggtattc gtgcagcata tgaggatgca gagtcagcag 4920 aactggggtg gatttgggtt ggaagtgagg gtcagagagg agtcagagag aatccctagt 4980 cttcaagcag attggagaaa cccttgaaaa gacatcaagc acagaaggag gaggaggagg 5040 tttaggtcaa gaagaagatg gattggtgta aaaggatggg tctggtttgc agagcttgaa 5100 cacagtctca cccagactcc aggctgtctt tcactgaatg cttctgactt catagatttc 5160 cttcccatcc cagctgaaat actgaggggt ctccaggagg agactagatt tatgaataca 5220 cgaggtatga ggtctaggaa catacttcag ctcacacatg agatctaggt gaggattgat 5280 tacctagtag tcatttcatg ggttgttggg aggattctat gaggcaacca caggcagcat 5340 ttagcacata ctacacattc aataagcatc aaactcttag ttactcattc agggatagca 5400 ctgagcaaag cattgagcaa aggggtccca tagaggtgag ggaagcctga aaaactaaga 5460 tgctgcctgc ccagtgcaca caagtgtagg tatcattttc tgcatttaac cgtcaatagg 5520 caaagggggg aagggacata ttcatttgga aataagctgc cttgagcctt aaaacccaca 5580 aaagtacaat ttaccagcct ccgtatttca gactgaatgg gggtgggggg ggcgccttag 5640 gtacttattc cagatgcctt ctccagacaa accagaagca acagaaaaaa tcgtctctcc 5700 ctccctttga aatgaatata ccccttagtg tttgggtata ttcatttcaa agggagagag 5760 agaggttttt ttctgttctg tctcatatga ttgtgcacat acttgagact gttttgaatt 5820 tgggggatgg ctaaaaccat catagtacag gtaaggtgag ggaatagtaa gtggtgagaa 5880 ctactcaggg aatgaaggtg tcagaataat aagaggtgct actgactttc tcagcctctg 5940 aatatgaacg gtgagcattg tggctgtcag caggaagcaa cgaagggaaa tgtctttcct 6000 tttgctctta agttgtggag agtgcaacag tagcatagga ccctaccctc tgggccaagt 6060 caaagacatt ctgacatctt agtatttgca tattcttatg tatgtgaaag ttacaaattg 6120 cttgaaagaa aatatgcatc taataaaaaa caccttctaa aataattcat tatattcttg 6180 ctctttcagt caagtgtaca tttagagaat agcacataaa actgccagag cattttataa 6240 gcagctgttt tcttccttag tgtgt 6265 <210> 47 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> primer1 (CCR5) <400> 47 ccacttggag gggtgaggtg agaggattg 29 <210> 48 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer2 (CCR5) <400> 48 taaagatgat tcctgggaga gacgc 25 <210> 49 <211> 25545 <212> DNA <213> Homo sapiens <400> 49 gcagtctttc tgccacagcc tcccaaagtg ctgagattat aggtgtgagc cattgtacct 60 ggcttggagt aatgtttttg agcaaagcaa atgtacagga catgcacaga gaggcacagg 120 gagcacagag tccctggatg aatgctctgg ctggtggcag tattgtcaca gggcaggcta 180 cccaaaggtg agcagaacac atgaggctag acaggtacaa cttgctcatg aagagcctcg 240 aatgccaagc ttaggagttt gaactttatt ggaacactga cactaatagt taatgtttac 300 tgagtgctta ctatgtgcta agagctatgc atgaatcacc tcattctaat tctcttaact 360 ctccacagca ggtcttatta tttccagatt gctgatgaaa aactgagtca cagagaggta 420 aaaaaaaaaa aacaaaaaca ccctgggtcc agagttgtgt gaaaaaattt taacaggtta 480 gagttgtgtt gtagaaatct ggtagccagc cacgtgtaag acgaattgta gaaaggagag 540 atcacaaatg gctatcataa gagaatcact gggaaaaggt aataagaacc caaattagag 600 gcaaggagaa cagaaagaaa tgaaagaatg caaagactga ctggatgtgc acagcagtga 660 ccgagagaaa ggaggtatca caggtgcctc ttagctgcta agcctgggtg tcctgcagaa 720 aggggcagct attatcagaa gagagaagcc agagagaggc acagatttgg tggggatgat 780 gttgagctcc gtttgggggt atggtgagtg tctagggggc ctgtaggaac ccctccagaa 840 aaattctcac aagcatttga aaatcagtga cttgatctgg agaaaaatat agggctggca 900 ttacaaacct gccggggtct gcattacagt attggttgaa agtgtggaaa ttgataatga 960 tagatggttg gtagatacat agatagatag atagatagat agatagatag atagatagat 1020 agatagatag atagaataaa tagcatgata catggaatga gggaagggct aaggataaag 1080 atgccttcat ggatgcccac agttaggaga agaaagtaga gcccatgaag gaacaactcc 1140 cagagtttgc agatccaggc aagtatcttg ttcagaaaat aaagggaagg gagtttccaa 1200 aagaaaaggg ggttgaaggt actcagatgc tgaggagcct ataaacaatt gtgactaaaa 1260 aagactcaaa tttggaaata aggtgtccta atgaacattt cagaggatgg agagagattc 1320 ttaaagtcag cctttggaag aataactata tagaacactt ccagaggcca aactagtgac 1380 aatggatcaa aagaattaaa atattgcata tctggaaatt acacagctag aaatatgtag 1440 aaaagaaaca caaacatgcg gtaagataca gctatggagc tgtttgtcga aattttgtta 1500 aaacagtgaa aatctgtaaa ctgtattaat gtccaacaat aaaaaatatt taatgagagg 1560 caaagatgct ttgattggtt ataaagataa agaagttaca atactatgta cagtatgatc 1620 ctttttttaa agggaggcac atatagaaag aactggaagg atatactgta agaatttcac 1680 gatgtttgtt tctgggtagt aggatttgac aattataaga tctctgtttt cccttcactc 1740 cccccttttg gattatctgt attttttata actctgtcca atagacatat aatgtgagac 1800 acataatttt aaatgttcta gtggccacat ttaaaaagta gaaagaaata gataaaataa 1860 tcttcttaag atatttcatt ttactcaata tatccattac tatgtgtaat cgatataaaa 1920 atattaatat tttaaatgtt ttagcactaa gcctgtttaa cactaaatgc agtggatatt 1980 cacatttaca gaacatctct gtttgggcca tccacttctc aagcaccaca ttaccgcatt 2040 tggctcctag cacggctcta tgaaataata gcagttaata tttatcaaaa gcctactatg 2100 ttccaggcac tgctccaagt tcatcaggtg gagattataa ctcattaggt ctcaataact 2160 ccatgaggtt gaacttattg tgctctccac aagcacgtgt tgcttgccct tgtcctcata 2220 ccataatgaa atgtttggag cttttgcaaa agccattttc ctaatatgat gggcatccaa 2280 gtctggttgc aaaggcttgg atagagggca agtgagagaa ttggagagag actaaaaatc 2340 attcaagaaa ttttgtggtg aaaaagacaa gtcaaaagac tgagagaaac atgaggacag 2400 aaaactcttt gtaaggcaag gagacataaa gatgaagtca ggctgaatag gaaagaagga 2460 ggtgaaaggt gaaagagaga tggctggggg tgtggctggt ccaaattctc acaagatctc 2520 tgttggagaa acattgcctg gcttgtgctg gtggcgagat gtacatagca gcttcccagc 2580 tagagggagc agggagtcat ggccttgtga gggagacaga tggagacaca cacaaccccc 2640 atcgcaggtg aatgctatga aagaatgggg tggagggctt cccagggaga tgaactgagt 2700 tttaagaacg aagttagcca gcaaagaagc aaaaggaaga ggatatagac ttgaggatta 2760 catcactgga tgactgagcc actgattgga tgtggaggat gagagagtga tgctttgagg 2820 tgattcccaa gttctccgca tggacaaagg cagagacaat aacttgtact gagtgctctt 2880 tggagtctga cattgatcca gtgcaccaca tatgttatct catttactcc tcacagaggt 2940 cccgtataac gcttgcaatt tcacagatac gcaagctgag gcaaaataat tggcccaggg 3000 ctcaccacta ataaatagga gagtctggat ttggggccag gttattccag aaatagagag 3060 agggagggaa aacgttaatg tggggccaga gccagaacag gtaggctagg ctgtatcagc 3120 ctgggaggca tcgggctatt ctccaaaaag tgaggctccg ggttgcagga gatgggacct 3180 ccaggaaact ggtgggaggc tggacagggg caaagtgaaa ggtaagcagc ctgaagatgg 3240 gtgggatgta gtggactcca gcgtgaagag cctccagtct ctggcagagc tcagcagctt 3300 gggtgggagg aaacgaaggg cagggagcag aaggtggtgg ggggaacggg ttttggttaa 3360 gatgggcagc tgtccagtgg tgaagagggg aagtatttgt gtatacgatc agttgtgggg 3420 gatggtggta gagggagcag tatgagagtc tgggaggaac agggcagggg agatggcaca 3480 ggagaagatt ggggtggggg tgggggcact gatactgaat ccagtacaca gaggcaggct 3540 tagagacccc ctgagggtga caaattcttc tcttaacttg ctgcagagga aacgacaaga 3600 gaataggtcc taagaggagt gaaaatagag gaaactggcc aagggataaa gataagcaga 3660 gctatggaag aaaaggaaga aaattaggga attactggag aggaagctga cagaaagggg 3720 cgctgggaga ggaaaaggtg agggaggacg aaaacggaac tcctatcacc cagcgcattc 3780 cagcaccccc tccccctccc ccgggaagtc tgcgactgca tcctcacagg gatggaatgg 3840 gagtggaagc taggccaggc tgggaccccg gggctgtccc agcccaacca agacggtgac 3900 cagactcaag ttactgatcc tccgctgttt cttcatctgt aaagtggagt taatgacaga 3960 cagctggatg tcaacgtttt ttgttgtttg ttttagagat gggatctccc tgtatcgccc 4020 aggctggagt gcagcggtat gatcacggct cactgcagcc tcgacctcct gggctcgaga 4080 gatcttcctg tctcagcctc ccgagtagaa atgtcagcat ttgaatgcct cacaagggaa 4140 ggtggtgtaa taaaaggtct attgatttag atatgaacaa gtatacccag agccacacga 4200 atgaaaggag gtggccagtg tagatgcaag tctaggacgg tcggtagatt ccaagcttct 4260 ctacctgccc agttaaacaa gttcgtggcc cctggccagc ctctcggtgg gggtctgcga 4320 cagaacgggt gggattcatt accaggctag gagcgcaagg ccctcgggcc gggttcagct 4380 tgctgggctc ctgtcttgtc tcagccccca gcacttgctc tgtcaccgca gagcacaggc 4440 ccaggcaacg tttacccaac tgaacccgca tccctgtggg aaccttgttc caacaaaatc 4500 ccgtcgttgt ctccttccat atggaacgaa aatctccttc tgtacctctg cccagctccg 4560 cacccccgcc cccttagaga tacggcctgg tcgggtcctg gtccccccct cggcggcgct 4620 tccacttttc ccagactgag ggtggggaaa aggaggaggg ggaagaaatc agaggaggaa 4680 aagtcgggag gtaggggagc cgggagacag gagaggggga aaataaagag cctgagacac 4740 aaacgagagg aaaagaccat cacagaaagc tggaaatctc cggagaggcc agcgagaacc 4800 cgcgctcccc acggattcca tcattccttc cgaaggcgcc tctgcggtgt ctcagccgtg 4860 ccaggccccg gggttcccag gacgcggagg agtgctgggt gcggccgcct cgcctcccca 4920 cccctggccg cccctcccca cctcgcccaa gggggccgga acggcgtcgg cgcgcggggg 4980 cttttcggag cagtcgagtg gaaaatagac tttaacccgc tttgtggcgg ccggggcgcc 5040 ctgagcgctc tccaaaccac ggctcccggc gctcaggcgg gccgctgcca agacccggcc 5100 tggagtcccc gcagagttgc gcggcgcacg gaccccgtgg ccttggggcg tcaggaggcc 5160 caacccagat ctgcgcgccc aggcagcgct caggccgcta gaatggaccc cggcagcggc 5220 gaggaagcgg aactctctgc ggctccctct ccgcagtgcg ccggcaaggt ccaggtccca 5280 gcctccccac cgccgcccgc gccctcctag gcctcggagc ggcgcctttc tgcggcctcg 5340 aaggtggggt gggaaagttt ggggagtccc ggctctcaca gcctgtcgtg agaactgccc 5400 ccggggaatt cgtccgccgt acggaaaaac tggccggagc agagtcgtcc gcggttccgc 5460 ggtcgcgggt ggaaggtgaa ggtcgaggga ggtcaggctg cttctgcgtg tcctgacggc 5520 tggcgtgttc tcttgagatg ggctcgggct acttggccag cttcaattta agccacagtg 5580 tctccgaggc cctgacctgg tccggcccgc cgacacttga gcccccagag cctcagagaa 5640 ggcgaggggg tggatctccc agtgccgagg cccgccgtcc tggtccaagc cggtcgcggc 5700 accgtgtctg ggcactggag ctgcttccag ccccgcgaac agctggaggg tggcagtggg 5760 accgctccgg cggcttctcc cgcgcagtgc cccgcctggc cccttgtgaa gggagtgagc 5820 gtcccctttc cagagctgtc ccccgtgaca tccagaaaac gcgaaacctc aggaacaagg 5880 tcgcagcttc agaccgcggc ccaggaggcc gatggtgggt gagtgggaga gtcccggaga 5940 gcaggggggc agagagctgg ttttcgggaa aaccaatgtg ttggacccca aacatccacc 6000 ctccgctcgg atccaagttc tctgagaact gaaacgacat cccgggacga atgggagagt 6060 taggctgagc tacacaccgg ggaggggagg gttggagttt agccccaagc ccttcggacg 6120 ccttcttcgg ctcccgcgtg ggttgagacg gcggcacggc caccagactc agctaaaggg 6180 cggagtcgcg aggagaagcc agtggcgagg ggaggaggag gcctggatct ccccgcgaag 6240 gctccagtcc ggcttttgcc tccgactgcg ggctccctcc ccacccgccg tccctcgccc 6300 cgccccgccc cgccccccac cttggggcag gtgagcggcg gccaatgggc gagcgcgggg 6360 caggtgcccg ctaactcgcg cctcgcagcg ctgggcggcc ggggctgggc agggcagtgc 6420 ggggacaccg ggggctgggg tcggtcccag cgggactccg aaaggaggga gacgagctca 6480 accctcgggc cttactggca gctcgcagcc tagcacggag cccgcgcctg tgcgggcgcc 6540 tggagctgcc cgctccgccg cagcagccgc cgcgcctggc cgtacgctgt ggccggaccc 6600 cgcggtcgct cgctcacaca cccctcgccg ctccgcgcct ggctcgcccg cgggggccga 6660 gcgcgagcgg gcgggcgggg gaggtgaggg gtgcgggcgg gtgtgcatgt gcctggctgg 6720 gtgcacaccc cgcaaggcgg cggcgccagg acgcggagcg ctccccagag cccggctgcc 6780 tcgcacagct cccgcggctg cgaccatgtt ccagcccgcg gccaagcgcg gctttaccat 6840 agagtccttg gtggccaagg acggcggcac cggcgggggc actggcggcg ggggcgcggg 6900 ctcccatctc ctggcggcgg ccgcctccga ggaaccgctc cggcccacgg cgctcaacta 6960 ccctcacccc agcgcggccg aggcggcctt cgtgagtggc ttccctgccg cggccgccgc 7020 gggcgcgggc cgctcgctct acggtgggcc cgagctcgtg ttccccgagg ccatgaacca 7080 ccccgcgctg accgtgcatc cggcgcacca gctgggcgcc tccccgctgc agcccccgca 7140 ctccttcttc ggcgcccagc accgggaccc tctccatttc tacccctggg tcctgcggaa 7200 ccgcttcttc ggccaccgct tccagggtga gtgtccacgc tgtgcccgcc gaggcggccg 7260 gccggcgccc gtgctgcggc gatgcggggg aggctcgggg gcgcgcgggg ctgtttagaa 7320 gttactgccg ggaaggctgc aggtccgcgg aggtagattc ccaggcaggg aagagctgtg 7380 cggcatccac ccgcgccttc gccgcgtagg tctccctccc aggaaagcag gtggagacct 7440 ccaggctttt ctagaaaata taccagttcg gacgcaagcc caggcgcgtc ctcggagcct 7500 gtgctggccc tcgccacagc ctgcccaatt ctctctccca gctgagccag tctcagacca 7560 gagtacaact cctcccgctc tccctccgcc cggcttaacc tcgcaccacg cttctctcgc 7620 aagtccacca ccacctccga gacctcagcc ttcgctggcg cgtccgggcg ggggaaagtc 7680 cattcgcgtg ccccagctct gggggaagca agggcagcag ggagggcgaa tcggagagtt 7740 aatgttcagt gtggagggcc tggctgtctt gggatgtttc tcggcaacct tggcccgact 7800 tctccaagtc acacgtgcct ctcctaccca aggtggggaa ggtttgcagt aagcaaactg 7860 gcttccgccg ttgctcgccg ccttcgggag ggagcccacc cggctgctgg aataccgagg 7920 acagttttcc cgggcagggg gcgggggcag agggctttta aggtcgtagc cagtccgaac 7980 cccggagttt gcatccagca atcggcttgc taataaagat cctccactgg ccctacacac 8040 acacacacac acacacacac acacacacac acgtttcaat tatttgtctt tcccggagaa 8100 aagagagttg catttgttgg agttcgtttt cttccttgaa atttgttgga gtttgttttt 8160 ttcttttctt tttttttaaa ttttatttta aagagtggcc ttgatttgta caggcatcac 8220 tttagtttcc agttttattt tgttagtgta gaccagacca cagccttgtg agaagggtct 8280 atggctcaga gctaggtaac ccggctttta gagaaacaaa tgaaagggac atggctggag 8340 cttcggctcc aggagctaat gtgacggtct gtagtctagg tctacagtca attagatgtt 8400 tggcacagtt gtttagataa taaaatgaaa attatctctt gacactttga ctttcacaga 8460 aaaccgcttt cccaggtccc gatttgtcag gcaatttttt cagtcccacc tggccaatag 8520 atgctgacct ggcagatacc acaaaaccag agaatgtaat tactagaata agaattgttg 8580 tgggtagcct tgcctcctct ttgaagattt caaagacttg cccaaatcca aatccgaaaa 8640 aacaaaaatg ctacaatgtc atctgccttg ggcaagagtt tctgccactt aaaaataaat 8700 gtttactgat aacatgagga tatctttaaa attgagcaat ctaccctggt cctccgtggg 8760 ctcgatccga agcctgggtc tcgaaacctg gcgcccaggg gccgagttgt agttggggcg 8820 gtgtgtgagc ccgcgggccg ccgcggccga ggggctggcg ggttggaggc ttgtggaggg 8880 ataggggctc ggaggagagg gcggggtcgt tcctaagtcc tgtggcctcc agccgttcag 8940 cttgtccgga gtcggcatcc tgggccgcac cctcggcttc gaatccagcc cctgacgccc 9000 tccgcaccgc ggttcctgcc tccgggcgcc gagggccggg ggcgcctgga gagaaatcca 9060 gctccggctc tgagcgtctc cagtcaggcg aggcggataa atccttcgca aaaccctctt 9120 ggaaattgcc gccgcttcct gagccatcag tcccagcggg tacgttatcg agtagcacaa 9180 acagttggat ttttccctca agaaccgagt ctggacgcgg agatggagcc aagtgtggct 9240 gcattttcgg acccggaaat ccgttgggca ctgaaggact tttcgaaccc tgtagcgctg 9300 ttgcttcgcg gtccatcgtc gccgctgcag acggatgcgc tccccggcgg ctctacgccc 9360 tccagtcccg gccaggcctc tgggctggga gccgagccgt ctcgggccct ccggcgccgc 9420 gttttctaga gaaccgggtc tcagcgatgc tcatttcagc cccgtcttaa tgcaacaaac 9480 gaaaccccac acgaacgaaa aggaacatgt ctgcgctctc tgcgcagcgc ttgggcggcg 9540 cggtcccggc gcgcggggaa gcggcgtctc cgctaaccga ggcgctggaa ggggaaaagc 9600 gaatgcggaa tcgtccagga ctccgaaggt cggggccgct cgcgagcacc gaaggggagg 9660 agccgacgaa gaccaggagt gggccgcatt tcggtactgt ttccccgaga tcaggaactt 9720 tccgggtcta ggagcaacgc ctggaggggg ctgtagagac ccagcccccc gggacccgca 9780 actacaatgg gccggagctt ctaaggtcgc ctttgttctg gcaggaggac ggggaatgag 9840 gttatctccg ccgcctgtcc tgcctctccc tctcctagcc ctagggccct ccgcccagcc 9900 gtccggccct gagcccctgg ccggcggcgg cctctccagc gaagactgcg gctcgaagac 9960 tgcagctcgg accccgggtg cttcggatcc ctagctccca cctccagctc cctcattcct 10020 gggaatctct tgtgctagtt cccagccatt gccttgaagg ggccctaaaa gagtggctgt 10080 agaaaaatcg gaggggtagg gaagcaggga ggagaggggt attcatttcc ctagctccag 10140 ggacggctat accagtccct ttccactttg ctaactgtcc tagtccgaaa ctgacagccc 10200 gttctcacag cccagaatta ctgcgtccaa acaggccgca ccctagaccc aagtttgttc 10260 tgcccttgtg gtccaggcaa gggaaactga acccctggta ggggtggttc aggcctcctt 10320 cccacaggtc ggggggcggg gcggtacagg tacctgtgca cctaaggcat cacccttgtc 10380 tttgcagaaa catgtagcaa ttgatctgtt tctcaggatg tttggtgttg tactaaacat 10440 cctctttcta acagggaaac gtccttattc ttttggaatc aaataacctg tcatcactta 10500 gcatcttgac tcatcctgca gtctcctgct tctctgtgat agggttagaa ggacccctgt 10560 atttttgcac atgcatgtga atataccctt taggacacat gctgtctacc acaactggac 10620 atgacaatga cctggggcca ttttctcagt aaggtagacc caaagcaacc tagcatcccc 10680 ctaaaataac cagacttgag gcaaaggggc atgtatgttg gtacagaagc ttgttgcctt 10740 catcctctca tctgggttta taaagacaaa cacagagcac tccaccacac aggtgactga 10800 catataccac ataattacaa aataatcact aagtcagaga cactggggca gactgcagac 10860 ctgcttcctc agccccacac tgcccttcac acctctgcct cctattcata cacacttacg 10920 gggctttcca cactgcagcc tcacttctga ccaacctggg ccagcccagc atctgaggcc 10980 aaaccctgcc aatgctggga tgagctaggc tttctctctc cctctctggt tcatttgtcc 11040 agaggaaacc actgttggga cttcacccag gttcataaca atgttgtttt ttgaagcaag 11100 ttattaacat taacaagaag catttgcttt ccacccacct ttccctggcc tacctcactg 11160 gccccacccc agagacttta atcttcctta ttccccacct ggagcaggct ccatattttt 11220 ctgcccttta ctcatctctg ccagaccacc tcccctgacc atctgtctat tccactatcc 11280 caagtcaaac ttctcttcag tcggacctga gggccctaga tctgcgccac ttgaataatc 11340 aaatggggtg tccctcaccc atctccctgt gatgtggtcc caccattttt gtggctgcac 11400 agatccaacc agttgaaatt gataaggtga ctggagatta ttgactgacc ccttccaggc 11460 actagccccg caatcctagc aactctgttc cacagaaaac tccagcaaaa acttggcttc 11520 tttaggtaac caaagcccag agacttggag gaagtaaggt cagggagttt ccaccaacag 11580 agggacaaga acagttacct ggagagtttt agctacagca tctcaattat ctgcttttga 11640 ttcacttaca tagatgtttc cagagatggg agatgttaac tgaattatcc aggtgattgt 11700 cttagagcaa agcaacaggt caaatcaagt ccaaccagta gccatctctg aagaaattaa 11760 ttggatcagt caatcccaac agctaattct gtcaaaataa tccatctagg gttccgtgtt 11820 tttggtgcat caggaggctg ttatgtgccc ttacatgaga atccatgggt gattttgtca 11880 gggcctgtta tgagtctgtt agcatgtgca accaagccag agattgtgtg agggcctagt 11940 ggggtgttca ttgagacagg cgctgtgggt agaggcttgt tttggcattg atagtttctg 12000 accccatctc ccctacccca gcttcatcca gtccagtgtt atcccttcct cctgcatgtg 12060 ggagctgagt ccctatgctg gccaacattt gctaagggac agtcacactc taaaaatcct 12120 atacagtaga taggaaaaaa gacagtaggg aggctggaac atatatttac acacgcccat 12180 gcagaaacca atatatctat atctatatat attagagaga aagatgacat ctagatattt 12240 atacacatgt ttctttagca agggactatt cagggatgaa gcagggatga agcttttccc 12300 accagacagt acttggagtc tccagtgtgt gtgttgggat agggggttgg gggcttaccc 12360 tagaggctgg gtctctggac cgccaaggcc tgggggagag agaggtggag aaaggggaag 12420 aaggagcctg actttccact tccaggtgct gcctggacca ctgacctagc cactggccta 12480 tttatacccc ctgcaagaca gagctagagc gtgctggcag gagtttttaa tgagttagta 12540 gcctgagcat tcagccgcaa gactagtgca agcaggtgtg aagggattgc tccttgtgta 12600 ccttctagtt cttgaatctg tgtttggcaa aggtgtgcct agcaccccgc tgctcccctt 12660 atcacgttcc tgacccccag ccctgcctct accctgggtc ctcttggagg gagatgcttt 12720 gcgaccagtt aactgaaagc aaatcgttgg ggctggcggc cagggcagcg cccctgggaa 12780 agggcggaga aagagcgcca tggacttttc ttccccaccc cttggcctct tccgctgccc 12840 caggcattgt gaatgtgggt ccacgcctcg tccggcctgc cccatctctt ggcttaacag 12900 agggatctgg agagctgtta ttccccgcgt tcccccgcgg agtggctctc gagtgcgggg 12960 aggtgttgcg gaggggagtg gacttaggga aggggcggca aaagggcaaa gggagaaatg 13020 gcgtgtgtgt gcgtgtcaag gaatggagag ggcagggcgc ttgggagcag ggcgcgaggc 13080 caggctctgt tgggccccgg ctcacggcgc cccttctctc tgtctgtacc tgcgtgtgtt 13140 gccgtcggcg gcggggccgc agccagcgac gtgccccagg acgggctgct tctgcacggc 13200 cccttcgcac gcaagcccaa gcggatccgc acggccttct cgccctcgca gctgctgcgg 13260 ctggagcgcg ccttcgagaa gaaccactac gtggtgggcg ccgagcggaa gcagctggcc 13320 ggcagtctca gcctctccga gacgcaggta atcacccccg gtcgcggcct gccctgcgcc 13380 cggagcccgg gtggaggtga gggtgcgcgg gtgcaggaga ggccctgagc ccgccccagc 13440 ccagccctgc tgggttccaa aaggccccca ttccccgcgg cgctgcggtc aagcccgtct 13500 ttagagcctc ttcctcgaga ctgcgtgcag cctgctgagc ccgcaggact tttgtcaagc 13560 gctaaagacc tagcaggagg cagagtaaat gcaaactgta tcccgagccc ggctcccaaa 13620 gctcctcacg gggggaccag gttccctgga ggaagcgggt cgcctcggga gcgggcagcg 13680 caggcagcac cgaggccact ggagctggct ccagccctgg cattcctgca gcccttttcc 13740 cgccactgtg tcggggcgct catagtcctg cggggagccg gtccgcactg gctttgctgc 13800 tgttcctggg caaaactggc ggggccttgg ctgcccacca gccaggagcg tctggggaga 13860 aagcccaggt gtcctcagac taccaacaga ggggcttaac cagggagggg ccagcccctg 13920 cttggggccc gagggttgct ctgatccggc ccaggccggc tgatagggct gtggaagcca 13980 cggtgtgcgc gcgcagagca tctgagtggc ctgggcctgg tgggaaatag accccgggta 14040 ctcaggtgct tctctgaatc actggaaagg ctgtcgaatg ggagaaggaa taaactccaa 14100 cggcgcctgg gcttgaactg agtgaaatta acaattaccg tgtagtgttt ttgtaactga 14160 tcgttaattt aagggaaaaa attaaagaat tagatgaaag ttatagggag gtggatttgg 14220 gttcattgta agtagacttt gccataaata aatgctgcct gggatcactg cataagctct 14280 tggtccaccc aggtccgacg tgttggagtg gggctcagcg accctcagcc tagctgctgc 14340 cctggaggtg gatttcagtc tctgcgtgcc ggccggctcc cagagttgcg agaggccggc 14400 tccgcggtct cccagctacc tcccggctga cttttcacct tccgctcccc tttcctccta 14460 gtctcgaccc tactacacca ccgtcccctc ccaagtcccg ggcagtgaga agatgcccgg 14520 catggggggc agccggagcc tccctttagc agccagagta ggaagggggc ttagtgaggg 14580 agcccagacc caaacttcat ccgcagcttt cttcggcgga ccttaccctc tcctccttca 14640 gtggcatttt ggcatctatt gtcgtcatat ctgtctgctg ccccacttaa tctacaaatc 14700 gctcacgggt cggaggcagg acccgtgcgt tttcagatgt actagctggg ctgttctaac 14760 tgcagggaaa aagcttacaa aacaagagtt aattttaaaa acgtttcaaa gaaagatgtg 14820 tttttaaaaa taagttaata aaataacact cccttttccc tcctggcagt gttttaaaat 14880 tattgtttga aacaaggtgt cagtttaaga atggtgttta taattaactt catttaaaca 14940 gtaatattta ttaaatttta attgcagaac tgtaagaaaa caaaaatggt ttttaatcct 15000 accacccaca gattaacact tgttgaaata atgtcattgt ttttaaactt tcaatttttt 15060 agctcagtga gagcattttt aattaactct ctttcaaact gaacctagct gcctgtcaat 15120 atttgctcct aacaatgcca gttagtaaac ggactgattg tttctttcat ttttattatg 15180 agacatttca aacatatatt taaaacaaaa ccagatagaa taacataaac gtatcctgct 15240 tcattaacta tcaaaactca gggctaatct tcttcccgtc tgtaaatgag ctgctttttg 15300 catatggtac aacaaaaaga atgaggggag gtttgagcct ggggaacctg ccgtggcagc 15360 ctgtccttcc aggtgaagac cctgagatgg agagatggtt tggacagagc ttcccaggtg 15420 ggcaaacacg attttaaata cctgcctccc tgctaactta ctgtgtaacc ctgggcaagt 15480 cacttaacct ctctgagctc tggtttcctc attgagaaaa tagttgttta atgattaaag 15540 gtacctcata tgagctcaaa taatattaat ccccatccct agtcccttcc ctttaaggta 15600 gtatgtcaga ttagtagcat aagaagatcc aaacctgtgt gtcctcttag tccagcgttc 15660 ttcctccctt atgcagtttc cgtcatcaac attgcctttc tgttgccctc ataacttatc 15720 atacggagcc aggctatata attagctact tctctatccg cctcttggta cttaccaggc 15780 aagcttacct gtcatttcca gctatcagct atttgtcaag catcagtcac ccccaacagc 15840 ccccctgcca tgcatttcta ctgttaatat ctgtatctgt ctccagagct ctctaatctg 15900 tcccaccccg tagctgtttt acatctagcc atatacttct gtctgctctc attaaactgc 15960 ctccccaaaa ctggctaatt tatatttccg attttctatt agttatatgt tcttcctaac 16020 aataagaact atttacccat ttgttcatta tctttgtcat ctattttacc ttctgtgttt 16080 ccaccattca tctcaaactt catctccata gagctatttc gcaactgaca aacagtatat 16140 tcatatgtct ggtaatggtt atctattatt ggctctggct ttgtcttctc tctgggtctg 16200 ggcctcagtt tctgtatctg tgagattgaa tgacacaaat tccagggttt tttctagtgc 16260 tgagtttctg tgactcctct acattctact tctctgtgtt tctgtatact acctcctcca 16320 cattctcaga gctcaccaca caacccctgc ctatcatgat atgcatcaaa ctttgttgtt 16380 attacttaat tatctgccat gtccaaacat caatctgtag accagcagta tgcgtctctc 16440 agggagatct taaaatacag attcctgggt ttcacccagg agattctctt aggaagtcca 16500 ggatagggtg caggaaaaag tttaaaaaca gttatttggg tgatcatgat taataacagg 16560 cctgagcatc ttagctctgg gaggcagagg ccaagcctgt ctgtttctta caggacccag 16620 ctcagtgccc gggatggagt acatgctcaa taaacatgta ttgaattaat gagcacattt 16680 ctctttgccc atacaaatac acactaactt tatcagtcat tccccttgct ctctgctgtc 16740 attgctccct ccctgtccct ctccttctat ctttcccttg tactttcaca gctgattgtt 16800 gatttagatt atgcatatac cagtttgtgg ataaaacttc tcggagggtt actcagatca 16860 gtgtgtgaat gagctcttaa tccagatctc agaagtctgt gcactcccca agctttagcc 16920 gggtgctagg aggtgggcaa cctgggtgac tctgtgtgtt tagtgggagt ggggtattcg 16980 tgctgggatg gccagtgcct caatctagga gatgagggaa gagccctggg caagggctag 17040 ttctcccttc aggttctaat gacttgttcc tcactgcttg ggtgccgccc tggagtatga 17100 ccaggaaggt accagtctaa gcttcagtcc tggtggctgg ttgggcagac ctgggcctgg 17160 gtcattgcag aggctcaagt ttaatgagta tgtgtaatgg gtgtgtgcaa catgtgtctg 17220 cccatgtggg gcaccaacgg gctttatgtg attgatgccc aaaggtcaga tgatagcata 17280 ggtacacatt agatgccatt aggcagtcat atgacatgga gtgcagcttg catgcttttg 17340 tgtgtgttcg tgtgtgtgtc gggggcaggg gtaagttagt tttaggggga gtgagagaaa 17400 gcacctggtt gctccaggct gatcaactgg tcagtgtttc cagctactcc ttctgctctg 17460 aacagatcag caggtgtttc ttgaccttgc ctgggttaga gtttagctga gcggtgaagg 17520 caaagggtac agaaacgtgg cctgtggctt tgaagatttc ttactgagtg atgaaggcta 17580 agtgcaaagc ttgcacattt gtgaaacatg cacaggaaga atgactaggg tcccctttga 17640 ggtcacagct gtgggctgag gggtgtcagg atagaaacgc ttgagaagat ggctccagga 17700 ggcctcagac ctggaagact tggggggatg cctaggatcc taggttggag ggaaagaagg 17760 gcagggtttg aggcaggcag atgaagatag agccaccatc ttggagccca agggcaggga 17820 gatcttggga ggcaggagtt acggtcacct gcctatggct ttttcccctc agaggcatgg 17880 aaaggaggat ttggagggtc ctttcctgct ctggaatgtt ctggccttag agggatggat 17940 aagaggggga tatccaagtg acctgaattt tagggaaaaa tcaagagaca tttgttccta 18000 gctcacggtg tgtccacatc tcttctctaa gtcttggctt ttcttcaaga acttctgcat 18060 ctcatgttcc aggagtcctg tgtgggagga tgagggggag ataaaggaga ttagagtggt 18120 tctgtgagga gctgggacca acatgtcctg aggtgaatct tatgatgtct ccctgagaga 18180 gacagaggaa gggtccaggc tgggctgaaa gaggaggaga cagggaggct tagggagatc 18240 atggttatgg ttggtgggga gctggaggtg acctcagctt actgaggtga aggttgaact 18300 tagcatggca ttgattgggc ttgaccttga gagtgggaac agcccacatg atcaaatgat 18360 aggaaatggg tccccaggga agagagaaag ctgaggggtg acttgactga tatctccagg 18420 ctcctgtcca ttctgggata tttgaaatct ttgaagacag gacacgtatt cacctgaaag 18480 tgtgcagggg cctggagcca cagacttttc catttgcagg agtggtgaaa aagaagggat 18540 ccagacctcg ttcattcaga atagcagatt attccaaagt aaagtctgat tagttctgaa 18600 atatcggctg gagccatagt ttgcttgttt gttagttcat ttttcccttt gttcttgcat 18660 gcatgtcttc atttattaat gcatacattg atcagtcctc tagcaaactg atacattcat 18720 tcatccatag cagtttcacc ttcttcattc tgcctgactc aagccaaccc ttcttctgcc 18780 cagcagtagg tgtccctcct ccaacttccc ctaaaagtgg ccaatccaat ttaccatgtg 18840 gaatattaaa aactggccct cttgcaaaag tgtccacaaa actaagaaaa agatccagtt 18900 tctccatcat tgagcacttc tcaaagcctt tgctgattag aattctaccc ctcttctgtt 18960 cattttctcc tgttttccag gtctggccca ggtacctctt gcctagagca taggcttgtc 19020 cagccagatg actatacatg gaacatgtcc tctgggcagg gcactgggac taacataaca 19080 gtttggctct ccagtctcat agtctggtga ggaggcagac gtaaataaat aaattagtgc 19140 acagtggggg tcactgttac tgagactggg aagaggtact aaggaactac aggcaggtga 19200 tggggcagga ccattaagga acatcaggac agggtcttga aggctaagga gagtattcca 19260 gggttggtaa gtcaggagaa tggagacttt tggaaggatg tggcctctga gaaactgaga 19320 tgttcacttc acagtgaaat gaggacttgg gagaccacaa gggacctctt gctacagcag 19380 agaggtcaga gtgggcaagg ggtcctccag ctaacattcc aactgtacct cggggcttag 19440 agagaggtga gtagtgtgtt tgtgttgggg atggggaggc atgtgcagga cagatccagc 19500 ctccaagcca taccatatga cccagctcct ttccagggcc tgttttctct agggaagggg 19560 ctctgaagga tccagagttg cctggctggg ttggagaggt catgaaatgt cactctcatc 19620 tcctaataca ctcagagccc agttcctttt ctttttccaa gtaaaaaata actaccatta 19680 tcaataatct attaaggaaa attcagaaaa gtagaaagaa gaaagaaaca tcacccacac 19740 tttaggtata tttccttcta gtcttttttc cccgtgtgta gattttgttt ttctatggtt 19800 gtgatcacac tgtgccagcc ttgtgcatcc tggcgtttcc attaatgcta tgaagtcata 19860 agcactaccc tgttattgca gtctttgtaa acagcatctg gacactcagc ccaaggctgt 19920 tctccggaag atggccaggc tgcacaggga gagggtttat gtccctgcct ctagagagat 19980 gcctacttga ccccagtatt tttcatggag aaaatattca gaatcacctt tcacttgggt 20040 gccctaggaa gctgcctctg gcctatcctg tgcctgaagt cgccatccaa agctttcctt 20100 ctttgagcca gtgttgctag tcaagggcag catgctgggc ccgtcccact acaggccaat 20160 gtgaccgtca gtctccttcc tgaaggacac ttggaaatgc atgtggaaag aggaaggtac 20220 agaaaagggc ccccggtccc tggtactgcc cgcatcacct gacagtcacc ttcggccagc 20280 ccacttgggc ttctcaggaa tgacaccccg gccctgcatc tggccctgag tcacgcacag 20340 gaggcagggt gagctcaccc gcccactgac tggcacagtc atagcaggct ccagggtggg 20400 gggcaggggc caggctgctg ccaaatggtt gtgctgagaa ccacccaggg tccaggtggc 20460 cctgcgccca aagataggtg ggcttggagt ccagcagcct gtgcccagag cctctgccat 20520 cctccacggc cggcctaggt gagatgtgca ggctatgggc ttggaaatga ggggagaatc 20580 cccttgccct cactccatcc atcgaggccg ggcaccaacc cttcctgggc cagctttcca 20640 gcccctggct ggctgctctg caggcactga atgccagctg cccccatccc catgccagtg 20700 ctctaaaatc agtgctctca aacaagggca gatggcgcag tggaagttct ggcaagaggg 20760 gactgtgagg ggaagtcctg gggtaggtgg gacagagagg actgcctggg aagggtgtag 20820 gggcagcacc tcctgggcat gaaaccatct gcagggcaca ggggccaggc ctgcctctgc 20880 atgcactgct tggccttgtg gctaaggcct gtgctttacc cagttctctg ggagcaggag 20940 cagtctttct gaggcctgcc ctcagccctg cccagggttc aaggatctct cctcagcatc 21000 attgctgctg ccaaaaccaa gaggctaccc accattcctc acccgcaact ctgccacgca 21060 gcaccgtctg cacagctgca gttggccaca tccacttgct tttaaatgtg ctgtcatttc 21120 ctggaaacca tccaggcctt gtagcctgcc ctctgcacct cctccccaag gggggcctct 21180 ggagcaagaa tccaagaggt gccctggcag ctgcaagtgt ccccagaaca tttcctctat 21240 gcatgaagga ctgaagccca gagggggaag ggacttagct gagaatcagt acccaggatc 21300 ctcctgccaa cgctgaagat ggtttgggtc tggcctgact ctgcaaagcc aagtaaagaa 21360 ccacggagtc agggagagtt gacagatgaa ggctttctcc acagcccaca agcactaagt 21420 ccagtccagg agccaggatg agcctcccag attatgcatg agaggacatt aagggctgtg 21480 tcctggacac tgaacagatg ctggaggagg agggaaaaga ggcttcctgg aggagatggc 21540 ttagaaccat agacctgccc tctgcctcat gcctcctcca tcatggagga tggttgtcca 21600 gtttctgttt gaaccccacc ccataccttg ccagggctct cactgccaga cacagaatag 21660 ggggctccct gggttcaaag tagagctcac ttctgtcccc tgggcttctc ctgactgttc 21720 cttgtgtgac ctgttcccac atctggatgg gctgcaggag ccagtgctgt ggggacagaa 21780 ggtctggagc tgcccgtgaa gggcagaatg ctgccctcag acccgcttcc tccctgtcct 21840 tgtctgtcca aggagaatga ggtctcactg gtggatttcg gactaccctg aggagctggc 21900 acctgaggga caaggccccc cacctgccca gctccagcct ctgatgaggg gtgggagaga 21960 gctacatgag gttgctaaga aagcctcccc tgaaggagac cacacagtgt gtgaggttgg 22020 agtctctagc agcgggttct gtgcccccag ggatagtctg gctgtccagg cactgctctt 22080 gatataaaca ccacctccta gttatgaaac catgcccatt ctgcctctct gtatggaaaa 22140 gagcatgggg ctggcccgtg gggtggtgtc cactttaggc cctgtgggag atcatgggaa 22200 cccacgcagt gggtcatagg ctctctcatt tactactcac atccactctg tgaagaagcg 22260 attatgatct ctcctctaga aactcgtaga gtcccatgtc tgccggcttc cagagcctgc 22320 actcctccac cttggcttgg ctttgctggg gctagaggag ctaggatgca cagcagctct 22380 gtgacccttt gtttgagagg aacaggaaaa ccacccttct ctctggccca ctgtgtcctc 22440 ttcctgccct gccatcccct tctgtgaatg ttagacccat gggagcagct ggtcagaggg 22500 gaccccggcc tggggcccct aaccctatgt agcctcagtc ttcccatcag gctctcagct 22560 cagcctgagt gttgaggccc cagtggctgc tctgggggcc tcctgagttt ctcatctgtg 22620 cccctccctc cctggcccag gtgaaggtgt ggttccagaa ccggaggaca aagtacaaac 22680 ggcagaagct ggaggaggaa gggcctgagt ccgagcagaa gaagaagggc tcccatcaca 22740 tcaaccggtg gcgcattgcc acgaagcagg ccaatgggga ggacatcgat gtcacctcca 22800 atgactaggg tgggcaacca caaacccacg agggcagagt gctgcttgct gctggccagg 22860 cccctgcgtg ggcccaagct ggactctggc cactccctgg ccaggctttg gggaggcctg 22920 gagtcatggc cccacagggc ttgaagcccg gggccgccat tgacagaggg acaagcaatg 22980 ggctggctga ggcctgggac cacttggcct tctcctcgga gagcctgcct gcctgggcgg 23040 gcccgcccgc caccgcagcc tcccagctgc tctccgtgtc tccaatctcc cttttgtttt 23100 gatgcatttc tgttttaatt tattttccag gcaccactgt agtttagtga tccccagtgt 23160 cccccttccc tatgggaata ataaaagtct ctctcttaat gacacgggca tccagctcca 23220 gccccagagc ctggggtggt agattccggc tctgagggcc agtgggggct ggtagagcaa 23280 acgcgttcag ggcctgggag cctggggtgg ggtactggtg gagggggtca agggtaattc 23340 attaactcct ctcttttgtt gggggaccct ggtctctacc tccagctcca cagcaggaga 23400 aacaggctag acatagggaa gggccatcct gtatcttgag ggaggacagg cccaggtctt 23460 tcttaacgta ttgagaggtg ggaatcaggc ccaggtagtt caatgggaga gggagagtgc 23520 ttccctctgc ctagagactc tggtggcttc tccagttgag gagaaaccag aggaaagggg 23580 aggattgggg tctgggggag ggaacaccat tcacaaaggc tgacggttcc agtccgaagt 23640 cgtgggccca ccaggatgct cacctgtcct tggagaaccg ctgggcaggt tgagactgca 23700 gagacagggc ttaaggctga gcctgcaacc agtccccagt gactcagggc ctcctcagcc 23760 caagaaagag caacgtgcca gggcccgctg agctcttgtg ttcacctgcc cttctgtttg 23820 tcccacttgt caggatgaag gtttcctgac aagcaaatct gcattcctaa gtctttccct 23880 tacgacatcc agacccctct ctttcttctt cacctcccat gtgctcatga aacctctgct 23940 ctttggcctc catgccacca ttctgccggt gctaatgaca gtcaccaacc acagtcactg 24000 gccaccccct tgtggccaaa ctcaaccact tcctgttggg ttcacctgct ccctgatctg 24060 ttggctatgc cctcctggat tctcccaccc cgctctgcct tcatttcggt agctctgact 24120 cctccttcag cctgagttca ttcagtgtga tccatgcctt gtcacctctg gccaccccca 24180 ggtcagtcct tgctctccct gactcctcat tatgtccttt gccttgtggg gatcacatcc 24240 acttccagga cttctctttg gctccctggc ctgtgtcttt agctgacctc tgctgagctg 24300 cagacccgtc aagccagctg cctgctccac cccctgcccc tcagcacctc aaagcccata 24360 catccacagc cggacgcacc tacccatctg tgcttctcca ggatcaccca cctcgacaaa 24420 cagcattaga catgtacaca gtttcccaag ctacaggaaa tctgggaatc ttcctcaagc 24480 ttcctctcct cttccccagc cccatccatt cccatctagt gggttgagtc tagactggct 24540 tcccaaccac acctccctaa tgcagcaccc cctacccccc tgcccagctc cctctgccac 24600 cggcctggcc tgggccctgc tcctctaggg aggtttctgt gaatgtcaag gatgaggtcc 24660 acttcaaagg aggccctcca tgttgcagct aggtttctct tccttgcacc caaacagggc 24720 agactcaccc ccttctgagc ccctttgccc catcttcttg ccttgctccc ggtacccttt 24780 gcttcagcat ccccatccct gtccctgagt gagccacagg ttttccctgt gctgtgcctt 24840 cgctcatgct gttcttccca cctggaatgt cgggtgcttg atcaatgtgg aactcactgg 24900 aaagatgtca gagacccagc cttgctgtct gggccacatg cagggatcca agcacacaag 24960 gtccttctgc tgggagcaca gacccaggtc ccactcgcac tctcagcgtc tctctcccac 25020 ctctgcccac ctcacttgtg tccagtcagt gctagaaacc aaagggcttt gtcccatccc 25080 aacaccccct ctccctccat cagtcaggaa tgcattctgc acatcttgaa agtcctaaca 25140 tggataagtc cagattaacc cacatggcga ccctcactgc caagcaggtg ggatcacttc 25200 tgggagcaca catgcccagg tgtggaagga aggtgggagg aagagtcatc cttttggccc 25260 cagtggggga cagagaaagg ggtgagctgt tcctctcaag atcctgcctc acttggtagg 25320 gggagggggt ccaggaagat cacagcagag caccccctgt catccgaata aagggctgga 25380 agggacccaa ggaaacctgc cagtctcccg aggccaggcc tgcggggggc ggggcgggga 25440 gtccctgccg cactcccatc caccccccat gttgtgcctc tccctgcaga cggtaaatat 25500 tggtgttgtg acttcattaa taaaggcttc tgtgagcctg aaaaa 25545 <210> 50 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer1 (EMX1) <400> 50 gggcttctcc tgactgttcc ttgtgtgacc 30 <210> 51 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer2 (EMX1) <400> 51 caggatggcc cttccctatg tctagcctgt 30 <210> 52 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> NLS (protein) <400> 52 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 53 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> NLS (nucleotide) <400> 53 cccaagaaga agcggaaggt g 21 <210> 54 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> BPNLS (protein) <400> 54 Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg 1 5 10 15 Lys Val Glu <210> 55 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> BPNLS (nucleotide) <400> 55 aagcggactg ctgatggcag tgaatttgag tccccaaaga agaagagaaa ggtggaa 57 <210> 56 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> BPNLS insert upper <400> 56 agatcttaat acgactcact atagggagag ccgccaccat ggcc 44 <210> 57 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> BPNLS insert lower <400> 57 taatatcctc gag 13 <210> 58 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> 2A (protein) <400> 58 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 59 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> 2A (nucleotide Cse1-Cse2) <400> 59 ggaagcggag caaccaactt cagcctgctg aagcaggccg gcgatgtgga ggagaatcca 60 ggcccc 66 <210> 60 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> 2A(nucleotide Cse2-Cas7) <400> 60 ggctccggcg ccaccaattt ttctctgctg aagcaggcag gcgatgtgga ggagaaccca 60 ggacct 66 <210> 61 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> 2A(nucleotide Cas7-Cas5) <400> 61 ggatctggag ccaccaattt cagcctgctg aagcaagcag gcgacgtgga agaaaaccca 60 ggacca 66 <210> 62 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> 2A(nucleotide Cas5-Cas6) <400> 62 ggatctgggg ctactaattt ttctctgctg aagcaagccg gcgacgtgga agagaatcca 60 ggaccg 66 <210> 63 <211> 176 <212> DNA <213> Artificial Sequence <220> <223> pre-crRNA(LRSR) <400> 63 tggatgtgtt gtttgtgtga tactataaag ttggtagatt gtgactggct taaaaaatca 60 ttaattaata ataggttatg tttagagtgt tccccgcgcc agcggggata aaccgcaggc 120 caatggggag gacatcgatg tcacctcgtg ttccccgcgc cagcggggat aaaccg 176 <210> 64 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> pre-crRNA(RSR) <400> 64 gtgttccccg cgccagcggg gataaaccgc aggccaatgg ggaggacatc gatgtcacct 60 cgtgttcccc gcgccagcgg ggataaaccg 90 <210> 65 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> mature crRNA <400> 65 ataaaccgca ggccaatggg gaggacatcg atgtcacctc gtgttccccg cgccagcggg 60 g 61

Claims

DNA가 편집된 진핵 세포를 제조하는 방법으로서, 진핵 세포에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
DNA가 편집된 동물(단 인간을 제외함) 또는 식물을 제조하는 방법으로서, 동물(단 인간을 제외함) 또는 식물에 CRISPR-Cas3 시스템을 도입하는 것을 포함하고, CRISPR-Cas3 시스템이 이하의 (A) 내지 (C)를 포함하는 방법.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터,
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(C) crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
제1항 또는 제2항에 있어서, 진핵 세포에 CRISPR-Cas3 시스템을 도입한 후에, 캐스케이드 단백질을 구성하는 단백질에 의해 crRNA가 절단되는 공정을 포함하는, 방법.
제1항 또는 제2항에 있어서, crRNA가 프리 crRNA인, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, 방법.
제5항에 있어서, 핵 이행 시그널이 바이파타이트(bipartite) 핵 이행 시그널인, 방법.
이하의 (A) 및 (B)를 포함하는, 제1항 내지 제6항 중 어느 한 항에 기재된 방법에 사용하기 위한 키트.
(A) Cas3 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터, 및
(B) 캐스케이드 단백질, 해당 단백질을 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터
제7항에 있어서, crRNA, 해당 crRNA를 코딩하는 폴리뉴클레오티드 또는 해당 폴리뉴클레오티드를 포함하는 발현 벡터를 더 포함하는, 키트.
제8항에 있어서, crRNA가 프리 crRNA인, 키트.
제7항 내지 제9항 중 어느 한 항에 있어서, Cas3 단백질 및/또는 캐스케이드 단백질에 핵 이행 시그널이 부가되어 있는, 키트.
제10항에 있어서, 핵 이행 시그널이 바이파타이트 핵 이행 시그널인, 키트.