KR20180042394A

KR20180042394A - 조작된 crispr-cas9 뉴클레아제

Info

Publication number: KR20180042394A
Application number: KR1020187008311A
Authority: KR
Inventors: 제이. 키쓰 종; 벤자민 클레인스티버; 비크람 패타나야크
Original assignee: 더 제너럴 하스피탈 코포레이션
Priority date: 2015-08-28
Filing date: 2016-08-26
Publication date: 2018-04-25
Also published as: CA2996888A1; JP6799586B2; HK1257676A1; AU2016316845B2; JP6942848B2; CN114875012A; JP2018525019A; AU2016316845A1; EP3341477B1; JP7074827B2; EP4036236A1; CN108350449A; CN108350449B; JP7326391B2; JP2021040644A; JP2023145657A; JP2021003110A; JP6745391B2; EP3341477A1; AU2022203146A1

Abstract

개선된 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제 및 게놈 조작, 에피게놈 조작, 게놈 표적화 및 게놈 편집에서의 그의 용도.

Description

조작된 CRISPR-CAS9 뉴클레아제

우선권의 주장

본 출원은 35 USC §119(e)에 의거하여, 2015년 8월 28일자로 출원된 미국 특허 출원 제 62/211,553호; 2015년 9월 9일자로 출원된 제 62/216,033호; 2015년 11월 20일자로 출원된 제 62/258,280호; 2015년 12월 28일자로 출원된 제 62/271,938호; 및 2016년 2월 4일자로 출원된 제 15/015,947호에 대한 우선권을 주장한다. 전술된 특허 출원의 전문은 본 명세서에 참조로 포함된다.

서열 목록

본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 그 전문이 본 명세서에 참조로 포함된다. 상기 ASCII 복사본은 2016년 8월 26일자로 생성되었고, 서열 LISTING.txt라는 명칭으로, 129,955 바이트 크기이다.

미국 연방정부 지원 하의 연구 또는 개발

본 발명은 미국 국립 보건원에 의해 부여된 허가 번호 DP1 GM105378 및 R01 GM088040 하에 미국 정부의 지원으로 이루어졌다. 미국 정부는 본 발명에 대해 특정 권리를 가진다.

기술 분야

본 발명은 적어도 부분적으로는, 변이되고 개선된 표적 특이성을 갖는 조작된 일정한 간격으로 주기적으로 분포하는 짧은 회문 구조의 반복서열(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)/CRISPR-연관 단백질 9(Cas9) 뉴클레아제 및 게놈 조작, 에피게놈 조작, 게놈 표적화, 게놈 편집 및 시험관내 진단법에서의 그의 용도에 관한 것이다.

CRISPR-Cas9 뉴클레아제는 다양한 유기체 및 세포 유형에서 효율적인 게놈 편집을 가능하게 한다(문헌[Sander & Joung, Nat Biotechnol 32, 347-355 (2014); Hsu et al., Cell 157, 1262-1278 (2014); Doudna & Charpentier, Science 346, 1258096 (2014); Barrangou & May, Expert Opin Biol Ther 15, 311-314 (2015)]). Cas9에 의한 표적 부위 인식은, 표적 프로토스페이서(protospacer)에 상보성인 서열을 인코딩하는 키메라 단일 가이드 RNA(sgRNA)에 의해 프로그래밍되나(문헌[Jinek et al., Science 337, 816-821 (2012)]), 또한, 짧은 이웃 PAM의 인식이 필요하다(문헌[Mojica et al., Microbiology 155, 733-740 (2009); Shah et al., RNA Biol 10, 891-899 (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Science 337, 816-821 (2012); Sternberg et al., Nature 507, 62-67 (2014)]).

본 명세서에 기재된 바와 같이, Cas9 단백질은 이론적으로는, DNA에 대한 Cas9의 결합 친화도를 감소시킴으로써, 증대된 특이성을 나타내도록 조작될 수 있다. 따라서, 본 명세서에는, 야생형 단백질과 비교하여, 특이성이 증대된(즉, 불완전하게 매치되거나, 미스매치된 DNA 부위에서 실질적으로 더 적은 표적외 효과를 유도하는) 다수의 Cas9 변이체뿐만 아니라, 이들을 사용하는 방법이 기재되어 있다.

제1 양태에서, 본 발명은 L169A, Y450, N497, R661, Q695, Q926, 및/또는 D1135E의 위치 중 1, 2, 3, 4, 5, 6 또는 7개 모두에서 돌연변이를 가지고, 예를 들어, L169, Y450, N497, R661, Q695, Q926, D1135E의 위치 중 1, 2, 3, 4, 5, 6 또는 7개에 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로, 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는 단리된 스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9(SpCas9) 단백질을 제공한다. 돌연변이는 아미노산을 천연 아미노산이 아닌 다른 아미노산으로 변이시킨다(예를 들어, 497은 N 이외의 다른 것임). 바람직한 구현예에서 돌연변이는 아미노산을 천연 아미노산, 아르기닌 또는 리신 이외에 임의의 아미노산으로 변화시킨다; 일부 구현예에서, 아미노산은 알라닌이다.

일부 구현예에서, 변이체 SpCas9 단백질은 N497, R661, Q695, 및 Q926 중 1, 2, 3 또는 4개 모두에서의 돌연변이, 예를 들어, N497A, R661A, Q695A, 및 Q926A의 돌연변이 중 1, 2, 3, 또는 4개 모두를 포함한다.

일부 구현예에서, 변이체 SpCas9 단백질은 Q695 및/또는 Q926, 및 선택적으로 L169, Y450, N497, R661 및 D1135E 중 1, 2, 3, 4 또는 5개 모두에서의 돌연변이를 포함하며, 예를 들어, Y450A/Q695A, L169A/Q695A, Q695A/Q926A, Q695A/D1135E, Q926A/D1135E, Y450A/D1135E, L169A/Y450A/Q695A, L169A/Q695A/Q926A, Y450A/Q695A/Q926A, R661A/Q695A/Q926A, N497A/Q695A/Q926A, Y450A/Q695A/D1135E, Y450A/Q926A/D1135E, Q695A/Q926A/D1135E, L169A/Y450A/Q695A/Q926A, L169A/R661A/Q695A/Q926A, Y450A/R661A/Q695A/Q926A, N497A/Q695A/Q926A/D1135E, R661A/Q695A/Q926A/D1135E, 및 Y450A/Q695A/Q926A/D1135E를 포함하지만, 이에 제한되지 않는다.

일부 구현예에서, 변이체 SpCas9 단백질은 N14; S15; S55; R63; R78; H160; K163; R165; L169; R403; N407; Y450; M495; N497; K510; Y515; W659; R661; M694; Q695; H698; A728; S730; K775; S777; R778; R780; K782; R783; K789; K797; Q805; N808; K810; R832; Q844; S845; K848; S851; K855; R859; K862; K890; Q920; Q926; K961; S964; K968; K974; R976; N980; H982; K1003; K1014; S1040; N1041; N1044; K1047; K1059; R1060; K1107; E1108; S1109; K1113; R1114; S1116; K1118; D1135; S1136; K1153; K1155 ; K1158; K1200; Q1221; H1241; Q1254; Q1256; K1289; K1296; K1297; R1298; K1300; H1311; K1325; K1334; T1337 및/또는 S1216에서의 돌연변이를 포함한다.

일부 구현예에서, 변이체 SpCas9 단백질은 또한 하기의 돌연변이 중 하나 이상을 포함한다: N14A; S15A; S55A; R63A; R78A; R165A; R403A; N407A; N497A; Y450A; K510A; Y515A; R661A; Q695A; S730A; K775A; S777A; R778A; R780A; K782A; R783A; K789A; K797A; Q805A; N808A; K810A; R832A; Q844A; S845A; K848A; S851A; K855A; R859A; K862A; K890A; Q920A; Q926A; K961A; S964A; K968A; K974A; R976A; N980A; H982A; K1003A; K1014A; S1040A; N1041A; N1044A; K1047A; K1059A; R1060A; K1107A; E1108A; S1109A; K1113A; R1114A; S1116A; K1118A; D1135A; S1136A; K1153A; K1155A; K1158A; K1200A; Q1221A; H1241A; Q1254A; Q1256A; K1289A; K1296A; K1297A; R1298A; K1300A; H1311A; K1325A; K1334A; T1337A 및/또는 S1216A. 일부 구현예에서, 변이체 단백질은 HF1(N497A/R661A/Q695A/Q926A)+K810A, HF1+K848A, HF1+K855A, HF1+H982A, HF1+K848A/K1003A, HF1+K848A/R1060A, HF1+K855A/K1003A, HF1+K855A/R1060A, HF1+H982A/K1003A, HF1+H982A/R1060A, HF1+K1003A/R1060A, HF1+K810A/K1003A/R1060A, HF1+K848A/K1003A/R1060A를 포함한다. 일부 구현예에서, 변이체 단백질은 HF1+K848A/K1003A, HF1+K848A/R1060A, HF1+K855A/K1003A, HF1+K855A/R1060A, HF1+K1003A/R1060A, HF1+K848A/K1003A/R1060A를 포함한다. 일부 구현예에서, 변이체 단백질은 Q695A/Q926A/R780A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K855A, Q695A/Q926A/K848A/K1003A, Q695A/Q926A/K848A/K855A, Q695A/Q926A/K848A/H982A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K848A/R1060A, Q695A/Q926A/K855A/H982A, Q695A/Q926A/K855A/K1003A, Q695A/Q926A/K855A/R1060A, Q695A/Q926A/H982A/K1003A, Q695A/Q926A/H982A/R1060A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K810A/K1003A/R1060A, Q695A/Q926A/K848A/K1003A/R1060A를 포함한다. 일부 구현예에서, 변이체는 N497A/R661A/Q695A/Q926A/K810A, N497A/R661A/Q695A/Q926A/K848A, N497A/R661A/Q695A/Q926A/K855A, N497A/R661A/Q695A/Q926A/R780A, N497A/R661A/Q695A/Q926A/K968A, N497A/R661A/Q695A/Q926A/H982A, N497A/R661A/Q695A/Q926A/K1003A, N497A/R661A/Q695A/Q926A/K1014A, N497A/R661A/Q695A/Q926A/K1047A, N497A/R661A/Q695A/Q926A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K968A, N497A/R661A/Q695A/Q926A/K810A/K848A, N497A/R661A/Q695A/Q926A/K810A/K1003A, N497A/R661A/Q695A/Q926A/K810A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A, N497A/R661A/Q695A/Q926A/K848A/R1060A, N497A/R661A/Q695A/Q926A/K855A/K1003A, N497A/R661A/Q695A/Q926A/K855A/R1060A, N497A/R661A/Q695A/Q926A/K968A/K1003A, N497A/R661A/Q695A/Q926A/H982A/K1003A, N497A/R661A/Q695A/Q926A/H982A/R1060A, N497A/R661A/Q695A/Q926A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A, Q695A/Q926A/R780A, Q695A/Q926A/K810A, Q695A/Q926A/R832A, Q695A/Q926A/K848A, Q695A/Q926A/K855A, Q695A/Q926A/K968A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K1003A, Q695A/Q926A/K1014A, Q695A/Q926A/K1047A, Q695A/Q926A/R1060A, Q695A/Q926A/K848A/K968A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K855A, Q695A/Q926A/K848A/K1003A, Q695A/Q926A/K848A/K855A, Q695A/Q926A/K848A/H982A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/R832A/R1060A, Q695A/Q926A/K968A/K1003A, Q695A/Q926A/K968A/R1060A, Q695A/Q926A/K848A/R1060A, Q695A/Q926A/K855A/H982A, Q695A/Q926A/K855A/K1003A, Q695A/Q926A/K855A/R1060A, Q695A/Q926A/H982A/K1003A, Q695A/Q926A/H982A/R1060A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K810A/K1003A/R1060A, Q695A/Q926A/K1003A/K1047A/R1060A, Q695A/Q926A/K968A/K1003A/R1060A, Q695A/Q926A/R832A/K1003A/R1060A, 또는 Q695A/Q926A/K848A/K1003A/R1060A를 포함한다.

알라닌 이외의 아미노산으로의 돌연변이가 또한 포함되며, 이는 본 발명의 방법 및 조성물로 제조되고, 사용될 수 있다.

일부 구현예에서, 변이체 SpCas9 단백질은 다음의 추가의 돌연변이 중 하나 이상을 포함한다: R63A, R66A, R69A, R70A, R71A, Y72A, R74A, R75A, K76A, N77A, R78A, R115A, H160A, K163A, R165A, L169A, R403A, T404A, F405A, N407A, R447A, N497A, I448A, Y450A, S460A, M495A, K510A, Y515A, R661A, M694A, Q695A, H698A, Y1013A, V1015A, R1122A, K1123A, K1124A, K1158A, K1185A, K1200A, S1216A, Q1221A, K1289A, R1298A, K1300A, K1325A, R1333A, K1334A, R1335A, 및 T1337A.

일부 구현예에서, 변이체 SpCas9 단백질은 다중 치환 돌연변이를 포함한다: N497/R661/Q695/Q926(사중 변이체 돌연변이체); Q695/Q926(이중 돌연변이체); R661/Q695/Q926 및 N497/Q695/Q926(삼중 돌연변이체). 일부 구현예에서, L169, Y450 및/또는 D1135에서의 추가의 치환 돌연변이가 이들 이중-, 삼중 및 사중 돌연변이체에 첨가될 수 있거나, Q695 또는 Q926에서 치환을 보유하는 단일 돌연변이체에 첨가될 수 있다. 일부 구현예에서, 돌연변이체는 야생형 아미노산 대신에 알라닌을 갖는다. 일부 구현예에서, 돌연변이체는 아르기닌 또는 리신(또는, 천연 아미노산) 이외의 임의의 아미노산을 갖는다.

일부 구현예에서, 변이체 SpCas9 단백질은 또한 D10, E762, D839, H983, 또는 D986; 및 H840 또는 N863에서의 돌연변이로 이루어진 군으로부터 선택되는 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 돌연변이는 (i) D10A 또는 D10N, 및 (ii) H840A, H840N, 또는 H840Y이다.

일부 구현예에서, SpCas9 변이체는 또한 다음의 돌연변이 세트 중 하나를 포함한다: D1135V/R1335Q/T1337R(VQR 변이체); D1135E/R1335Q/T1337R(EQR 변이체); D1135V/G1218R/R1335Q/T1337R(VRQR 변이체); 또는 D1135V/G1218R/R1335E/T1337R(VRER 변이체).

또한 본 명세서에서는 Y211, Y212, W229, Y230, R245, T392, N419, Y651, 또는 R654의 위치 중 1, 2, 3, 4, 5, 6개 이상에서 돌연변이를 가지고, 예를 들어, Y211, Y212, W229, Y230, R245, T392, N419, Y651, 또는 R654의 위치 중 1, 2, 3, 4, 또는 5, 또는 6개에 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로, 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는 단리된 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9(SaCas9) 단백질이 제공된다. 일부 구현예에서, 본 명세서에 기재된 SaCas9 변이체는 Y211, Y212, W229, Y230, R245, T392, N419, Y651및/또는 R654의 위치 중 1, 2, 3, 4, 5, 6개 이상에서 돌연변이를 갖는 SEQ ID NO:2의 아미노산 서열을 포함한다. 일부 구현예에서 변이체는 Y211A, Y212A, W229, Y230A, R245A, T392A, N419A, Y651, 및/또는 R654A의 돌연변이 중 하나 이상을 포함한다.

일부 구현예에서, 변이체 SaCas9 단백질은 N419 및/또는 R654에서의 돌연변이 및 선택적으로 추가의 돌연변이 Y211, Y212, W229, Y230, R245 및 T392 중 1, 2, 3, 4개 이상, 바람직하게는 N419A/R654A, Y211A/R654A, Y211A/Y212A, Y211A/Y230A, Y211A/R245A, Y212A/Y230A, Y212A/R245A, Y230A/R245A, W229A/R654A, Y211A/Y212A/Y230A, Y211A/Y212A/R245A, Y211A/Y212A/Y651A, Y211A/Y230A/R245A, Y211A/Y230A/Y651A, Y211A/R245A/Y651A, Y211A/R245A/R654A, Y211A/R245A/N419A, Y211A/N419A/R654A, Y212A/Y230A/R245A, Y212A/Y230A/Y651A, Y212A/R245A/Y651A, Y230A/R245A/Y651A, R245A/N419A/R654A, T392A/N419A/R654A, R245A/T392A/N419A/R654A, Y211A/R245A/N419A/R654A, W229A/R245A/N419A/R654A, Y211A/R245A/T392A/N419A/R654A, 또는 Y211A/W229A/R245A/N419A/R654A를 포함한다.

일부 구현예에서, 변이체 SaCas9 단백질은 Y211; Y212; W229; Y230; R245; T392; N419; L446; Q488; N492; Q495; R497; N498; R499; Q500; K518; K523; K525; H557; R561; K572; R634; Y651; R654; G655; N658; S662; N667; R686; K692; R694; H700; K751; D786; T787; Y789; T882; K886; N888; 889; L909; N985; N986; R991; R1015; N44; R45; R51; R55; R59; R60; R116; R165; N169; R208; R209; Y211; T238; Y239; K248; Y256; R314; N394; Q414; K57; R61; H111; K114; V164; R165; L788; S790; R792; N804; Y868; K870; K878; K879; K881; Y897; R901; 및/또는 K906에서의 돌연변이를 포함한다.

일부 구현예에서, 변이체 SaCas9 단백질은 다음의 돌연변이 중 하나 이상을 포함한다: Y211A; Y212A; W229A; Y230A; R245A; T392A; N419A; L446A; Q488A; N492A; Q495A; R497A; N498A; R499A; Q500A; K518A; K523A; K525A; H557A; R561A; K572A; R634A; Y651A; R654A; G655A; N658A; S662A; N667A; R686A; K692A; R694A; H700A; K751A; D786A; T787A; Y789A; T882A; K886A; N888A; A889A; L909A; N985A; N986A; R991A; R1015A; N44A; R45A; R51A; R55A; R59A; R60A; R116A; R165A; N169A; R208A; R209A; T238A; Y239A; K248A; Y256A; R314A; N394A; Q414A; K57A; R61A; H111A; K114A; V164A; R165A; L788A; S790A; R792A; N804A; Y868A; K870A; K878A; K879A; K881A; Y897A; R901A; K906A.

일부 구현예에서, 변이체 SaCas9 단백질은 다음의 추가의 돌연변이 중 하나 이상을 포함한다: Y211A, W229A, Y230A, R245A, T392A, N419A, L446A, Y651A, R654A, D786A, T787A, Y789A, T882A, K886A, N888A, A889A, L909A, N985A, N986A, R991A, R1015A, N44A, R45A, R51A, R55A, R59A, R60A, R116A, R165A, N169A, R208A, R209A, T238A, Y239A, K248A, Y256A, R314A, N394A, Q414A, K57A, R61A, H111A, K114A, V164A, R165A, L788A, S790A, R792A, N804A, Y868A, K870A, K878A, K879A, K881A, Y897A, R901A, K906A.

일부 구현예에서, 변이체 SaCas9 단백질은 다중 치환 돌연변이를 포함한다: R245/T392/N419/R654 및 Y221/R245/N419/R654(사중 변이체 돌연변이체); N419/R654, R245/R654, Y221/R654, 및 Y221/N419(이중 돌연변이체); R245/N419/R654, Y211/N419/R654, 및 T392/N419/R654(삼중 돌연변이체). 일부 구현예에서 돌연변이체는 야생형 아미노산 대신에 알라닌을 함유한다.

일부 구현예에서, 변이체 SaCas9 단백질은 또한 D10, E477, D556, H701, 또는 D704; 및 H557 또는 N580에서의 돌연변이로 이루어진 군으로부터 선택되는 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 돌연변이는 (i) D10A 또는 D10N, (ii) H557A, H557N, 또는 H557Y, (iii) N580A, 및/또는(iv) D556A이다.

일부 구현예에서, 변이체 SaCas9 단백질은 다음의 돌연변이 중 하나 이상을 포함한다: E782K, K929R, N968K, 또는 R1015H. 구체적으로는, E782K/N968K/R1015H(KKH 변이체); E782K/K929R/R1015H(KRH 변이체); 또는 E782K/K929R/N968K/R1015H(KRKH 변이체).

일부 구현예에서, 변이체 Cas9 단백질은 특이성을 증대시키기 위해, 다음의 영역 중 하나 이상에 돌연변이를 포함한다:

또한, 본 명세서에서는 선택적 개입 링커에 의해, 이종 기능성 도메인에 융합된 본 명세서에 기재된 단리된 변이체 Cas9 단백질을 포함하는 융합 단백질이 제공되며, 여기서, 링커는 융합 단백질의 활성에 간섭하지 않는다. 일부 구현예에서, 이종 기능성 도메인은 DNA 또는 단백질, 예를 들어 염색질에 작용한다. 일부 구현예에서, 이종 기능성 도메인은 전사 활성화 도메인이다. 일부 구현예에서, 전사 활성화 도메인은 VP64 또는 NF-κB p65으로부터 유래한다. 일부 구현예에서, 이종 기능성 도메인은 전사 사일런서(transcriptional silencer) 또는 전사 억제 도메인이다. 일부 구현예에서, 전사 억제 도메인은 Kruppel-연관 박스(KRAB) 도메인, ERF 리프레서 도메인(ERD), 또는 mSin3A 상호작용 도메인(SID)이다. 일부 구현예에서, 전사 사일런서는 이질염색질 단백질 1(HP1), 예를 들어, HP1α 또는 HP1β이다. 일부 구현예에서, 이종 기능성 도메인은 DNA의 메틸화 상태를 변형시키는 효소이다. 일부 구현예에서, DNA의 메틸화 상태를 변형시키는 효소는 DNA 메틸기전달효소(DNMT) 또는 TET 단백질의 전체 또는 디옥시게나제 도메인, 예를 들어, 시스테인-풍부 연장을 포함하는 촉매 모듈 및 7개의 고도로 보존된 엑손에 의해 인코딩되는 2OGFeDO 도메인, 예를 들어, 아미노산 1580 내지 2052를 포함하는 Tet1 촉매 도메인, 아미노산 1290 내지 1905를 포함하는 Tet2 및 아미노산 966 내지 1678을 포함하는 Tet3이다. 일부 구현예에서, TET 단백질 또는 TET-유래 디옥시게나제 도메인은 TET1로부터 유래한다. 일부 구현예에서, 이종 기능성 도메인은, 히스톤 서브유닛을 변형시키는 효소이다. 일부 구현예에서, 히스톤 서브유닛을 변형시키는 효소는 히스톤 아세틸기전달효소(HAT), 히스톤 탈아세틸효소(HDAC), 히스톤 메틸기전달효소(HMT), 또는 히스톤 탈메틸효소이다. 일부 구현예에서, 이종 기능성 도메인은 생물학적 테더(biological tether)이다. 일부 구현예에서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질이다. 일부 구현예에서, 이종 기능성 도메인은 FokI이다.

또한 본 명세서에서는 본 명세서에 기재된 변이체 Cas9 단백질을 인코딩하는 핵산으로서, 단리된 핵산뿐만 아니라, 선택적으로, 본 명세서에 기재된 변이체 Cas9 단백질을 발현시키기 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 단리된 핵산을 포함하는 벡터가 제공된다. 또한, 본 명세서에서는 본 명세서에 기재된 핵산을 포함하고, 선택적으로 본 명세서에 기재된 변이체 Cas9 단백질을 발현하는 숙주 세포, 예를 들어 박테리아, 효모, 곤충 또는 포유류 숙주 세포 또는 트랜스제닉 동물(transgenic animal)(예를 들어, 마우스)이 제공된다.

또한, 본 명세서에서는 Cas9변이체를 인코딩하는 단리된 핵산뿐만 아니라, 선택적으로, 이러한 변이체를 발현시키기 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 단리된 핵산을 포함하는 벡터 및 이러한 핵산을 포함하고, 선택적으로, 이러한 변이체 단백질을 발현하는 숙주 세포, 예를 들어 포유류 숙주 세포가 제공된다.

또한, 본 명세서에서는, 본 명세서에 기재된 바와 같은 변이체 Cas9 단백질 또는 융합 단백질 및, 게놈 표적 부위에서 최적의 뉴클레오타이드 간격의 세포 게놈의 선택 부분에 상보성인 영역을 가지는 적어도 하나의 가이드 RNA를 세포에서 발현시키거나, 이들과 세포를 접촉시킴으로써, 세포의 게놈 또는 에피게놈을 변이시키는 방법이 제공된다. 이 방법은 특히, 예를 들어 단일 벡터에서 Cas9 단백질을 인코딩하는 핵산 및 가이드 RNA와 세포를 접촉시키는 단계; 예를 들어, 다수의 벡터에서, Cas9 단백질을 인코딩하는 핵산 및 가이드 RNA를 인코딩하는 핵산과 세포를 접촉시키는 단계; 및 정제된 Cas9 단백질 및 합성되거나, 정제된 gRNA의 복합체와 세포를 접촉시키는 단계를 포함할 수 있다. 일부 구현예에서, 세포는 gRNA 또는 변이체 단백질/융합 단백질 중 하나 또는 둘 모두를 안정하게 발현하고, 다른 요소가 세포 내로 형질감염되거나, 도입된다. 예를 들어, 세포는 본 명세서에 기재된 바와 같은 변이체 단백질 또는 융합 단백질을 안정하게 발현할 수 있으며, 상기 방법은 합성 gRNA, 재조합적으로 생성된 정제된 gRNA, 또는 gRNA를 인코딩하는 핵산과 세포를 접촉시키는 단계를 포함할 수 있다. 일부 구현예에서, 변이체 단백질 또는 융합 단백질은 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함한다.

또한, 본 명세서에서는, 본 명세서에 기재된 바와 같은 정제된 변이체 단백질 또는 융합 단백질 및, dsDNA 분자의 선택 부분에 상보성인 영역을 가지는 가이드 RNA와 dsDNA를 접촉시킴으로써, 시험관내에서 단리된 dsDNA 분자를 변이시키기 위한 방법, 예를 들어, 선택적으로 변이시키기 위한 방법이 제공된다.

달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및 과학 용어는, 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에는 본 발명에 사용하기 위한 방법 및 재료가 기재되어 있으며; 당업계에 공지된 다른 적절한 방법 및 재료가 또한 사용될 수 있다. 이러한 재료, 방법 및 실시예는 단지 예시를 위한 것이며, 제한하고자 하는 것은 아니다. 본 명세서에서 언급되는 모든 공보물, 특허 출원, 특허, 서열, 데이터베이스 목록 및 다른 참조문헌은 그 전문이 본 명세서에 참조로 포함된다. 모순되는 경우, 정의를 포함하는 본 명세서가 우선할 것이다.

하기의 상세한 설명 및 도면 및 청구범위로부터 본 발명의 다른 특징 및 이점이 분명해질 것이다.

도 1a 내지 도 1e | 비특이적 DNA 접촉을 형성하는 잔기에 돌연변이를 보유하는 SpCas9 변이체의 확인 및 특성화. 도 1a, PDB 4OOG 및 4UN3(각각, 참조문헌 31 및 32로부터 개작됨)을 기반으로 한 표적 DNA:sgRNA 이중가닥의 야생형 SpCas9 인식을 도시하는 도식. 도 1b, DNA 백본에 수소 결합을 형성하는 위치에 알라닌 치환을 함유하는 SpCas9 변이체의 특성화. 야생형 SpCas9 및 변이체는, 완전히 매치된 sgRNA 또는, 표적 부위에 대한 미스매치를 인코딩하는 4개의 다른 sgRNA에 의해 프로그래밍되는 경우, 인간 세포 EGFP 파괴 분석을 사용하여 평가되었다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 백그라운드 EGFP 손실의 평균 수준은 적색 점선으로 표시된다(도 1b 및 도 1c). 도 1c 및 도 1d, EGFP 파괴 분석(도 1c)에 의해 평가된 24개의 부위 및 T7E1 분석(도 1d)에 의해 평가된 13개의 내인성 부위에 걸친 야생형 SpCas9 및 SpCas9-HF1의 표적내 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 1e, SpCas9-HF1 대 야생형 SpCas9의 표적내 활성(도 1c 및 도 1d)의 비율.
도 2a 내지 도 2c | 표준 표적 부위에 대한 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1의 게놈 전체 특이성. 도 2a, GUIDE-서열에 의해 결정되는 바와 같은 내인성 인간 유전자에 표적화된 8개의 sgRNA에 의한 야생형 SpCas9와 SpCas9-HF1의 표적외 부위. 판독 계수는 특정 부위에서의 절단 빈도의 측정치를 나타내며; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있다. 도 2b, 도 2a에서 사용된 8개의 sgRNA로부터 야생형 SpCas9 및 SpCas9-HF1에 대해 GUIDE-서열에 의해 확인된 게놈 전체의 표적외 부위의 총수의 요약. 도 2c, 표적내 부위와 비교하여, (프로토스페이서 및 PAM 내의) 미스매치의 총수에 따라 분류된 8개의 sgRNA에 대해 야생형 SpCas9 및 SpCas9-HF1의 경우에 확인된 표적외 부위.
도 3a 내지 도 3c | GUIDE-서열에 의해 확인된 표적외 부위의 표적화된 심층 서열분석에 의한 SpCas9-HF1 특이성 개선의 검증. 도 3a, 도 2로부터의 6개의 sgRNA에 의한 야생형 SpCas9 및 SpCas9-HF1의 심층 서열분석에 의해 결정된 평균 표적내 변형 퍼센트. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 3b, 삽입결실 돌연변이를 함유하는 심층 서열분석된 표적내 부위 및 GUIDE-서열 검출된 표적외 부위의 백분율. 야생형 SpCas9, SpCas9-HF1, 및 대조군 조건에 대한 3회 반복 실험이 도시되어 있다. x-축 하부의 채색된 원은, 삽입 또는 결실 돌연변이가 관찰되지 않은 2회 반복 실험을 나타낸다. PCR에 의해 증폭될 수 없는 표적외 부위는 별표가 표시된 적색 부분으로 제시된다. 풀링(pooling)된 판독 계수에 의한 일방 Fisher 정확 검증(one-sided Fisher exact test)을 사용한 가설 검증에 의해, SpCas9-HF1과 대조군 조건 사이의 비교시, 단지 EMX1-1 표적외 1 및 FANCF-3 표적외 1에서만 유의한 차이가 발견되었다(Benjamini-Hochberg 방법을 사용한 다중 비교로의 조정 후 p < 0.05). 또한, RUNX1-1 표적외 2를 제외하고, 모든 표적외 부위에서 야생형 SpCas9와 대조군 조건 사이 및 모든 표적외 부위에서 야생형 SpCas9와 SpCas9-HF1 사이에 유의한 차이가 발견되었다. 도 3c, 야생형 SpCas9에 의한 표적내 및 표적외 절단 부위에서의 심층 서열분석에 의해 결정된 평균 변형 퍼센트과 GUIDE-서열 판독 계수(도 2a) 사이의 상관관계의 산포도.
도 4a 내지 도 4c | 비표준 반복 부위에 대한 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1의 게놈 전체 특이성. 도 4a, 다수의 표적외 부위를 절단하는 것으로 인식되어 있는 2개의 sgRNA를 사용한 야생형 SpCas9 및 SpCas9-HF1의 GUIDE-서열 특이성 프로파일(문헌[Fu et al., Nat Biotechnol 31, 822-826(2013); Tsai et al., Nat Biotechnol 33, 187-197(2015)]). GUIDE-서열 판독 계수는 특정 부위에서의 절단 효율의 측정치를 나타내고; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있고; 적색 원은 sgRNA-DNA 경계면에서 지정된 벌지(bulge)(문헌[Lin et al., NucleicAcids Res 42, 7473-7485 (2014)])를 가질 수 있는 부위를 나타내며; 청색 원은, 도시된 것과 비교하여, 일정한 갭의 대안적 정렬을 가질 수 있는 부위를 나타낸다(도 8 참조). 도 4b, 도 4a에 사용된 2개의 sgRNA로부터 야생형 SpCas9 및 SpCas9-HF1에 대해 GUIDE-서열에 의해 확인된 게놈 전체 표적외 부위의 총수의 요약. 도 4c, 표적내 부위와 비교하여, (프로토스페이서 및 PAM 내의) 미스매치의 총수에 따라 분류된 VEGFA 부위 2 및 3에 대해 야생형 SpCas9 또는 SpCas9-HF1에 의해 확인된 표적외 부위. 도 4a의 적색 원으로 표시된 표적외 부위는 이들 계수에 포함되지 않으며; 도 4a의 청색 원으로 표시된 부위는 갭 무함유 정렬의 미스매치의 수에 의해 계수된다.
도 5a 내지 도 5d | 추가의 치환을 보유하는 SpCas9 - HF1 유도체의 활성. 도 5a, 8개의 sgRNA에 의한 야생형 SpCas9, SpCas9-HF1, 및 SpCas9-HF1-유도체 변이체의 인간 세포 EGFP 파괴 활성. SpCas9-HF1은 N497A, R661A, Q695, 및 Q926A 돌연변이를 보유하고; HF2 = HF1 + D1135E이고; HF3 = HF1 + L169A이며; HF4 = HF1 + Y450A이다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다. 도 5b, 도 5a로부터 8개의 sgRNA에 의해 야생형 SpCas9와 비교하여, SpCas9-HF 변이체를 사용한 경우의 표적내 활성의 요약. 중앙값 및 사분범위가 제시되며; 야생형 활성의 70% 초과를 나타내는 구근은 녹색으로 강조되어 있다. 도 5c, SpCas9-HF1의 효과에 내성인 도 2a 및 도 4a로부터의 표적외 부위뿐만 아니라, FANCF 부위 2 및 VEGFA 부위 3 표적내 부위에서의 SpCas9 및 HF 변이체에 의한 평균 변형 퍼센트. T7E1 분석에 의해 결정된 변형 퍼센트; 백그라운드 삽입결실 백분율을 모든 실험에서 차감하였다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 5d, 표적내 활성 대 표적외 활성(도 5c)의 비율로 도시된 것으로서, FANCF 부위 2 또는 VEGFA 부위 3 sgRNA에 의한 야생형 SpCas9 및 HF 변이체의 특이성 비율.
도 5e 및 도 5f | SpCas9 -HF1의 효과에 내성인 표적외 부위를 갖는 sgRNA에 의한 SpCas9 - HF1, -HF2, 및 -HF4의 게놈 전체 특이성. 도 5e, 도 5f로부터의 GUIDE-서열 실험에서 의도된 표적내 부위에서의 평균 GUIDE-서열 태그 혼입. SpCas9-HF1 = N497A/R661A/Q695A/Q926A이고; HF2 = HF1 + D1135E이며; HF4 = HF1 + Y450A이다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 5f, FANCF 부위 2 또는 VEGFA 부위 3 sgRNA에 의한 SpCas9-HF1, -HF2, 또는 -HF4의 GUIDE-서열 확인 표적외 부위. 판독 계수는 특정 부위에서의 절단 빈도의 측정치를 나타내며; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있다. 표적외 식별시의 개선-배수는 SpCas9-HF 변이체의 표적외 판독 계수를 SpCas9-HF 변이체 사이의 비교 전의 표적내 부위에서의 판독 계수에 대해 정규화함으로써, 계산된다.
도 6a 및 도 6b | sgRNA 및 표적 DNA와 SpCas9의 상호작용 . 도 6a, sgRNA와 표적 DNA 사이에 염기쌍을 갖는 SpCas9:sgRNA 복합체를 예시하는 도식. 도 6b, PDB: 4UN3(참조문헌 32)로부터 표적 DNA와 결합된 SpCas9:sgRNA 복합체의 구조 대표 예. 표적-가닥 DNA 백본과의 수소 결합 접촉을 형성하는 4개의 잔기는 청색으로 강조되어 있으며; HNH 도메인은 시각화 목적으로 숨겨져 있다.
도 7a 내지 도 7d | GUIDE - 서열 실험에 사용된 다양한 sgRNA에 의한 야생형 및 SpCas9 -HF1의 표적내 활성 비교. 도 7a 및 도 7c, 제한 단편 길이 다형성 분석에 의해 정량화된, 도 2a 및 도 4a에 제시된 GUIDE-서열 실험에서의 의도된 표적내 부위의 평균 GUIDE-서열 태그 혼입(각각, 도 7a 및 도 7c). 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 7b 및 도 7d, T7E1 분석에 의해 검출된, 도 2a 및 도 4a에 제시된 GUIDE-서열 실험에서의 의도된 표적내 부위의 평균 변형 퍼센트(각각, 도 7b 및 도 7d). 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다.
도 8 | VEGFA 부위 2 표적외 부위의 잠재적 대안적 정렬. Geneious(문헌[Kearse et al., Bioinformatics 28, 1647-1649 (2012)]) 버전 8.1.6을 사용하여 정렬된 단일 뉴클레오타이드 갭을 함유하는 표적외 부위(문헌[Lin et al., NucleicAcids Res 42, 7473-7485 (2014)])(우측)로서 잠재적으로 인식될 수 있는 GUIDE-서열에 의해 확인되는 10개의 VEGFA 부위 2 표적외 부위(좌측).
도 9 | 절두된 sgRNA14에 의한 야생형 SpCas9 및 SpCas9 -HF1의 활성. EGFP의 4개의 부위에 표적화된 전장의 sgRNA 또는 절두된 sgRNA를 사용한 야생형 SpCas9 및 SpCas9-HF1의 EGFP 파괴 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 대조군 실험에서의 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다.
도 10 | 5 '- 미스매치된 구아닌 염기를 보유하는 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1 활성. 4개의 상이한 부위에 표적화된 sgRNA에 의한 야생형 SpCas9 및 SpCas9-HF1의 EGFP 파괴 활성. 각각의 표적 부위에서, sgRNA는, 의도적으로 미스매치된 5'-구아닌 또는 매치된 비-구아닌 5'-염기를 함유한다.
도 11 | 야생형 SpCas9 및 SpCas9 - HF1 발현 플라스미드의 양의 적정. 다양한 양의 야생형 및 SpCas9-HF1 발현 플라스미드에 의한 형질감염으로부터의 인간 세포 EGFP 파괴 활성. 모든 형질감염의 경우, sgRNA-함유 플라스미드의 양은 250 ng으로 고정시켰다. 2개의 sgRNA 표적화 개별 부위가 사용되었고; 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 음성 대조군의 백그라운드 EGFP 손실의 평균 수준은 적색 점선으로 표시된다.
도 12a 내지 도 12d | SpCas9 -HF1의 PAM 인식 특이성의 변이. 도 12a, T7E1 분석에 의해 정량화된 8개의 sgRNA를 사용하여, SpCas9-VQR(참조문헌 15) 및 개선된 SpCas9-VRQR에 의한 표적내 내인성 인간 부위의 평균 변형 퍼센트의 비교. 두 변이체 모두 NGAN PAM을 인식하도록 조작되었다. 오류 막대는 n = 2 또는 3인 경우의 s.e.m.을 나타낸다. 도 12b, 8개의 sgRNA를 사용하여, 그의 -HF1 대응 대상과 비교한 pCas9-VQR 및 SpCas9-VRQR의 표적내 EGFP 파괴 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 음성 대조군의 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다. 도 12c, T7E1 분석의 정량화된 8개의 내인성 인간 유전자 부위에서 그의 -HF1 변이체와 비교한 SpCas9-VQR 및 SpCas9-VRQR에 의한 평균 표적내 변형 퍼센트의 비교. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; ND는 검출이 불가능한 것이다. 도 12d, 그의 상응하는 -HF1 변이체(도 12b 및 도 12c)와 비교한 SpCas9-VQR 또는 SpCas9-VRQR를 사용하는 경우의 표적내 활성의 변화-배수의 요약. 중앙값 및 사분범위가 도시되며; 야생형 활성의 70%를 초과하는 구간은 녹색으로 강조되어 있다.
도 13a 및 도 13b | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9 , SpCas9 -HF1, 및 야생형 SpCas9 유도체의 활성. 도 13a 및 도 13b, 위치 11 및 12(도 13a) 또는 위치 9 및 10(도 13b)에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내며; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이다.
도 14a 및 도 14b | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9, SpCas9 - HF1, 및 SpCas9 - HF1 유도체의 활성. 도 14a 및 도 14b, 위치 11 및 12(도 14a) 또는 위치 9 및 10(도 14b)에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내며; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이다.
도 15 | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9, SpCas9 - HF1, 및 SpCas9 ( Q695A / Q926A) 유도체의 활성. 위치 11 및 12에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내고; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이이며; Dbl = Q695A/Q926A 치환을 갖는 SpCas9이다.
도 16 | 스페이서의 각 위치에 단일 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9, SpCas9 - HF1, 및 eSpCas9 -1.1의 활성. 지정 위치에서 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다. SpCas9-HF1 = N497A/R661A/Q695A/Q926A이고, eSP1.1 = K848A/K1003A/R1060A이다.
도 17a 및 도 17b | 스페이서의 다양한 위치에 단일 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9 및 변이체의 활성. (도 17a) (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 활성을, 지정 스페이서 위치에 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. (도 17b) (도 17a)로부터의 이러한 뉴클레아제의 하위세트를, 매치된 표적내 부위에 대해 나머지 모든 가능한 단일 미스매치된 sgRNA를 사용하여, 시험하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다. mm = 미스매치이고, WT = 야생형이고, Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이고, 1.0 = K810A/K1003A/R1060A이며, 1.1 = K848A/K1003A/R1060A이다.
도 18 | 스페이서의 다양한 개별 위치에 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야 생형 SpCas9 및 변이체의 활성. (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 활성을, 지정 위치에서 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이다.
도 19a 및 도 19b | 스페이서의 다양한 개별 위치에 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9 및 변이체의 활성. (도 19a) (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 표적내 활성을, EGFP 유전자의 일 부위에 완전히 매치된 2개의 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. (도 19b) (도 19a)로부터의 이러한 뉴클레아제의 하위세트를, 미스매치에 대한 불내성이 이들 치환에 의해 부여되는지를 결정하기 위해, 이들의 스페이서 서열의 (sgRNA '부위 1'의) 위치 12, 14, 16, 또는 18에 미스매치를 함유하는 sgRNA에 의해 시험하였다. Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이다.
도 20 | (황색 구형 표시로 도시된) 사중 돌연변이 작제물의 돌연변이 위치 사이의 유사성을 예시하는 SpCas9(상단) 및 SaCas9(하단)의 구조 비교. 또한, DNA 백본과 접촉하는 다른 잔기는 분홍색 구형 표시로 도시된다.
도 21a 및 도 21b | 하나 이상의 알라닌 치환을 보유하는 야생형 SaCas9 및 SaCas9 유 도체의 활성. 도 21a 및 도 21b, 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치(도 21a) 또는 PAM 특이성에 영향을 주는 것으로 이전에 밝혀진 위치(도 21b)에 SaCas9 치환을 유도하였다. 위치 11 및 12에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이며; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타낸다.
도 22a 및 도 22b | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 하나 이상의 알라닌 치환을 보유하는 야생형(WT) SaCas9 및 SaCas9 유도체의 활성. 도 22a 및 도 22b, 위치 19 및 20에 의도적으로 미스매치된 sgRNA 및 ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다.
도 23 | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 알라닌 치환의 삼중 조합을 보유하는 야생형(WT) SaCas9 및 SaCas9 변이체의 활성. EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 4개의 상이한 sgRNA를 사용하였으며(매치된 #1 내지 4), 또한, 4개의 표적 부위 각각을 야생형 SaCas9에 의해 효율적으로 사용되는 것으로 인식되어 있는 미스매치된 sgRNA에 의해 시험하였다. 각각의 부위에 대해 미스매치된 sgRNA는 각각의 매치된 sgRNA의 우측에 도시된다(예를 들어, 매치된 부위 3에 대한 단일 미스매치된 sgRNA는 mm 11&12임). 미스매치된 위치를 넘버링하였고, 위치 21은 PAM-최원위 위치이며; mm은 미스매치이다.
도 24a 및 도 24b | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 하나 이상의 알라닌 치환을 보유하는 야생형(WT) SaCas9 및 SaCas9 유도체의 활성. 도 24a 및 도 24b, 이중(도 24a) 또는 삼중(도 24a) 조합 치환을 보유하는 SaCas9 변이체를, T7E1 분석를 사용하여, 매치된 내인성 인간 유전자 표적 부위 및 단일 미스매치된 내인성 인간 유전자 표적 부위에 대해 평가하였다. 매치된 '표적내' 부위는 문헌[Kleinstiver et al., Nature Biotechnology 2015]으로부터의 그의 유전자 표적 부위 sgRNA 번호에 따라 명명된다. 미스매치된 sgRNA를 넘버링하였고, PAM-최원위 위치인 위치 21에 미스매치가 발생하였으며; 미스매치된 sgRNA는, 미스매치된 sgRNA의 좌측에 나열된 매치된 표적내 부위로부터 유해한다.

CRISPR-Cas9 뉴클레아제의 한계는, 일부 경우, 그 빈도가 의도된 표적내 부위에서 관찰되는 빈도와 경쟁 관계에 있는(문헌[Fu et al., Nat Biotechnol. 2013]), 불완전하게 매치된 표적 부위에 바람직하지 않은 "표적외" 돌연변이를 유도할 수 있는 가능성이다(예를 들어, 문헌[Tsai et al., Nat Biotechnol. 2015] 참조). CRISPR-Cas9 뉴클레아제를 사용한 종래 연구는, 가이드 RNA(gRNA)와 표적 부위의 스페이서 영역 사이의 서열 특이적 상호작용의 수를 감소시키는 경우, 인간 세포에서 표적외 절단 부위에서의 돌연변이유발 효과를 감소시킬 수 있다고 제안했다(문헌[Fu et al., Nat Biotechnol. 2014]).

이는 종래에, gRNA를 5' 말단에서 2 또는 3개의 뉴클레오타이드만큼 절두시킴으로써 달성되었으며, 이러한 증대된 특이성의 메커니즘이, 단지, 표적내 부위의 절단에 필요한 에너지만큼만 유지되도록 함으로써, 표적 DNA 부위에서의 미스매치로 인해, 에너지 면에서 불리할 것으로 예상되는 표적외 부위의 절단에 필요한 에너지를 가질 가능성이 감소하도록 하는, gRNA/Cas9 복합체의 상호작용 에너지의 감소라고 가정하였다(WO2015/099850).

SpCas9의 (가이드 RNA에 대한 의도된 표적 부위와 불완전하게 매치되거나, 미스매치된 DNA 부위에서의) 표적외 효과가 표적 DNA 부위와의 비특이적 상호작용의 저하에 의해, 최소화될 수 있다고 가정하였다. SpCas9-sgRNA 복합체는 NGG PAM 서열(SpCas9에 의해 인식됨)로 구성된 표적 부위(문헌[Deltcheva, E. et al. Nature 471, 602-607(2011); Jinek, M. et al. Science 337, 816-821(2012); Jiang, W., et al., Nat Biotechnol 31, 233-239(2013); Sternberg, S.H., et al., Nature 507, 62-67(2014)]) 및 (sgRNA의 5' 말단에 상보성인) 인접한 20 bp의 프로토스페이서 서열(문헌[(Jinek, M. et al. Science 337, 816-821(2012); Jinek, M. et al. Elife 2, e00471(2013); Mali, P. et al., Science 339, 823-826(2013); Cong, L. et al., Science 339, 819-823(2013)])을 절단한다. SpCas9-sgRNA 복합체가 의도된 표적 DNA 부위를 인식하기 위해 필요한 에너지보다 더 많은 에너지를 보유할 수 있음으로써, 미스매치된 표적외 부위의 절단이 가능하게 된다는 것이 종래에 이론화되었다(문헌[Fu, Y., et al., Nat Biotechnol 32, 279-284(2014)]). 이러한 특성이 박테리아의 적응 면역에서 Cas9의 의도된 역할에 유리할 수 있음으로써, 돌연변이가 될 수 있는 외래 서열을 절단하는 능력을 부여할 수 있음을 유추할 수 있을 것이다. 이러한 과량의 에너지 모델은 또한, 표적외 효과에 대해 다른 해석이 또한 제안된 바 있으나(문헌[Josephs, E.A. et al. NucleicAcids Res 43, 8924-8941(2015); Sternberg, S.H., et al. Nature 527, 110-113(2015); Kiani, S. et al. Nat Methods 12, 1051-1054(2015)]), SpCas9 농도의 감소(문헌[Hsu, P.D. et al. Nat Biotechnol 31, 827-832(2013); Pattanayak, V. et al. Nat Biotechnol 31, 839-843(2013)]) 또는 sgRNA의 상보성 길이의 감소(문헌[Fu, Y., et al., Nat Biotechnol 32, 279-284(2014)])에 의해, 표적외 효과가 감소할 수 있음(그러나, 제거되지는 않음)을 입증하는 종래의 연구에 의해, 뒷받침된다. 구조 데이터는, SpCas9-sgRNA-표적 DNA 복합체가, 4개의 SpCas9 잔기(N497, R661, Q695, Q926)에 의해 이루어지는 표적 DNA 가닥의 포스페이트 백본과의 직접적 수소 결합을 포함하는 여러 개의 SpCas9-매개 DNA 접촉에 의해 안정화될 수 있음을 시사한다(문헌[Nishimasu, H. et al. Cell 156, 935-949(2014); Anders, C., et al. Nature 513, 569-573(2014)])(도 1a 및 도 6a 및 도 6b). 본 발명자들은, 하나 이상의 이러한 접촉의 파괴가 SpCas9-sgRNA 복합체를 에너지 면에서, 단지 강력한 표적내 활성만을 보유하기에 충분한 수준으로 유지시키면서, 미스매치된 표적외 부위의 절단 능력은 감소하도록 한다고 유추하였다.

본 명세서에 기재된 바와 같이, Cas9 단백질은, 이론상, DNA에 대한 Cas9의 결합 친화도의 감소에 의해, 증대된 특이성을 나타내도록 조작될 수 있다. 널리 사용되는 스트렙토코커스 피오게네스 Cas9(SpCas9)의 몇몇 변이체는, 구조 정보, 박테리아 선택-기반 직접 진화 및 조합 설계를 사용하여, DNA 백본 상의 포스페이트와 상호작용하는 것으로 예상되는 SpCas9의 다양한 잔기에 개개의 알라닌 치환을 도입시킴으로써, 조작되었다. 이러한 변이체는, 이러한 박테리아 시스템에서의 이들 변이체의 세포 활성으로서, gRNA 및 SpCas9에 의해 표적화되는 23개의 염기쌍의 서열 및 독성 자이라제 독(gyrase poison) ccdB의 유전자를 함유하는 선택 플라스미드의 절단 및 후속 파열에 따른 세포 생존을 평가하기 위한 강력한 E. 콜라이-기반 스크리닝 분석을 사용하여, 세포 활성에 대해 추가로 시험되었으며, 이는 활성의 보유 또는 손실과 관련된 잔기의 확인으로 이어졌다. 이에 더하여, 인간 세포에서 개선된 표적 특이성을 나타내는 또 다른 SpCas9 변이체가 확인되고, 특성화되었다.

추가로, 박테리아 세포-기반 시스템에서 평가된 바와 같은 SpCas9의 단일 알라닌 치환 돌연변이체의 활성은, 50 내지 100%의 생존율이 일반적으로 강력한 절단을 시사하며, 0% 생존은, 효소가 기능적으로 손상되었음을 시사하는 것으로 표현되었다. 이어서, 다음을 포함하는 SpCas9의 추가의 돌연변이를 박테리아에서 분석하였다: R63A, R66A, R69A, R70A, R71A, Y72A, R74A, R75A, K76A, N77A, R78A, R115A, H160A, K163A, R165A, L169A, R403A, T404A, F405A, N407A, R447A, N497A, I448A, Y450A, S460A, M495A, K510A, Y515A, R661A, M694A, Q695A, H698A, Y1013A, V1015A, R1122A, K1123A, K1124A, K1158A, K1185A, K1200A, S1216A, Q1221A, K1289A, R1298A, K1300A, K1325A, R1333A, K1334A, R1335A, 및 T1337A. 박테리아에서 5% 미만의 생존을 나타내는 2개의 돌연변이체 (R69A 및 F405A)를 제외하고, 이들 추가의 단일 돌연변이는 모두 SpCas9의 표적내 활성에 영향을 주지않는 것으로 나타났다(박테리아 스크린에서 70% 초과의 생존).

박테리아 스트린에서 확인된 Cas9의 변이체가 인간 세포에서 효율적으로 기능하였는지를 추가로 결정하기 위해, 다양한 알라닌 치환 Cas9 돌연변이체를 인간 U2OS 세포-기반 EGFP-파괴 분석을 사용하여 시험하였다. 이 분석에서, 단일 혼입된 항시 발현 EGFP 유전자의 코딩 서열에서의 표적 부위의 성공적인 절단은 삽입결실 돌연변이의 유도 및 EGFP 활성의 파괴를 야기하였으며, 이를 유동 세포계측법에 의해 정량적으로 평가하였다(예를 들어, 문헌[Reyon et al., Nat Biotechnol. 2012 May;30(5):460-5] 참조).

이 실험은, 박테리아 세포 기반 분석에서 얻은 결과가 인간 세포에서의 뉴클레아제 활성과 잘 일치 함을 보여주며, 이는 이러한 조작 전략이 다른 종 및 상이한 세포들로부터의 Cas9로 확장될 수 있음을 시사한다. 따라서, 이러한 발견은 본 명세서에서 "변이체" 또는 "이러한 변이체"로 총칭되는 SpCas9 및 SaCas9 변이체에 대한 뒷받침을 제공한다.

본 명세서에 기재된 변이체는 모두, 예를 들어, 단순 부위-직접 돌연변이유발에 의해, 기존의 광범위하게 사용되는 벡터 내로 빠르게 혼입될 수 있으며, 이러한 변이체는 소수의 돌연변이만이 필요하므로, 이들은 또한, SpCas9 플랫폼(예를 들어, 절두된 sgRNA(문헌[Tsai et al., Nat Biotechnol 33, 187-197(2015); Fu et al., Nat Biotechnol 32, 279-284(2014)]), 닉카제 돌연변이(nickase mutation)(문헌[Mali et al., Nat Biotechnol 31, 833-838(2013); Ran et al., Cell 154, 1380-1389(2013)]), FokI-dCas9 융합(문헌[Guilinger et al., Nat Biotechnol 32, 577-582(2014); Tsai et al., Nat Biotechnol 32, 569-576(2014); WO2014144288]); 및 PAM 특이성이 변이된 조작된 CRISPR-Cas9 뉴클레아제(문헌[Kleinstiver et al., Nature. 2015 Jul 23;523(7561):481-5])에 대한 종래 기재된 다른 개선과 함께 작업되어야 한다.

따라서, 본 명세서에서는 SpCas9 변이체를 포함하는 Cas9 변이체가 제공된다. SpCas9 야생형 서열은 다음과 같다:

본 명세서에 기재된 SpCas9 변이체는, N497, R661, Q695, Q926(또는, 이와 유사한 위치)의 위치 중 하나 이상에서 돌연변이(즉, 상이한 아미노산, 예를 들어 알라닌, 글리신 또는 세린으로의 천연 아미노산의 대체)를 가질 수 있는 SEQ ID NO:1의 아미노산 서열을 포함할 수 있다. 일부 구현예에서, SpCas9 변이체는 SEQ ID NO:1의 아미노산 서열과 적어도 80%, 예를 들어, 적어도 85%, 90%, 또는 95% 동일하고, 예를 들어, 본 명세서에 기재된 돌연변이에 더하여, 예를 들어 보존적 돌연변이에 의해 대체된, SEQ ID NO:1의 최대 5%, 10%, 15%, 또는 20%의 잔기에서 차이점을 가진다. 바람직한 구현예에서, 이러한 변이체는 모체의 바람직한 활성, 예를 들어 뉴클레아제 활성(모체가 닉카제 또는 사멸 Cas9인 경우는 제외됨) 및/또는 가이드 RNA 및 표적 DNA와의 상호작용 능력을 보유한다).

2개의 핵산 서열의 동일성 백분율을 결정하기 위해, 최적의 비교 목적을 위해, 서열을 정렬한다(예를 들어, 최적의 정렬을 위해, 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭이 도입될 수 있으며, 비교 목적을 위해, 비상동성 서열이 무시될 수 있음). 비교 목적을 위해 정렬되는 기준 서열의 길이는 기준 서열 길이의 적어도 80%이며, 일부 구현예에서는 적어도 90% 또는 100%이다. 이어서, 상응하는 아미노산 위치 도는 뉴클레오타이드 위치의 뉴클레오타이드를 비교한다. 제1 서열이 제2 서열에서의 상응하는 위치와 동일한 뉴클레오타이드에 의해 점유된 경우, 그 후, 이러한 분자들은 이 위치에서 동일하다(본 명세서에 사용되는 바와 같은 핵산 "동일성"은 핵산 "상동성"과 동등함). 2개의 서열 사이의 동일성 백분율은, 2개의 서열의 최적의 정렬을 위해 도입될 필요가 있는 갭의 수 및 각각의 갭의 길이를 고려한 것으로, 서열에 의해 공유되는 동일한 위치의 수의 함수이다. 2개의 폴리펩타이드 또는 핵산 서열 사이의 동일성 백분율은, 예를 들어 공개적으로 이용 가능한 컴퓨터 소프트웨어, 예를 들어 Smith Waterman Alignment (문헌[Smith, T. F. and M. S. Waterman (1981) J Mol Biol 147:195-7]); GeneMatcher Plus™, 문헌[Schwarz and Dayhof (1979) Atlas of Protein Sequence and Structure, Dayhof, M.O., Ed, pp 353-358]에 내장된 것으로서, "BestFit" (문헌[Smith and Waterman, Advances in Applied Mathematics, 482-489 (1981)]); BLAST 프로그램 (Basic Local Alignment Search Tool; (문헌[Altschul, S. F., W. Gish, et al. (1990) J Mol Biol 215: 403-10]), BLAST-2, BLAST-P, BLAST-N, BLAST-X, WU-BLAST-2, ALIGN, ALIGN-2, CLUSTAL, 또는 Megalign (DNASTAR) 소프트웨어를 사용하여, 당업계의 기술 범위 내의 다양한 방법으로 결정된다. 이에 더하여, 당업자는, 비교되는 서열의 길이에 걸쳐 최대의 정렬을 달성하기 위해 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 일반적으로, 단백질 또는 핵산에서, 비교 길이는, 최대 전체 길이를 포함하는 임의의 길이일 수 있다(예를 들어, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100%). 본 조성물 및 방법의 목적을 위해, 서열의 전체 길이의 적어도 80%가 정렬된다.

본 발명의 목적을 위해, 서열의 비교 및 2개의 서열 사이의 동일성 백분율의 결정은, 12의 갭 패널티, 4의 갭 연장 패널티 및 5의 프레임시프트 갭 패널티(frameshift gap penalty)의 Blossum 62 채점표를 사용하여 달성될 수 있다.

보존적 치환은 통상적으로 다음의 기 내에 치환을 포함한다: 글리신, 알라닌; 발린, 이소류신, 류신; 아스파르트산, 글루탐산, 아스파라긴, 글루타민; 세린, 트레오닌; 리신, 아르기닌; 및 페닐알라닌, 티로신.

일부 구현예에서, SpCas9 변이체는 다음의 돌연변이 세트 중 하나를 포함한다: N497A/R661A/Q695/Q926A(사중 알라닌 돌연변이체); Q695A/Q926A(이중 알라닌 돌연변이체); R661A/Q695A/Q926A 및 N497A/Q695A/Q926A(삼중 알라닌 돌연변이체). 일부 구현예에서, L169 및/또는 Y450에서의 추가의 치환 돌연변이가 이러한 이중, 삼중 및 사중 돌연변이체에 추가되거나, Q695 또는 Q926에서 치환을 보유하는 단일 돌연변이체에 추가된다. 일부 구현예에서, 이러한 돌연변이체는 야생형 아미노산 대신에 알라닌을 갖는다. 일부 구현예에서, 이러한 돌연변이체는 아르기닌 또는 리신(또는, 천연 아미노산) 이외에 임의의 아미노산을 갖는다.

일부 구현예에서, SpCas9 변이체는 또한, 단백질의 뉴클레아제 부분이 촉매적으로 비활성이 되도록 하는 것으로, Cas9의 뉴클레아제 활성을 감소시키거나, 파괴하는, D10, E762, D839, H983, 또는 D986 및 H840 또는 N863의 돌연변이, 예를 들어, D10A/D10N 및 H840A/H840N/H840Y 중 하나를 포함하며; 이들 위치에서의 치환은 알라닌(이는 문헌[Nishimasu al., Cell 156, 935-949(2014)]의 것과 같음), 또는 다른 잔기, 예를 들어, 글루타민, 아스파라긴, 티로신, 세린 또는 아스파테이트, 예를 들어, E762Q, H983N, H983Y, D986N, N863D, N863S, 또는 N863H일 수 있다(WO 2014/152432 참조). 일부 구현예에서, 이러한 변이체는 D10A 또는 H840A에서의 돌연변이(단일 가닥 닉카제를 생성함), 또는 D10A 및 H840A에서의 돌연변이(뉴클레아제 활성을 파기함; 이러한 돌연변이체는 사멸 Cas9 또는 dCas9로 일컬어짐)를 포함한다.

SpCas9 N497A/R661A/Q695A/R926A 돌연변이는 스타필로코커스 아우레우스 Cas9(SaCas9)에서와 유사한 잔기를 가지며; 도 20을 참조한다. DNA 또는 RNA 백본과 접촉된 잔기에 대한 돌연변이는 SaCas9의 특이성을 증대시킬 것으로 예상되며, 이는 본 발명자들이 SpCas9에서 관찰한 바와 같다. 따라서, 또한 본 명세서에서는 SaCas9 변이체를 제공한다.

SaCas9 야생형 서열은 다음과 같다:

본 명세서에 기재된 SaCas9 변이체는, Y211, W229, R245, T392, N419, 및/또는 R654의 위치 중 1, 2, 3, 4, 5 또는 6개 모두에서 돌연변이를 갖는 SEQ ID NO:2의 아미노산 서열을 포함하며, 예를 들어, Y211, W229, R245, T392, N419, 및/또는 R654의 위치 중 1, 2, 3, 4, 5 또는 6개에서 돌연변이를 갖는 SEQ ID NO:2의 아미노산 서열과 적어도 80% 동일한 서열을 포함한다.

일부 구현예에서, 변이체 SaCas9 단백질은 또한 다음의 돌연변이 중 하나 이상을 포함한다: Y211A; W229A; Y230A; R245A; T392A; N419A; L446A; Y651A; R654A; D786A; T787A; Y789A; T882A; K886A; N888A; A889A; L909A; N985A; N986A; R991A; R1015A; N44A; R45A; R51A; R55A; R59A; R60A; R116A; R165A; N169A; R208A; R209A; Y211A; T238A; Y239A; K248A; Y256A; R314A; N394A; Q414A; K57A; R61A; H111A; K114A; V164A; R165A; L788A; S790A; R792A; N804A; Y868A; K870A; K878A; K879A; K881A; Y897A; R901A; K906A.

일부 구현예에서, 변이체 SaCas9 단백질은 다음의 추가의 돌연변이 중 하나 이상을 포함한다: Y211A, W229A, Y230A, R245A, T392A, N419A, L446A, Y651A, R654A, D786A, T787A, Y789A, T882A, K886A, N888A, A889A, L909A, N985A, N986A, R991A, R1015A, N44A, R45A, R51A, R55A, R59A, R60A, R116A, R165A, N169A, R208A, R209A, Y211A, T238A, Y239A, K248A, Y256A, R314A, N394A, Q414A, K57A, R61A, H111A, K114A, V164A, R165A, L788A, S790A, R792A, N804A, Y868A, K870A, K878A, K879A, K881A, Y897A, R901A, K906A.

일부 구현예에서, 변이체 SaCas9 단백질은 다중 치환 돌연변이를 포함한다: R245/T392/N419/R654 및 Y221/R245/N419/R654(사중 변이체 돌연변이체); N419/R654, R245/R654, Y221/R654, 및 Y221/N419(이중 돌연변이체); R245/N419/R654, Y211/N419/R654, 및 T392/N419/R654(삼중 돌연변이체). 일부 구현예에서, 이러한 돌연변이체는 야생형 아미노산 대신에 알라닌을 함유한다.

일부 구현예에서, 변이체 SaCas9 단백질은 또한 E782K, K929R, N968K, 및/또는 R1015H에서 돌연변이를 포함한다. 예를 들어, KKH 변이체(E782K/N968K/R1015H), KRH 변이체(E782K/K929R/R1015H), 또는 KRKH 변이체(E782K/K929R/N968K/R1015H)]

일부 구현예에서, 변이체 SaCas9 단백질은 또한 D10, E477, D556, H701, 또는 D704; 및 H557 또는 N580에서의 돌연변이로 이루어진 군으로부터 선택되는, 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 포함한다.

일부 구현예에서, 돌연변이는 (i) D10A 또는 D10N, (ii) H557A, H557N, 또는 H557Y, (iii) N580A, 및/또는(iv) D556A이다.

또한 본 명세서에서는, Cas9 변이체를 인코딩하는 단리된 핵산, 선택적으로, 변이체 단백질을 발현시키기 위한 하나 이상의 조절 도메인과 작동 가능하게 연결된 이러한 단리된 핵산을 포함하는 벡터 및 이러한 핵산을 포함하고, 선택적으로 변이체 단백질을 발현하는 숙주 세포, 예를 들어 포유류 숙주 세포가 제공된다.

본 명세서에 기재된 변이체는 세포 게놈을 변이시키기 위해 사용될 수 있으며; 그 방법은 일반적으로, 세포 게놈의 선택 부분에 상보성인 영역을 갖는 가이드 RNA에 따라, 세포에서 변이체 단백질을 발현시키는 단계를 포함한다. 세포 게놈을 선택적으로 변이시키기 위한 방법은 당업계에 공지되어 있으며, 예를 들어, US 8, 993, 233; US 20140186958; US 9, 023, 649; WO/2014/099744; WO 2014/089290; WO2014/144592; WO144288; WO2014/204578; WO2014/152432; WO2115/099850; US8, 697, 359; US20160024529; US20160024524; US20160024523; US20160024510; US20160017366; US20160017301; US20150376652; US20150356239; US20150315576; US20150291965; US20150252358; US20150247150; US20150232883; US20150232882; US20150203872; US20150191744; US20150184139; US20150176064; US20150167000; US20150166969; US20150159175; US20150159174; US20150093473; US20150079681; US20150067922; US20150056629; US20150044772; US20150024500; US20150024499; US20150020223;; US20140356867; US20140295557; US20140273235; US20140273226; US20140273037; US20140189896; US20140113376; US20140093941; US20130330778; US20130288251; US20120088676; US20110300538; US20110236530; US20110217739; US20110002889; US20100076057; US20110189776; US20110223638; US20130130248; US20150050699; US20150071899; US20150050699; ; US20150045546; US20150031134; US20150024500; US20140377868; US20140357530; US20140349400; US20140335620; US20140335063; US20140315985; US20140310830; US20140310828; US20140309487; US20140304853; US20140298547; US20140295556; US20140294773; US20140287938; US20140273234; US20140273232; US20140273231; US20140273230; US20140271987; US20140256046; US20140248702; US20140242702; US20140242700; US20140242699; US20140242664; US20140234972; US20140227787; US20140212869; US20140201857; US20140199767; US20140189896; US20140186958; US20140186919; US20140186843; US20140179770; US20140179006; US20140170753; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US 20150071899; 문헌[Makarova et al., "Evolution and classification of the CRISPR-Cas systems" 9(6) Nature Reviews Microbiology 467-477 (1-23) (Jun. 2011); Wiedenheft et al., "RNA-guided genetic silencing systems in bacteria and archaea" 482 Nature 331-338 (Feb. 16, 2012); Gasiunas et al., "Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria" 109(39) Proceedings of the National Academy of Sciences USA E2579-E2586 (Sep. 4, 2012); Jinek et al., "A Programmable Dual-RNA-GuidedDNA Endonuclease in Adaptive Bacterial Immunity" 337 Science 816-821 (Aug. 17, 2012); Carroll, "A CRISPR Approach to Gene Targeting" 20(9) Molecular Therapy 1658-1660 (Sep. 2012); 2012년 5월 25일자로 출원된 미국 출원 제 61/652,086호; Al-Attar et al., Clustered Regularly Interspaced Short Palindromic Repeats (CRISPRs): The Hallmark of an Ingenious Antiviral Defense Mechanism in Prokaryotes, Biol Chem. (2011) vol. 392, Issue 4, pp. 277-289; Hale et al., Essential Features and Rational Design of CRISPR RNAs That FunctionWith the Cas RAMP Module Complex to Cleave RNAs, Molecular Cell, (2012) vol. 45, Issue 3, 292-302]을 참조한다.

본 명세서에 기재된 변이체 단백질은, 전술된 참조문헌에 기재된 Cas9 단백질 중 어느 하나 대신에 또는 그에 더하여, 또는 본 명세서에 기재된 돌연변이와 조합하여, 사용될 수 있다. 이에 더하여, 본 명세서에 기재된 변이체는 야생형 Cas9 또는 당업계에 공지된 바와 같은 다른 Cas9 돌연변이(예를 들어, 전술된 dCas9 또는 Cas9 닉카제) 대신에 융합 단백질, US 8, 993, 233; US 20140186958; US 9, 023, 649; WO/2014/099744; WO 2014/089290; WO2014/144592; WO144288; WO2014/204578; WO2014/152432; WO2115/099850; US8, 697, 359; US2010/0076057; US2011/0189776; US2011/0223638; US2013/0130248; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US20150050699; US 20150071899 및 WO 2014/124284에 기재된 바와 같은 이종 기능성 도메인과의 융합 단백질에서 사용된다. 예를 들어, 바람직하게는 하나 이상의 뉴클레아제-감소, -변이 또는 -사멸 돌연변이를 포함하는 변이체는 Cas9의 N 또는 C 말단에서 전사 활성화 도메인 또는 다른 이종 기능성 도메인(예를 들어, 전사 리프레서(예를 들어, KRAB, ERD, SID, 등, 예를 들어, ets2 리프레서(ERF) 리프레서 도메인(ERD)의 아미노산 473 내지 530, KOX1의 KRAB 도메인의 아미노산 1 내지 97 , 또는 Mad mSIN3 상호작용 도메인(SID)의 아미노산 1 내지 36; 문헌[Beerli et al., PNAS USA 95:14628-14633(1998)] 참조) 또는 사일런서, 예를 들어, 이질염색질 단백질 1(HP1, 또한 swi6으로 일컬어짐), 예를 들어, HP1α 또는 HP1β; MS2 외피 단백질, 엔도리보뉴클레아제 Csy4, 또는 람다 N 단백질에 의해 결합된 것과 같은 고정 RNA 결합 서열과 융합된 긴 비코딩 RNA(lncRNA)를 동원할 수 있는 단백질 또는 펩타이드; DNA의 메틸화 상태를 변형하는 효소(예를 들어, DNA 메틸기전달효소(DNMT) 또는 TET 단백질); 또는 히스톤 서브유닛을 변형하는 효소(예를 들어, 히스톤 아세틸기전달효소(HAT), 히스톤 탈아세틸효소(HDAC), 히스톤 메틸기전달효소(예를 들어, 리신 또는 아르기닌 잔기의 메틸화의 경우) 또는 히스톤 탈메틸효소(예를 들어, 리신 또는 아르기닌 잔기의 탈메틸화의 경우))에 융합될 수 있으며, 당업계에 공지된 바와 같은 것이 또한 사용될 수 있다. 이러한 도메인, 예를 들어, DNA에서 메틸화된 시토신의 하이드록실화를 촉매하는 도메인의 다수의 서열이 공지되어 있다. 예시적 단백질은, DNA에서 5-메틸시토신(5-mC)을 5-하이드록시메틸시토신(5-hmC)으로 전환시키는 효소인 10-11-전좌(Ten-Eleven-Translocation)(TET)1-3 패밀리를 포함한다.

인간 TET1-3의 서열은 당업계에 공지되어 있으며, 하기 표에 제시된다:

일부 구현예에서, 촉매 도메인, 예를 들어, 7개의 고도로 보존된 엑손에 의해 인코딩되는 2OGFeDO 도메인 및 시스테인-풍부 연장을 포함하는 촉매 모듈, 예를 들어, 아미노산 1580 내지 2052를 포함하는 Tet1 촉매 도메인, 아미노산 1290 내지 1905를 포함하는 Tet2 및 아미노산 966 내지 1678을 포함하는 Tet3의 전장 서열의 전부 또는 일부를 포함할 수 있다. 예를 들어, 3종의 Tet 단백질 모두의 주요 촉매 잔기를 예시하는 정렬에 대한 문헌[Iyer et al., Cell Cycle. 2009 Jun1;8(11):1698-710. Epub 2009 Jun27]의 도 1 및 전장 서열(예를 들어, 서열 2c 참조)에 대한 보충 자료(ftp site ftp.ncbi.nih.gov/pub/aravind/DONS/supplementary_material_DONS.html에서 이용 가능함)를 참조하고; 일부 구현예에서, 서열은 Tet1의 아미노산 1418 내지 2136 또는 Tet2/3의 상응하는 영역을 포함한다.

다른 촉매 모듈은 문헌[Iyer et al., 2009]에서 확인되는 단백질로부터 유래할 수 있다.

일부 구현예에서, 이종 기능성 도메인은 생물학적 테더(biological tether)이며, MS2 외피 단백질, 엔도리보뉴클레아제 Csy4, 또는 람다 N 단백질의 전부 또는 일부(예를 들어, DNA 결합 도메인)를 포함한다. 이들 단백질은, dCas9 gRNA 표적화 서열에 의해 특정되는 구역에 특이적 스템-루프 구조(stem-loop structure)를 함유하는 RNA 분자를 동원하기 위해 사용될 수 있다. 예를 들어, MS2 외피 단백질, 엔도리보뉴클레아제 Csy4, 또는 람다 N에 융합된 dCas9 변이체는, Csy4, MS2 또는 람다 N 결합 서열에 연결된 XIST 또는 HOTAIR과 같은 긴 비코딩 RNA(lncRNA)를 동원하기 위해 사용될 수 있으며; 예를 들어, 문헌[Keryer-Bibens et al., Biol. Cell 100:125-138(2008)]을 참조한다. 대안적으로, Csy4, MS2 또는 람다 N 단백질 결합 서열은, 예를 들어 전술된 문헌[Keryer-Bibens et al.]에 기재된 바와 같은 또 다른 단백질에 연결될 수 있으며, 이러한 단백질은, 본 명세서에 기재된 방법 및 조성물을 사용하여, dCas9 변이체 결합 부위에 표적화될 수 있다. 일부 구현예에서, Csy4는 촉매적으로 비활성이다. 일부 구현예에서, Cas9 변이체, 바람직하게는 dCas9 변이체는 FokI에 융합되며, 이는 US8,993,233; US20140186958; US9,023,649; WO/2014/099744; WO2014/089290; WO2014/144592; WO144288; WO2014/204578; WO2014/152432; WO2115/099850; US8,697,359; US2010/0076057; US2011/0189776; US2011/0223638; US2013/0130248; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US20150050699; US20150071899 및 WO2014/204578에 기재된 바와 같다.

일부 구현예에서, 이러한 융합 단백질은 dCas9 변이체와 이종 기능성 도메인 사이에 링커를 포함한다. 이들 융합 단백질(또는, 연쇄 구조의 융합 단백질 사이)에 사용될 수 있는 링커는, 융합 단백질의 기능에 간섭하지 않는 임의의 서열을 포함할 수 있다. 바람직한 구현예에서, 링커는, 예를 들어, 2 내지 20개의 아미노산으로 짧으며, 통상적으로 가요성이다(즉, 글리신, 알라닌 및 세린과 같은 자유도가 높은 아미노산을 포함함). 일부 구현예에서, 링커는 GGGS(SEQ ID NO:3) 또는 GGGGS(SEQ ID NO:4)로 이루어진 하나 이상의 단위, 예를 들어, GGGS(SEQ ID NO:5) 또는 GGGGS(SEQ ID NO:6) 단위의 2, 3, 4개 이상의 반복을 포함한다. 다른 링커 서열이 또한 사용될 수 있다.

일부 구현예에서, 이러한 변이체 단백질은, 세포내 공간으로의 전달을 용이하게 하는 세포-관통 펩타이드 서열, 예를 들어, HIV-유래 TAT 펩타이드, 페너트라틴(penetratin), 트랜스포탄(transportan), 또는 hCT 유래 세포-관통 펩타이드를 포함하며, 예를 들어, 문헌[Caron et al., (2001) Mol Ther. 3(3):310-8; Langel, Cell-Penetrating Peptides: Processes and Applications (CRC Press, Boca Raton FL 2002); El-Andaloussi et al., (2005) CurrPharm Des. 11(28):3597-611; 및 Deshayes et al., (2005) Cell Mol Life Sci. 62(16):1839-49]을 참조한다.

세포 관통 펩타이드(CPP)는, 세포막을 통해, 세포질 또는 다른 세포소기관, 예를 들어 미토콘드리아 및 핵으로의 광범위한 생체분자의 이동을 용이하게 하는 짧은 펩타이드이다. CPP에 의해 전달될 수 있는 분자의 예는 치료제, 플라스미드 DNA, 올리고뉴클레오타이드, siRNA, 펩타이드-핵산(PNA), 단백질, 펩타이드, 나노입자, 및 리포솜을 포함한다. CPP는 일반적으로 30개 이하의 아미노산이고, 천연 또는 비천연 유래 단백질 또는 키메라 서열로부터 유래하며, 비교적 고 풍부도의 양으로 하전된 아미노산, 예를 들어 리신 또는 아르기닌, 또는 극성 및 비극성 아미노산의 교대 패턴을 함유한다. 당업계에서 통상적으로 사용되는 CPP는 Tat(문헌[Frankel et al., (1988) Cell. 55:1189-1193, Vives et al., (1997) J. Biol. Chem. 272:16010-16017]), 페너트라틴(문헌[Derossi et al., (1994) J. Biol. Chem. 269:10444-10450]), 폴리아르기닌 펩타이드 서열(문헌[Wender et al., (2000) Proc. Natl. Acad. Sci. USA 97:13003-13008, Futaki et al., (2001) J. Biol. Chem. 276:5836-5840]), 및 트랜스포탄(문헌[Pooga et al., (1998) Nat. Biotechnol. 16:857-861])을 포함한다.

CPP는 공유 또는 비공유 전략을 통해 내용물과 연결될 수 있다. CPP와 그 내용물을 공유적으로 결합시키는 방법은 당업계에 공지되어 있으며, 예를 들어 화학적 가교 연결(문헌[Stetsenko et al., (2000) J. Org. Chem. 65:4900-4909, Gait et al.(2003) Cell. Mol. Life. Sci. 60:844-853]) 또는 융합 단백질의 클로닝(문헌[Nagahara et al., (1998) Nat. Med. 4:1449-1453])이 있다. 극성 및 비극성 도메인을 포함하는 짧은 양친매성 CPP와 내용물 사이의 비공유적 커플링은 정전기 및 소수성 상호작용을 통해 달성된다.

CPP는 치료용 생체분자를 세포 내로 잠재적으로 전달하기 위해, 당업계에서 사용되어 왔다. 예로는 면역억제를 위한, 폴리아르기닌에 연결된 사이클로스포린(cyclosporine)(문헌[Rothbard et al., (2000) Nature Medicine 6(11):1253-1257]), 종양생성을 억제하기 위한, MPG로 일컬어지는 CPP에 연결된 사이클린(cyclin) B1에 대한 siRNA(문헌[Crombez et al., (2007) Biochem Soc. Trans. 35:44-46]), 암 세포 성장을 감소시키기 위한, CPP에 연결된 종양 리프레서 p53 펩타이드(문헌[Takenobu et al., (2002) Mol. Cancer Ther. 1(12):1043-1049, Snyder et al., (2004) PLoS Biol. 2:E36]), 및 천식 치료를 위한, Tat에 융합된 Ras 또는 포스포이노시톨 3 키나제(PI3K)(문헌[Myou et al., (2003) J. Immunol. 171:4399-4405])를 포함한다.

CPP는 영상화 및 바이오센싱(biosensing) 적용을 위해, 조영제를 세포 내로 수송하기 위해, 당업계에서 사용되어 왔다. 예를 들어, Tat에 부착된 녹색 형광 단백질(GFP)이 암 세포의 표지를 위해 사용되어 왔다(문헌[Shokolenko et al., (2005) DNA Repair 4(4):511-518]). 퀀텀닷(quantum dot)에 접합된 Tat가 랫트 뇌의 시각화를 위해, 혈액 뇌장벽을 성공적으로 통과하기 위해 사용되어 왔다(문헌[Santra et al., (2005) Chem. Commun. 3144-3146]). CPP는 또한 세포 영상화를 위한 자기 공명 영상 기법과 조합되어 왔다(문헌[Liu et al., (2006) Biochem. and Biophys. Res. Comm. 347(1):133-140]). 또한 문헌[Ramsey and Flynn, Pharmacol Ther. 2015 Jul 22. pii: S0163-7258(15)00141-2]을 참조한다.

대안적으로, 또는 이에 더하여, 이러한 변이체 단백질은 핵 위치화 서열, 예를 들어, SV40 거대 T 항원 NLS(PKKKRRV(SEQ ID NO:7)) 및 뉴클레오플라스민(nucleoplasmin) NLS(KRPAATKKAGQAKKKK(SEQ ID NO:8))를 포함할 수 있다. 다른 NLS가 당업계에 공지되어 있으며; 예를 들어, 문헌[Cokol et al., EMBO Rep. 2000 Nov 15; 1(5): 411-415; Freitas and Cunha,CurrGenomics. 2009 Dec; 10(8): 550-557]을 참조한다.

일부 구현예에서, 이러한 변이체는 리간드, 예를 들어 GST, FLAG 또는 헥사히스티딘(hexahistidine) 서열에 대해 높은 친화도를 갖는 모이어티를 포함한다. 이러한 친화도 태그는 재조합 변이체 단백질의 정제를 용이하게 할 수 있다.

변이체 단백질의 세포로의 전달 방법에서, 당업계에 공지된 임의의 방법을 사용하여, 예를 들어, 변이체 단백질을 인코딩하는 핵산으로부터의 시험관내 번역 또는 적절한 숙주 세포에서의 발현에 의해, 단백질이 생성될 수 있으며; 단백질 생성을 위한 다수의 방법이 당업계에 공지되어 있다. 예를 들어, 단백질은 효모, E. 콜라이, 곤충 세포주, 식물, 트랜스제닉 동물(transgenic animal) 또는 배양된 포유류 세포에서 생성되고, 그로부터 정제될 수 있으며; 예를 들어, 문헌[Palomares et al., "Production of Recombinant Proteins: Challenges and Solutions," Methods Mol Biol. 2004;267:15-52]을 참조한다. 이에 더하여, 변이체 단백질은, 단백질이 세포 내부에 존재하는 경우, 선택적으로 절단되는 링커에 의해, 세포로의 전달을 용이하게 하는 모이어티, 예를 들어, 지질 나노입자에 연결될 수 있다. 예를 들어, 문헌[LaFountaine et al., Int J Pharm. 2015 Aug 13;494(1):180-194]을 참조한다.

발현 시스템

본 명세서에 기재된 Cas9 변이체를 사용하는 경우, 이를 인코딩하는 핵산으로부터 이를 발현시키는 것이 요망될 수 있다. 이는 다양한 방법으로 수행될 수 있다. 예를 들어, Cas9 변이체를 인코딩하는 핵산이 복제 및/또는 발현을 위해, 원핵세포 또는 진핵세포로의 형질전환을 위한 중간 벡터로 클로닝될 수 있다. 중간 벡터는 통상적으로, Cas9 변이체의 생성을 위해, Cas9 변이체를 인코딩하는 핵산의 저장 또는 조작을 위한 원핵생물 벡터, 예를 들어 플라스미드 또는 셔틀 벡터(shuttle vector) 또는 곤충 벡터이다. Cas9 변이체를 인코딩하는 핵산은 또한, 식물 세포, 동물 세포, 바람직하게는 포유류 세포 또는 인간 세포, 진균 세포, 박테리아 세포 또는 원생생물 세포로의 투여를 위한 발현 벡터 내로 클로닝될 수 있다.

발현되도록 하기 위해, Cas9 변이체를 인코딩하는 서열은 통상적으로, 전사를 유도하는 프로모터를 함유하는 발현 벡터 내로 서브클로닝된다. 적합한 박테리아 및 진핵생물 프로모터는 당업계에 널리 공지되어 있으며, 예를 들어 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual (3d ed. 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 CurrentProtocols in Molecular Biology (Ausubel et al., eds., 2010)]에 기재되어 있다. 조작된 단백질을 발현시키기 위한 박테리아 발현 시스템은, 예를 들어 E. 콜라이, 바실루스 종 및 살모넬라에서 이용 가능하다(문헌[Palva et al., 1983, Gene 22:229-235]). 이러한 발현 시스템을 위한 키트는 상업적으로 구입 가능하다. 포유류 세포, 효모 및 곤충 세포용 진핵생물 발현 시스템은 당업계에 널리 공지되어 있으며, 또한 상업적으로 구입 가능하다.

핵산의 발현을 유도하기 위해 사용되는 프로모터는 특정 적용에 따른다. 예를 들어, 강력한 항시성 프로모터는 통상적으로, 융합 단백질의 발현 및 정제를 위해 사용된다. 달리는, Cas9 변이체가 유전자 조절을 위해, 생체내로 투여되어야 하는 경우, Cas9 변이체의 특정 용도에 따라, 항시성 또는 유도성 프로모터가 사용될 수 있다. 이에 더하여, Cas9 변이체의 투여를 위해 바람직한 프로모터는 약한 프로모터, 예를 들어, HSV TK 또는 유사한 활성을 갖는 프로모터일 수 있다. 프로모터는 또한, 전사활성화에 반응성인 요소, 예를 들어, 저산소 반응 요소, Gal4 반응 요소, lac 리프레서 반응 요소, 및 소분자 제어 시스템, 예를 들어, 테트라사이클린-조절 시스템 및 RU-486 시스템을 포함한다(예를 들어, 문헌[Gossen & Bujard,1992, Proc. Natl. Acad. Sci. USA, 89:5547; Oligino et al., 1998, Gene Ther., 5:491-496; Wang et al., 1997, Gene Ther., 4:432-441; Neering et al., 1996, Blood, 88:1147-55; 및 Rendahl et al., 1998, Nat. Biotechnol., 16:757-761] 참조).

프로모터에 더하여, 발현 벡터는 통상적으로, 원핵 또는 진핵 숙주 세포에서 핵산의 발현에 필요한 모든 추가의 요소를 함유하는 전사 단위 또는 발현 카세트를 함유한다. 통상적인 발현 카세트는 따라서, 예를 들어, Cas9 변이체를 인코딩하는 핵산 서열에 작동 가능하게 연결된 프로모터 및 예를 들어, 전사체의 효율적인 폴리아데닐화, 전사 종결, 리보솜 결합 부위 또는 번역 종결에 필요한 임의의 신호를 함유한다. 카세트의 추가의 요소는, 예를 들어 인핸서 및 이종 스플라이싱 인트론 신호(heterologous spliced intronic signal)를 포함할 수 있다.

세포로 유전자 정보를 수송하기 위해 사용되는 특정 발현 벡터는 Cas9 변이체의 의도된 용도, 예를 들어, 식물, 동물, 박테리아, 진균, 원생동물 등에서의 발현을 고려하여 선택된다. 표준 박테리아 발현 벡터는 플라스미드, 예를 들어, pBR322 기반 플라스미드, pSKF, pET23D, 및 상업적으로 구입 가능한 태그-융합 발현 시스템, 예를 들어, GST 및 LacZ를 포함한다.

진핵생물 바이러스로부터의 조절 요소를 함유하는 발현 벡터는 종종 진핵생물 발현 벡터, 예를 들어, SV40 벡터, 파필로마 바이러스 벡터(papilloma virus vector) 및 Epstein-Barr 바이러스로부터 유래한 벡터에 사용된다. 다른 예시적 진핵생물 벡터는 pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, 바큘로바이러스 pDSVE, 및 SV40 초기 프로모터, SV40 후기 프로모터, 메탈로티오네인 프로모터, 뮤린 유방 종양 바이러스 프로모터, 라우스 육종 바이러스 프로모터(Rous sarcoma virus promoter), 폴리헤드린 프로모터, 또는 진핵세포에서의 발현에 효과적인 것으로 밝혀진 다른 프로모터의 유도 하에, 단백질의 발현을 가능하게 하는 임의의 다른 벡터를 포함한다.

Cas9 변이체를 발현시키기 위한 벡터는, 가이드 RNA의 발현을 유도하는 RNA Pol III 프로모터, 예를 들어, H1, U6 또는 7SK 프로모터를 포함할 수 있다. 이들 인간 프로모터는 플라스미드 형질감염 후, 포유류 세포에서 Cas9 변이체의 발현을 가능하게 한다.

일부 발현 시스템은 안정적으로 형질감염된 세포주의 선택을 위한 마커, 예를 들어, 티미딘 키나제, 하이그로마이신 B 인산전달효소(hygromycin B phosphotransferase) 및 디히드로엽산 환원효소(dihydrofolate reductase)를 갖는다. 폴리헤드린 프로모터 또는 다른 강력한 바큘로바이러스 프로모터의 유도 하에, gRNA 인코딩 서열을 갖는 곤충 세포에서 바큘로바이러스 벡터를 사용하는 것과 같은 고수율 발현 시스템이 또한 적합하다.

발현 벡터에 통상적으로 포함되는 요소는 또한, E. 콜라이에서 기능하는 레플리콘(replicon), 재조합 플라스미드를 보유하는 박테리아의 선택을 가능하게 하는 항생제 내성을 인코딩하는 유전자 및 재조합 서열의 삽입을 가능하게 하는 플라스미드의 비필수 영역의 고유 제한 부위를 포함한다.

표준 형질감염 방법을 사용하여, 다량의 단백질을 발현하는 박테리아, 포유류, 효모 또는 곤충 세포를 생성한 후, 표준 기법을 사용하여 정제한다(문헌[Colley et al., 1989, J. Biol. Chem., 264:17619-22; Guideto Protein Purification,in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)] 참조). 진핵세포 및 원핵세포의 형질전환은 표준 기법에 따라 수행된다(예를 들어, 문헌[Morrison, 1977, J. Bacteriol. 132:349-351; Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362(Wu et al., eds, 1983] 참조).

외래 뉴클레오타이드 서열을 숙주 세포로 도입하기 위한 공지된 절차 중 임의의 것이 사용될 수 있다. 이는, 인산칼슘 형질감염, 폴리브렌(polybrene), 원형질체 융합, 전기천공, 뉴클레오펙션(nucleofection), 리포좀, 미세주입, 네이키드 DNA(naked DNA), 에피솜 및 혼입형 둘 모두의 경우의 플라스미드 벡터, 바이러스 벡터의 사용 및, 클로닝된 게놈 DNA , cDNA, 합성 DNA 또는 다른 외래 유전자 물질을 숙주 세포로 도입하기 위한 임의의 다른 널리 공지된 방법을 포함한다(예를 들어, 전술된 문헌[Sambrook et al.] 참조). 단지, 사용되는 특정 유전자 조작 절차는, Cas9 변이체를 발현할 수 있는 숙주 세포로 적어도 하나의 유전자를 성공적으로 도입시킬 수 있을 필요가 있다.

본 방법은 또한, Cas9 단백질을 인코딩하는 mRNA에 더하여, gRNA를 도입시킴에 의한 것뿐만 아니라, 리보핵 단백질(RNP) 복합체로서 gRNA를 갖는 정제된 Cas9 단백질을 세포로 도입시킴으로써, gDNA를 변형하는 단계를 포함한다. gRNA는 합성 gRNA 또는 가이드 RNA를 인코딩하는 핵산(예를 들어, 발현 벡터 내)일 수 있다.

본 발명은 또한 벡터 및 벡터를 포함하는 세포를 포함한다.

실시예

본 발명은 하기의 실시예에서 추가로 기재되며, 이는 청구범위에 기재된 본 발명의 범위를 제한하지 않는다.

방법

진화하는 SpCas9 변이체에 대한 박테리아 기반 양성 선택 분석

양성 선택 플라스미드(표적 부위가 내재됨)를 함유하는 경쟁적 E. 콜라이 BW25141(λDE3)²³을 Cas9/sgRNA-인코딩 플라스미드에 의해 형질전환시켰다. SOB 배지 중에서의 회수 60분 후에, 클로람페니콜(chloramphenicol)(비선택성) 또는 클로람페니콜 + 10 mM 아라비노스(arabinose)(선택성)를 함유하는 LB 플레이트에 형질전환된 것을 플레이팅하였다.

게놈 전체 표적 특이성에 주요할 수 있는 추가의 위치를 확인하기 위해, 호밍 엔도뉴클레아제(homing endonuclease)의 특성을 연구하기 위해 종래에 사용된 박테리아 선택 시스템(이하, 양성 선택법으로 지칭됨)(문헌[Chen & Zhao, NucleicAcids Res 33, e154 (2005); Doyon et al., J Am Chem Soc 128, 2477-2484 (2006)])을 채용하였다.

이 시스템을 본 발명에 채용하는 경우, 유도성 독성 유전자를 인코딩하는 양성 선택 플라스미드의 Cas9-매개 절단은, 선형화된 플라스미드의 후속 분해 및 손실로 인해, 세포 생존을 가능하게 한다. SpCas9가 양성 선택 시스템에서 기능할 수 있도록 하는 단계를 달성한 후, 야생형 및 변이체 둘 모두를, 공지의 인간 게놈으로부터 선택된 표적 부위를 보유하는 선택 플라스미드를 절단하는 능력에 대해 시험하였다. 이들 변이체를 표적 부위를 함유하는 양성 선택 플라스미드를 갖는 박테리아로 도입시키고, 선택 배지에 플레이팅하였다. 생존 빈도: 선택성 플레이트 상의 콜로니 / 비선택성 플레이트 상의 콜로니를 계산함으로써, 양성 선택 플라스미드의 절단을 추산하였다(도 1, 도 5 내지 도 6 참조).

본 연구에 사용된 플라스미드의 하위세트(서열은 하기에서 제시됨)

인간 세포 배양 및 형질감염

항시적으로 발현되는 EGFP-PEST 리포터 유전자¹⁵의 단일 혼입 카피를 보유하는 U2OS.EGFP 세포를 37℃, 5% CO₂에서 10% FBS, 2 mM GlutaMax(Life Technologies), 페니실린/스트렙토마이신, 및 400 μg/ml의 G418이 보충된 보강 DMEM 배지(Life Technologies) 중에서 배양하였다. 제조사의 프로토콜에 따라, (달리 언급되지 않는 한) Lonza 4D-nucleofector의 DN-100 프로그램을 사용하여, 750 ng의 Cas9 플라스미드 및 250 ng의 sgRNA 플라스미드에 의해, 세포를 공동 형질감염시켰다. 빈 U6 프로모터 플라스미드에 의해 함께 형질감염된 Cas9 플라스미드를 모든 인간 세포 실험의 음성 대조군으로서 사용하였다(도 2, 도 7 내지 도 10 참조).

인간 세포 EGFP 파괴 분석

EGFP 파괴 실험을 종래에 기재된 바와 같이 수행하였다¹⁶. 형질감염된 세포를 Fortessa 유동세포계측기(BD Biosciences)를 사용하여, 형질감염으로부터 약 52시간 후 EGFP 발현에 대해 분석하였다. 백그라운드 EGFP 손실은 모든 실험에서 대략 2.5%에서 게이팅(gating)되었다(도 2, 도 7 참조).

뉴클레아제-유도 돌연변이 비율을 정량화하기 위한 T7E1 분석, 표적화된 심층 서열분석 및 GUIDE-서열

T7E1 분석을 인간 세포에 대해 종래에 기재된 바와 같이 수행하였다(문헌[Kleinstiver, B.P. et al., Nature 523, 481-485(2015)]). U2OS.EGFP 인간 세포에서, Agencourt DNAdvance 게놈 DNA 단리 키트(Beckman Coulter Genomics)를 사용하여, 형질감염으로부터 약 72시간 후에, 형질감염된 세포로부터 게놈 DNA를 추출하였다. 대략 200 ng의 정제된 PCR 산물을 T7E1(New England BioLabs)을 사용하여, 변성시키고, 어닐링(annealing)시키고, 분해시켰다. 인간 세포에 대해 종래 기재된 바와 같이(문헌[Kleinstiver et al., Nature 523, 481-485(2015); Reyon et al, . Nat Biotechnol 30, 460-465(2012)]), Qiaxcel 모세관 전기영동 장비(QIagen)를 사용하여, 돌연변이유발 빈도를 정량화하였다.

GUIDE-서열 실험을 종래에 기재된 바와 같이 수행하였다(문헌[Tsai et al., Nat Biotechnol 33, 187-197(2015)]). 간략히 말하면, 전술된 바와 같이, Cas9 및 sgRNA 발현 플라스미드와 함께 Cas9 뉴클레아제를 사용하여, 인산화된 포스포로티오에이트-변형된 이중 가닥 올리고데옥시뉴클레오타이드(dsODN)를 U2OS 세포로 형질감염시켰다. DSB 활성을 함유하는 게놈 구간을 확인하기 위해, dsODN-특이적 증폭, 고-처리량 서열분석 및 맵핑(mapping)을 수행하였다. 야생형 대 이중 또는 사중 돌연변이체 변이체 실험에서, 샘플들 사이의 서열분석 심도 차 보정을 위해, 표적외 판독 계수를 표적내 판독 계수로 정규화하였다. 이어서, 야생형 및 변이체 SpCas9의 정규화된 비율을 비교하여, 표적외 부위에서 활성의 변화 배수를 계산하였다. GUIDE-서열에 대해 야생형 및 SpCas9 변이체 샘플이 의도된 표적 부위에서 유사한 올리고 태그 혼입 비율을 갖는지 여부를 결정하기 위해, Phusion Hot-Start Flex에 의해, 100 ng의 게놈 DNA(전술된 바와 같이 단리됨)로부터 의도된 표적 좌위를 증폭시킴으로써, 제한 단편 길이 다형성(RFLP) 분석을 수행하였다. 대략 150 ng의 PCR 산물을 37℃에서 3시간 동안 20 U의 NdeI(New England BioLabs)에 의해 분해한 후, Agencourt Ampure XP 키트를 사용하여 세정하였다. Qiaxcel 모세관 전기영동 장비(QIagen)를 사용하여, RFLP 결과를 정량화함으로써, 올리고 태그 혼입 비율을 추산하였다. T7E1 분석을 유사한 목적으로 전술된 바와 같이 수행하였다.

실시예 1

CRISPR-Cas9 RNA 가이드 유전자 편집의 표적화 특이성을 처리하기 위한 한가지 가능한 해결책은 신규한 돌연변이에 의해 Cas9 변이체를 조작하는 것일 것이다.

이러한 이전의 결과를 기반으로 하여, DNA 상의 포스페이트 기와의 결합 또는 DNA와의 소수성 또는 염기 중첩 상호작용에 의해 매개되는, DNA에 대한 Cas9의 비특이적 결합 친화도를 감소시킴으로써, CRISPR-Cas9 뉴클레아제의 특이성이 유의하게 증대될 것으로 가정하였다(이론에 결부시키고자 하는 것은 아님). 이러한 접근법은, 종래 기재된 절두된 gRNA 접근법에서와 같이, gRNA/Cas9 복합체에 의해 인식되는 표적 부위의 길이를 저하시키지 않는 이점을 갖는다. 이는, DNA에 대한 Cas9의 비특이적 결합 친화도가 표적 DNA 상의 포스페이트 기와 접촉하는 아미노산 잔기를 돌연변이시킴으로써, 감소될 것이기 때문이다.

유사한 접근법이 TALEN과 같은 비-Cas9 뉴클레아제의 변이체를 생성하기 위해 사용되어 왔다(예를 들어, 문헌[Guilinger et al., Nat. Methods. 11: 429(2014)] 참조).

이러한 가정의 초기 시험에서, 본 발명자들은, DNA 백본 상의 포스페이트와 상호작용할 것으로 예상되는 SpCas9의 다양한 잔기로 개개의 알라닌 치환을 도입함으로써, 광범위하게 사용되는 S. 피오게네스 Cas9(SpCas9)의 감소된 친화도 변이체를 조작하고자 시도하였다. E. 콜라이-기반 스크리닝 분석을 이들 변이체의 활성을 평가하기 위해 사용하였다(문헌[Kleinstiver et al., Nature. 2015 Jul 23;523(7561):481-5]). 이러한 박테리아 시스템에서, 세포 생존은, gRNA 및 SpCas9에 의해 표적화되는 23개의 염기쌍 서열 및 독성 자이라제 독 ccdB의 유전자를 함유하는 선택 플라스미드의 절단(및, 후속 파열)에 좌우되었다. 이 실험의 결과에 의해, 활성을 보유하였거나, 손실한 잔기가 확인되었다(표 1).

[표 1]

50 내지 100%의 생존율은 일반적으로 강력한 절단을 시사하였으며, 0%의 생존은 효소가 기능적으로 손실되었음을 시사하였다. 박테리아에서 분석된 추가의 돌연변이(그러나, 상기 표에 제시되지 않음)는 R69A, R71A, Y72A, R75A, K76A, N77A, R115A, H160A, K163A, L169A, T404A, F405A, R447A, I448A, Y450A, S460A, M495A, M694A, H698A, Y1013A, V1015A, R1122A, K1123A, 및 K1124A를 포함한다. (박테리아에서 5% 미만의 생존을 나타낸) R69A 및 F405A를 제외하고, 이들 추가의 단일 돌연변이 모두는 SpCas9의 표적내 활성에 영향을 주지 않는 것으로 나타났다(박테리아 스크린에서 70% 초과의 생존).

N497A, R661A, Q695A, 및 Q926A 돌연변이의 모든 가능한 단일, 이중, 삼중 및 사중 조합을 보유하는 15개의 상이한 SpCas9 변이체를, 이들 잔기에 의해 이루어지는 접촉이 표적내 활성에 비필수적인지 여부를 시험하기 위해, 작제하였다(도 1b). 이 실험에서, 단일 혼입 EGFP 리포터 유전자 내의 비상동성 말단-결합(NHEJ)-매개 수리에 의한 삽입 또는 결실 돌연변이(삽입결실)의 절단 및 유도가 세포 형광의 손실을 야기하는 종래 기재된 인간 세포-기반 분석을 사용하였다(문헌[Reyon, D. et al., Nat Biotechnol. 30, 460-465, 2012]). 야생형 SpCas9와 쌍을 형성하는 경우, 인간 세포에서 EGFP 발현을 효율적으로 파괴하는 것으로 이전에 밝혀진 EGFP-표적화된 sgRNA(문헌[Fu, Y. et al., Nat Biotechnol 31, 822-826(2013))를 사용한 경우, 15개의 SpCas9 변이체 모두가 야생형 SpCas9와 근사한 EGFP 파괴 활성을 보유하였다(도 1b, 회색 막대). 따라서, 이들 잔기 중 하나 또는 전부의 치환은 EGFP-표적화된 sgRNA에 의한 SpCas9의 표적내 절단 효율을 감소시키지 않았다.

다음으로, 미스매치된 표적 부위에서의 15개의 SpCas9 변이체 모두의 상대 활성을 평가하기 위한 실험을 수행하였다. 이를 위해, 위치 13 및 14, 15 및 16, 17 및 18, 및 18 및 19(PAM-최근위 염기를 1로 시작하여, PAM-최원위 염기를 20으로 종결하여 넘버링함; 도 1b)에서 치환된 염기쌍을 함유하는, 이전 실험에서 사용된 EGFP-표적화된 sgRNA의 유도체를 사용하여, EGFP 파괴 분석을 반복하였다. 이 분석에 의해, 삼중 돌연변이체(R661A/Q695A/Q926A) 및 사중 돌연변이체(N497A/R661A/Q695A/Q926A) 둘 모두 중 하나가 미스매치된 sgRNA 4개 모두에 의한 백그라운드와 등가의 EGFP 파괴 수준을 나타내는 것으로 밝혀졌다(도 1b, 채색 막대). 유의하게는, 15개의 변이체 중, 미스매치된 sgRNA와의 최저 활성을 보유하는 변이체는 모두 Q695A 및 Q926A 돌연변이를 보유하였다. 이들 결과 및 또 다른 EGFP 표적 부위에 대한 sgRNA를 사용한 실험으로부터의 유사한 결과를 기반으로 하여, 사중 돌연변이체(N497A/R661A/Q695A/Q926A)를 추가 분석을 위해 선택하였으며, SpCas9 -HF1(고 신뢰도 변이체 #1의 경우)로서 지정하였다.

SpCas9 -HF1의 표적내 활성

다수의 표적내 부위에서 SpCas9-HF1 기능이 얼마나 강력한지를 결정하기 위해, 추가의 sgRNA를 사용하여, 이 변이체와 야생형 SpCas9 간의 직접 비교를 수행하였다. 총 37개의 상이한 sgRNA를 시험하였다: EGFP에 표적화된 24개(EGFP 파괴 분석에 의해 분석함) 및 내인성 인간 유전자 표적에 표적화된 13개(T7 엔도뉴클레아제 I(T7EI) 미스매치 분석에 의해 분석함). EGFP 파괴 분석에 의해 시험된 24개의 sgRNA 중 20개(도 1c) 및 내인성 인간 유전자 부위에서 시험된 13개의 sgRNA 중 12개(도 1d)는 동일한 sgRNA에 의한 야생형 SpCas9와 비교하여 적어도 70% 활성인 SpCas9-HF1에 의한 활성을 나타내었다(도 1e). 사실상, SpCas9-HF1은 대다수의 sgRNA에 의한 야생형 SpCas9와 매우 근사한 활성(90 내지 140%)을 나타내었다(도 1e). 시험된 37개의 sgRNA 중 3개는 본질적으로 SpCas9-HF1에 의한 활성을 나타내지 않았으며, 이들 표적 부위를 조사한 결과, 높은 활성으로 나타난 것과 비교하여, 이들 서열의 특성에 대해 어떠한 분명한 차이도 시사되지 않았다(표 3). 종합하면, SpCas9-HF1은 시험된 sgRNA의 86%(32/37)와 근사한 활성(야생형 SpCas9 활성의 70%를 초과함)을 보유하였다.

[표 3]

SpCas9 -HF1의 게놈-전체 특이성

인간 세포에서 SpCas9-HF1가 감소된 표적외 효과를 나타내었는지를 시험하기 위해, 서열분석(GUIDE-서열) 방법에 의해 가능한 이중 가닥 파손의 게놈-전체 비편향 확인을 사용하였다. GUIDE-서열은 이중가닥 파손으로의 짧은 이중가닥 올리고데옥시뉴클레오타이드(dsODN) 태그의 혼입을 사용하여, 임의의 특정 부위에 다수의 태그가 혼입된 인접 게놈 서열의 증폭 및 서열분석을 가능하게 하며, 절단 효율의 정량적 측정을 제공한다(문헌[Tsai, S.Q. et al, Nat Biotechnol 33, 187-197(2015)]). 내인성 인간 EMX1, FANCF, RUNX1, 및 ZSCAN2 유전자의 다양한 부위에 표적화된 8개의 상이한 sgRNA를 사용하여, 야생형 SpCas9 및 SpCas9-HF1에 의해 유도되는 표적외 효과의 스펙트럼을 비교하기 위해, GUIDE-서열을 사용하였다. 이들 sgRNA에 의해 표적화되는 서열은 고유하며, 기준 인간 게놈에 다양한 수의 예측된 미스매치 부위를 갖는다(표 2). 8개의 sgRNA에 대한 표적내 dsODN 태그 혼입 평가(제한 단편 길이 다형성(RFLP) 분석) 및 삽입결실 형성 평가(T7EI 분석)는 야생형 SpCas9 및 SpCas9-HF1와 근사한 표적내 활성을 나타내었다(각각 도 7a 및 도 7b). GUIDE-서열 실험은, 8개의 sgRNA 중 7개가 다수의 게놈-전체 표적외 부위(sgRNA당 2 내지 25개의 범위)에서 절단을 유도하였으며, 8개의 sgRNA(FANCF 부위 4의 경우)는 임의의 검출 가능한 표적외 부위를 생성하지 않았음을 나타내었다(도 2a 및 도 2b). 그러나, 야생형 SpCas9에 의해 삽입결실을 유도하는 7개의 sgRNA 중 6개는 SpCas9-HF1에 의한 GUIDE-서열 검출 가능한 표적외 이벤트의 상당 정도의 완전한 부재를 나타내었으며(도 2a 및 도 2b); 나머지 7개의 sgRNA(FANCF 부위 2의 경우)는, 프로토스페이서 종자 서열 내에 하나의 미스매치를 보유하는 부위에서 단지 단일의 검출 가능한 게놈-전체 표적외 절단 이벤트를 유도하였다(도 2a). 종합하면, SpCas9-HF1을 사용하는 경우, 검출되지 않았던 표적외 부위는 프로토스페이서 및/또는 PAM 서열에 1 내지 6개의 미스매치를 보유하였다(도 2c). 야생형 SpCas9와 같이, 8개의 sgRNA(FANCF 부위 4의 경우)는, SpCas9-HF1에 의해 시험한 경우, 임의의 검출 가능한 표적외 절단 이벤트를 생성하지 않았다(도 2a).

GUIDE-서열 결과를 확인하기 위해, 표적화된 앰플리콘 서열분석을 사용하여, 야생형 SpCas9 및 SpCas9-HF1에 의해 유도되는 NHEJ-매개 삽입결실 돌연변이의 빈도를 보다 직접적으로 측정하였다. 이들 실험에서, 인간 세포를 단지 sgRNA- 및 Cas9-인코딩 플라스미드만으로 (즉, GUIDE-서열 태그 없이) 형질감염시켰다. 이어서, 차세대 서열분석을 사용하여, GUIDE-서열 실험에서 6개의 sgRNA에 대해 야생형 SpCas9에 의해 확인된 40개의 표적외 부위 중 36개를 조사하였다(40개의 부위 중 4개는, 게놈 DNA로부터 특이적으로 증폭될 수 없으므로, 조사할 수 없었음). 이러한 심층 서열분석 실험은: (1) 야생형 SpCas9 및 SpCas9-HF1이 6개의 sgRNA 표적내 부위 각각에서 근사한 빈도의 삽입결실을 유도하고(도 3a 및 도 3b); (2) 야생형 SpCas9는, 예상된 바와 같이, 36개의 표적외 부위 중 35개에서, 이들 동일 부위에 대한 GUIDE-서열 판독 계수와 적절한 상관관계에 있는 빈도로(도 3c), 통계적으로 유의한 삽입결실 돌연변이의 증거를 나타내었으며(도 3b); (3) 36개의 표적외 부위 중 34개에서 SpCas9-HF1에 의해 유도되는 삽입결실의 빈도는 대조군 형질감염으로부터의 샘플에서 관찰된 삽입결실의 백그라운드 수준과 구별 불가능함(도 3b)을 나타내었다. 음성 대조군과 비교하여, SpCas9-HF1에 의해 통계적으로 유의한 돌연변이 빈도를 갖는 것으로 나타난 2개의 표적외 부위의 경우, 삽입결실의 평균 빈도는 0.049% 및 0.037%이었으며, 이는, 이들이 서열분석/PCR 오류로 인한 것인지, 또는 진정한 뉴클레아제-유도 삽입결실인지를 결정하기 어려운 수준이다. 이러한 결과를 기반으로, SpCas9-HF1이, 야생형 SpCas9와 상이한 빈도의 범위에 걸쳐 검출 불가능한 수준으로 발생하는 표적외 돌연변이를 완전히, 또는 거의 완전히 감소시킬 수 있는 것으로 결론지었다.

그런 다음, 통상적인 호모폴리머(homopolymer) 또는 반복 서열을 표적화하는 sgRNA의 게놈-전체 표적외 효과를 감소시키는 SpCas9-HF1의 능력을 평가하였다. 게놈에 대한 직교성의 상대적 결핍으로 인해, 이러한 특성을 갖는 표적내 부위를 피하기 위한 많은 시도가 현재 이루어지고 있으나, SpCas9-HF1이 이들 유발 표적에 대해서도 표적외 삽입결실을 감소시킬 수 있는지에 대한 조사가 요망되었다. 따라서, 인간 VEGFA 유전자에서 시토신-풍부 호모폴리머 서열 또는 다수의 TG 반복을 함유하는 서열(각각 VEGFA 부위 2 및 VEGFA 부위 3)을 표적화하는, 이미 특성화된 sgRNA(문헌[Fu, Y. et al., Nat Biotechnol 31, Tsai, S.Q. et al., Nat Biotechnol 33, 187-197(2015)]를 사용하였다(표 2). 대조군 실험에서, 각각의 이들 sgRNA는 야생형 SpCas9 및 SpCas9-HF1 둘 모두와 근사한 수준의 GUIDE-서열 ds ODN 태그 혼입(도 7c) 및 삽입결실 돌연변이(도 7d)를 유도하였으며, 이는, SpCas9-HF1이 이들 sgRNA 중 어느 것에서도 표적내 활성이 손상되지 않았음을 시사한다. 중요하게는, GUIDE-서열 실험에 의해, SpCas9-HF1이 이들 sgRNA의 표적외 부위를 감소시키는 데 매우 효과적이라는 것이 밝혀졌으며, VEGFA 부위 2의 경우, 123/144 부위가, VEGFA 부위 3의 경우, 31/32 부위가 검출되지 않았다(도 4a 및 도 4b). SpCas9-HF1에 의해 검출되지 않은 이들 표적외 부위에 대한 조사에 따르면, 이들 각각이 프로토스페이서 및 PAM 서열 내에 일정한 범위의 총 미스매치로서: VEGFA 부위 2 sgRNA의 경우, 2 내지 7개의 미스매치 및 VEGFA 부위 3 sgRNA의 경우, 1 내지 4개의 미스매치를 보유하며(도 4c); 또한, VEGFA 부위 2의 이들 표적외 부위 중 9개는 sgRNA-DNA 경계면에서 잠재적인 벌지 염기(bulged base)(문헌[Lin, Y. et al,. NucleicAcids Res 42, 7473-7485 (2014)]를 가질 수 있는 것으로 나타났다(도 4a 및 도 8). SpCas9-HF1에 의해 검출되지 않은 부위는 VEGFA 부위 2 sgRNA의 경우, 2 내지 6개의 미스매치를, VEGFA 부위 3 sgRNA의 경우, 단일 부위에서 2개의 미스매치를 보유하며(도 4c), VEGFA 부위 2 sgRNA의 3개의 표적외 부위는 다시 잠재적 벌지를 갖는다(도 8). 종합하면, 이들 결과에 따르면, SpCas9-HF1은, 단순 반복 서열에 표적화된 sgRNA의 표적외 효과의 감소에 매우 효과적일 수 있으며, 또한, 호모폴리머 서열에 표적화된 sgRNA에 대해 실질적인 영향을 줄 수 있음이 입증되었다.

[표 2]

GUIDE-서열에 의해 조사된 10개의 sgRNA에 대한 기준 인간 게놈에서의 잠재적 미스매치 부위의 정리

* Cas-OFFinder(문헌[Bae et al., Bioinformatics 30, 1473-1475 (2014)])를 사용하여 결정됨

[표 4]

SpCas9 -HF1의 특이성에 대한 재정의

종래에 기재된 방법, 예를 들어 절두된 gRNA(문헌[Fu, Y. et al., Nat Biotechnol 32, 279-284(2014)) 및 SpCas9-D1135E 변이체(문헌[Kleinstiver, B.P. et al., Nature 523, 481-485(2015)])는 SpCas9 표적외 효과를 부분적으로 감소시킬 수 있으며, 본 발명자들은, 이것이 SpCas9-HF1과 조합되어, 게놈-전체 특이성을 추가로 개선할 수 있는지에 대한 궁금증이 들었다. 인간 세포-기반 EGFP 파괴 분석에서, 4개의 부위에 표적화된, 전장 매치된 절두된 sgRNA에 의한 SpCas9-HF1의 시험에 의하면, sgRNA의 상보성 길이를 단축시키는 경우, 표적내 활성이 현저히 손상되는 것으로 밝혀졌다(도 9). 반대로, 추가의 D1135E 돌연변이를 갖는 SpCas9-HF1(본 명세서에서 SpCas9-HF2로 지칭되는 변이체)은 인간 세포-기반 EGFP 파괴 분석을 사용하여 시험된 8개의 sgRNA 중 6개에 의해, 야생형 SpCas9의 70% 이상의 활성을 보유하였다(도 5a 및 도 5b). 또한, PAM 근위 말단에서 측쇄가 표적 DNA와의 소수성 비특이적 상호작용을 매개하는 위치에서, 각각 L169A 또는 Y450A 돌연변이를 보유하는 SpCas9-HF3 및 SpCas9-HF4 변이체가 생성되었다(문헌[Nishimasu, H. et al., Cell 156, 935-949 (2014); Jiang, F., et al., Science 348, 1477-1481 (2015)]). SpCas9-HF3 및 SpCas9-HF4는 8개의 EGFP-표적화된 sgRNA 중 동일한 6개에 의해, 야생형 SpCas9에서 관찰된 활성의 70% 이상을 보유하였다(도 5a 및 도 5b).

SpCas9-HF2, -HF3, 및 -HF4가, SpCas9-HF1에 내성인 2개의 표적외 부위(FANCF 부위 2 및 VEGFA 부위 3 sgRNA)에서 삽입결실 빈도를 감소시킬 수 있는지를 결정하기 위해, 추가의 실험을 수행하였다. 프로토스페이서의 종자 서열에서 단일 미스매치를 보유하는 FANCF 부위 2 표적외의 경우, SpCas9-HF4는 삽입결실 돌연변이 빈도를, T7EI 분석에 의해 평가된 바와 같이, 거의 백그라운드 수준으로 감소시켰고, 이는 또한, 표적내 활성을 유리하게 증대시켰으며(도 5c), 3개의 변이체 중 최대의 특이성 증대를 야기하였다(도 5d). 2개의 프로토스페이서 미스매치(하나는 종자 서열에, 다른 하나는 PAM 서열로부터 최원위의 뉴클레오타이드에 존재함)를 보유하는 VEGFA 부위 3 표적외 부위의 경우, SpCas9-HF2는 삽입결실 형성에서 최대 감소를 나타내었고, 표적내 돌연변이 효율에 대해 단지 중간 정도의 효과를 나타내었으며(도 5c), 이는 시험된 3개의 변이체 중 최대의 특이성 증대를 야기하였다(도 5d). 이를 종합하면, 이들 결과에 의해, 비특이적 DNA 접촉을 매개하거나, PAM 인식을 변이시킬 수 있는 추가의 돌연변이를 다른 잔기에 도입시킴으로써, SpCas9-HF1에 내성인 표적외 효과를 감소시킬 수 있는 가능성이 입증되었다.

SpCas9-HF4 및 SpCas9-HF2가 각각 FANCF 부위 2 및 VEGFA 부위 3 sgRNA의 표적외에 대해, SpCas9-HF1과 비교하여, 개선된 식별성을 갖는다는 것을 보여주는 전술된 T7E1 분석 결과를 일반화하기 위해, GUIDE-서열을 사용하여, 이들 변이체의 게놈-전체 특이성을 조사하였다. RFLP 분석을 사용하는 경우, SpCas9-HF4 및 SpCas9-HF2는 SpCas9-HF1과 유사한 표적내 활성을 가진 것으로 나타났으며, 이는 GUIDE-서열 태그 혼입율에 의해 분석된 바와 같다(도 5e). GUIDE-서열 데이터를 분석하자면, SpCas9-HF2 또는 SpCas9-HF4의 경우, 새로운 표적외 부위가 확인되지 않았다(도 5f). SpCas9-HF1과 비교하여, 모든 부위에서의 표적외 활성은 GUIDE-서열에 의해 검출 불가능해지거나, 실질적으로 저하되었다. SpCas9-HF1과 비교하여, SpCas9-HF4는, SpCas9-HF1의 특이성 개선에 대해 저항성으로 남아 있는 단일 FANCF 부위 2 표적외 부위에 대해 거의 26배 더 증대된 특이성을 가졌다(도 5f). SpCas9-HF2는 고빈도 VEGFA 부위 3 표적외에 대해, SpCas9-HF1과 비교하여, 거의 4배의 개선된 특이성을 가졌으며, 또한, 다른 저빈도 표적외 부위에서 GUIDE-서열에 의한 검출 가능한 이벤트를 급격하게 감소시키거나(38배 초과), 이를 제거하였다. 주목할 것은, SpCas9-HF1에서 확인된 저빈도 부위 중 3개의 게놈 위치는 종래에 특성화된 백그라운드 U20S 세포 파손 지점 핫스폿(hotspot)에 인접해 있다는 점이다. 종합하면, 이들 결과는, SpCas9-HF2 및 SpCas9-HF4 변이체가 SpCas9-HF1의 게놈-전체 특이성을 개선할 수 있다는 것을 시사한다.

표준 비 반복 표적 서열에 대해 설계된 sgRNA를 사용한 경우, SpCas9-HF1은 표적외 돌연변이를 강력하고, 일관되게 감소시켰다. SpCas9-HF1에 대해 가장 내성인 2개의 표적외 부위는 프로토스페이서에 단지 하나의 미스매치 및 2개의 미스매치를 갖는다. 종합하면, 이들 관찰 결과는, 게놈 내의 다른 부분에 하나 또는 2개의 미스매치를 보유하는 밀접 부위를 갖지 않는 비 반복 서열을 표적화하고, SpCas9-HF1을 사용함으로써, 표적외 돌연변이가 검출 불가능한 수준으로 최소화될 수 있음을 시사한다(일부 경우, 기존의 공개적으로 이용 가능한 소프트웨어 프로그램(문헌[Bae, S., et al, Bioinformatics 30, 1473-1475(2014)])을 사용하여 용이하게 달성될 수 있음). 사용자가 유념해야 할 한 가지 매개변수는, SpCas9-HF1이, 프로토스페이서 서열에 미스매치된 gRNA의 5' 말단의 구아닌을 이용하는 통상의 실행 방식과 호환될 수 없다는 것이다. 표적 부위에 미스매치된 5' 구아닌을 보유하는 4개의 sgRNA를 시험한 결과, 위의 4개 중 3개가 야생형 SpCas9와 비교하여, SpCas9-HF1에 의한 활성을 감소시키는 것으로 나타났으며(도 10), 이는, 예상컨대, 부분적으로 매치된 부위를 더 잘 식별하는 SpCas9-HF1의 능력을 반영한다.

추가의 생화학적 작업에 의해, SpCas9-HF1가 게놈-전체에 대해 고 특이성을 달성하는 정확한 메커니즘을 확인하거나, 명료화할 수 있다. 발현 플라스미드의 농도를 저하시킨 적정 실험에서, 야생형 SpCas9 및 SpCas9-HF1이, 농도가 저하된 경우와 유사하게 거동하는 것으로 보아, 도입된 4개의 돌연변이는 세포에서 SpCas9의 안정성 또는 정상 상태(steady state)의 발현 수준을 변이시키는 것으로 보이지 않는다(도 11). 그 대신, 메커니즘에 대해, 가장 단순한 설명은, 이들 돌연변이가 Cas9-sgRNA와 표적 DNA 사이의 상호작용의 에너지적 상태를 저하하여, 복합체의 에너지 수준이 표적내 활성의 보유에 필요한 수준 정도는 되나, 표적외 부위의 절단이 비효율적이 되거나, 부재하도록 할 수 있을 만큼의 낮은 수준이라는 것이다. 이러한 메커니즘은, 구조 데이터에서의 표적 DNA 포스페이트 백본과 돌연변이된 잔기 사이에 관찰되는 비특이적 상호작용과 일치한다(문헌[Nishimasu, H. et al., Cell 156, 935-949 (2014); Anders, C et. Al., Nature 513, 569-573 (2014)]). 양으로 하전된 잔기에서 치환을 보유하는 전사 활성인자형 효과기 뉴클레아제의 증대된 특이성을 설명하기 위해, 일부 유사한 메커니즘이 제안된 바 있다(문헌[Guilinger, J.P. et al., Nat Methods 11, 429-435(2014)]).

또한, SpCas9-HF1을, Cas9 기능을 변이시키는 것으로 밝혀진 다른 돌연변이와 조합하는 것이 가능하다. 예를 들어, 3개의 아미노산 치환을 보유하는 SpCas9 돌연변이체(D1135V/R1335Q/T1337R, 또한 SpCas9-VQR 변이체로 일컬어짐)는 NGAN PAM을 갖는 부위를 인식하며(상대 효율성은 NGAG>NGAT=NGAA>NGAC임)(문헌[Kleinstiver, B.P. et al, Nature 523, 481-485(2015)]), 최근 확인된 사중 SpCas9 돌연변이체(D1135V/G1218R/R1335Q/T1337R, SpCas9-VRQR 변이체로 지칭됨)는 NGAH(H = A, C, 또는 T) PAM을 갖는 부위에서 VQR 변이체와 비교하여, 개선된 활성을 갖는다(도 12a). SpCas9-VQR에 SpCas9-HF1로부터의 4개의 돌연변이(N497A/R661A/Q695A/Q926A)를 도입시킴으로써, 각각 SpCas9-VQR-HF1 및 SpCas9-VRQR-HF1을 생성시켰다. 이들 뉴클레아제의 HF 버젼 둘 모두는, 8개의 sgRNA 중 5개가 EGFP 리포터 유전자에 표적화되고, 8개의 sgRNA 중 7개가 내인성 인간 유전자 부위에 표적화된 비-HF 대응 대상과 유사한 표적내 활성(즉, 70% 이상)을 나타내었다(도 12b 내지 도 12d).

더욱 광범위하게는, 이들 결과는 CRISPR-관련 뉴클레아제의 추가의 고 신뢰도 변이체의 조작을 위한 일반 전략을 예시한다. 잔기와 접촉된 비특이적 DNA에 추가의 돌연변이를 첨가함으로써, SpCas9-HF1에 저항성인 매우 소수의 나머지 표적외 부위 중 일부를 추가로 감소시켰다. 따라서, SpCas9-HF2, SpCas9-HF3, SpCas9-HF4, 등과 같은 변이체는 표적외 서열의 특성에 따라 사용자 지정 방식으로 활용될 수 있다. 추가로, SpCas9의 고 신뢰도 변이체 조작의 성공은, 비특이적 DNA 접촉을 돌연변이시키는 접근법이, 빈도가 증대된 것으로 밝혀지고, 특성화된 더 최근의 CRISPR-관련 뉴클레아제(문헌[Zetsche, B. et al., Cell 163, 759-771 (2015); Shmakov, S. et al., Molecular Cell 60, 385-397])뿐만 아니라, 다른 천연 유래의 Cas9 이종상동체 및 조작된 Cas9 이종상동체(문헌[Ran, F.A. et al., Nature 520, 186-191 (2015), Esvelt, K.M. et al., Nat Methods 10, 1116-1121 (2013); Hou, Z. et al., Proc Natl Acad Sci U S A (2013); Fonfara, I. et al., NucleicAcids Res 42, 2577-2590 (2014); Kleinstiver, B.P. et al, Nat Biotechnol (2015)])에 연장될 수 있음을 시사한다.

실시예 2

본 명세서에서는, N497A, Q695A, R661A, 및 Q926A를 포함하는 표적 가닥 DNA와 접촉하는 잔기에 알라닌 치환을 갖는 SpCas9 변이체가 기재된다. 본 발명자들은, 이들 잔기 이외에, 비표적 DNA 가닥과 접촉하는 것으로 보이는 양으로 하전된 SpCas9 잔기에 치환을 첨가함으로써, 이들 변이체, 예를 들어, SpCas9-HF1 변이체(N497A/R661A/Q695A/Q926A)의 특이성이, 추가로 개선될 수 있는지를 결정하고자 하였다: R780, K810, R832, K848, K855, K968, R976, H982, K1003, K1014, K1047, 및/또는 R1060(문자[Slaymaker et al., Science. 2016 Jan 1;351(6268):84-8] 참조).

처음에, 이들 위치에 단일 알라닌 치환 및 이들의 조합을 보유하는 야생형 SpCas9 유도체의 활성을, EGFP 유전자의 일 부위에 설계된 완전히 매치된 sgRNA(표적내 활성을 평가하기 위함) 및, PAM-최근위 염기인 위치 1과 위치 11 및 12에서의 의도된 미스매치를 보유하는 동일한 sgRNA(미스매치된 부위에서의 활성을 평가하기 위한 것으로, 표적외 부위에서 발견되는 바와 같음)에 의해, EGFP 파괴 분석을 사용하여 시험하였다(도 13a). (삼중 치환 K810A/K1003A/R1060A 또는 K848A/K1003A/R1060A를 보유하는 변이체는 각각 eSpCas9(1.0) 및 eSpCas9(1.1)로 일컬어지는 최근 기재된 변이체와 동일함에 유의한다; 참조문헌 1 참조). 예상된 바와 같이, 야생형 SpCas9는 강력한 표적내 및 미스매치된-표적 활성을 가졌다. 본 발명자들은 또한, 이 실험에서 대조군으로서 SpCas9-HF1을 시험하였으며, 예상된 바와 같이, 이는 미스매치된-표적 활성이 감소하였으나, 표적내 활성을 보유한다는 것을 발견하였다(도 13a). 잠재적으로 비표적 DNA 가닥과 접촉할 수 있는 위치에서 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9 유도체 모두는 야생형 SpCas9와 유사한 표적내 활성을 나타내었다(도 13a). 흥미롭게도, 이들 유도체 중 일부는 또한 야생형 SpCas9에 의해 관찰되는 활성과 비교하여, 미스매치된 11/12 sgRNA에 의해 감소된 절단을 나타내었으며, 이는, 이들 유도체의 치환의 하위세트가 야생형 SpCas9와 비교하여, 이러한 미스매치된 부위에 대해 증대된 특이성을 부여한다는 것을 시사한다(도 13a). 그러나, 이들 단일 치환 또는 치환의 조합 중 어느 것도 11/12 미스매치된 sgRNA에서 관찰된 활성을 완전히 제거하기에 충분하지 않았다. 본 발명자들이 위치 9 및 10에서 미스매치를 보유하는 추가의 sgRNA를 사용하여, 야생형 SpCas9, SpCas9-HF1, 및 이들의 동일한 야생형 SpCas9 유도체를 시험하였을 때(도 13b), 대부분의 유도체의 경우, 미스매치된-표적 활성에서 단지 최소의 변화만이 관찰되었다. 다시 말하자면, 이는 이러한 잠재적 비표적 가닥 접촉 잔기에서의 단일, 이중 또는 심지어 삼중 치환(이전에 기재된 eSpCas9(1.0) 및 (1.1) 변이체와 동등함)이, 불완전하게 매치된 DNA 부위에서 활성을 제거하기에 불충하다는 것이 입증되었다. 종합하면, 이들 데이터는, 야생형 SpCas9 변이체가 매치된 sgRNA에 의한 표적내 활성을 보유하며, (야생형 SpCas9의 맥락에서) 그 자체로 이들 유도체에 함유된 치환이 2개의 상이한 미스매치된 DNA 부위에서 뉴클레아제 활성을 제거하기에 충분하지 않다는 것을 입증한다(도 13a 및 도 13b).

이러한 결과를 감안할 때, 비표적 DNA 가닥과 접촉할 수 있는 잔기에 하나 이상의 추가적 아미노산 치환을 보유하는 SpCas9-HF1 유도체가 모 SpCas9-HF1 단백질과 비교하여, 특이성을 추가로 개선할 수 있을 것으로 가정하였다. 따라서, 단일, 이중 또는 삼중 알라닌 치환의 조합을 보유하는 다양한 SpCas9-HF1-유도체를, 완전히 매치된 sgRNA(표적내 활성을 시험하기 위함) 및, 위치 11 및 12에서의 미스매치를 보유하는 동일한 sgRNA(미스매치된 표적 부위에서의 활성을 평가하기 위한 것으로, 표적외 부위에서 발견되는 바와 같음)를 사용하여, 인간 세포-기반 EGFP 파괴 분석에서 시험하였다. 이들 sgRNA는 도 13a 및 도 13b에 사용된 것과 동일한 것이다. 이 실험에 의해, 본 발명자들이 시험한 SpCas9-HF1-유도체 변이체 대부분이 야생형 SpCas9 및 SpCas9-HF1 둘 모두에 의해 관찰된 것과 유사한 표적내 활성을 나타내는 것으로 밝혀졌다(도 14a). 11/12 미스매치된 sgRNA에 의한 경우, 시험된 일부 SpCas9-HF1 유도체(예를 들어, SpCas9-HF1 + R832A 및 SpCas9-HF1 + K1014A)는 미스매치된 sgRNA에 의해, 절단에서 현저한 변화를 나타내지 않았다. 그러나, 중요하게는, 대부분의 SpCas9-HF1 유도체는, SpCas9-HF1, eSpCas9(1.0), 또는 eSpCas9(1.1)에 의해 관찰된 것보다 11/12 미스매치된 sgRNA에 의해 실질적으로 더 낮은 활성을 가졌으며, 이는, 이들 신규한 변이체의 특정 조합이 감소된 미스매치된-표적 활성을 가지며, 따라서 개선된 특이성을 가짐을 시사한다(도 14a). 11/12 미스매치된 sgRNA에 의한 미스매치된-표적 활성을 거의 백그라운드 수준으로 감소시키는 16개의 SpCas9-HF1 유도체 중 9개가 표적내 활성에 대해 단지 최소의 효과만을 가진 것으로 나타났다(완전히 매치된 sgRNA를 사용하여 평가됨; 도 14a). 위치 9 및 10에서 의도적으로 미스매치된 sgRNA를 사용한 EGFP 파괴 분석에서의 이들 SpCas9-HF1 유도체의 하위세트의 추가의 시험(도 14b)은 또한, 이들 변이체가 SpCas9-HF1(도 14b), eSpCas9(1.1)(도 13a), 또는 야생형 SpCas9 뉴클레아제에 첨가된 동일한 치환(도 13b)에 의해 관찰된 것보다 이러한 미스매치된 sgRNA에 의해 더 낮은 활성을 보유하였음을 밝혀내었다. 중요하게는, 9/10 미스매치된 sgRNA에 의한 이러한 분석에서 5개의 변이체가 백그라운드 수준의 표적외 활성을 나타내었다.

다음으로, 비표적 가닥의 이러한 알라닌 치환이, 본 발명자들의 SpCas9-HF1 변이체(본 명세서의 "이중" 변이체)로부터의 Q695A 및 Q926A 치환만을 함유하는 SpCas9 변이체와 조합될 수 있는지를 시험하였다. 상기에서 시험된 많은 HF1 유도체가 표적내 활성에서 관찰 가능한(또한, 바람직하지 않은) 저하를 나타내므로, 하나 이상의 비표적 가닥 접촉 치환과 SpCas9-HF1로부터의 2개의 가장 중요한 치환(Q695A 및 Q926A; 도 1b 참조)만을 조합하는 경우, 표적내 활성이 구제되나, 이들 치환이 SpCas9-HF1 변이체에 첨가된 경우에 관찰되는 특이성의 증대가 여전히 유지되는 것으로 가정하였다. 따라서, 잠재적 비표적 DNA 가닥 상호작용 위치에서 단일, 이중 또는 삼중 알라닌 치환의 조합을 보유하는 다양한 SpCas9(Q695A/Q926A) 유도체를, 전술된 EGFP에 표적화된 동일한 완전히 매치된 sgRNA(표적내 활성을 시험하기 위함) 및 도 13a 및 도 13b에 사용된 위치 11 및 12에 미스매치를 보유하는 동일한 sgRNA(미스매치된 표적 부위에서의 활성을 평가하기 위한 것으로, 표적외 부위에서 발견되는 바와 같음)를 사용하여, 인간 세포-기반 EGFP 파괴 분석에서 시험하였다. 이 실험에 의해, 시험된 대부분의 SpCas9(Q695A/Q926A) 유도체 변이체가 야생형 SpCas9 및 SpCas9-HF1 둘 모두에 의해 관찰된 것과 유사한 표적내 활성을 나타내는 것으로 밝혀졌다(도 15). 중요하게는, 많은 SpCas9-HF1 유도체는 SpCas9-HF1, eSpCas9(1.0), 또는 eSpCas9(1.1)에 의해 관찰된 것과 비교하여, 11/12 미스매치된 sgRNA에 의해 실질적으로 더 낮은 활성을 가지며, 이는, 이들 신규한 변이체의 특정 조합이 미스매치된-표적 활성을 감소시키고, 따라서 특이성을 개선한다는 것을 시사한다(도 15). 11/12 미스매치된 sgRNA에 의한 미스매치된-표적 활성을 거의 백그라운드 수준으로 감소시키는 13개의 SpCas9(Q695A/Q926A) 유도체 중 단지 하나만이 표적내 활성에 실질적인 효과를 갖는 것으로 나타났다(완전히 매치된 sgRNA를 사용하여 평가됨; 도 15).

전체적으로 볼 때, 이러한 데이터에 의하면, 비표적 DNA 가닥과 접촉되는 위치에서 SpCas9-HF1 또는 SpCas9(Q695A/Q926A)로의 1, 2 또는 3개의 알라닌 치환의 첨가가, (그의 모 클론 또는 최근 기재된 eSpCas9(1.0) 또는 (1.1)과 비교하여) 미스매치된 표적외 부위에 대해 식별되는 개선된 능력을 갖는 신규한 변이체를 야기할 수 있음이 입증된다. 중요하게는, 야생형 SpCas9의 맥락에서의 이러한 동일한 치환은 임의의 실질적인 특이성 이점을 제공하는 것으로 보이지 않는다.

sgRNA-표적 DNA 상보성 경계면에서의 미스매치에 대한 SpCas9-HF1 및 eSpCas9-1.1의 내성을 더 잘 정의하고, 비교하기 위해, 스페이서 상보성 영역의 모든 가능한 위치에 단일 미스매치를 함유하는 sgRNA를 사용하여, 그의 활성을 조사하였다. SpCas9-HF1 및 eSPCas9-1.1 변이체 둘 모두는, SpCas9-HF1이 eSpCas9-1.1을 능가하는 소수의 경우를 제외하고, 야생형 SpCas9와 비교하는 경우, 대부분의 단일 미스매치된 sgRNA에 대해 유사한 활성을 가졌다(도 16).

다음으로, 본 발명자들은, 표적 가닥 DNA와 접촉하거나, 비표적 가닥 DNA와 잠재적으로 접촉할 수 있는 잔기에 추가의 알라닌 치환을 갖는 이중 돌연변이체(Db = Q695A/Q926A), SpCas9-HF1(N497A/R661A/Q695A/Q926A), eSpCas9-1.0(1.0 = K810A/K1003A/R1060A), 또는 eSpCas9-1.1(1.1 = K848A/K1003A/R1060A)로부터의 아미노산 치환의 조합을 함유하는 일부 변이체의 단일 뉴클레오타이드 미스매치 내성을 시험하였다(도 17a 및 도 17b). 완전히 매치된 sgRNA를 사용하여, 표적내 활성을 평가하였으며, 스페이서 서열의 위치 4, 8, 12, 또는 16에 이러한 미스매치를 보유하는 sgRNA를 사용하여, 단일 뉴클레오타이드 미스매치 내성을 평가하였다(도 17a). 다수의 이들 변이체는, 미스매치된 sgRNA에 의해 관찰된 활성에 실질적인 감소를 갖는 표적내 활성을 유지하였다. 이들 변이체(Q695A/K848A/Q926A/K1003A/R1060A, N497A/R661A/Q695A/K855A/Q926A/R1060A, 및 N497A/R661A/Q695A/Q926A/H982A/R1060A) 중 3개를 나머지 단일 미스매치 sgRNA(위치 1 내지 3, 5 내지 7, 9 내지 11, 13 내지 15, 및 17 내지 20에서 미스매치를 함유함)에 의해 추가로 시험하였다. 이들 변이체는 eSpCas9-1.1과 비교하여, sgRNA에서 단일 뉴클레오타이드 치환에 대해 더욱 강력한 불내성(intolerance)을 나타내었으며, 이는 이들 신규한 변이체의 개선된 특이성 특성을 입증한다(도 17b). 아미노산 치환의 대안적 조합을 함유하는 추가의 변이체 뉴클레아제를 스페이서의 위치 5, 7, 및 9에 미스매치를 함유하는 sgRNA를 사용하여 시험하였다(이전의 변이체가 이들 위치의 미스매치에 대해 내성을 갖는 것으로 나타났으므로, 이들 특정의 미스매치된 sgRNA를 사용하였음)(도 18). 다수의 이들 뉴클레아제는 미스매치된 부위에 대해 개선된 특이성을 가졌으며, 표적내 활성에 단지 미미한 감소만을 나타내었다(도 18).

돌연변이의 추가의 조합이 특이성 개선을 가져올 수 있는지를 추가로 결정하기 위해, 추가로 2개의 매치된 sgRNA에 의한 뉴클레아제 변이체의 크게 확장된 패널을 시험함으로써, 본 발명자들의 EGFP 파괴 활성에서의 표적내 활성을 조사하였다(도 19a). 다수의 이들 변이체는 강력한 표적내 활성을 유지하였으며, 이는, 이들이 특이성에 대한 추가의 개선을 유발하는 데 유용할 수 있음을 시사한다(도 19b). 위치 12, 14, 16, 또는 18에서 단일 치환을 함유하는 sgRNA에 의해, 다수의 이들 변이체를 시험함으로써, 특이성 개선이 관찰되는지를 결정하였으며, 이들은 이들 위치에서 단일 뉴클레오타이드 미스매치에 대한 더 큰 불내성을 나타내는 것으로 밝혀졌다(도 19b).

실시예 3

본 발명자들이 SpCas9를 사용하여 실행한 바와 같이, 스타필로코커스 아우레우스 Cas9(SaCas9)에 의한 유사한 전략을 취하여, 표적 DNA 가닥과 접촉하는 것으로 인식되는 잔기(도 20 및 도 21a), 비표적 DNA와 접촉할 수 있는 잔기(진행중인 실험), 및 본 발명자들이 이전에, PAM 특이성에 영향을 줄 수 있다는 것을 밝혀낸 잔기(도 21b)에 알라닌 치환을 도입함으로써, SaCas9의 특이성을 개선하기 위한 실험을 수행하였다. 표적 가닥 DNA 백본과 접촉할 수 있는 잔기는 Y211, Y212, W229, Y230, R245, T392, N419, L446, Y651, 및 R654를 포함하고; 비표적 가닥 DNA와 접촉할 수 있는 잔기는 Q848, N492, Q495, R497, N498, R499, Q500, K518, K523, K525, H557, R561, K572, R634, R654, G655, N658, S662, N668, R686, K692, R694, H700, K751을 포함하며; PAM과 접촉할 수 있는 잔기는 E782, D786, T787, Y789, T882, K886, N888, A889, L909, K929, N985, N986, R991, 및 R1015를 포함한다. 예비 실험에서, 표적 가닥 DNA 접촉 잔기 또는 PAM 접촉 잔기(각각, 도 21a 및 도 21b)의 단일 알라닌 치환(또는, 이들의 일부 조합)은 표적내 EGFP 파괴 활성(완전히 매치된 sgRNA를 사용함)에 가변적인 효과를 나타내었으며, (위치 11 및 12에서 미스매치된 sgRNA를 사용하는 경우) 표적외 절단을 제거할 수 없었다. 놀랍게도, HF1에서의 SpCas9 돌연변이는 유사하게 미스매치된 표적/sgRNA 쌍에 의한 표적외 활성을 완전히 폐지할 수 없었으며, 이는, 표적 가닥/비표적 가닥 치환의 조합을 함유하는 변이체가 이러한 부위에서의 특이성 개선에 필요할 수 있다는 것을 시사한다(본 발명자들이 SpCas9에 의해 관찰한 바와 같음).

SaCas9 특이성을 개선하는, 잠재적 표적 가닥 DNA 접촉의 돌연변이 전략을 추가로 평가하기 위해, sgRNA의 위치 19 및 20에서의 미스매치에 내성을 갖는 돌연변이의 단일, 이중, 삼중 및 사중 조합의 가능성을 시험하였다(도 22a 및 도 22b). 이들 조합들에 의해, Y230 및 R245에서의 알라닌 치환이, 다른 치환과 조합되는 경우, 특이성을 증대시킬 수 있음이 밝혀졌으며, 이는 미스매치된 부위에 대한 더 우수한 식별 능력에 의해 평가되는 바와 같다.

다음으로, 이들 삼중 알라닌 치환 변이체 중 2개(Y211A/Y230A/R245A 및 Y212A/Y230A/R245A)의 표적내 유전자 파괴 활성을 EGFP의 4개의 표적내 부위(매치된 부위 #1 내지 4; 도 23)에서 조사하였다. 이들 변이체는 매치된 부위 1 및 2에 대해 강력한 표적내 활성을 유지하였으나, 매치된 부위 3 및 4의 경우, 표적내 활성의 대략 60 내지 70%의 손실을 나타내었다. 이들 삼중 알라닌 치환 변이체 둘 모두는 야생형 SaCas9와 비교하여, 특이성을 급격하게 개선하였으며, 이는 표적 부위 1 내지 4의 스페이서의 다양한 위치에서 이중 미스매치를 보유하는 sgRNA를 사용함으로써, 평가된 바와 같다(도 23).

이들 알라닌 치환의 이중 및 삼중 조합(각각, 도 24a 및 도 24b)을 보유하는 SaCas9 변이체를, 위치 21(식별되는 유발 미스매치로 예상되는 PAM 최원위 위치)에서 단일 미스매치를 함유하는 sgRNA를 사용하여 평가되는 표적 활성 및 특이성의 개선에 대해, 6개의 내인성 부위에서 시험하였다. 일부 경우, 매치된 sgRNA에 의한 표적내 활성이 변이체에 의해 유지되었으며, 위치 21에서 미스매치된 sgRNA에 의한 '표적외' 활성은 제거되었다(도 24a 및 도 24b). 다른 경우, 매치된 sgRNA에 의해, 활성의 완전한 손실에 대한 한계가 관찰되었다.

참조문헌

1. Sander, J.D. & Joung, J.K. CRISPR-Cas systems for editing, regulating and targeting genomes. Nat Biotechnol 32, 347-355 (2014).

2. Hsu, P.D., Lander, E.S. & Zhang, F. Development and applications of CRISPR-Cas9 for genome engineering. Cell 157, 1262-1278 (2014).

3. Doudna, J.A. & Charpentier, E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science 346, 1258096 (2014).

4. Barrangou, R. & May, A.P. Unraveling the potential of CRISPR-Cas9 for gene therapy. Expert Opin Biol Ther 15, 311-314 (2015).

5. Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).

6. Sternberg, S.H., Redding, S., Jinek, M., Greene, E.C. & Doudna, J.A. DNA interrogation by the CRISPR RNA-guided endonuclease Cas9. Nature 507, 62-67 (2014).

7. Hsu, P.D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases.Nat Biotechnol 31, 827-832 (2013).

8. Tsai, S.Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases.Nat Biotechnol 33, 187-197 (2015).

9. Hou, Z. et al. Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis. Proc Natl Acad Sci U S A (2013).

10. Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic Acids Res 42, 2577-2590 (2014).

11. Esvelt, K.M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nat Methods 10, 1116-1121 (2013).

12. Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013).

13. Horvath, P. et al. Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus. J Bacteriol 190, 1401-1412 (2008).

14. Anders, C., Niewoehner, O., Duerst,A. & Jinek, M. Structural basis of PAM-dependent target DNA recognition by the Cas9 endonuclease. Nature 513, 569-573 (2014).

15. Reyon, D. et al. FLASH assembly of TALENs for high-throughput genome editing. Nat Biotechnol 30, 460-465 (2012).

16. Fu,Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826 (2013).

17. Chen, Z. & Zhao, H. A highly sensitive selection method for directed evolution of homing endonucleases. Nucleic Acids Res 33, e154 (2005).

18. Doyon, J.B., Pattanayak, V., Meyer, C.B. & Liu, D.R. Directed evolution and substrate specificity profile of homing endonuclease I-SceI. J Am Chem Soc 128, 2477-2484 (2006).

19. Jiang, W., Bikard, D., Cox, D., Zhang, F. & Marraffini, L.A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31, 233-239 (2013).

20. Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013).

21. Hwang, W.Y. et al. Efficient genome editing in zebrafish using a CRISPR-Cas system. Nat Biotechnol 31, 227-229 (2013).

22. Chylinski, K., Le Rhun, A. & Charpentier, E. The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems. RNA Biol 10, 726-737 (2013).

23. Kleinstiver, B.P., Fernandes, A.D., Gloor, G.B. & Edgell, D.R. A unified genetic, computational and experimental framework identifies functionally relevant residues of the homing endonuclease I-BmoI. Nucleic Acids Res 38, 2411-2427 (2010).

24. Gagnon, J.A. et al. Efficient mutagenesis by Cas9 protein-mediated oligonucleotide insertion and large-scale assessment of single-guide RNAs. PLoS One 9, e98186 (2014).

서열

SEQ ID NO:271 - JDS246: CMV-T7-인간SpCas9-NLS-3xFLAG

인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:272 - VP12: CMV-T7-인간SpCas9-HF1(N497A, R661A, Q695A, Q926A)-NLS-3xFLAG

인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:273 - MSP2135: CMV-T7-인간SpCas9-HF2(N497A, R661A, Q695A, Q926A, D1135E)-NLS-3xFLAG

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgagAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:274 - MSP2133: CMV-T7-인간SpCas9-HF4(Y450A, N497A, R661A, Q695A, Q926A)-NLS-3xFLAG

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTgccTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:275 - MSP469: CMV-T7-인간SpCas9-VQR(D1135V, R1335Q, T1337R)-NLS-3xFLAG

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:276 - MSP2440: CMV-T7-인간SpCas9-VQR-HF1(N497A, R661A, Q695A, Q926A, D1135V, R1335Q, T1337R)-NLS-3xFLAG

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:277 - BPK2797: CMV-T7-인간SpCas9-VRQR(D1135V, G1218R, R1335Q, T1337R)-NLS-3xFLAG

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCagaGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:278 - MSP2443: CMV-T7-인간SpCas9-VRQR-HF1(N497A, R661A, Q695A, Q926A, D1135V, G1218R, R1335Q, T1337R)-NLS-3xFLAG

ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCagaGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA

SEQ ID NO:279 - BPK1520: U6-BsmBI카세트-Sp-sgRNA

U6 프로모터는 정상 글꼴이고, BsmBI 부위는 이탤릭체이고, S. 피오게네스 sgRNA는 소문자이며, U6 종결인자는 이중 밑줄 그어져 있다:

TGTACAAAAAAGCAGGCTTTAAAGGAACCAATTCAGTCGACTGGATCCGGTACCAAGGTCGGGCAGGAAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG GAGACG ATTAATG CGTCTC Cgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt

기타 구현예

본 발명은 그 상세한 설명과 관련하여 설명되었으나, 전술된 설명은 예시하기 위한 것이지, 본 발명의 범위를 제한하는 것이 아니며, 본 발명의 범위는 첨부된 청구범위의 범위에 의해서 규정된다. 다른 양태, 이점 및 변형들이 하기의 청구범위의 범위 내에 있다.

SEQUENCE LISTING <110> THE GENERAL HOSPITAL CORPORATION <120> ENGINEERED CRISPR-CAS9 NUCLEASES <130> 29539-0189WO1 <150> US 15/015,947 <151> 2016-02-04 <150> US 62/258,280 <151> 2015-11-20 <150> US 62/216,033 <151> 2015-09-09 <150> US 62/211,553 <151> 2015-08-28 <150> US 62/271,938 <151> 2015-12-28 <160> 279 <170> PatentIn version 3.5 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 2 <211> 1053 <212> PRT <213> Staphylococcus aureus <400> 2 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 3 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 3 Gly Gly Gly Ser 1 <210> 4 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 4 Gly Gly Gly Gly Ser 1 5 <210> 5 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Gly Gly Gly Ser 1 <210> 6 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 6 Gly Gly Gly Gly Ser 1 5 <210> 7 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Pro Lys Lys Lys Arg Arg Val 1 5 <210> 8 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 gggcacgggc agcttgccgg 20 <210> 10 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 gggcacgggc agcttgccgg tggt 24 <210> 11 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 11 gcacgggcag cttgccgg 18 <210> 12 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 gcacgggcag cttgccggtg gt 22 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 gggcacccgc agcttgccgg 20 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 14 gggcacccgc agcttgccgg tggt 24 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 gggctggggc agcttgccgg 20 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 gggctggggc agcttgccgg tggt 24 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 ggcgacgggc agcttgccgg 20 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 18 ggcgacgggc agcttgccgg tggt 24 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 19 gcccacgggc agcttgccgg 20 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 20 gcccacgggc agcttgccgg tggt 24 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 21 gtcgccctcg aacttcacct 20 <210> 22 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 22 gtcgccctcg aacttcacct cggc 24 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 23 gtaggtcagg gtggtcacga 20 <210> 24 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 24 gtaggtcagg gtggtcacga gggt 24 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 25 ggcgagggcg atgccaccta 20 <210> 26 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 26 ggcgagggcg atgccaccta cggc 24 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 27 ggtcgccacc atggtgagca 20 <210> 28 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 28 ggtcgccacc atggtgagca aggg 24 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 29 ggtcagggtg gtcacgaggg 20 <210> 30 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 30 ggtcagggtg gtcacgaggg tggg 24 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 31 ggtggtgcag atgaacttca 20 <210> 32 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 32 ggtggtgcag atgaacttca gggt 24 <210> 33 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 33 ggtgcagatg aacttca 17 <210> 34 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 34 ggtgcagatg aacttcaggg t 21 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 35 gttggggtct ttgctcaggg 20 <210> 36 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 36 gttggggtct ttgctcaggg cgga 24 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 37 ggtggtcacg agggtgggcc 20 <210> 38 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 38 ggtggtcacg agggtgggcc aggg 24 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 39 gatgccgttc ttctgcttgt 20 <210> 40 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 40 gatgccgttc ttctgcttgt cggc 24 <210> 41 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 41 gccgttcttc tgcttgt 17 <210> 42 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 gccgttcttc tgcttgtcgg c 21 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 43 gtcgccacca tggtgagcaa 20 <210> 44 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 44 gtcgccacca tggtgagcaa gggc 24 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 45 gcactgcacg ccgtaggtca 20 <210> 46 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 gcactgcacg ccgtaggtca gggt 24 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 47 gtgaaccgca tcgagctgaa 20 <210> 48 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 gtgaaccgca tcgagctgaa gggc 24 <210> 49 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 gaagggcatc gacttcaagg 20 <210> 50 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 gaagggcatc gacttcaagg agga 24 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 gcttcatgtg gtcggggtag 20 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 52 gcttcatgtg gtcggggtag cggc 24 <210> 53 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 53 gctgaagcac tgcacgccgt 20 <210> 54 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 gctgaagcac tgcacgccgt aggt 24 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 55 gccgtcgtcc ttgaagaaga 20 <210> 56 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 56 gccgtcgtcc ttgaagaaga tggt 24 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 57 gaccaggatg ggcaccaccc 20 <210> 58 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 58 gaccaggatg ggcaccaccc cggt 24 <210> 59 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 gacgtagcct tcgggcatgg 20 <210> 60 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 gacgtagcct tcgggcatgg cgga 24 <210> 61 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 gaagttcgag ggcgacaccc 20 <210> 62 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 62 gaagttcgag ggcgacaccc tggt 24 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 63 gagctggacg gcgacgtaaa 20 <210> 64 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 gagctggacg gcgacgtaaa cggc 24 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 ggcatcgccc tcgccctcgc 20 <210> 66 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 ggcatcgccc tcgccctcgc cgga 24 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 67 ggccacaagt tcagcgtgtc 20 <210> 68 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 68 ggccacaagt tcagcgtgtc cggc 24 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 69 gggcgaggag ctgttcaccg 20 <210> 70 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 70 gggcgaggag ctgttcaccg gggt 24 <210> 71 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 71 gcgaggagct gttcaccg 18 <210> 72 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 gcgaggagct gttcaccggg gt 22 <210> 73 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 73 cctcgaactt cacctcggcg 20 <210> 74 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 74 cctcgaactt cacctcggcg cggg 24 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 75 gctcgaactt cacctcggcg 20 <210> 76 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 76 gctcgaactt cacctcggcg cggg 24 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 77 caactacaag acccgcgccg 20 <210> 78 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 78 caactacaag acccgcgccg aggt 24 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 79 gaactacaag acccgcgccg 20 <210> 80 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 80 gaactacaag acccgcgccg aggt 24 <210> 81 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 81 cgctcctgga cgtagccttc 20 <210> 82 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 82 cgctcctgga cgtagccttc gggc 24 <210> 83 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 83 ggctcctgga cgtagccttc 20 <210> 84 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 84 cgctcctgga cgtagccttc gggc 24 <210> 85 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 85 agggcgagga gctgttcacc 20 <210> 86 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 86 agggcgagga gctgttcacc gggg 24 <210> 87 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 87 ggggcgagga gctgttcacc 20 <210> 88 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 88 ggggcgagga gctgttcacc gggg 24 <210> 89 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 89 gttcgagggc gacaccctgg 20 <210> 90 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 90 gttcgagggc gacaccctgg tgaa 24 <210> 91 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 91 gttcaccagg gtgtcgccct 20 <210> 92 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 92 gttcaccagg gtgtcgccct cgaa 24 <210> 93 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 93 gcccaccctc gtgaccaccc 20 <210> 94 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 94 gcccaccctc gtgaccaccc tgac 24 <210> 95 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 95 gcccttgctc accatggtgg 20 <210> 96 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 96 gcccttgctc accatggtgg cgac 24 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 97 gtcgccgtcc agctcgacca 20 <210> 98 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 98 gtcgccgtcc agctcgacca ggat 24 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 99 gtgtccggcg agggcgaggg 20 <210> 100 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 100 gtgtccggcg agggcgaggg cgat 24 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 101 ggggtggtgc ccatcctggt 20 <210> 102 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 102 ggggtggtgc ccatcctggt cgag 24 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 103 gccaccatgg tgagcaaggg 20 <210> 104 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 104 gccaccatgg tgagcaaggg cgag 24 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 105 gagtccgagc agaagaagaa 20 <210> 106 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 106 gagtccgagc agaagaagaa gggc 24 <210> 107 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 107 gtcacctcca atgactaggg 20 <210> 108 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 108 gtcacctcca atgactaggg tggg 24 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 109 gggaagactg aggctacata 20 <210> 110 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 gggaagactg aggctacata gggt 24 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 111 gccacgaagc aggccaatgg 20 <210> 112 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 112 gccacgaagc aggccaatgg ggag 24 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 ggaatccctt ctgcagcacc 20 <210> 114 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 ggaatccctt ctgcagcacc tgga 24 <210> 115 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 115 gctgcagaag ggattccatg 20 <210> 116 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 116 gctgcagaag ggattccatg aggt 24 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 117 ggcggctgca caaccagtgg 20 <210> 118 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 118 ggcggctgca caaccagtgg aggc 24 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 119 gctccagagc cgtgcgaatg 20 <210> 120 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 120 gctccagagc cgtgcgaatg gggc 24 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 121 gaatcccttc tgcagcacct 20 <210> 122 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 122 gaatcccttc tgcagcacct ggat 24 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 123 gcggcggctg cacaaccagt 20 <210> 124 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 124 gcggcggctg cacaaccagt ggag 24 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 125 ggttgtgcag ccgccgctcc 20 <210> 126 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 126 ggttgtgcag ccgccgctcc agag 24 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 127 gcattttcag gaggaagcga 20 <210> 128 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 gcattttcag gaggaagcga tggc 24 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 129 gggagaagaa agagagatgt 20 <210> 130 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 130 gggagaagaa agagagatgt aggg 24 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 131 ggtgcatttt caggaggaag 20 <210> 132 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 132 ggtgcatttt caggaggaag cgat 24 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 133 gagatgtagg gctagagggg 20 <210> 134 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 134 gagatgtagg gctagagggg tgag 24 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 135 ggtatccagc agaggggaga 20 <210> 136 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 136 ggtatccagc agaggggaga agaa 24 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 gaggcatctc tgcaccgagg 20 <210> 138 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 138 gaggcatctc tgcaccgagg tgaa 24 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 139 gaggggtgag gctgaaacag 20 <210> 140 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 140 gaggggtgag gctgaaacag tgac 24 <210> 141 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 141 gagcaaaagt agatattaca 20 <210> 142 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 gagcaaaagt agatattaca agac 24 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 ggaattcaaa ctgaggcata 20 <210> 144 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 ggaattcaaa ctgaggcata tgat 24 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 gcagagggga gaagaaagag 20 <210> 146 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 gcagagggga gaagaaagag agat 24 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 gcaccgaggc atctctgcac 20 <210> 148 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 gcaccgaggc atctctgcac cgag 24 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 gagatgtagg gctagagggg 20 <210> 150 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 150 gagatgtagg gctagagggg tgag 24 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 gtgcggcaag agcttcagcc 20 <210> 152 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 gtgcggcaag agcttcagcc gggg 24 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 gggtgggggg agtttgctcc 20 <210> 154 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 154 gggtgggggg agtttgctcc tgga 24 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 gaccccctcc accccgcctc 20 <210> 156 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 gaccccctcc accccgcctc cggg 24 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 ggtgagtgag tgtgtgcgtg 20 <210> 158 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 ggtgagtgag tgtgtgcgtg tggg 24 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 gcgagcagcg tcttcgagag 20 <210> 160 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 gcgagcagcg tcttcgagag tgag 24 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 161 gtgcggcaag agcttcagcc 20 <210> 162 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 gtgcggcaag agcttcagcc agag 24 <210> 163 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 gagtccgagc agaagaagaa ggg 23 <210> 164 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 gtcacctcca atgactaggg tgg 23 <210> 165 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 ggaatccctt ctgcagcacc tgg 23 <210> 166 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 gctgcagaag ggattccatg agg 23 <210> 167 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 ggcggctgca caaccagtgg agg 23 <210> 168 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 gctccagagc cgtgcgaatg ggg 23 <210> 169 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 gcattttcag gaggaagcga tgg 23 <210> 170 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 gtgcggcaag agcttcagcc ggg 23 <210> 171 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 gaccccctcc accccgcctc cgg 23 <210> 172 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 ggtgagtgag tgtgtgcgtg tgg 23 <210> 173 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 173 ggagcagctg gtcagagggg 20 <210> 174 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 174 ccatagggaa gggggacact gg 22 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 175 gggccgggaa agagttgctg 20 <210> 176 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 176 gccctacatc tgctctccct cc 22 <210> 177 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 177 ccagcacaac ttactcgcac ttgac 25 <210> 178 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 178 catcaccaac ccacagccaa gg 22 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 179 tccagatggc acattgtcag 20 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 180 agggagcagg aaagtgaggt 20 <210> 181 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 181 cgaggaagag agagacgggg tc 22 <210> 182 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 182 ctccaatgca cccaagacag cag 23 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 183 agtgtggggt gtgtgggaag 20 <210> 184 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 184 gcaaggggaa gactctggca 20 <210> 185 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 185 tacgagtgcc tagagtgcg 19 <210> 186 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 186 gcagatgtag gtcttggagg ac 22 <210> 187 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 187 ggagcagctg gtcagagggg 20 <210> 188 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 188 cgatgtcctc cccattggcc tg 22 <210> 189 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 189 gtggggagat ttgcatctgt ggagg 25 <210> 190 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 190 gcttttatac catcttgggg ttacag 26 <210> 191 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 191 caatgtgctt caacccatca cggc 24 <210> 192 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 192 ccatgaattt gtgatggatg cagtctg 27 <210> 193 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 193 gagaaggagg tgcaggagct agac 24 <210> 194 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 194 catcccgacc ttcatccctc ctgg 24 <210> 195 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 195 gtagttctga cattcctcct gaggg 25 <210> 196 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 196 tcaaacaagg tgcagataca gca 23 <210> 197 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 197 cagggtcgct cagtctgtgt gg 22 <210> 198 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 198 ccagcgcacc attcactcca cctg 24 <210> 199 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 199 ggctgaagag gaagaccaga ctcag 25 <210> 200 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 200 ggcccctctg aattcaattc tctgc 25 <210> 201 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 201 ccacagcgag gagtgacagc c 21 <210> 202 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 202 ccaagtcttt cctaactcga ccttgg 26 <210> 203 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 203 ccctaggccc acaccagcaa tg 22 <210> 204 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 204 gggatgggaa tgggaatgtg aggc 24 <210> 205 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 205 gcccaggtga aggtgtggtt cc 22 <210> 206 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 206 ccaaagcctg gccagggagt g 21 <210> 207 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 207 aggcaaagat ctaggacctg gatgg 25 <210> 208 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 208 ccatctgagt cagccagcct tgtc 24 <210> 209 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 209 ggttccctcc cttctgagcc c 21 <210> 210 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 210 ggataggaat gaagaccccc tctcc 25 <210> 211 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 211 ggactggctg gctgtgtgtt ttgag 25 <210> 212 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 212 cttatccagg gctacctcat tgcc 24 <210> 213 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 213 gctgctgctg ctttgatcac tcctg 25 <210> 214 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 214 ctccttaaac cctcagaagc tggc 24 <210> 215 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 215 gcactgtcag ctgatcctac agg 23 <210> 216 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 216 acgttggaac agtcgagctg tagc 24 <210> 217 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 217 tgtgcataac tcatgttggc aaact 25 <210> 218 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 218 tccacaacta ccctcagctg gag 23 <210> 219 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 219 ccactgacaa ttcactcaac cctgc 25 <210> 220 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 220 aggcagacca gttatttggc agtc 24 <210> 221 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 221 acaggcgcag ttcactgaga ag 22 <210> 222 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 222 gggtaggctg actttgggct cc 22 <210> 223 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 223 gccctcttgc ctccactggt tg 22 <210> 224 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 224 cgcggatgtt ccaatcagta cgc 23 <210> 225 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 225 gcgggcagtg gcgtcttagt cg 22 <210> 226 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 226 ccctgggttt ggttggctgc tc 22 <210> 227 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 227 ctccttgccg cccagccggt c 21 <210> 228 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 228 cactggggaa gaggcgagga cac 23 <210> 229 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 229 ccagtgtttc ccatccccaa cac 23 <210> 230 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 230 gaatggatcc ccccctagag ctc 23 <210> 231 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 231 caggcccaca ggtccttctg ga 22 <210> 232 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 232 ccacacggaa ggctgaccac g 21 <210> 233 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 233 gcgcagagag agcaggacgt c 21 <210> 234 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 234 gcacctcatg gaatcccttc tgc 23 <210> 235 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 235 caagtgatgc gacttccaac ctc 23 <210> 236 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 236 ccctcagagt tcagcttaaa aagacc 26 <210> 237 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 237 tgcttctcat ccactctaga ctgct 25 <210> 238 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 238 caccaaccag ccatgtgcca tg 22 <210> 239 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 239 ctgcctgtgc tcctcgatgg tg 22 <210> 240 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 240 gggttcaaag ctcatctgcc cc 22 <210> 241 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 241 gcatgtgcct tgagattgcc tgg 23 <210> 242 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 242 gacattcaga gaagcgacca tgtgg 25 <210> 243 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 243 ccatcttccc ctttggccca cag 23 <210> 244 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 244 ccccaaaagt ggccaagagc ctgag 25 <210> 245 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 245 gttctccaaa ggaagagagg ggaatg 26 <210> 246 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 246 ggtgctgtgt cctcatgcat cc 22 <210> 247 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 247 cggcttgcct agggtcgttg ag 22 <210> 248 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 248 ccttcagggg ctcttccagg tc 22 <210> 249 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 249 gggaactggc aggcaccgag g 21 <210> 250 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 250 gggtgaggct gaaacagtga cc 22 <210> 251 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 251 gggaggatgt tggttttagg gaactg 26 <210> 252 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 252 tccaatcact acatgccatt ttgaaga 27 <210> 253 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 253 ccaccctctt cctttgatcc tccc 24 <210> 254 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 254 tcctccctac tccttcaccc agg 23 <210> 255 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 255 gagtgcctga catgtgggga gag 23 <210> 256 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 256 tccagctaaa gcctttccca cac 23 <210> 257 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 257 gaactctctg atgcacctga aggctg 26 <210> 258 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 258 accgtatcag tgtgatgcat gtggt 25 <210> 259 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 259 tgggtttaat catgtgttct gcactatg 28 <210> 260 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 260 cccatcttcc attctgccct ccac 24 <210> 261 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 261 cagctagtcc atttgttctc agactgtg 28 <210> 262 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 262 ggccaacatt gtgaaaccct gtctc 25 <210> 263 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 263 ccagggacct gtgcttgggt tc 22 <210> 264 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 264 caccccatga cctggcacaa gtg 23 <210> 265 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 265 aagtgttcct cagaatgcca gccc 24 <210> 266 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 266 caggagtgca gttgtgttgg gag 23 <210> 267 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 267 ctgatgaagc accagagaac ccacc 25 <210> 268 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 268 cacacctggc acccatatgg c 21 <210> 269 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 269 gatccacact ggtgagaagc cttac 25 <210> 270 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 270 cttcccacac tcacagcaga tgtagg 26 <210> 271 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 271 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 272 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 272 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 273 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 273 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgagagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 274 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 274 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg catacctgcc tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 275 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 275 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 276 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 276 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 277 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 277 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cagagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 278 <211> 4206 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 278 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cagagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aagtga 4206 <210> 279 <211> 422 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 279 tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60 gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120 gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180 tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240 gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300 tggaaaggac gaaacaccgg agacgattaa tgcgtctccg ttttagagct agaaatagca 360 agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 420 tt 422

Claims

L169, Y450, N497, R661, Q695, Q926, 및/또는 D1135의 위치 중 1, 2, 3, 4, 5, 6 또는 7개 모두에서 돌연변이를 가지고, 바람직하게는, L169, Y450, N497, R661, Q695, Q926, D1135의 위치 중 1, 2, 3, 4, 5, 6 또는 7개에 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로 하나 이상의 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그를 포함하는, 단리된 스트렙토코커스 피오게네스 Cas9(SpCas9) 단백질.
제1항에 있어서, N497, R661, Q695, 및 Q926 중 1, 2, 3 또는 4개 모두에서의 돌연변이, 바람직하게는 N497A, R661A, Q695A, 및 Q926A의 돌연변이 중 1, 2, 3 또는 4개 모두를 포함하는, 단리된 단백질.
제1항에 있어서, Q695 및/또는 Q926 중 하나 또는 둘 모두에서의 돌연변이, 선택적으로 L169, Y450, N497, R661, 및 D1135 중 1, 2, 3, 4 또는 5개 모두에서의 돌연변이, 바람직하게는 Y450A/Q695A, L169A/Q695A, Q695A/Q926A, Q695A/D1135E, Q926A/D1135E, Y450A/D1135E, L169A/Y450A/Q695A, L169A/Q695A/Q926A, Y450A/Q695A/Q926A, R661A/Q695A/Q926A, N497A/Q695A/Q926A, Y450A/Q695A/D1135E, Y450A/Q926A/D1135E, Q695A/Q926A/D1135E, L169A/Y450A/Q695A/Q926A, L169A/R661A/Q695A/Q926A, Y450A/R661A/Q695A/Q926A, N497A/Q695A/Q926A/D1135E, R661A/Q695A/Q926A/D1135E, 또는 Y450A/Q695A/Q926A/D1135E를 포함하는, 단리된 단백질.
제1항에 있어서, N14; S15; S55; R63; R78; H160; K163; R165; L169; R403; N407; Y450; M495; N497; K510; Y515; W659; R661; M694; Q695; H698; A728; S730; K775; S777; R778; R780; K782; R783; K789; K797; Q805; N808; K810; R832; Q844; S845; K848; S851; K855; R859; K862; K890; Q920; Q926; K961; S964; K968; K974; R976; N980; H982; K1003; Y1013; K1014; V1015; S1040; N1041; N1044; K1047; K1059; R1060; K1107; E1108; S1109; K1113; R1114; S1116; K1118; R1122; K1123; K1124; D1135; S1136; K1153; K1155 ; K1158; K1200; Q1221; H1241; Q1254; Q1256; K1289; K1296; K1297; R1298; K1300; H1311; K1325; K1334; T1337 및/또는 S1216에서의 돌연변이, 바람직하게는 N497A/R661A/Q695A/Q926A/K810A, N497A/R661A/Q695A/Q926A/K848A, N497A/R661A/Q695A/Q926A/K855A, N497A/R661A/Q695A/Q926A/R780A, N497A/R661A/Q695A/Q926A/K968A, N497A/R661A/Q695A/Q926A/H982A, N497A/R661A/Q695A/Q926A/K1003A, N497A/R661A/Q695A/Q926A/K1014A, N497A/R661A/Q695A/Q926A/K1047A, N497A/R661A/Q695A/Q926A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K968A, N497A/R661A/Q695A/Q926A/K810A/K848A, N497A/R661A/Q695A/Q926A/K810A/K1003A, N497A/R661A/Q695A/Q926A/K810A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A, N497A/R661A/Q695A/Q926A/K848A/R1060A, N497A/R661A/Q695A/Q926A/K855A/K1003A, N497A/R661A/Q695A/Q926A/K855A/R1060A, N497A/R661A/Q695A/Q926A/K968A/K1003A, N497A/R661A/Q695A/Q926A/H982A/K1003A, N497A/R661A/Q695A/Q926A/H982A/R1060A, N497A/R661A/Q695A/Q926A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A, Q695A/Q926A/R780A, Q695A/Q926A/K810A, Q695A/Q926A/R832A, Q695A/Q926A/K848A, Q695A/Q926A/K855A, Q695A/Q926A/K968A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K1003A, Q695A/Q926A/K1014A, Q695A/Q926A/K1047A, Q695A/Q926A/R1060A, Q695A/Q926A/K848A/K968A, Q695A/Q926A/K848A/K1003A, Q695A/Q926A/K848A/K855A, Q695A/Q926A/K848A/H982A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/R832A/R1060A, Q695A/Q926A/K968A/K1003A, Q695A/Q926A/K968A/R1060A, Q695A/Q926A/K848A/R1060A, Q695A/Q926A/K855A/H982A, Q695A/Q926A/K855A/K1003A, Q695A/Q926A/K855A/R1060A, Q695A/Q926A/H982A/K1003A, Q695A/Q926A/H982A/R1060A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K810A/K1003A/R1060A, Q695A/Q926A/K1003A/K1047A/R1060A, Q695A/Q926A/K968A/K1003A/R1060A, Q695A/Q926A/R832A/K1003A/R1060A, 또는 Q695A/Q926A/K848A/K1003A/R1060A를 추가로 포함하는, 단리된 단백질.
제1항에 있어서, 돌연변이 D1135E; D1135V; D1135V/R1335Q/T1337R(VQR 변이체); D1135E/R1335Q/T1337R(EQR 변이체); D1135V/G1218R/R1335Q/T1337R(VRQR 변이체); 또는 D1135V/G1218R/R1335E/T1337R(VRER 변이체) 중 하나 이상을 추가로 포함하는, 단리된 단백질.
제1항에 있어서, D10, E762, D839, H983, 또는 D986에서; 및 H840 또는 N863에서의 돌연변이로 이루어진 군으로부터 선택되는, 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 추가로 포함하는, 단리된 단백질.
제6항에 있어서, 뉴클레아제 활성을 감소시키는 돌연변이는 하기의 것인, 단리된 단백질:
(i) D10A 또는 D10N, 및
(ii) H840A, H840N, 또는 H840Y.
Y211, Y212, W229, Y230, R245, T392, N419, Y651, R654의 위치 중 1, 2, 3, 4, 5, 6개 이상에서의 돌연변이를 가지며, 바람직하게는, Y211, Y212, W229, Y230, R245, T392, N419, Y651, R654의 위치 중 1, 2, 3, 4, 또는 5, 6개 이상에서 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는, 단리된 스타필로코커스 아우레우스 Cas9(SaCas9) 단백질.
제8항에 있어서, 돌연변이 Y211A, Y212A, W229, Y230A, R245A, T392A, N419A, Y651, 및/또는 R654A 중 하나 이상을 포함하는, 단리된 단백질.
제8항에 있어서, N419 및/또는 R654에서의 돌연변이 및 선택적으로 추가적인 돌연변이 Y211, Y212, W229, Y230, R245 및 T392 중 1, 2, 3, 4개 이상, 바람직하게는 N419A/R654A, Y211A/R654A, Y211A/Y212A, Y211A/Y230A, Y211A/R245A, Y212A/Y230A, Y212A/R245A, Y230A/R245A, W229A/R654A, Y211A/Y212A/Y230A, Y211A/Y212A/R245A, Y211A/Y212A/Y651A, Y211A/Y230A/R245A, Y211A/Y230A/Y651A, Y211A/R245A/Y651A, Y211A/R245A/R654A, Y211A/R245A/N419A, Y211A/N419A/R654A, Y212A/Y230A/R245A, Y212A/Y230A/Y651A, Y212A/R245A/Y651A, Y230A/R245A/Y651A, R245A/N419A/R654A, T392A/N419A/R654A, R245A/T392A/N419A/R654A, Y211A/R245A/N419A/R654A, W229A/R245A/N419A/R654A, Y211A/R245A/T392A/N419A/R654A, 또는 Y211A/W229A/R245A/N419A/R654A를 포함하는, 단리된 단백질.
제8항에 있어서, Y211; Y212; W229; Y230; R245; T392; N419; L446; Q488A; N492A; Q495A; R497A; N498A; R499; Q500; K518; K523; K525; H557; R561; K572; R634; Y651; R654; G655; N658; S662; N667; R686; K692; R694; H700; K751; D786; T787; Y789; T882; K886; N888; 889; L909; N985; N986; R991; R1015; N44; R45; R51; R55; R59; R60; R116; R165; N169; R208; R209; Y211; T238; Y239; K248; Y256; R314; N394; Q414; K57; R61; H111; K114; V164; R165; L788; S790; R792; N804; Y868; K870; K878; K879; K881; Y897; R901; 및/또는 K906에서의 돌연변이를 추가로 포함하는, 단리된 단백질.
제8항에 있어서, 돌연변이 E782K, K929R, N968K, 또는 R1015H 중 하나 이상, 구체적으로, E782K/N968K/R1015H(KKH 변이체); E782K/K929R/R1015H(KRH 변이체); 또는 E782K/K929R/N968K/R1015H(KRKH 변이체)를 추가로 포함하는, 단리된 단백질.
제8항에 있어서, D10, E477, D556, H701, 또는 D704에서의 돌연변이; 및 H557 또는 N580에서의 돌연변이로 이루어진 군으로부터 선택되는, 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 추가로 포함하는, 단리된 단백질.
제13항에 있어서, 돌연변이는 하기의 것인, 단리된 단백질:
(i) D10A 또는 D10N, 및/또는
(ii) H557A, H557N, 또는 H557Y, 및/또는
(iii) N580A, 및/또는
(iv) D556A.
선택적 개입 링커에 의해, 이종 기능성 도메인에 융합된 제1항 내지 제14항 중 어느 한 항의 단리된 단백질을 포함하는 융합 단백질로서, 링커는 융합 단백질의 활성에 간섭하지 않는, 융합 단백질.
제15항에 있어서, 이종 기능성 도메인은 전사 활성화 도메인인, 융합 단백질.
제16항에 있어서, 전사 활성화 도메인은 VP64 또는 NF-κB p65로부터 유래하는, 융합 단백질.
제15항에 있어서, 이종 기능성 도메인은 전사 사일런서(transcriptional silencer) 또는 전사 억제 도메인인, 융합 단백질.
제18항에 있어서, 전사 억제 도메인은 Krueppel-연관 박스(KRAB) 도메인, ERF 리프레서 도메인(ERD), 또는 mSin3A 상호작용 도메인(SID)인, 융합 단백질.
제18항에 있어서, 전사 사일런서는 이질염색질 단백질 1(HP1), 바람직하게는 HP1α 또는 HP1β인, 융합 단백질.
제15항에 있어서, 이종 기능성 도메인은 DNA의 메틸화 상태를 변형하는 효소인, 융합 단백질.
제21항에 있어서, DNA의 메틸화 상태를 변형하는 효소는 DNA 메틸기전달효소(DNMT) 또는 TET 단백질인, 융합 단백질.
제22항에 있어서, TET 단백질은 TET1인, 융합 단백질.
제15항에 있어서, 이종 기능성 도메인은 히스톤 서브유닛을 변형하는 효소인, 융합 단백질.
제15항에 있어서, 히스톤 서브유닛을 변형하는 효소는 히스톤 아세틸기전달효소(HAT), 히스톤 탈아세틸효소(HDAC), 히스톤 메틸기전달효소(HMT), 또는 히스톤 탈메틸효소인, 융합 단백질.
제15항에 있어서, 이종 기능성 도메인은 생물학적 테더(biological tether)인, 융합 단백질.
제26항에 있어서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질인, 융합 단백질.
제26항에 있어서, 이종 기능성 도메인은 FokI인, 융합 단백질.
제1항 내지 제14항 중 어느 한 항의 단백질을 인코딩하는, 단리된 핵산.
선택적으로, 제1항 내지 제24항 중 어느 한 항의 단백질의 발현을 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 제29항의 단리된 핵산을 포함하는 벡터.
제29항의 핵산을 포함하고, 선택적으로 제1항 내지 제14항 중 어느 한 항의 단백질을 발현하는 숙주 세포, 바람직하게는 포유류 숙주 세포.
세포의 게놈 또는 에피게놈을 변이시키는 방법으로서, 제1항 내지 제14항 중 어느 한 항의 단리된 단백질 및 세포 게놈의 선택 부분에 상보성인 영역을 가지는 가이드 RNA를 세포에서 발현시키거나 이들과 세포를 접촉시키는 단계를 포함하는 방법.
제15항의 단백질을 인코딩하는 단리된 핵산.
선택적으로, 제15항의 단백질의 발현을 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 제33항의 단리된 핵산을 포함하는 벡터.
제33항의 핵산을 포함하고, 선택적으로 제15항의 단백질을 발현하는 숙주 세포, 바람직하게는 포유류 숙주 세포.
세포의 게놈 또는 에피게놈을 변이시키는 방법으로서, 제1항 내지 제14항 중 어느 한 항의 단리된 단백질 및 세포 게놈의 선택 부분에 상보성인 영역을 가지는 가이드 RNA를 세포에서 발현시키거나 이들과 세포를 접촉시키는 단계를 포함하는, 방법.
세포의 게놈 또는 에피게놈을 변이시키는 방법으로서, 제15항 내지 제28항 중 어느 한 항의 단리된 융합 단백질 및 세포 게놈의 선택 부분에 상보성인 영역을 가지는 가이드 RNA를 세포에서 발현시키거나 이들과 세포를 접촉시키는 단계를 포함하는, 방법.
제36항 또는 제37항에 있어서, 단리된 단백질 또는 융합 단백질은 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는, 방법.
제36항 또는 제37항에 있어서, 세포는 줄기세포, 바람직하게는 배아 줄기세포, 간엽 줄기세포 또는 유도된 만능성 줄기세포이거나; 살아 있는 동물 내에 존재하거나, 배아 내에 존재하는, 방법.
이중 가닥 DNA D(dsDNA) 분자를 변이시키는 방법으로서, dsDNA 분자를 제1항 내지 제14항 중 어느 한 항의 단리된 단백질 및 dsDNA 분자의 선택 부분에 상보성인 영역을 가지는 가이드 RNA와 접촉시키는 단계를 포함하는, 방법.
제40항에 있어서, dsDNA 분자는 시험관내에(in vitro) 존재하는, 방법.
이중 가닥 DNA D(dsDNA) 분자를 변이시키는 방법으로서, dsDNA 분자를 제15항의 융합 단백질 및 dsDNA 분자의 선택 부분에 상보성인 영역을 가지는 가이드 RNA와 접촉시키는 단계를 포함하는, 방법.
제42항에 있어서, dsDNA 분자는 시험관내에 존재하는, 방법.